或许会使用错位拍摄法文字转WAV音频