只不过他这次是向下拍的文字转WAV音频