因为他一开始给我看的就是影像文字转WAV音频