当他的确声音的确是从下传出来的文字转WAV音频