接受的是最正统文字转WAV音频