并不一定全盘接收文字转WAV音频