最后双方决定文字转WAV音频