双方都是误会文字转WAV音频