他们沟通的是原能文字转WAV音频