当初我们是达成了口头协议的文字转WAV音频