他们要的是他们认定的文字转WAV音频