他只是简单分析一下情况文字转WAV音频