不过他只知道文字转WAV音频