但是根据我们掌握的信息来推理文字转WAV音频