最终还是否定了文字转WAV音频