加上严格的训练和任何时候都是任务优先文字转WAV音频