他们并不一定认可文字转WAV音频