他们必须确保文字转WAV音频