而是当众说出的文字转WAV音频