估计是他生怕第一次认真地说出文字转WAV音频