他们刚开始是害怕文字转WAV音频