依旧保留了大部分文字转WAV音频