其实还是保留了相当意识的文字转WAV音频