这次没有更多的额外损失文字转WAV音频