这样在后面的统一过程中不可避免的会造成极大的损失文字转WAV音频