这个难题我们也在研究文字转WAV音频