他们甚至能推算出文字转WAV音频