不断的为自己解释着文字转WAV音频