这里的时间很明显处在凝固状态文字转WAV音频