还是给予了他们相当的时间来处理文字转WAV音频