经过第二幕的积累文字转WAV音频