最后这一步就是在等观看到完整的影片文字转WAV音频