读取了其中的视频信息文字转WAV音频