按照现场的划分结果来看文字转WAV音频