为什么要先放他们离开文字转WAV音频