他们还是利用了那个人质文字转WAV音频