结合刚刚发生的事情以及他们说的话文字转WAV音频