而且整个接待过程已经演练了两遍文字转WAV音频