所以对方不得不提前出现文字转WAV音频