所以两人的对话他们都听得见文字转WAV音频