我们就得替对方端起文字转WAV音频