我们和他们原本就是互相利用文字转WAV音频