他们肯定是认识对方的文字转WAV音频