毕竟人数上本就比对方少一个文字转WAV音频