而是用眼神和他们交流文字转WAV音频