因为他要转移其他人的视线文字转WAV音频