他在分辨这是什么语言文字转WAV音频