他们训练的一项就是蒙着眼辨别方向文字转WAV音频