但他还可以清晰的分辨出那个核心区域的几个侧面的角度文字转WAV音频