他可以通过表象看实质文字转WAV音频