如果说他们会透过表象看实际文字转WAV音频