是介于人类和数据之间的特殊存在文字转WAV音频