可以认为是对语言文字分析文字转WAV音频