是一种融入文字转WAV音频