他们自然是要加入了文字转WAV音频