在第一轮变化之前就输了文字转WAV音频