随后这套设备会根据两组数据的微小差异文字转WAV音频