毕竟目前托尔多收集到到信息都是侧面的文字转WAV音频