但他能从周围一些细微的行为和言语之中猜测到文字转WAV音频