就是不能用常人常理常情揣测其言行文字转WAV音频