他应该是使用瞬移离开的文字转WAV音频