判断依据是边学道下注时的神态和动作细节文字转WAV音频