他开始计算每个人的位置文字转WAV音频