当其他人全都是静止的姿态时文字转WAV音频