在场的所有人加起来文字转WAV音频