我们无法在人群里分辨出谁是坏人谁是普通人文字转WAV音频