这里的人们基本都是凡人文字转WAV音频