后面的那四人均是脸色大变文字转WAV音频