在确定不是带着面具的其他人之后文字转WAV音频