也就是说必须要让这些人完全的服从命令文字转WAV音频