第一个是里面的人主动开门文字转WAV音频