将他们几个的信息和容貌录制下来文字转WAV音频