再之外的第三环便是十六人文字转WAV音频