而这六年里我们有三分之二的时间都是分离文字转WAV音频