而裁定的标准都是它们自己定的文字转WAV音频