也就是指的能够应付几个卡文斯的复制体文字转WAV音频