现在的规模是否满足需要文字转WAV音频