也没有技术储备……而且我们现在在想的是文字转WAV音频