这是因为他使用了计算力极高的大型晶脑文字转WAV音频