是因为他动用了一些研究成果文字转WAV音频