这也是他自信水平比较高的论文才会如此做文字转WAV音频