他们总算是可以接受正规一点的训练了文字转WAV音频