首先采用了半可动的骨架设计文字转WAV音频