就算是构造一个最基本的法术模型文字转WAV音频