然后使用各种各样的法则之力去引导文字转WAV音频