当然了……就算在脑中构建出了那种模型来文字转WAV音频