那自然是需要一个空间法阵来联系外面的文字转WAV音频