或许是因为此法术本身就以通用性为目的文字转WAV音频