他们就要和其他的散修那样文字转WAV音频