这是从攻击感觉上能分辨的文字转WAV音频