而且还是在核心区域文字转WAV音频