而是只研究这些相关的子系统文字转WAV音频