还划分了一些区域文字转WAV音频