也就是在从九品和正九品这两个品阶上文字转WAV音频