因为脉络投影本尊已经训练文字转WAV音频