而是让楚封先行寻找一处位置进行定位文字转WAV音频