我听老安和老王说这项工作主要是你在抓文字转WAV音频