去了京城也基本上是切除文字转WAV音频