所以听完之后才要分析呀文字转WAV音频