至少自己可以坐在车里观察清楚周围的动静文字转WAV音频