所以倒不如直接认错文字转WAV音频