所以我们商量的结果是撤退文字转WAV音频