所以我们必须分开文字转WAV音频