所以我们的目标只是能在这里站住脚文字转WAV音频