他们的目标从一开始就是赢文字转WAV音频