他们通过数据比对文字转WAV音频