既然他们是为核心数据來的文字转WAV音频