GoldData将采集数据融合到两张关联关系表-创新互联
概述
在上一期中,我们抓取了新闻数据,现在我们要通过GoldData融合到两张数据库表news_site和news表当中去。如下图所示:
成都创新互联是一家专业的成都网站建设公司,我们专注成都网站设计、做网站、网络营销、企业网站建设,外链,广告投放平台为企业客户提供一站式建站解决方案,能带给客户新的互联网理念。从网站结构的规划UI设计到用户体验提高,创新互联力求做到尽善尽美。我们很容易看到这两张表存在关联,那是怎样将数据写入关联呢,我们将接上一期在此一一介绍。
定义融合映射
数据集news ==> 表news_site
在“融合管理”中,选择数据集"news",选择数据库表news_site点击“添加”按扭,然后再点击“编辑映射”。如下图所示:
关联数据方式选择“关联字段”,关联表字段"name",关联数据集JS为“dataset.source
”,然后选择“保存”即可。
news_site表有两个字段:一个是id字段,由于是自增长字段,所以不用关联;另一个是name字段,选择映谢方式为“数据集字段”,而内容是来自于数据集news的source字段。
手动作业
我们回到“融合管理”页面,点击“融合作业”,然后点击“手动作业”,打开“手动作业”子页面,如下图所示:
在这里我们可以看到融合是没问题的。点击“提交且下一条”,则会将合并结果写入到数据库表当中。如下图所示:
然后回到“融合作业”子页面,点击“开始融合”,将会开始自动融合。如下图所示:
系统就将会将数据集的数据按照指定的规则进行一个个的融合了。
数据集news ==> 表news
在“融合管理”中,选择数据集"news",选择数据库表news点击“添加”按扭,然后再点击“编辑映射”。如下图所示:
关联数据方式选择“不关联,数据追加”,这将意味着数据集里的新数据将会追加到表news新记录里,但当然老数据不会追加为news新记录里,也就是多次反复融合也不会在表news里产生重复数据。
对于字段映射,说明如下:
字段 | 说明 |
---|---|
id | 自增长,不用映射 |
title | 直接映射为数据集字段title |
pub_date | 使用JS 将数据集字段pubdate内容添加:00 即可 |
site_id | 映射表news_site,通过数据集字段source查找得到id |
content | 直接映射为数据集字段content |
date_created | 用JS创建该值即可 |
手动作业
我们回到“融合管理”页面,点击“融合作业”,然后点击“手动作业”,打开“手动作业”子页面,如下图所示:
确认正确无误,点击“提交且下一条”,数据将会写入数据库中。如下图所示:
然后回到“融合作业”子页面,点击“开始融合”,将会开始自动融合。
结语
通过GoldData后,我们很容易将数据及数据之间关系融合到关系数据库表中。接下来我们还介绍自关联数据的融合。
另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。
当前标题:GoldData将采集数据融合到两张关联关系表-创新互联
当前地址:http://myzitong.com/article/djohce.html