发布时间:2020-07-03 16:02:16作者:知识屋
用户在使用懒人采集器执行网页采集任务的时候,常常会遇到重复采集字段内容的情况,有大量重复数据被添加到本地采集库中,为后续的信息处理带来麻烦。那么应该如何避免重复采集数据呢?
懒人采集器采集数据重复怎么办?
首先我们要分析采集数据出现重复的原因:一是在重复对相同网页进行字段采集之前没有清空之前的数据;二是网页本身存在重复数据,然后介绍解决方法。
1、进入编辑任务采集配置界面,如果想避免某个字段重复采集,那么点击该字段表头右侧倒三角图标。
2、然后会弹出字段采集设置界面,勾选【过滤重复】,然后点击【确定】即可。
3、如果想避免多个字段重复采集,点击逐个字段表头倒三角图标逐一设置即可,操作方法一样。
以上就是关于使用懒人采集器如何避免重复采集的介绍,想要了解更多相关内容,大家可以登陆官网查看详细教程。
2016-05-30
新浪秒拍视频怎么下载?秒拍视频下载的方法教程
监控怎么安装?网络监控摄像头安装图文教程
电脑待机时间怎么设置 电脑没多久就进入待机状态
农行网银K宝密码忘了怎么办?农行网银K宝密码忘了的解决方法
手机淘宝怎么修改评价 手机淘宝修改评价方法
支付宝钱包、微信和手机QQ红包怎么用?为手机充话费、淘宝购物、买电影票
不认识的字怎么查,教你怎样查不认识的字
如何用QQ音乐下载歌到内存卡里面
2015年度哪款浏览器好用? 2015年上半年浏览器评测排行榜!