当前位置:文档之家› 58同城信息采集器使用教程

58同城信息采集器使用教程

58同城信息采集器使用教程
58同城信息采集器使用教程

https://www.doczj.com/doc/9912368712.html,

58同城信息采集器使用教程

58同城是国内比较有名的生活分类信息网站,网站上主要提供找房子、找工作、二手物品买卖、二手车、58团购、商家黄页、宠物票务、旅游、交友等多种生活信息。这些信息对于有些朋友来说非常有价值,如果一个个自己去复制下来的话很是麻烦,那么有没有一款采集软件可以把这些信息批量弄下来呢,下面为大家介绍58同城信息采集器的使用教程。

采集网站:58同城分类列表页

https://www.doczj.com/doc/9912368712.html,/chuzu/

上述仅以58同城租房分类页举例,大家在采集58同城号码的时候,可以更换其他分类列表也进行采集。

采集的内容包括:58分类信息标题,号码

使用功能点:

●创建循环翻页

●分页列表信息采集

●Ajax点击

https://www.doczj.com/doc/9912368712.html, 执行前等待

步骤1:创建58同城信息采集使用任务

1)进入八爪鱼采集器主界面,选择“自定义采集

58同城信息采集器使用步骤1

2)将要采集的58分类列表网站URL复制粘贴到输入框中,点击“保存网址”

https://www.doczj.com/doc/9912368712.html,

58同城信息采集器使用步骤2

3)打开网页的时候页面需要向下滚动才会出现所有的数据,所以可以在这一步设置一个高级选项,在滚动页面这里设置页面加载完成向下滚动,滚动次数设置3秒,每次间隔3秒,滚动方式选择“直接滚动到底部”。

https://www.doczj.com/doc/9912368712.html,

58同城信息采集器使用步骤3

步骤2:创建翻页循环

将页面下拉到底部,鼠标点击“下一页”按钮。然后在右侧的操作提示框中,选择“循环点击下一页”

https://www.doczj.com/doc/9912368712.html,

58同城信息采集器使用步骤4

步骤3:提取58同城房源信息

1)移动鼠标,选中页面里的第一条房源标题。选中后,红框内的底板会变成绿色,其中的适配信息字段会变为红色底色。系统会自动识别其他相似的元素,然后在右侧的操作提示框中,选择“循环点击每个链接”。

https://www.doczj.com/doc/9912368712.html,

58同城信息采集器使用步骤5

2)选中页面中房源标题,然后在右面的提示框中选择“采集该元素文本”

https://www.doczj.com/doc/9912368712.html,

58同城信息采集器使用步骤6

3)选中页面中58同城号码,然后在右面的提示框中选择“采集该元素文本”

https://www.doczj.com/doc/9912368712.html,

58同城信息采集器使用步骤7

4)点开右上角的流程按钮,可以对提取字段的自定义命名,点下面的垃圾桶的标识可以删除不需要的字段。

https://www.doczj.com/doc/9912368712.html,

58同城信息采集器使用步骤8

步骤4:Ajax点击

1)此网页涉及Ajax技术。打开“高级选项”,选中点击元素的步骤,勾选“Ajax 加载数据”,设置时间为“3秒”。完成后,点击“确定”

https://www.doczj.com/doc/9912368712.html,

58同城信息采集器使用步骤9

2)同样的操作在1点击翻页这一步骤也需要设置Ajax加载。

https://www.doczj.com/doc/9912368712.html,

58同城信息采集器使用步骤10

3)由于网页打开速度不会很快,可以设置执行前等待,如下图,选中循环翻页的步骤,在高级选中勾选“执行前等待”,设置时间为2秒。

https://www.doczj.com/doc/9912368712.html,

58同城信息采集器使用步骤11

4)注:AJAX即延时加载、异步更新的一种脚本技术,通过在后台与服务器进行少量数据交换,可以在不重新加载整个网页的情况下,对网页的某部分进行更新。

表现特征:

1.点击网页中某个选项时,大部分网站的网址不会改变;

2.网页不是完全加载,只是局部进行了数据加载,有所变化

https://www.doczj.com/doc/9912368712.html,

步骤5:58同城号码数据采集及导出

设置完成之后,启动本地采集

58同城信息采集器使用步骤12

采集完成后,会跳出提示,选择“导出数据”选择“合适的导出方式”,将采集好的数据导出这里我们选择excel作为导出为格式,一份完好的58同城号码就倒出来了,数据导出后如下图

https://www.doczj.com/doc/9912368712.html,

58同城信息采集器使用步骤13

相关采集教程:

天眼查爬虫:https://www.doczj.com/doc/9912368712.html,/tutorial/hottutorial/qyxx/tianyancha 企查查爬虫:https://www.doczj.com/doc/9912368712.html,/tutorial/hottutorial/qyxx/qichacha 点评数据采集:https://www.doczj.com/doc/9912368712.html,/tutorial/hottutorial/shfw/xfdp

https://www.doczj.com/doc/9912368712.html,

美团商家数据采集方法以及具体步骤:https://www.doczj.com/doc/9912368712.html,/tutorial/mtsj_7

大众点评商家团购评价数据的采集方法:https://www.doczj.com/doc/9912368712.html,/tutorial/dzdppj 百姓网分类信息的采集方法:https://www.doczj.com/doc/9912368712.html,/tutorial/bxw-px-7

赶集网招聘信息采集:https://www.doczj.com/doc/9912368712.html,/tutorial/cjganjirecruit

阿里巴巴数据采集器:https://www.doczj.com/doc/9912368712.html,/tutorial/aliphonecj

八爪鱼——90万用户选择的网页数据采集器。

1、操作简单,任何人都可以用:无需技术背景,会上网就能采集。完全可视化流程,点击鼠标完成操作,2分钟即可快速入门。

2、功能强大,任何网站都可以采集:对于点击、登陆、翻页、识别验证码、瀑布流、Ajax脚本异步加载数据的网页,均可经过简单设置进行采集。

3、云采集,关机也可以。配置好采集任务后可关机,任务可在云端执行。庞大云采集集群24*7不间断运行,不用担心IP被封,网络中断。

4、功能免费+增值服务,可按需选择。免费版具备所有功能,能够满足用户的基本采集需求。同时设置了一些增值服务(如私有云),满足高端付费企业用户的需要。

相关主题
文本预览
相关文档 最新文档