二、数据挖掘方法—学习渠道
寻本溯源,洞悉万象
2020/3/29
二、数据挖掘方法-数据爬虫工具举例
数据爬虫工具
Arachnid
Spiderman ThinkUp
网络矿工
应用
优点
Arachnid是一个基于Java的web spider框架.它包含一个简单 的HTML剖析器能够分析包含HTML内容的输入流.通过实现 Arachnid的子类就能够开发一个简单的Web spiders并能够在 Web站上的每个页面被解析之后增加几行代码调用。 Arachnid的下载包中包含两个spider应用程序例子用于演示如 何使用该框架。
▪其他的网站
寻本溯源,洞悉万象
2020/3/29
一、信息获取渠道:市场信息获取
▪ 1.国内咨询机构网站数据报告 ▪ 2.国内互联网公司数据报告网站 ▪ 3.国外咨询机构网站数据报告 ▪ 4.各大公司不定期发布的报告 ▪ 5.企业信息报告 ▪ 6.政府统计类网站/数据库 ▪ 7.法律规章
寻本溯源,洞悉万象
2020(1)
1、Flurry-国外app行业报告 2、App Annie Blog-app指数报告 3、https:// 4、BI Intelligence-business insider的报告 5、Today's Articles on Digital Marketing and Media-emarker的报告 6、http://侧重于手游行业报告 7、Gartner Press Release Archives-gartner侧重于硬件的出货量,包括智能机和PC等 8、IDC - Search Results-IDC的硬件出货量全球报告 9、Yozzo Telecom News 10、J.P. Morgan Home-摩根投行报告 11、德勤中国 | 审计, 企业管理咨询, 财务咨询, 风险管理, 税务服务及行业洞察 12、Precisely Everywhere-comscore的互联网行业报告 13、Ericsson - A world of communication(Global移动行业报告)