ROST新浪微博数据抓取工具使用手册(C#版)本软件由武汉大学信息管理学院和计算机学院教授沈阳老师团队研发。由洪婧倞编码,官林辉整理。
微博:https://www.doczj.com/doc/7714050431.html,/rost@武大沈阳
团队网站:https://www.doczj.com/doc/7714050431.html,
博客:https://www.doczj.com/doc/7714050431.html,/whusoft
新闻:团队新闻
如果电脑上没有安装.NET Framework 3.5,(下载地址:https://www.doczj.com/doc/7714050431.html,/soft/21819.html)则需要首先安装此软件!
总体介绍:主要有单个关键词和批量关键词两种抓取模式,另外,可以设置翻页抓取及导出当前页内容功能。
系统主界面:
如果没有注册或登录新浪微博,则会出现如下界面,在下面的界面上可以进行新浪微博注册和直接登录!
登录之后,就进入个人首页!此时,可以把它当做浏览器,进行发微博,转发,评论.....
一、单个关键词翻页抓取
如:首先,在搜索框里输入“杨幂”,进行搜索;然后,设置翻页页数,并点击"单个翻页抓取",程序开始翻页抓取数据;最后,等弹出一个提示框,说明数据抓取完毕并保存在Data 文件夹!注意:如果是抓取自己的首页,必须翻到第二页开始,程序才可以自动翻页抓取!
二、批量关键词翻页抓取
首先,点击"批量翻页抓取",会弹出一个对话框,选择之前输入关键词并保存好的文本文档,如下:
然后,程序开始自动对文本文档中的文档进行翻页抓取;最后,弹出一个提示框,说明数据抓取完毕并保存在BatchData文件夹!免费版暂不提供批量数据抓取功能。
按钮作用简要介绍
1.点击“导出当前页内容”按钮,系统将当前页内容保存在Data文件夹!
2.点击“转到网址”按钮,系统自动跳转到文本框输入的网址的网页!
3.点击“从当前页开始翻页”按钮,系统从当前页翻到下一页!
4.对翻页页数进行设置,结合“单个翻页抓取”或“批量翻页抓取”按钮,系统将自动对搜索词进行翻页抓取并保存!
5.点击“停止翻页”按钮,系统则终止自动翻页功能!
6.点击“打开结果存放目录”按钮,将跳转到数据存放的地方!