当前位置:文档之家› 新浪微博客户端的设计与实现

新浪微博客户端的设计与实现

新浪微博客户端的设计与实现
新浪微博客户端的设计与实现

新浪微博客户端的设计与实现学院计算机学院

专业

计算机科学与技术(嵌入式系统方向)

班级04010105

学号2010040101170 姓名高志伟

指导教师曹一鹏

负责教师

沈阳航空航天大学

2014年6月

摘要

作为市场占有率第一的新浪微博客户端拥有着广泛的需求。目前一些新浪微博客户端相对比较完善,功能也比较齐全,但基于市场利益考虑,有着不同程度涉及广告的行为,而且界面设计的相对传统,引起很多用户不满。因此,本课题就致力于开发出一款基于Android平台的满足用户使用需求的新浪微博客户端。

为了实现新浪微博客户端,需要申请开发者账号,并且下载新浪微博Android SDK。新浪微博Android SDK为第三方微博应用提供了微博API调用服务,使第三方微博客户端无需了解复杂的验证和API调用过程,就可以实现分享文字或者多媒体信息到新浪微博。

本文阐述了新浪微博客户端的各种相关知识,同时将设计过程中所用到的主要方法及控件进行了详细说明。本应用实现了发表微博、评论微博、转发微博、我的资料、我的关注、我的粉丝、收藏评论等功能,具有较强的实用性;将服务接入微博平台,有助于推广产品,增加应用的流量、拓展新用户,甚至获得收益。

关键词:Android平台;新浪微博Android SDK;微博API调用服务

Sina Micro blogging Client Design and Implementation

Abstract

As the market share of the first Sina micro blogging client has a wide range of needs. At present, some Sina micro blogging client base is relatively sound, function relatively complete, but based on market interest, with varying degrees of behavior involved in advertising, and the interface is relatively conventional design, attracted a lot of user dissatisfaction. Thus, the subject is committed to develop a platform based on Android to meet user needs Sina micro blogging client.

To achieve Sina micro blogging client, application developers need to account, and download Weibo Android SDK. Sina Weibo Android SDK third-party applications to provide API calls micro blogging service, enabling third-party Twitter clients do not need to understand the complex process of verification and API calls, you can achieve shared text or multimedia message to Sina micro blogging.

This paper describes a variety of related knowledge Sina micro blogging client, while the major methods and controls used in the design process is described in detail. This application implements published micro blogging comment micro blogging, micro blogging forwarded my information, my attention, my fans, collectors comments and other features, has a strong practicality. The micro blogging service access platform, helps to promote their products, increase traffic applications, develop new users, and even gain.

Keywords: Android; Sina Weibo Android SDK; Micro blogging API services calls;

目录

1 绪论 (1)

1.1 课题背景 (1)

1.2 微博发展简介 (1)

1.3 Android简介 (3)

1.4 OAuth2.0概述 (4)

1.5 开发平台介绍 (4)

1.6 开发工具eclipse简介 (4)

1.7 开发语言和开发环境 (5)

1.8 课题目标、内容、意义 (5)

1.9 论文结构 (5)

2 系统分析 (7)

2.1 可行性分析 (7)

2.1.1 市场的可行性 (7)

2.1.2 经济的可行性 (7)

2.1.3 技术的可行性 (7)

2.1.4 运行的可行性 (7)

2.2 需求分析 (8)

2.2.1 对功能的规定 (8)

2.2.2 对性能的规定 (10)

2.2.3 对可维护性的规定 (10)

2.2.4 对个性的规定 (10)

2.3 系统规划概述 (10)

3 系统设计 (12)

3.1 系统总体框架 (12)

3.2 功能模块设计 (13)

4 详细设计与编码 (14)

4.1 授权功能模块 (14)

4.1.1 应用启动与授权 (14)

4.2 微博首页模块 (15)

4.3 用户信息模块 (18)

4.4 发送微博模块 (18)

4.4.1 基本功能 (18)

4.4.2 文本输入 (19)

4.4.3 选择图片上传 (19)

4.5 微博详情模块 (20)

4.5.1 评论微博 (20)

4.5.2 转发微博 (21)

4.6 微博评论模块 (21)

4.7 更多设置模块 (22)

5 系统测试 (23)

5.1 测试目标 (23)

5.2 测试流程和结果 (23)

5.2.1 授权登录 (23)

5.2.2 微博首页、个人信息等显示 (24)

5.2.3 微博详情页面显示 (25)

5.2.4 发送微博 (25)

5.2.5 更多设置 (26)

5.3 系统评价 (27)

参考文献 (28)

致谢 (29)

1 绪论

1.1课题背景

一个新的时代的诞生意味着新的理念的产生,而新的理念催生出新的潮流,新的潮流又会给现有的社会带来变革,创新是社会发展的强大动力,能为IT业带来新的活力。摩尔定律的成功运用给IT行业带来的冲击令人措手不及,作为终端设备之中数量级比较大的手机,近年来发展迅速,在改变传统手机形式的同时,不断地创新以创造出更大的市场价值,这也使它成为许多厂商的青睐。IOS在乔布斯的创新理念下的发展势如破竹,Android则另辟蹊径凭着开源的优势占得一席之地,Symbian和Black berry的传统模式被不断侵蚀,Windows Phone的发展举步维艰。手机终端应用种类的不断增加,使其能够实现在PC端的功能时,也深深地改变着PC端的发展。互联网行业,以Facebook为代表的SNS的突然崛起更是为网络的发展带来不小的冲击,而在国内,新浪推陈出新,迎合大众口味,利用网络等多种宣传方式使新浪微博在市场取得先机,被广大网民所推崇,新浪微博的受众较多,有各界名人,政府机构,企业,媒体等,微博的开通使老百姓生活更加丰富多彩,除此之外政府机构开通微博能够使老百姓以更快的速度了解政府决策,以及更方便地参政议政。于是,新浪微博的手机客户端适时出现,新浪微博搭载在使用者众多的Android平台下更有利于它的下载量的增长。由于Android系统的使用者较多,所以它的微博客户端功能比较齐全也更完善,但是为了能够更快地收回成本,所以肯定会有一些广告出现,且界面设计中规中矩不够有新意,这些原因可能会导致一些用户的流失。因此,本课题就应运而生,它致力于开发出一款基于Android平台的新浪微博客户端,使新浪微博客户端更加完善,以增加用户的满意度。

1.2微博发展简介

从2007年中国第一家带有微博色彩的饭否网开张,到2009年,微博这个全新的名词,新浪微博以摧枯拉朽的姿态扫荡世界,打败奥巴马、甲流等等名词,成为全世界最流行的词汇。伴随而来的,是一场微博世界人气的争夺战,大批量的名人被各大网站招揽,各路名人也以微博为平台,在网络世界里聚集人气,同样,新的传播工具也造就了无数的草根英雄,从默默无闻到新的话语传播者,往往只在一夜之间、寥

寥数语。2009年7月中旬开始,国内大批老牌微博产品(饭否、腾讯滔滔等)停止运营,一些新产品开始进入人们的视野,像开放的叽歪,6月份开放的Follow5,7月份开放的9911,8月份开放的新浪微博,其中Follow5在2009年7月19日孙楠大连演唱会上的亮相,是国内第一次将微博引入大型演艺活动,与Twitter当年的发展颇有几分神似。

2010年国内微博迎来春天,微博像雨后春笋般崛起,四大门户网站均开设微博。根据相关公开数据,截至2010年1月份,该产品在全球已经拥有7500万注册用户。

中国互联网络信息中心(CNNIC)于2011年7月19日发布《第28次中国互联网络发展状况统计报告》,报告显示,2011年上半年,中国微博用户从6331万增至1.95亿,增长约2倍。该《报告》指出,中国互联网的普及率增至36.2%,较2010年增加1.9%。

2011年上半年,我国微博用户数量从6331万增至1.95亿,半年增幅高达208.9%。微博在网民中的普及率从13.8%增至40.2%。从2010年底至今,手机微博在网民中的使用率比例从15.5%上升到34%。

2012年1月,据中国互联网络信息中心(CNNIC)报告显示,截至2011年12月底,我国微博用户数达到2.5亿,较上一年底增长了296.0%,网民使用率为48.7%。微博用一年时间发展成为近一半中国网民使用的重要互联网应用。据统计2012年6月我国微博用户已达到3亿之多。

2012年,中国社科文献出版社在北京发布的《新媒体蓝皮书:中国新媒体发展报告(2012)》指出,作为一种新型媒介工具,微博传播对于社会发展有着明显的积极作用,但其负面效应也很显著。而中国微博发展快,用户增长迅速,自然容易滋生一些新的问题。

《新媒体蓝皮书》还指出,中国政府积极开启微博,开启了中国新媒体政治和社会治理新时代。

2013年1月15日,中国互联网络信息中心(CNNIC)在北京发布《第31次中国互联网络发展状况统计报告》。报告显示,截至2012年12月底,我国网民规模达5.64亿,互联网普及率为42.1%。其中微博用户规模在2012年达到3.09亿,较2011年底增长了5873万。微博急速扩张的阶段已经结束,但年增幅仍能达到23.5%。相当一部分用户访问和发送微博的行为发生在手机终端上,截至2012年底手机微博用户规模达到2.02亿,即高达65.6%的微博用户使用手机终端访问微博。

至今,新浪微博用户数已超过5亿,得益于抢占了先机,而且在整体的战略执行上也比较彻底到位,所以获得了地位。仅仅两年时间,新浪微博就为新浪生下了一个价值几十亿美金的‘金蛋’。

而另一个微博巨头腾讯微博,也呈现出发展迅猛的姿态,腾讯拥有近7.5亿的QQ注册用户,3亿左右的活跃用户。这部分人群很容易受潮流趋势的影响,开通腾讯微博。通过腾讯微博能够与QQ好友和腾讯微博上的其他用户进行信息的分享。

另外其作为重要的推广渠道。企业用户通过注册腾讯官方微博,得到认证后,能够迅速的扩大企业的知名度以及提高企业核心竞争力。个人用户通过腾讯微博,也能在微博平台进行个人的推广.很多的社会事件揭露都来自于微博平台。

同时“高校教育平台”也随之建立,如腾讯微博校园频道上的高校新闻哥微博体系的发展,推动了中国教育事业信息化发展的步伐。

1.3Android简介

随着2012年移动互联网时代的全面到来,手机操作系统越来越被我们每一个人所认识。各种操作系统的手机随处可见,在这些操作系统中。Android越来越引起人们的关注和追捧。

Android是一种以Linux为基础的开放源码操作系统,主要使用于便携设备。2005年由Google收购注资,并组建开放手机联盟开发改良,逐渐扩展到平板电脑及其他领域上。到2012年2月份,Android在智能移动设备的市场份额占到15%,每天的Android手机的激活量达到85万部。目前国内外都越来越重视Android系统,如把PC上的常用软件移植到Android系统的供手机用户使用,使得产品在移动互联网上占有更大的市场,增加额外的收入等。目前Android手机平台的应用数量达到450000之多。因此,基于Android手机客户端的微博开发,也是现代互联网时代下催生的人们生活中不可或缺的一个产物。

3G互联网时代下,移动应用越来越多,Android 4.0.3版本已经发布,未来采用Android系统手机越来越多。不仅仅在于手机,在任何移动设备上,都可以采用Android 开发移植到终端设备上,例如电视、冰箱、空调、洗衣机等。将这些设备计入互联网,我们可以通过手机实时知道各个设备的状态,也可以控制它们工作。总之,Android 将带给我们更加智能、便捷、现代的生活。从而,Android应用的开发,将会越来越庞大,需求将会越来越丰富。开发微博手机客户端和其他应用将会越来越普遍,Android

将会越来越壮大。

1.4OAuth

2.0概述

大部分API的访问如发表微博、获取私信,关注都需要用户身份,目前微博开放平台用户身份鉴权有OAuth2.0和Basic Auth(仅用于应用所属开发者调试接口),新版接口也仅支持这两种方式。

OAuth2.0较1.0相比整个授权验证流程更简单更安全,也是未来最主要的用户身份验证和授权方式。

关于OAuth2.0协议授权流程查看OAuth2.0授权流程,其中Client指第三方应用,Resource Owner指用户,Authorization Server是我们的授权服务器,Resource Server 是API服务器。

开发者可以先浏览OAuth2.0的接口文档,熟悉OAuth2的接口及参数的含义,然后我们根据应用场景各自说明如何使用OAuth2.0。

注意事项:

(1) OAuth2.0授权无需申请,任何应用都可以使用。如果开发者需要更长的授权有效期参考本文档授权有效期部分。

(2) 如果你是站外网页应用或客户端应用,出于安全性考虑,需要在平台网站填写redirect_url(授权回调页),才能使用OAuth2.0,填写地址:https://www.doczj.com/doc/8911829116.html,/apps/应用APPKEY/privilege/oauth 对于客户端,我们也提供了默认的回调页地址。详细请查看授权页功能部分。

1.5开发平台介绍

本设计的开发平台是windows xp/7,由于windows系列操作系统做为市场份额最大的PC操作系统,无论是用户数还是基于windows平台应用数都是遥遥领先的。大多数开发者都会选择此平台作为开发平台,而且很多应用在windows 平台提供了的相应的开发工具,如eclipse、QT等。所以本论文采用windows平台作为开发平台。

1.6开发工具eclipse简介

eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,eclipse附带

了一个标准的插件集,包括Java 开发工具(Java Development Kit,JDK)。虽然大多数用户很乐于将eclipse 当作Java 集成开发环境(IDE)来使用,但Eclipse 的目标却不仅限于此。eclipse 还包括插件开发环境(Plug-in Development Environment,PDE),这个组件主要针对希望扩展eclipse 的软件开发人员,因为它允许他们构建与eclipse 环境无缝集成的工具。由于eclipse 中的每样东西都是插件,对于给eclipse 提供插件,以及给用户提供一致和统一的集成开发环境而言,所有工具开发人员都具有同等的发挥场所。

1.7开发语言和开发环境

由于Android上层应用的开发是使用Java语言的。所以,本文开发语言为java。开发Android 项目需要android 开发包(android_sdk_for Windows),所以eclipse装有android开发插件,从而运行Android 模拟器,模拟android智能手机。

1.8课题目标、内容、意义

了解Android应用程序的设计和开发过程行。使用多种组件进行Android 平台新浪微博客户端的开发。本软件是基于Eclipse 的开发环境,依托新浪微博开放平台提供的接口,开发出针对Android平台的新浪微博客户端。

本课题研究的主要内容是熟悉新浪微博Android SDK,使用Java 语言编写,通过新浪微博开放平台提供的接口去创建微博客户端应用。

本课题研究的意义在于使用基于Android系统的新浪微博客户端可以方便的在本系统中使用发微博,评论微博,转发微博,消息提醒,为用户推荐微博等全面的功能。用户可以随时随地的更新自己的微博信息,把看到的、想说的一切都以最快的速度分享给大家。

1.9论文结构

经过这一段时间的学习和努力,基本上可以说完成了设计需求。本文是对毕业设计工作的总结,全文共分六章,内容如下:

第1章绪论概括了开发的背景、意义与发展趋势。

第2章开发平台与开发工具介绍了开发环境及所用开发语言。

第3章系统分析进行了可行性分析、需求分析,以及介绍了系统规划概述。

第4章系统设计介绍系统的总体框架,并且对各个功能模块做了划分和简介。

第5章详细设计与编码针对每个功能模块进行了详细的介绍和设计思想的分析,以及使用方法的介绍和每个模块间的跳转;

第6章系统测试介绍了系统的测试条件、测试流程、测试用例和测试结果。

2 系统分析

2.1可行性分析

2.1.1市场的可行性

一个项目是否有开发的必要,要看这个项目有没有市场或者是潜在的市场,以及开发结果是否能够应对市场的发展变化。有需求才会有市场,有市场才会有开发新技术的必要,市场推动技术的发展进步。有时,即便没有经济实力和技术支持,只有找到合适的市场,依然可以通过找风投等途径来获得资金支持和技术支持的。因此,市场是项目的基础和前提。

本系统是基于移动平台的微博客户端系统,是人们及时了解最新新闻最热话题及朋友交流的重要工具。睡前刷微博,起床前刷微博几乎成为了大多数用户的生活习惯。在微博已经如此受欢迎的前提下,完善它的功能,美化它界面就一定会有市场潜力。

2.1.2经济的可行性

本应用所用的安卓系统是开源的,而且设备仅仅需要虚拟机或者Android手机,因此开发成本比较低,所以开发基于Android移动平台的微博客户端在经济上是可行的。

2.1.3技术的可行性

新浪微博Android平台SDK为第三方微博应用提供了文档易用的微博API调用服务,使第三方客户端无需了解复杂的验证,基于Android系统开发使用Java作为编程语言具有良好的平台移植性和可扩展性,所以在技术上也是可行的。

2.1.4运行的可行性

本应用是基于Android系统手持移动终端,Android系统在智能手机和平板电脑市场拥有较高的市场份额,每个手机厂商为了吸引用户也积极地推出更新版本和硬件配置更高的终端,而本系统对于一般的Android手机硬件配置运行起来都是没有问题的,所以在运行上也是可能的。

2.2需求分析

2.2.1对功能的规定

(1)界面

必须有开始界面(当程序启动的时候显示开始界面,几秒之后跳的登陆界面)。完成下列情况的任一种即可:

仅仅输出信息;

显示一张或一些图片;

设计一些有创意的动画。

(2)登录

使用新浪的接口完成登录;

保存登录信息。

描述:能够保存用户登录信息。

要求:用SharedPreferences存储登录信息;第一次登录的时候从新浪的接口登录,第一次成功登录以后,之后每次都可直接登录无需授权。

(3)主界面

登陆后跳到微博主界面。

○1分类选项菜单

描述:显示分类选项菜单来选择不同的功能模块,完成下列情况的任一种即可:使用TabHost显示不同的标签菜单;

使用系统菜单;

其他有创意的方式。

○2发送微博按钮

描述:提供发送微博信息的按钮,点击后跳到发送页面。

○3显示当前用户名

描述:在主界面上显示当前用户名。

(4)最新的微博信息

显示最新的微博信息。

○1微博列表

描述:以列表的方式逐条显示微博信息。

○2刷新

描述:点击刷新按钮,重新读取最新的微博信息并显示。

○3数量限制

描述:限制每次读取的微博信息数量。

○4更多

描述:列表底部显示更多按钮,点击后获取更多微博信息。

○5保存到本地

描述:要求将每条公共微博信息保存到本地数据库中,在断网的情况下也可以显示读取过的微博信息。

(5)我的资料

显示登录用户的信息。

○1地址

描述:显示登录用户的地址。

○2登录名

描述:显示登录用户的用户名。

○3其他

描述:显示其他信息,完成下列情况:

显示关注的微博数量;

显示本人发表的微博数量;

显示本人的粉丝数量;

显示本人的收藏数量。

(6)设置

描述:可设置一些界面显示参数,完成下列情况的任一种即可。

如字体的大小;

不同的主题背景;

其它更有创意的设计。

2.2.2对性能的规定

本应用在设计方面本着方便、实用及娱乐性高的宗旨,性能方面应遵循如下原则:流畅性:运行应该流畅,不会出现卡机;

美观性:界面应力求美观,赏心悦目;

稳定性:运行过程中不会出现BUG;

资源损耗:设计尽量节约资源;不用的资源应及时回收;

2.2.3对可维护性的规定

对可维护性的最终要求:别人能够轻松上手你的代码。

结构清晰:封装良好;继承关系清晰;代码块清晰;

变量命名规范:变量名应该具有自明性;

注释充分:变量、方法、代码功能块、一些复杂算法等都需要清晰明了地说明。

2.2.4对个性的规定

把项目做出个性出来。下列各项中有和比人不同之处、或很有创意,即可认为有个性。独立设计的软件,一般都会出现一些个性。参考、抄袭不会出现个性。

设计思路:包括软件的整体架构、功能块的设计思路等等;

功能实现:从用户的角度,使用上发现与众不同的地方;

其它方面。

2.3系统规划概述

凡事预则立,不预则废。科学的规划对于任何需要经过较长时间努力才能实现的

事情都是非常重要的。规划,一般是指对较长时期的活动进行总体的、全面的计划。现代社会组织,特别是企业的结构和活动内容都很复杂,应该充分认识这一阶段工作所具有的特点,以提高系统规划工作的科学性和有效性。

(1) 系统规划工作是面向长远的、未来的、全局性和关键性的问题,因此它具有较强的不确定性,非结构化程度较高。

(2) 其工作环境是组织管理环境,高层管理人员是工作的主体。

(3) 系统规划是为整个系统建设,确定目标、战略、系统总体结构方案以及资源计划。因而,整个工作过程是一个管理决策过程。同时,系统规划也是技术与管理相结合的过程,它确定了利用现代信息技术有效的支持管理决策的总体方案。

(4) 系统规划人员对管理与技术环境的理解程度、对管理与技术发展的见识,以及开创精神与务实态度是规划工作的决定因素。

(5) 规划工作的结果是要明确回答规划工作内容中提出的问题,描述出系统的总体概貌和发展进程,为系统的发展制定一个科学而又合理的目标和达到该目标的可行方案,而不是替代后续阶段的工作。

3 系统设计

3.1系统总体框架

在三层结构中,解决了客户机/服务器模式面临的许多问题。通过划分客户与服务器之间的功能,分布式计算提供了一种把应用中的用户界面从企业逻辑中分离出来的自然方法。在分布式环境下,企业逻辑提供了一种把应用中的用户界面从企业逻辑中分离出来的自然方法。在分布式环境下,企业逻辑集中地安装在应用服务器上,这样就降低了客户端的负载,同时对敏感信息的访问也可以得到很好的控制。

采用分布式计算有着多方面的技术优势,包括:

(1) 封装性

(2) 性能

(3) 安全性管理

在分布式计算模式中,由于所有的商业逻辑都驻留在服务器端,信息管理部就可以十分方便地监控服务器的运行情况,很容易地控制访问服务器以及与服务器应用打交道人员的数量。这可以大大简化管理员对系统的管理,减轻系统维护的工作量,并确保系统的可靠运行。

软件设计时,考虑到整个系统的延续性和可扩充性,将系统应用体系分为三部分:用户表现层、数据访问层、商业逻辑层。

(1) 用户表现层:处理用户界面的功能;

(2) 数据访问层:在通常情况下指数据库;

(3) 商业逻辑层:指在程序中做出职能决策的那一部分功能。

微博客户端的功能模块图如图3.1所示。

图3.1功能模块图

3.2功能模块设计

本新浪微博客户端大致分为首页、微博详情、用户信息、发布微博、查看评论等模块,分别负责不同的功能:

(1) 授权模块:访问用户的信息与数据需要经过用户的授权,所以必须有用户授权的模块本软件才能正常使用。

(2) 首页:是用户浏览微博的界面,会将用户所关注的人的微博按照时间先后顺序排列,其中会显示微博的作者、发布时间、内容、转发评论数量、发布方式等。首页是用户使用最多的界面,也是软件初次打开的默认界面。

(3) 微博详情:当用户在首页浏览微博的时候,点击某一条微博就会进入到微博详情的界面,这个界面会更详细的展示用户所点击的那条微博,并且提供转发和评论的功能按钮。

(4) 用户信息:用户信息是展示用户的界面,何以展示用户本身的信息并修改,也可以查看任何用户感兴趣的用户。

(5) 发表微博:用来发布新微博的界面。

(6) 查看评论:用来浏览某一条微博的评论,转发和评论时也会用到这个模块。

(7) 更多设置:包括了字体大小、背景更换和版本信息等功能设置。

4 详细设计与编码

4.1授权功能模块

4.1.1应用启动与授权

当点击应用图标启动后,会有新浪微博的开启界面并且持续3秒;之后将进入新浪官方提供的授权流程。OAuth认证授权分三步,(1) 获取未授权的Request Token;

(2) 获取用户授权的Request Token;(3) 用授权的Request Token换取Access Token。当应用拿到Access Token后,就可以有权访问用户授权的资源了。其中,每步分别请求一个URL,并收到相关信息,拿到上步相关信息去请求接下来的URL直到拿到Access Token。具体每步执行信息如下:(1) 使用者(第三方应用)向OAUTH服务提供商请求未授权的Request Token。向Request Token URL发起请求,请求需要带上参数。(2) OAuth服务提供商同意使用者的请求,并向其颁发未经用户授权的oauth_token与对应的oauth_token_secret,并返回给使用者。(3) 使用者向OAuth服务提供商请求用户授权的Request Token。向User Authorization URL发起请求,请求带上上步拿到的未授权的token与其密钥。(4) OAuth服务提供商将引导用户授权。该过程可能会提示用户,你想将哪些受保护的资源授权给该应用。此步可能会返回授权的Request Token也可能不返回。如Yahoo OAuth就不会返回任何信息给使用者。(5) Request Token 授权后,使用者将向Access Token URL发起请求,将上步授权的Request Token换取成Access Token。(6) OAuth服务提供商同意使用者的请求,并向其颁发Access Token与对应的密钥,并返回给使用者。(7) 使用者以后就可以使用上步返回的Access Token访问用户授权的资源。

从上述步骤来看,用户始终没有将其用户名与密码等信息提供给使用者(第三方软件),从而使得更安全。用OAuth实现背景一节中的典型案例:当服务B(打印服务)要访问用户的服务A(图片服务)时,通过OAuth机制,服务B向服务A请求未经用户授权的Request Token后,服务A将引导用户在服务A的网站上登录,并询问用户是否将图片服务授权给服务B。用户同意后,服务B就可以访问用户在服务A上的图片服务。整个过程服务B没有触及到用户在服务A的帐号信息。本软件使用新浪微博的android SDK来辅助开发,这里面已经集成了一个开源的java OAuth 认证包。授权过程如图4.1所示。

图4.1授权流程图

获取token值成功后,就完成了授权。

4.2微博首页模块

当授权成功后,将运行下面一段代码。这样在manifest文件中注册Activity就会启动。这里用的是隐式启动,Intent中所填的值是manifest文件中首页界面Activity 的Action属性。这样,微博首页就会启动。

Intent intent = new Intent("微博首页Activity的action属性");

AOuthActivity.this.finish();

startActivity(intent);

在新打开的Activity中有一个主要控件ListView,在ListView中的每一个Item 中展示每一条微博信息。

将获得的Access_token值存储到sharedPreference中,这样用户就只需在首次登录时使用授权,以后就可以直接获取数据。

private Oauth2AccessToken mAccessToken;

mAccessToken = AccessTokenKeeper.readAccessToken(上下文);

接着启动了一个bindService去处理和下载各种微博信息和用户信息。本系统将所有的功能操作和耗时操作以及微博回调类都放在Service中完成,通过Handler发消息来通知Mainactivity进行操作,并且利用onServiceConnected传输数据。接下来,将一一介绍这些部分。

新浪微博企业认证申请公函1504901

新浪微博企业认证申请公函1504901 企业用户认证申请公函 企业营业执照登记名称:快商(厦门)软件科技有限公司 企业微博UID地址: (请填写公函上传框下方提示的UID地址) 本企业微博是由企业注册,并由本企业指定员工负责内容维护。(如指定员工发生变化,本企业将提前五个工作日以书面形式通知新浪。) 本企业承诺:本企业合法有效存续,提交给新浪的认证资料真实无误,并承诺遵守新浪网网络安全规定,包括但不限于: 1. 遵守中国有关的法律和法规,不得为任何非法目的而使用网络服务系统。 2. 遵守所有与网络服务有关的网络协议、规定和程序。 3. 不得利用新浪网络服务系统进行任何不利于新浪的行为。 4. 不得利用新浪网络服务系统进行任何可能对互联网的正常运转造成不利影响的行为。 5. 不得利用新浪网络服务系统发布虚假的活动和宣传,承诺所有填写和发布的信息真实。 6. 不得利用新浪网络服务系统传输任何骚扰性的、中伤他人的、辱骂性的、恐吓性的、庸 俗淫秽的或其他任何非法的信息资料。 7. 不得利用新浪网络服务系统传输任何垃圾信息,传销信息或其他任何非法的信息资料。 8. 在未获授权的情况下,不得利用新浪网络服务系统发布受著作权、商标或其它法律保护 的文字、软件、声音、图片、录象、图表等。 9. 如发现任何非法使用用户账号或账号出现安全漏洞的情况,应立即通告新浪。 10. 如用户在使用新浪网络服务时违反任何规定,新浪或及其授权的人有权要求用户改正或

直接采取一切必要的措施(包括但不限于更改或删除用户张贴的内容等、暂停或终止用 户使用网络服务的权利)以减轻用户不当行为造成的影响。 11. 不得将帐号、密码转让或出借予他人使用。如用户发现其帐号遭他人非法使用,应立即 通知新浪。因黑客行为或用户的保管疏忽导致帐号、密码遭他人非法使用,新浪不承担 任何责任。 公章 日期 注意: 1. 所有都为必填项目,请您根据企业实际情况正确填写。 上传的公函应为加盖企业公章的清晰彩色图片。 下面是赠送的合同范本,不需要的可以编辑删除~~~~~~ 教育机构劳动合同范本 为大家整理提供,希望对大家有一定帮助。 一、_________ 培训学校聘请_________ 籍_________ (外文姓名)_________ (中文姓名)先生/女士/小姐为_________ 语教师,双方本着友好合作精神,自愿签订本合同并保证认真履行合同中约定的各项义务。 二、合同期自_________ 年_________ 月_________ 日起_________ 年 _________ 月_________ 日止。 三、受聘方的工作任务(另附件1 ) 四、受聘方的薪金按小时计,全部以人民币支付。 五、社会保险和福利:

微博数据抓取方法详细步骤

https://www.doczj.com/doc/8911829116.html, 微博数据抓取方法详细步骤 很多朋友想要采集微博上面的有用信息,对于繁多的信息量,需要手动的复制,粘贴,修改格式吗?不用这么麻烦!教你一键收集海量数据。 本文介绍使用八爪鱼采集器简易模式采集抓取新浪微博的方法。 需要采集微博内容的,在网页简易模式界面里点击微博进去之后可以看到所有关于微博的规则信息,我们直接使用就可以的。 新浪微博数据抓取步骤1 采集在微博首页进关键词搜索后的信息以及发文者的关注量,粉丝数等(下图所示)即打开微博主页进行登录后输入关键词进行搜索,采集搜索到的内容以及进入发文者页面采集关注量,粉丝数,微博数。

https://www.doczj.com/doc/8911829116.html, 1、找到微博网页-关键词搜索规则然后点击立即使用 新浪微博数据抓取步骤2 2、简易模式中微博网页-关键词搜索的任务界面介绍 查看详情:点开可以看到示例网址 任务名:自定义任务名,默认为微博网页-关键词搜索 任务组:给任务划分一个保存任务的组,如果不设置会有一个默认组用户名:请填写您的微博账号 密码:请填写微博账号的登录密码 关键词/搜索词:用于搜索的关键词,只支持填写一个 翻页次数:设置采集多少页,由于微博会封账号,限制翻页1-50页 将鼠标移动到?号图标和任务名顶部文字均可以查看详细的注释信息。示例数据:这个规则采集的所有字段信息。

https://www.doczj.com/doc/8911829116.html, 新浪微博数据抓取步骤3 3、任务设置示例 例如要采集与十九大相关的微博消息 在设置里如下图所示: 任务名:自定义任务名,也可以不设置按照默认的就行 任务组:自定义任务组,也可以不设置按照默认的就行 用户名:请填写您的微博账号,必填 密码:请填写微博账号的登录密码,必填 关键词/搜索词:用于搜索的关键词,此处填写“十九大” 翻页次数:设置采集多少页,此处设置2页 设置好之后点击保存

新浪微博抓包分析

新浪微博抓包分析 摘要:数据包捕获及分析主要实现了对网络上的数据包进行捕获及分析。在包分析功能模块,根据报文协议的格式,把抓到的包进行解析,从而得到网络层和传输层协议的报头内容等信息。本次研究通过对新浪微博的网络数据包进行捕捉,分析数据包的结构,从而掌握数据包捕获和数据包分析的相关知识。 关键词:包分析;协议;数据包 1序言 本实验研究通过技术手段捕获数据包并加以分析。Ether Peek5.1是当前较为流行的图形用户接口的抓包软件,是一个可以用来监视所有在网络上被传送的包,并分析其内容的程序。它通常被用来检查网络工作情况,或是用来发现网络程序的bugs。通过Ether Peek对TCP、SMTP和FTP等常用协议进行分析,非常有助于网络故障修复、分析以及软件和协议开发。计算机网络安全、信息安全已经成为一个国际性的问题,每年全球因计算机网络的安全问题而造成的经济损失高达数百亿美元,且这个数字正在不断增加。网络数据包的捕获与分析对研究计算机网络安全问题有着重要意义。网络安全问题既包括网络系统的安全,又包括网络信息的安全和机密性。 2抓包工具介绍及抓包原理 2.1工具介绍 目前常用的抓包工具有Sniffer,wireshark,WinNetCap,WinSock Expert,EtherPeek等。本次实验研究是在windows XP系统环境下安装EtherPeek进行抓包。EtherPeek是个用来截取网络数据包的工具,主要用监听统计和捕获数据包两种方式进行网络分析。它只能截取同一HUB的包,也就是说假如你的便携装了EtherPeek,那么你的便携必须与你要监控的目的地址和源地址中的一个接在同一HUB上。有了这个工具,如果5250仿真或telnet仿真出了问题,就可以用它来截取数据包,保存下来,再进行分析。 2.2数据包捕获原理 在通常情况下,网络通信的套接字程序只能响应与自己硬件地址相匹配的或

新浪微博博主信息采集方法以及详细步骤

https://www.doczj.com/doc/8911829116.html, 本文介绍使用八爪鱼7.0采集新浪微博博主信息的方法(以艺术分类为例)采集网站: 使用功能点: ●翻页元素设置 ●列表内容提取 相关采集教程: 新浪微博数据采集 豆瓣电影短评采集 搜狗微信文章采集 步骤1:创建采集任务 1)进入主界面选择,选择自定义模式

https://www.doczj.com/doc/8911829116.html, 微博博主信息采集方法以及详细步骤图1 2)将上面网址的网址复制粘贴到网站输入框中,点击“保存网址” 微博博主信息采集方法以及详细步骤图2

https://www.doczj.com/doc/8911829116.html, 3)保存网址后,页面将在八爪鱼采集器中打开,红色方框中的信息是这次演示要采集的内容 微博博主信息采集方法以及详细步骤图3 步骤2:设置翻页步骤 创建翻页循环,设置翻页元素 1)页面下拉到底部,找到“下一页”按钮,点击选择“循环点击下一页”

https://www.doczj.com/doc/8911829116.html, 微博博主信息采集方法以及详细步骤图4 2)设置翻页步骤:打开流程图,点击“循环翻页”步骤,在右侧点击“自定义” 微博博主信息采集方法以及详细步骤图5 注意:点击右上角的“流程”按钮,即可展现出可视化流程图。

https://www.doczj.com/doc/8911829116.html, 3)如图选择好翻页点击元素的xpath ,点击“确定”,完成翻页步骤的设置 微博博主信息采集方法以及详细步骤图 6 步骤3:采集博主信息 选中需要采集列表中的信息框,创建数据提取列表 1)如图,移动鼠标选中博主信息栏,右键点击,选择“选中子元素” 微博博主信息采集方法以及详细步骤图7

https://www.doczj.com/doc/8911829116.html, 2)然后点击“选中全部” 微博博主信息采集方法以及详细步骤图8 注意:鼠标点击“X”,即可删除不需要字段。 微博博主信息采集方法以及详细步骤图9

新浪微博数据抓取详细教程

https://www.doczj.com/doc/8911829116.html, 新浪微博数据抓取详细教程 本文介绍使用八爪鱼采集器简易模式采集抓取新浪微博的方法。 需要采集微博内容的,在网页简易模式界面里点击微博进去之后可以看到所有关于微博的规则信息,我们直接使用就可以的。 新浪微博数据抓取步骤1 采集在微博首页进关键词搜索后的信息以及发文者的关注量,粉丝数等(下图所示)即打开微博主页进行登录后输入关键词进行搜索,采集搜索到的内容以及进入发文者页面采集关注量,粉丝数,微博数。 1、找到微博网页-关键词搜索规则然后点击立即使用

https://www.doczj.com/doc/8911829116.html, 新浪微博数据抓取步骤2 2、 简易模式中微博网页-关键词搜索的任务界面介绍 查看详情:点开可以看到示例网址 任务名:自定义任务名,默认为微博网页-关键词搜索 任务组:给任务划分一个保存任务的组,如果不设置会有一个默认组 用户名:请填写您的微博账号 密码:请填写微博账号的登录密码 关键词/搜索词:用于搜索的关键词,只支持填写一个 翻页次数: 设置采集多少页,由于微博会封账号,限制翻页1-50页 将鼠标移动到?号图标和任务名顶部文字均可以查看详细的注释信息。 示例数据:这个规则采集的所有字段信息。

https://www.doczj.com/doc/8911829116.html, 新浪微博数据抓取步骤3 3、任务设置示例 例如要采集与十九大相关的微博消息 在设置里如下图所示: 任务名:自定义任务名,也可以不设置按照默认的就行 任务组:自定义任务组,也可以不设置按照默认的就行 用户名:请填写您的微博账号,必填 密码:请填写微博账号的登录密码,必填 关键词/搜索词:用于搜索的关键词,此处填写“十九大” 翻页次数:设置采集多少页,此处设置2页 设置好之后点击保存

新浪微博企业认证申请公函

企业用户认证申请公函 企业营业执照登记名称:快商(厦门)软件科技有限公司 企业微博UID地址:(请填写公函上传框下方提示的UID地址)本企业微博是由企业注册,并由本企业指定员工负责内容维护。(如指定员工发生变化,本企业将提前五个工作日以书面形式通知新浪。) 本企业承诺:本企业合法有效存续,提交给新浪的认证资料真实无误,并承诺遵守新浪网网络安全规定,包括但不限于: 1.遵守中国有关的法律和法规,不得为任何非法目的而使用网络服务系统。 2.遵守所有与网络服务有关的网络协议、规定和程序。 3.不得利用新浪网络服务系统进行任何不利于新浪的行为。 4.不得利用新浪网络服务系统进行任何可能对互联网的正常运转造成不利影响的行为。 5.不得利用新浪网络服务系统发布虚假的活动和宣传,承诺所有填写和发布的信息真实。 6.不得利用新浪网络服务系统传输任何骚扰性的、中伤他人的、辱骂性的、恐吓性的、庸 俗淫秽的或其他任何非法的信息资料。 7.不得利用新浪网络服务系统传输任何垃圾信息,传销信息或其他任何非法的信息资料。 8.在未获授权的情况下,不得利用新浪网络服务系统发布受著作权、商标或其它法律保护 的文字、软件、声音、图片、录象、图表等。 9.如发现任何非法使用用户账号或账号出现安全漏洞的情况,应立即通告新浪。 10.如用户在使用新浪网络服务时违反任何规定,新浪或及其授权的人有权要求用户改正或 直接采取一切必要的措施(包括但不限于更改或删除用户张贴的内容等、暂停或终止用户使用网络服务的权利)以减轻用户不当行为造成的影响。 11.不得将帐号、密码转让或出借予他人使用。如用户发现其帐号遭他人非法使用,应立即 通知新浪。因黑客行为或用户的保管疏忽导致帐号、密码遭他人非法使用,新浪不承担任何责任。 公章 日期 注意: 1.所有都为必填项目,请您根据企业实际情况正确填写。 2.上传的公函应为加盖企业公章的清晰彩色图片。

微博爬虫抓取方法

https://www.doczj.com/doc/8911829116.html, 微博爬虫一天可以抓取多少条数据 微博是一个基于用户关系信息分享、传播以及获取的平台。用户可以通过WEB、WAP等各种客户端组建个人社区,以140字(包括标点符号)的文字更新信息,并实现即时分享。 微博作为一种分享和交流平台,十分更注重时效性和随意性。微博平台上产生了大量的数据。而在数据抓取领域,不同的爬虫工具能够抓取微博数据的效率是质量都是不一样的。 本文以八爪鱼这款爬虫工具为例,具体分析其抓取微博数据的效率和质量。 微博主要有三大类数据 一、博主信息抓取 采集网址:https://www.doczj.com/doc/8911829116.html,/1087030002_2975_2024_0 采集步骤:博主信息抓取步骤比较简单:打开要采集的网址>建立翻页循环(点击下一页)>建立循环列表(直接以博主信息区块建立循环列表)>采集并导出数据。 采集结果:一天(24小时)可采集上百万数据。

https://www.doczj.com/doc/8911829116.html, 微博爬虫一天可以抓取多少条数据图1 具体采集步骤,请参考以下教程:微博大号-艺术类博主信息采集 二、发布的微博抓取 采集网址: 采集步骤:这类数据抓取较为复杂,打开网页(打开某博主的微博主页,经过2次下拉加载,才会出现下一页按钮,因而需对步骤,进行Ajax下拉加载设置)>建立翻页循环(此步骤与打开网页步骤同理,当翻到第二页时,同样需要经过2次下来加载。因而也需要进行Ajax下拉加载设置)>建立循环列表(循环点击每条微博链接,以建立循环列表)>采集

https://www.doczj.com/doc/8911829116.html, 并导出数据(进入每条微博的详情页,采集所需的字段,如:博主ID、微博发布时间、微博来源、微博内容、评论数、转发数、点赞数)。 采集结果:一天(24小时)可采集上万的数据。 微博爬虫一天可以抓取多少条数据图2 具体采集步骤,请参考以下教程:新浪微博-发布的微博采集 三、微博评论采集 采集网址: https://https://www.doczj.com/doc/8911829116.html,/mdabao?is_search=0&visible=0&is_all=1&is_tag=0&profile_fty pe=1&page=1#feedtop 采集步骤:微博评论采集,采集规则也比较复杂。打开要采集的网页(打开某博主的微博主

新浪微博蓝V认证

1.企业认证范围: 1.1.公司帐号:用于企业形象宣传,官方信息发布 1.2. 分支机构帐号:用于企业分支机构、分公司或连锁机构进行宣传,提供本地 服务 1.3.产品帐号:用于主/子产品推广,市场活动及公关(注:产品有商标或软件注 册证) 1.4.招聘帐号:收集求职应聘者信息,招聘企业员工或实习生 1.5.客服帐号:提供业务咨询服务、处理用户投诉建议;维护客户关系 1.6.同一营业执照原则上仅可以申请三个不同用途的企业认证蓝V账号。如需认 证3个以上的官方账号,需满足以下任意一个条件: 1.6.1.拥有多个分支机构的连锁企业 1.6. 2.注册资本超过1000万人民币的大型企业,含多个子品牌及业务线 1.6.3.微博官方合作伙伴 2.企业认证条件: 2.1. 微博头像应为企业商标/标识或品牌Logo 2.2.微博昵称应为企业/品牌的全称或无歧义简称;若昵称为代理品牌,需体现代 理区域 2.3.微博昵称不能仅包含一个通用性描述词语,且不可使用过度修饰性词语 2.4.企业提供完成有效年检的《企业法人营业执照》/《个体工商户营业执照》等 资料 2.5.微博昵称与营业执照登记名称不一致需提供相关补充材料,如《商标注册证》、 《代理授权书》等 3.企业认证资料: 3.1.基本资料: 3.1.1.营业执照副本:已通过最新年检的营业执照副本,并将此副本拍摄成 清晰彩色照片的形式; 3.1.2.加盖了红色公司公章的企业认证公函(公函下载详见认证资料提交页

面),公函内容手抄打印后拍摄成清晰彩色照片的形式; 3.2.补充材料: 3.2.1.自有品牌:商标注册证、软件著作权证等 3.2.2.代理品牌:代理授权书、代理授权合同等 3.2.3.加盟品牌:品牌加盟证 3.2. 4.企业网站/企业网店:网站备案信息、天猫商城的卖家信息或阿里巴巴 供应商信息页的拷屏图片,如下示例图片: 3.2.5.企业实体店:实体店属于企业的文件证明资料,如:餐饮服务许可证等 注:所有非中文资料应提供资料原件及加盖翻译公司公章的彩色版翻译件。 4.认证流程: 4.1.申请准备:准备各项申请材料 4.2.在线提交认证申请:填写企业信息、上传相关认证材料 4.3.微博审核:等待工作人员审核(五个工作日内) 4.4.审核完成: 4.4.1.通过审核,申请帐号可以登录申请认证的微博,在消息--通知中收到 认证通过的通知,同时获得认证标识,自动升级为企业版 4.4.2.未通过审核,申请帐号可以登录申请认证的微博,在消息-通知中查看 未通过审核的原因

微博内容提取

微博内容提取 摘要 随着近年来微博等社交软件的使用人数日益增多,微博的隐私发展也成为人们日益关注的问题,然而由于微博没有固定的格式约束使得在微博的研究过程中有一些无意义的“噪音”的干扰,本文主要是为了完成微博的“噪音”过滤问题,实现一个小软件,来将新浪微博等微博中下载到本地的微博来进行过滤,去除其中的噪音,提取出纯净的页面内容,主要工作包括以下几个方面: (1)字符串的查找函数与分割函数的实现。 (2)多个文件的查找的函数的实现。 (3)固定字符串的即表情“噪音”的过滤实现。 (4)具有一定正则文法的“噪音”的过滤实现。 关键字:中文微博,微博,过滤,噪音,正则

Microblogging content extraction Author: Liudi Tutor: Yangkexin Abstract With recent years the number of micro-blog using social software is increasing, the development of micro-blog privacy has become a growing concern,However, due to the micro blog there is no fixed format constraint makes the interference of some meaningless "noise" in the research process of micro blog. the purpose of this paper is to complete the "noise" micro-blog filtering problem, the realization of a small software, to be used for filtering the download to the Sina micro-blog micro-blog etc., remove the noise, extract the page content is pure, the main work includes the following aspects: (1) the search function and the function of the string segmentation. (2) the implementation of the search function for multiple files (3) the filter of the expression "noise" of the fixed string. (4) the filter of a certain regular grammar "noise" of the fixed string. Keywords: Chinese micro-blog,micro-blog,filtering ,noise ,regular

新浪微博活动策划方法

新浪微博活动策划方法 1、活动策划: a、【活动文案的策划】 活动标题策划,如何策划让用户心动参与的活动?活动标题是关键,直接影响用户活动第一关注印象,在标题策划中,体现活动免费性,如0元赢取、免费之类词。还有就是在标题出现活动的具体奖品实物,如ipad、iphone、项链、手表、U盘,流行度高的产品更为的吸引用户。推荐使用数码内产品,用户的参与度好。 活动主题内容策划和活动规则,活动主题明确,如周年庆典、用户回馈、或借助节假日有吸引力。在活动规则中,一般关注、转发@好友,微博登录官方网站、话题讨论,明确好活动规则,请勿过于繁琐的流程。活动声明未按要求参与者权取消其获奖资格,并采用第三方抽奖平台重新抽取符合规则的参与者。体现活动的公平、公正。 活动话题策划,紧扣时尚热点和新闻热点,尽量贴近用户关注高的话题,植入活动活动传播的主题内容,成为粉丝的热点话题。 活动时间策划:在用户关注度高的节假日,如国庆、情人节、元旦、圣诞节。 b、【活动海报设计】:标语醒目,奖品突出,参与规则。 c、【活动产品准备】: 活动产品预算,活动预算高的朋友可以考虑如iphone、ipad之类,流行度高的产品。预算低的朋友也别灰心,我们从iphone、ipad之类周边产品入手、如乔布斯传、iphone充电器、iphone手机套、ipad键盘。推广不一定是砸金,有技巧的推广一样有不错的效果。当然,也有人说不要一味使用ipad、iphone之类的产品,但是从目前的效应告诉我们这样的产品受用户关注依旧居高不下,而这样的活动产品也屡试不爽。如果企业有自己不错的产品,可以将自己的产品设置为奖品,增加企业品牌宣传。 活动产品的包装,在产品的包装上,尽量精致、更加体现出是一份高档的礼物。 活动产品的受欢迎度,热门时尚的产品是首选,一般选择中性类的产品,不能女性化或者男性化的产品,当然跟推广目标用户群有关,有做女性产品或男性产品的用户可以这样做。推荐使用数码类产品。活动产品的物流配送,选择易配送的产品。 d、【活动效果预估】: 根据自身网站内会员和微博的粉丝数,从日常的活跃度,访问量,粉丝的互动来判断活动效果的预估,最重要的是将活动用户转化为自己的用户。 2、活动预热:

基于微博API的分布式抓取技术

1引言 近年来,社交网络的发展引人注目,参考文献[1]介绍了社交网络的发展现状及趋势。目前,约有一半的中国网民通过社交网络沟通交流、分享信息,社交网络已成为覆盖用户最广、传播影响最大、商业价值最高的Web2.0业务。微博作为一种便捷的媒体交互平台,在全球范围内吸引了数亿用户,已成为人们进行信息交流的重要媒介,用户可以通过微博进行信息记录和交流、娱乐消遣以及社会交往等[2]。 Twitter自2006年由Williams E等人联合推出以来,发展迅猛。Twitter作为一种结合社会化网络和微型博客的新型Web2.0应用形式正风靡国外,其应用涉及商业、新闻教育等社会领域,已成为网络舆论中最具有影响力的一种[3]。 基于微博API的分布式抓取技术 陈舜华1,王晓彤1,郝志峰1,蔡瑞初1,肖晓军2,卢宇2 (1.广东工业大学计算机学院广州510006;2.广州优亿信息科技有限公司广州510630) 摘要:随着微博用户的迅猛增长,越来越多的人希望从用户的行为和微博内容中挖掘有趣的模式。针对如何对微博数据进行有效合理的采集,提出了基于微博API的分布式抓取技术,通过模拟微博登录自动授权,合理控制API的调用频次,结合任务分配控制器高效地获取微博数据。该分布式抓取技术还结合时间触发和内存数据库技术实现重复控制,避免了数据的重复爬取和重复存储,提高了系统的性能。本分布式抓取技术具有可扩展性高、任务分配明确、效率高、多种爬取策略适应不同的爬取需求等特点。新浪微博数据爬取实例验证了该技术的可行性。 关键词:新浪微博;爬取策略;分布式爬取;微博API doi:10.3969/j.issn.1000-0801.2013.08.025 A Distributed Data-Crawling Technology for Microblog API Chen Shunhua1,Wang Xiaotong1,Hao Zhifeng1,Cai Ruichu1,Xiao Xiaojun2,Lu Yu2 (1.School of Computers,Guangdong University of Technology,Guangzhou510006,China; 2.Guangzhou Useease Information Technology Co.,Ltd.,Guangzhou510630,China) Abstract:As more and more users begin to use microblog,people eagerly want to dig interesting patterns from the microblog data.How to efficiently collect data from the service provider is one of the main challenges.To address this issue,a distributed crawling solution based on microblog API was present.The distributed crawling solution simulates microblog login,automatically gets authorized,and control the invoked frequency of the API with a task controller.A time trigger method with memory database was also proposed to avoid extra trivial data duplication and improve efficiency of the system.In the distributed framework,the crawling tasks can be assigned to distributed clients independently,which ensures the high scalability and flexibility of the crawling procedure.The feasibility of the crawler technology according to Sina microblog instance was verified. Key words:Sina microblog,crawling strategy,distributed crawl,microblog API 运营创新论坛 146

iPhone微博客户端产品体验报告

腾讯微博VS 新浪微博 因为本人来腾讯后才开始接触iPhone版的微博,所以,我应该是最典型的小小小白用户了。以下是我开始使用腾讯微博和新浪微博的感受。第一项是最直观的产品体验了,主要介绍一个功能方面。 一、功能点的比较: 1、上传头像: 腾讯微博:进入个人资料页后,点击编辑按钮,选中头像,并设为主头像。在个人资料的顶部是头像区,用户可以有多个备用头像。 (如果之前使用的是网页上的头像,则你的头像将会被覆盖)。 建议:这个头像区不就是为了方便用户直接设置头像吗?为什么不直接点击某个图片后询问用户是否设置为主头像呢。例:

新浪微博:我的资料,然后在编辑,上传头像,操作非常方便,简洁。 2、更改资料 腾讯微博:在pc上,用户可以随意更改昵称等资料,但是在手机上,只能更改头像,个性签名。

新浪微博:只要是个人资料都可以更改,甚至,您的性别。 3、微相册 腾讯微博:微相册就是查看好友所有的图片(位置不清晰),不过新版得到改善。 老版(直接点击下方资料按钮,进入个人资料页是看不到微相册的,只能通过主页进入):

新版:点击个人资料页可以看到微相册。但是,如果是这样,自己看自己的资料,为什么微相册不能对照片进行修改呢,比如增删查?

4、广场 我自己理解广场的意思,就是大家能够在一起谈论的一些话题。 腾讯微博:新版的广场给人感觉很清晰,分类很明确,能够订阅自己喜欢的话题。老版话题频道里面的内容并不一定就是该话题。例: (这跟美食有关系?)

建议:新版话题取消按钮会让人误解为取消订阅。 5、发表微博(定位) 腾讯微博:定位到当前位置,并显示地图。最好,如果能与LBS结合,定位的同时在下方显示有好友在附近。 新浪微博:比较细,显示到有多少人微博在线。发表微博后,能够提示,在您的周边有多少人同时发表了微博。新浪微博有个不好的体验就是发博文和取消博文是在同一个地方,一不小心按两下就直接回到主页面了。这个体验非常不好。

微信文章抓取工具详细使用方法

https://www.doczj.com/doc/8911829116.html, 微信文章抓取工具详细使用方法 如今越来越多的优质内容发布在微信公众号中,面对这些内容,有些朋友就有采集下来的需求,下面为大家介绍使用八爪鱼抓取工具去抓取采集微信文章信息。 抓取的内容包括:微信文章标题、微信文章关键词、微信文章部分内容展示、微信所属公众号、微信文章发布时间、微信文章URL等字段数据。 采集网站:https://www.doczj.com/doc/8911829116.html,/ 步骤1:创建采集任务 1)进入主界面,选择“自定义模式”

https://www.doczj.com/doc/8911829116.html, 微信文章抓取工具详细使用步骤1 2)将要采集的网址URL复制粘贴到网站输入框中,点击“保存网址”

https://www.doczj.com/doc/8911829116.html, 微信文章抓取工具详细使用步骤2 步骤2:创建翻页循环 1)在页面右上角,打开“流程”,以展现出“流程设计器”和“定制当前操作”两个板块。点击页面中的文章搜索框,在右侧的操作提示框中,选择“输入文字”

https://www.doczj.com/doc/8911829116.html, 微信文章抓取工具详细使用步骤3 2)输入要搜索的文章信息,这里以搜索“八爪鱼大数据”为例,输入完成后,点击“确定”按钮 微信文章抓取工具详细使用步骤4

https://www.doczj.com/doc/8911829116.html, 3)“八爪鱼大数据”会自动填充到搜索框,点击“搜文章”按钮,在操作提示框中,选择“点击该按钮” 微信文章抓取工具详细使用步骤5 4)页面中出现了 “八爪鱼大数据”的文章搜索结果。将结果页面下拉到底部,点击“下一页”按钮,在右侧的操作提示框中,选择“循环点击下一页”

https://www.doczj.com/doc/8911829116.html, 微信文章抓取工具详细使用步骤6 步骤3:创建列表循环并提取数据 1)移动鼠标,选中页面里第一篇文章的区块。系统会识别此区块中的子元素,在操作提示框中,选择“选中子元素”

微博推广技巧(实用教程)

微博推广技巧(实用教程) 新媒体推广是这两年互联网最火最有效的方法,很多商家都开始瞄准新媒体营销推广,那新媒体最为典型就是微博,微博以其即时性强、转发性广、传播性快、互动性好而深受大家喜欢。 通过140个字符的内容就可以跟大家交流,讨论话题,传播事件,当您的粉丝超过100个,你就是一本内刊;当您的粉丝超过1000个,你就是个布告栏;当您的粉丝超过1万个,你就是一本杂志;当您的粉丝超过10万个,你就是一份都市报;当您的粉丝超过1亿个,你就是中央电视台了! 那么如何才能做好微博,把微博经营成你的个人品牌营销或是企业营销呢? 一、微博定位: 微博分类:我们知道微博也是有分类的,按内容分类:美食、旅游、体育、新闻、财经、笑话、美女、健康等等!按身分可分为:个人、企业、政府、名人、明星、作家等! 了解了上面的分类,那么你的是什么样的微博?要推广自己的微博,还是企业微博,不要单单只是发表自己的东西,这样显得太单调,久而久之关注的朋友会觉得挺无趣。不要太官方,那样大家就会对你没有兴趣,感觉离的很远不实际!发表一些社会、业界和项目的一些热点问题(比如最近的美韩军演,世界艾滋病日等),虽然我们不是新闻媒体,不能得到第一线的消息,但是我们可以整合别人的消息,来变成我们自己的东西发到微博上去,何尝不是一种提高自己微博关注度的方法。 我自己的微博虽然定义为:都市性感美女。但我是以内容取胜,不然大家只会转发不会评论。提醒大家:无论你怎么定位,都不能超越法律,不可以发表一些不好的言论和低俗的照片! 总之,你要有一个方向,不能有新闻,有体育,有健康,有笑话这样给人感觉不知道你到底是什么方向,也无从关注你。 二、微博粉丝:

知乎回答采集方法

https://www.doczj.com/doc/8911829116.html, 知乎回答采集方法 本文介绍使用八爪鱼采集知乎回答的方法 采集网站:https://https://www.doczj.com/doc/8911829116.html,/question/29727952 规则下载: 使用功能点: ●分页列表信息采集 https://www.doczj.com/doc/8911829116.html,/tutorialdetail-1/fylb-70.html ●AJAX点击和翻页教程 https://www.doczj.com/doc/8911829116.html,/tutorial/ajaxdjfy_7.aspx?t=1 步骤1:创建采集任务 1)进入主界面,选择“自定义模式”

https://www.doczj.com/doc/8911829116.html, 知乎回答采集方法图1 2)将要采集的网址URL复制粘贴到网站输入框中,点击“保存网址”

https://www.doczj.com/doc/8911829116.html, 知乎回答采集方法图2 步骤2:创建翻页循环 1)在页面右上角,打开“流程”,以展现出“流程设计器”和“定制当前操作”两个板块。点击问题,在操作提示框中,选择“采集该元素的文本”

https://www.doczj.com/doc/8911829116.html, 知乎回答采集方法图3 2)将页面下拉到底部,点击“查看更多回答”按钮,在右侧的操作提示框中,选择“更多操作”

https://www.doczj.com/doc/8911829116.html, 知乎回答采集方法图4 选择“循环点击单个按钮”

https://www.doczj.com/doc/8911829116.html, 知乎回答采集方法图5 我们发现,系统自动打开要采集的网页,进入知乎问题回答区。经过一次自动下拉加载,此页面达到最底部,出现“查看更多回答”按钮。因而,我们在执行翻页操作前,需等待网页完全加载出来,即需要设置执行前等待 选中整个“循环翻页”步骤,打开高级选项,设置执行前等待为“3秒”,然后点击 “确定”

网络爬虫开题报告doc

网络爬虫开题报告 篇一:毕设开题报告及开题报告分析 开题报告如何写 注意点 1.一、对指导教师下达的课题任务的学习与理解 这部分主要是阐述做本课题的重要意义 2.二、阅读文献资料进行调研的综述 这部分就是对课题相关的研究的综述落脚于本课题解决了那些关键问题 3.三、根据任务书的任务及文件调研结果,初步拟定执行实施的方案(含具体进度计划) 这部分重点写具体实现的技术路线方案的具体实施方法和步骤了,具体进度计划只是附在后面的东西不是重点南京邮电大学通达学院毕业设计(论文)开题报告文献[5] 基于信息数据分析的微博研究综述[J];研究微博信息数据的分析,在这类研究中,大多数以微博消息传播的三大构件---微博消息、用户、用户关系为研究对象。以微博消息传播和微博成员组织为主要研究内容,目的在于发祥微博中用户、消息传博、热点话题、用户关系网络等的规律。基于微博信息数据分析的研究近年来在国内外都取得了很多成果,掌握了微博中的大量特征。该文献从微博消息传播三大构件的角度,对当前基于信息数据分析的微博研究

进行系统梳理,提出微博信息传播三大构件的概念,归纳了此类研究的主要研究内容及方法。 对于大多用户提出的与主题或领域相关的查询需求,传统的通用搜索引擎往往不能提供令人满意的结果网页。为了克服通用搜索引擎的以上不足,提出了面向主题的聚焦爬虫的研究。文献[6]综述了聚焦爬虫技术的研究。其中介绍并分析了聚焦爬虫中的关键技术:抓取目标定义与描述,网页分析算法和网页分析策略,并根据网络拓扑、网页数据内容、用户行为等方面将各种网页分析算法做了分类和比较。聚焦爬虫能够克服通用爬虫的不足之处。 文献[7]首先介绍了网络爬虫工作原理,传统网络爬虫的实现过程,并对网络爬虫中使用的关键技术进行了研究,包括网页搜索策略、URL去重算法、网页分析技术、更新策略等。然后针对微博的特点和Ajax技术的实现方法,指出传统网络爬虫的不足,以及信息抓取的技术难点,深入分析了现有的基于Ajax的网络爬虫的最新技术——通过模拟浏览器行为,触发JavaScript事件(如click, onmouseover等),解析JavaScript脚本,动态更新网页DOM树,抽取网页中的有效信息。最后,详细论述了面向SNS网络爬虫系统的设计方案,整(转载自:https://www.doczj.com/doc/8911829116.html, 小草范文网:网络爬虫开题报告)体构架,以及各功能模块的具体实现。面向微博的网络爬虫系统的实现是以新浪微博作为抓取的

新浪个人微博运营前期总结

现在玩微博的人越来越多了,很多企业也都以微博进行营销,主要是在于它的传播速度够快,传播范围也够大。而微博营销也必然成为企业营销的一部分。因为随着微博的火热,每一个粉丝都成为了营销对象,利用140字向网友传播企业或者产品的信息,树立良好的企业形象或者产品形象,每天更新内容就可以跟大家交流或者提供大家感兴趣的话题,这样就可以达到营销目的,何乐而不为呢。同样个人微博也一样。下面讲得我自己个人微博的经历,希望对大家有所帮助。 新浪微博运营之细节决定成败 其实,微博其实和网站是一样的,一个微博相当于一个小型网站。名字即网站名称,标签即网站关键词,介绍就是描述,而且现在已经有个性域名了,那就相当于自己的网站地址,还可以设置自己喜欢的背景。因此这些细节问题一定要做好。 首先是定位问题。做事情之前都有一个目标,这将决定着最终的成败。在微博上定位的时候还是建议把品牌考虑进去,就是说做口碑营销,对以后培养有效粉丝有很大的帮助。 然后是名字,定位之后给自己起一个响亮的名字,让别人一看就知道你是做什么内容的。这样他们看了之后紧接着看你的内容怎样才会关注。 最后就是其他资料了,包括:标签、介绍、域名、背景等。大家应该知道关键词在网站中的作用,微博中的标签也是如此,别人在搜索的时候也会通过标签搜索,这样的粉丝就是在找明确的目标,质量很高的。介绍就是让别人更加信任你,一句好的介绍很可能让他立马关注你。个性域名这一块,要注意的就是一旦改好将不能修改,因此要慎重。一个好的背景也是粉丝关注你的关键,因为也许粉丝进入你的微博,从背景可以看你是不是很有品味,另一点就是增加可信度。最后其他资料也要完善,便于别人联系我们增加可信度和互动机会。 新浪微博运营之坚持很重要 任何事情都需要坚持,总之记住,坚持就是胜利。微博运营中前期要坚持的就是粉丝,内容和互动。 一、首先说粉丝。在前期你想自然增加粉丝那肯定是不可能的,除非你是名人。那怎样才能有了粉丝呢?下面给大家介绍几种方法。 1:进出微群 进出微群的意思就是退群加群,大家应该都知道微群中有个板块是欢迎新人。大部分人在微群中会看新人这些,有喜欢的就会关注你,特别是互粉群中,因为他们也想得到粉丝,因此就回先关注你,互粉群更是如此。 那什么时间进出最好呢?通过四个月的实验,大概可以分为这几个时间段早上8点—9点半(人们都刚上班,玩的人多)中午11点半—12点半(快下班和吃饭时间)晚上5点—6点(将要下班时间)。提醒一下:每天退群和进群的次数是有限的,因此要适当分开。 2:互粉

新浪微博App的商业模式及价值链

《移动商务》 标 题 新浪微博App 的商业模式及价值链 学 院 专业班级 学 号 姓 名 任课教师 (2012----2013学年第一学期)

目录 一、新浪微博手机客户端介绍 (1) 二、新浪微博手机客户端优缺点 (1) 1、优点: (1) 1、缺点: (2) 三、新浪微博app的商业模式及价值链 (2) 1、新浪微博App的商业模式 (2) 2、新浪微博App的价值链 (3) 四、总结 (3) 参考文献: (3)

摘要:我国智能手机用户逐年增加,而几乎每个智能手机用户都会使用上网功能。由于现在移动电子商务的迅猛发展,越来越多的app被研发出来。由于这些应用程序充满了娱乐性,时尚性,交流性,因而受到了手机上网用户的广泛关注,各大软件下载平台(如android market,app store等)种类也越发丰富。本文就以新浪微博手机应用程序为例,分析社交类手机应用程序的商业模式及价值链。 关键词:新浪微博商业模式价值链 一、新浪微博手机客户端介绍 新浪微博手机客户端是一款为大众提供娱乐休闲生活服务的信息分享和交流平台。它实现了:轻松更新浏览你关注的好友、娱乐明星、专家发布的最新微博;即时获取国内外热点新闻,网络流行话题,好玩的视频和图片;随时随地分享照片、文字、地点或转发有趣的内容给好友;快捷发布前到微博、查看附近的微博用户和微博内容;通过私信与好友和粉丝进行语音聊天,私密分享图片和地理位置;它主要的功能有:浏览微博、分组查看用户微博、关注用户、分享文字和图片、私信聊天、分享地理位置、查看周边内容、搜索微博和用户、微博收藏、转发评论微博、管理个人资料、多账号登陆、更换主题皮肤。[1] 二、新浪微博手机客户端优缺点 1、优点: ①可以制定个性化的信息源,如感兴趣的资讯、明星等 ②快捷、方便的更新自己的状态,随时随地分享文字、图片和视频,与自己的微博好友和粉丝进行互动 ③可以关注明星,了解关注的明星动态,明星与粉丝之间也可以进行互动 ④即时获取国内外热点新闻 ⑤可以通过微博快速的进行求助 ⑥方便对感兴趣的内容进行评论、转发和收藏 ⑦方便查看附近的微博用户,上传自己的地理位置,进行交友互动 ⑧言论相对自由 ⑨企业可以运用微博进行微博营销

新浪微博企业版Q&A

新浪微博企业版Q&A T o ALL: Q:什么是新浪微博企业版? A:新浪微博企业版具有更丰富的个性化页面展示功能设置,更精准的数据分析服务,以及更高效的沟通管理后台。 Q:新浪微博企业版的新功能有哪些?: A: 1)根据不同的展示传播诉求,在微博首页设置不同的模块,实现更具商业价值的展现, 如:图片、视频、友情链接、企业简介等; 2)可以将不同但相关联的微博用户集中添加到一个模块中,并且设置在首页显示,当 用户到达企业主页时,能同时看到与企业相关的子品牌、分支机构,甚至企业员工、高管和客服的微博头像,并选择关注,进行更有针对性地沟通; 3)用户到达企业微博主页后,通过留言板就可以给企业留言或评论,也可以浏览其他 用户的评论; 4)舆情监测:通过设置话题关键字,可以查看不同用户群体对该话题的讨论,实时监 测微博用户对企业品牌的态度,帮助企业及时发现用户的负面投诉,及时响应,避 免负面口碑扩散; 5)数据统计服务,帮助企业进行用户属性和行为分析,同时可以查看页面流量及短链 点击的相关数据,作为衡量微博传播效果的重要指标。 Q:如何申请加入新浪微博企业版内测? A:感谢您对微博企业版的关注,此次测试暂时还不接受申请哦,不过不要着急,预计不久之后就会开放线上报名申请了,请您持续关注新浪微博企业版,谢谢! Q:如果没有收到邀请,何时能够使用新浪微博企业版? 或者:为什么别的企业有企业版,我没有? A:目前测试只开放部分内部邀请的新浪网合作企业,请您不要着急,线上申请会在近期内开放的。 Q:新浪微博企业版内测多长时间?何时公测? A:预计公测时间为7月份,请您持续关注企业微博助理发出的通告,谢谢! Q:新浪微博企业版会收费么? A:内测及公测期的功能服务全部开放,免费提供给企业使用。我们将分析企业对不同功能的使用情况和效果,同时,持续开展对不同企业差异化需求的调研,未来将规划提供满足细分需求的增值服务。谢谢!

相关主题
文本预览
相关文档 最新文档