亿级用户下的新浪微博平台架构
- 格式:pdf
- 大小:843.50 KB
- 文档页数:22
新浪微博用户等级体系分析,用户可以通过访问这个页面,查看自己的等级,并了解等级升级规则。
笔者拿自己的一个帐号观察发现当前等级已经是LV6,而不是LV0/1。
说明这个前两年等级计算可能之前就已经存在,一直在后台计算数据,只是从未向用户演示过而已。
通过上面截图,我们可以得到,微博等级包含以下几个表现形式:1.当前等级2.活跃天数3.等级计算规则4.升级剩余天数,可以在页面中看到每个等级level对应的基本逐渐活跃天数需要,还可以看到非常活跃天数的累积规则:可以看到活跃平均值的看到获得有三种方式:1.登录后在线时长2.发表微博奖励3.连续登录奖励好吧,这里暂且成长是否参考了其他公司或产品的用户等级激励不谈体系,但是从这里的计算规则来看,这里还是费了一番心思的——在提高用户活跃度上有很多思考和动作。
那么现在新浪微博上是否只有这一种用户激励成长体系呢?下面就确知的几种激励,做一个简单的梳理。
1.V认证用户:新浪微博在最早推出的时候,就拥有了V认证用户,一度,那个黄色的小V让无数人竟折腰。
在某种场合,加V用户自夸俨然是一种炫耀的资本,尤其是一些小有名气又不太知名权威人士的社会人士,一度将微博作为提升自身形象和知名度的一个重要途径。
因为加V代表着身份,代表着话语权,代表着是少数的人则,代表着“精英”身份……但最近和老朋友聊天,已经有很多朋友陆续说加V已经不值钱了,甚至有的想去V。
记得最早听说加V的条件是——500总和人以上公司总监级别人士才可以凭借身份证明重要信息加V认证。
但是目前仍然经常看到以下某某公司销售、某某公司运维字样的认证某时描述,此时笔者当更愿意相信加V认证已经变成一种很贴近草根的注重用户激励方式。
2.微博达人:这应该是最早面向草根的用户激励草根体系吧,根据官方显示的能够帮助资料,达人只需顾及一定条件如:绑定手机、真实头像、粉丝数达到100等即可申请。
而且具有完整的系数和升级规则——但貌似这一规则没有在网站上公示,我们只找到以下一段手写:“达人积分是根据作为微博达人在微博上的活跃度(登陆、发原创微博、评论)和社区产品活跃度(微群、活动)的使用情况和积分规则,系统自动统计计算出来的,可以在对个人微博首页(我的微博)页面查询,达为也可以在微博达人首页查询“。
微博:“平台化”新浪
作者:
来源:《商界评论》2011年第10期
瓶颈:新浪网商业模式趋于老化,渐变为互联网里的传统企业。
新引擎:新浪微博。
现状:两年时间,140个字,改变了中国4.8亿网民获取信息的方式,新浪的下一个增长点。
新浪在产品创新方面已经沉寂了许久,甚至整个新浪网都趋于传统、没落。
一个微博,将中场休息的新浪再次推到前台。
2009年8月28日,新浪微博上线内测,名人效应、热点事件,新浪微博一炮而红,成为互联网界、媒体传播界的新宠儿。
它是一个社交工具、也是一个媒介、又是一个舆论监督利器,大众、明星、企业、政府,皆能在此平台上找到自己想要的价值。
新浪微博获得的成功,来自于新浪自我转型的动因。
在微博项目上,新浪赌得很大,精锐尽出。
初期,微博产品由新浪三大部门联合研发运营,彭少滨领导的桌面事业部负责协调研发,王刚飞领导的无线部门负责手机端,总编辑陈彤领导的运营部负责产品运营,三大核心产品部门并肩作战。
新浪对微博的定位有三个功能:媒体功能、社区功能、开放平台功能。
网民接触新浪微博首先是因为它的媒体功能,社区功能是媒体功能的升级,开放平台功能则是新浪盈利模式发展的方向。
新浪开放平台主要围绕新浪微博的数据开放展开,包括广大用户的状态更新信息、好友关系数据,以及用户本身。
自2010年年初新浪微博推出API开放平台至今,新浪开放平台已经拥有超过800款的应用,其中已经有一些比较优秀的应用涌现出来,如街旁、口袋微博客户端。
平台化也是新浪微博探索盈利模式的一种路径,如果平台化成功,将使新浪从媒体公司再度回归互联网。
前段时间关于杜红将接任曹国伟新浪CEO之职的传言四起。
随着今天曹国伟一封CEO来信发出,该传言被证明至少在相当一段时期内不会为真了。
而这封信也表明,新浪前段时间,的确是在进行紧密集中的高层分工与架构调整。
曹国伟表明,这是“新浪多年来第一次根据战略发展的需要进行的架构重建”。
调整的总体思路是,新浪拆为门户板块与微博板块,门户板块由杜红负责(这可能就是杜红将任新浪CEO传言的由来),微博板块由曹国伟负责,王高飞任总经理。
For personal use only in study and research; not for commercial use可以说,杜红接管了老新浪。
这个动作,可以被看作是新浪加大微博与门户、移动与传统互联网的切分力度,也可以看作是对微博商业化更决绝的尝试。
此前,微博商业化的一个难题就是微博广告客户很大程度是由门户客户迁移过来,这实际上不利于微博广告产品与客户系统的独立进化,对新浪来说,也像是左手倒右手的无谓游戏。
可以想见,经此切分后,明年新浪营销体系会经受不小的调整与重新磨合。
另外一个亮点是,重建后,新浪新设了独立的产品创新部门,负责创新产品项目的孵化,由公司副总裁彭少彬负责。
另外新浪现在才提出明年将“移动优先”的战略,似乎真心晚了点?以下为曹国伟信的全文:各位同事,2012年即将结束,新的财年马上就要开始,感谢大家在过去一年里的辛勤工作,也借此机会跟大家分享一下公司2013年的战略思考和相关业务和组织架构的调整。
在2012年,我们取得了不少成绩,但也有不小的遗憾。
无论是门户还是微博,无论在移动端还是PC端,我们的用户和流量都在进一步增长,而移动端的增长尤为显著。
微博商业化也有了一个良好的开端。
回顾2012年,移动互联网的发展势头异常迅猛,而围绕移动互联网的产品和模式的创新与迭代正在迅速地改变互联网的竞争格局。
我们原来从PC向移动延伸的业务架构以及按职能线划分的组织架构无论在战略布局还是在执行效率上已经很难适应移动时代的市场竞争。
揭秘国内四大门户网站主流微博的运营之道2010年11月29日07:37 来源:北京商报刘妮丽2010年,中国互联网从博客时代正式进入了微博时代,传统门户网站一股脑儿投奔微博怀抱。
就连已经关闭的饭否也获得了“重生”。
微博已不仅仅是一种新兴媒体,它可以做成一个网游、邮箱、音乐、搜索、相册等产品线的整合平台,每个网站必须具备一些不可复制的或者门槛较高的方法或技术,才能在即将到来的微博大浪中扬帆起航!新浪微博:媒体效应用户超5000万分成三七开从微博上线之日起,新浪就成立了专门的团队负责微博运营,如今,这一团队已经发展成为微博产品事业部,全面负责微博产品的开发、运营及规划。
虽然四大门户均已开发了微博产品,但其中作为独立事业部运作的仅新浪一家。
新浪副总裁、微博事业部总经理彭少彬表示,以微博平台为核心,新浪微博可以提供应用、连接、分享三个层面的合作模式。
与苹果的AppStore、优酷等合作,极大地提升了用户黏性和品牌曝光度。
与新浪博客共享计划相比,新浪微博将会提供更加多元化的广告模式。
在这个广告服务平台上,广告主和开发者可以进行双向选择,并实现自主竞价。
在应用增值服务方面,随着用户数的爆发式增长,无论是企业用户还是个人用户,都会产生对收费服务的需求,这就为开发者通过应用增值服务获得收入创造了更广阔的空间。
此前,在互联网市场,一旦牵涉到平台应用增值服务的分成,平台基本都会占据主导地位。
但彭少彬透露,目前新浪微博用户已超5000万,开发者在新浪微博平台上开发的应用增值服务,新浪微博平台与开发者将采用3:7的分成比例,把应用增值服务的大部分收入给开发者,更大限度地保护开发者利益。
搜狐微博:明星效应名人战略投入不封顶搜狐相关媒介负责人林涛表示,“作为Web2.0的最新产品,微博的战略地位已被搜狐提升到最高级别”。
张朝阳更是表示,将亲自来抓微博的发展,对其“进行不封顶的投入,名人战略必须得走”。
此前,张朝阳在不同场合多次阐述对微博发展趋势的看法,“目前微博还仅仅在特定圈子中比较风靡,而未来微博肯定是面向大众的。
大型互联网公司新浪微博技术架构分析与设计新浪微博,作为当今国内最大的基于社交媒体之一,我们就不用在这赘述了。
今天我站在架构的角度上,从技术跟设计方面给大家通俗的讲一下,如果不对,请指出,我本是事实的角度,一定回承认,改正,谢谢。
12月31日跨年夜,网友再次刷新微博发送峰值。
根据微博方面的数据,2016年第一分钟,微博用户共发出883536条微博,超过去年同期。
跨年期间,相关微博互动量达1.38亿,2947万用户发布4414万条微博,整体阅读量达到106亿。
微博推出的#哈喽2016#新年许愿活动,两天里收集了166万多条网友的新年愿望,阅读量超过3亿。
如此巨大的用户规模和业务量,需要高可用(HA)、高并发访问、低延时的强大后台系统支撑。
微博平台第一代架构为LAMP架构,数据库使用的MyIsam,后台用的php,缓存为Memcache。
随着应用规模的增长,衍生出的第二代架构对业务功能模块化、服务化、组件化,后台系统从php替换为Java,逐渐形成面向服务的SOA架构(面向服务的架构),在很长一段时间支撑微博平台业务发展。
SOA架构在此基础上又经过长时间的重构、线上运行、思索与沉淀,平台形成了第三代架构体系。
我们先看一张微博的核心业务图(如下),是不是非常复杂,但这已经是一个简化的不能再简化的业务图啦,第三代技术体系就是为了保障在微博核心业务上快速、高效、可靠的发布新产品新功能。
新浪微博心业务图第三代技术体系微博平台的第三代技术体系,使用正交分解法建立模型,在水平方向,采用典型的三级分层模型,即接口层、服务层与资源层,在垂直方向,进一步细分为业务架构、技术架构、监控平台与服务治理平台,接着看一下平台的整体架构图。
第三代技术体系正交分解法将整个图分解为3*4=12个区域,每一个区域代表一个水平维度与一个垂直维度的交点,相应的定义这个区域的核心功能点,比如区域5主要完成服务层的技术架构,下面详细介绍水平方向与垂直方向的设计原则,尤其重点介绍4、5、6中的技术组件及其在整个架构体系中的作用。
QQ空间基本情况◆QQ空间(/)是腾讯公司提供的社区服务之一。
QQ空间创建于2005年5月,依附于腾讯网和即时通讯工具QQ,属于附属型综合社区,表现为SNS形式,作为腾讯最重要的社区服务之一,它不但可以满足用户自我展示、社交、互动交友等多方面的需求,而且还可以让QQ 用户的人际关系变得更多元,从而形成一个社会化的网络。
◆2009年2月,QQ空间的月登陆帐户数突破2亿,QQ空间成为空间社区类网站的霸主,遥遥领先校内网、百度空间、网易博客、新浪博客。
11.4.2 商业模式战略目标腾讯QQ空间推出的目的就是为了满足用户群体交流和资源共享方面的需求,目前,QQ空间(Qzone)已成为中国最大的个人空间,并与访问量极大的论坛、聊天室、QQ群相互协同。
目标用户◆QQ空间用户年龄主要为18-30岁;男性用户多于女性;◆用户主要是装扮、日志、相册、音乐盒、朋友互动;◆主要是学生、都市白领、名人和企业,目前QQ空间的主体会员是高校学生和都市白领。
赢利模式◆社区广告◆QQ品牌空间◆个人收费核心能力QQ空间的核心能力就是其开辟了“即时通讯+社区互联网社区发展模式”。
经营模式◆开发SOSO网,服务QQ空间社区◆与网上行合作,开展QQzone营销◆升级QQ空间,进军在线时尚生活11.4.4 管理模式组织结构◆腾讯集团设有首席执行官、首席战略投资官、首席技术官、首席运营官、首席财务官等高级管理职位,同时下设国际业务部、增值开发部、互动娱乐事业部、即时通信产品部、互联网事业部、电信事业部、移动通信部等管理部门企业管制◆腾讯集团设有单一的董事会,董事会授权首席执行官负责腾讯集团的日常业务,董事会成立审核委员会、薪酬委员会、投资委员会三个小组委员会。
腾讯集团引进内部控制制度让管理人员及董事会能确保本集团的财务状况、保障资产(包括信息)及遵照监管规定。
内部及外聘核数师负责监察内部控制制度的运作,并向管理人员及审核委员会提供意见。
◆腾讯集团设有单一的董事会,董事会授权首席执行官负责腾讯集团的日常业务,董事会成立审核委员会、薪酬委员会、投资委员会三个小组委员会。
竭诚为您提供优质文档/双击可除微博市场调查报告篇一:新浪微博发展现状的调查报告关于新浪微博发展现状的调查一、关于微博(一)微博的定义微博,即微博客(microblog)的简称,是一个基于用户关系的信息分享、传播以及获取平台,用户可以通过web、wAp以及各种客户端组建个人社区,以140字左右的文字更新信息,并实现即时分享。
最早也是最著名的微博是美国的twitter,根据相关公开数据,截至20XX年1月份,该产品在全球已经拥有7500万注册用户。
20XX年8月份中国最大的门户网站新浪网推出“新浪微博”内测版,成为门户网站中第一家提供微博服务的网站,微博正式进入中文上网主流人群视野。
(二)我国微博的发展20XX年5月,饭否网成立,这是中国国内第一家微博的网站。
此后,叽歪、做啥网、腾讯“滔滔”、嘀咕等微博网站如雨后春笋般大量涌现。
20XX年8月,新浪微博开始内测。
20XX年1月,网易和搜狐微博几乎同时进行公测和内侧。
几天后,人民网的微博平台在改进后上线,胡锦涛的微博一度引发了关注狂潮,20XX年被称为中国的微博元年。
有研究报告称,中国的微博登记用户已经从20XX年的800万增加到20XX年的7500万,这一数字预计到20XX年将增加到2.4亿。
二、关于新浪微博(一)新浪微博在国内的领先地位据DccI20XX年度中国互联网微博与社区的调查显示,经过一年时间的发展,新浪微博在知名度、使用率、首选率、满意度、用户粘性、权威性、吸引力、月度覆盖人数、月度总访问次数、月度总浏览时间十项指标上全部位列第一。
1.知名度与首选率根据DccI的调查结果,59.79%的微博关注者听说过新浪微博,在国内市场知名度最高。
微博用户以及潜在用户使用的首选微博网站中,新浪微博以69.7%领先于其他主流微博网站,是首选率最高的微博网站。
2.使用率与满意度目前,60.9%的微博用户使用过新浪微博,是用户使用率最高的主流微博产品。
在满意度方面,新浪微博也明显强于其他产品。
在2010年的QCon北京大会上,InfoQ的编辑对杨卫华进行了采访,其中谈到了关于新浪微博系统平台应对各种问题的解决方案,以及正在开发中的新浪云。
杨卫华,新浪产品部技术经理,目前工作以新浪微博技术平台为主,曾负责过新浪IM等通讯服务端架构设计。
对互联网后端技术,分布式,网络编程,XMPP即时通讯等领域感兴趣。
曾组织多次广州及珠三角技术沙龙活动。
个人blog 为:/。
InfoQ:大家都知道,在美国有一个非常有名的信息分享平台叫做Twitter,而在中国,我们也有同样的方式,就是现在非常流行的新浪微博,它还有个非常温馨的名字,叫做围脖。
而新浪微博的架构就是杨卫华先生主持开发的。
今天我有幸采访到杨卫华先生,让他来给大家谈一谈,在新浪微博的技术架构方面,他们是如何为用户提供更好的性能、更好的服务的。
卫华先生你好,我的第一个问题是,在新浪微博上有很多名人,名人的微博一般都是非常热的,对它们的访问量也特别高,那么对于这些微博,您采用了什么样的方式来支持这种大数据量的访问呢?杨卫华(以下简称卫华):对于这个问题,我们做过专门的分析。
因为最近新浪微博有名人扎堆的现象,我们根据这个现象,从以下几个角度来进行解决。
首先根据中国的网络现状,比如说网通和电信,之间的网络访问速度会比较慢,我们考虑让用户能够访问就近的服务器,这样使用体验、速度都能达到要求。
我们根据新浪以往的经验,在全国部署了大量服务器,这样就为微博提供了硬件上的保证。
第二个方面,在程序优化的方面,在产品上线之前,我们进行了全方面的压力测试,如果系统在某个方面可能会出现瓶颈,比如名人的访问量比较高的话,我们就从那个角度去优化。
比如说Cache是否够用,数据库访问是不是瓶颈,这方面我们预先都有对压力的估计,然后会针对那些方面去做优化。
第三个方面,对于那些静态资源,比如图片、视频、JS脚本,我们有专业的CDN 来解决的,这样就能够保证全国的用户在访问新浪微博时都能够得到比较好的体验。
新浪微博是如何实现盈利的新浪微博是如何实现盈利的从2011年年初的80美元一路攀升至当年4月的135美元,之后一路下跌至50美元——新浪微博的发展是影响新浪股价的最重要因素。
微博,曾经让新浪这家老牌门户网站看到了重生的曙光,坚实的用户基础和活跃度也为资本市场提供了充分的想象空间。
在问世三年之后,背负着沉重业绩压力的新浪来到了一个尴尬的节点:用户增长速度持续下降,第二季度运营利润仅20万美元,同比下降98%。
前有业绩压力,后有对手紧逼。
新浪微博,如何赚钱?如何赚钱?新浪是一家缺钱的公司。
与其他3家门户网站不同,新浪长久以来的主要收入来源仅有广告业务。
而网易有网络游戏,搜狐有搜索、输入法等业务集群,这些产品均能带来大量利润,腾讯则依靠QQ,成为了全球最赚钱的互联网公司。
庞大的流量就像一座难以开采的“金矿”,最短平快的赢利方式仍是新浪最擅长的赚钱方法——广告。
新浪微博也致力于吸引更多广告客户。
在最新的微博V5版本发布之后,新浪又出台了一种新型的广告方式,商业账户可以在粉丝时间线中置顶微博,以保证广告信息被用户看到。
这个模式是新浪微博从Twitter(推特)上借鉴过来的,虽然有利于广告客户,却牺牲了一定的用户体验。
新浪已经意识到了自己面临的赢利难题,在2011年年报的风险提示中新浪称:“如果我们的货币化努力不成功,对新浪微博的投资将会明显降低我们的赢利能力。
”前车之鉴是新浪博客,这款人气产品曾经也为新浪带来大量流量,但并未给带来任何实际收益。
但新浪没有别的选择。
2011年,新浪已经为微博砸下1.1亿~1.2亿美元的投入。
随着用户数量持续增长,新浪还在不断增加基础架构、网络设备等投入,预计今年的投入将超过1.6亿美元。
这些投入并未给新浪带来想象中的利润,新浪仍未摆脱3年前只依靠广告收入的困境,新浪二季度财报首次公布了微博营业收入的数据,其中微博广告收入为1000万美元,占新浪集团广告收入的10%。
据曹国伟在财报会议上介绍,新浪微博的80家广告客户,其中75%~80%都是原有客户,即在门户和微博都有投放,这意味着微博的新广告客户实际上只有15家。
千万级规模高性能、高并发的网络架构经验分享本文通过介绍新浪微博的平台架构以及核心技术难点,对于大型网站的发展历程提出一系列理论和实际相结合的经验总结。
主要介绍:1.架构以及我理解中架构的本质;2.新浪微博整体架构是什么样的;3.在大型网站的系统架构是如何演变的;4.微博的技术挑战和正交分解法解析架构;5.微博多级双机房缓存架构;6.分布式服务追踪系统;7.总结。
在开始谈我对架构本质的理解之前,先谈谈个人对千万级规模的网站的理解,对这个数量级我们战略上要藐视视,战术上要重视。
先举个例子感受一下千万级到底是什么数量级?现在很流行的优步(Uber),从媒体公布的信息看,它每天接单量平均在百万左右, 假如每天有10个小时的服务时间,平均QPS只有30左右。
对于一个后台服务器,单机的平均QPS可以到达800-1000,单独看写的业务量很简单 。
为什么我们又不能说轻视它?第一,我们看它的数据存储,每天一百万的话,一年数据量的规模是多少?其次,刚才说的订单量,每一个订单要推送给附近的司机、司机要并发抢单,后面业务场景的访问量往往是前者的上百倍,轻松就超过上亿级别了。
我想从架构的本质谈起,希望大家理解在做架构设计的时候,从什么出发点开始,解决的什么样的问题。
架构,刚开始的解释是我从知乎上看到的。
什么是架构?有人讲,说架构并不是一个很悬乎的东西,实际上就是一个架子,放一些业务和算法,跟我们的生活中的晾衣架很像。
更抽象一点,说架构其实是对我们重复性业务的抽象和我们未来业务拓展的前瞻,强调过去的经验和你对整个行业的预见。
我们要想做一个架构的话需要哪些能力?我觉得架构师一个最重要的能力就是你要有战略分解能力。
这个怎么来看呢,第一,你必须要有抽象的能力,抽象的能力最基本就是去重,去重在整个架构中体现在方方面面,从定义一个函数,到定义一个类,到提供的一个服务,以及模板,背后都是要去重提高可复用率。
第二,分类能力。
做软件需要做对象的解耦,要定义对象的属性和方法,做分布式系统的时候要做服务的拆分和模块化,要定义服务的接口和规范。
新浪微博单独上路业务架构调整来源: 一财网发布时间:2013-01-11 名噪一时的新浪MBO,现在看来只是一场财务游戏。
要想微博获得更大成功,曹国伟要做的事太多了。
留给曹国伟的时间已经越来越紧迫了。
2012年快结束时,所有新浪员工都收到了一封这位CEO发出的邮件。
除了新年祝福,他还确认了新浪组织架构的又一次调整。
新浪的业务架构被分为了门户和微博两大部分,曹国伟本人继续担任CEO,但会把更多的精力放在微博业务上—新任新浪微博负责人王高飞将直接向曹国伟汇报;COO杜红则负责新浪门户业务。
王高飞原为新浪无线事业部负责人,在这次调整中,新浪无线事业部被并入了新浪微博事业部。
原新浪微博事业部负责人彭少彬则负责新的产品创新部门。
在这封邮件发出之前,新浪刚刚经历了一次“被换帅”风波,杜红将接替曹国伟的说法一度被传得有板有眼:过去一年,令人眼花缭乱的微博“商业化”的探索没有获得多大起色,新浪的股价已经再次回到了低点,而曹国伟应该对此负责。
这次风波反映出,新浪正错过一次历史上最好的时机。
它是在2009年由曹国伟、杜红等管理层完成MBO(管理层持股 Management buy out)所带来的。
当时,曹国伟等6位高管以1.8亿美元购买了新浪10%的股权,成为第一大股东。
由于新浪在历史上一直处于股权分散的状态,曹国伟的这一举动被人们认为是将新浪带入了一个新的时期。
现在看起来,这个新时期仅仅维持了两年多的时间。
当6位管理人员完成了持股、新浪股价冲上历史最高点时,它也开始了缓慢的回落。
成功MBO之后的管理层,一直在持续抛售自己所拥有的股份。
最近一次的SEC文件显示,由曹国伟本人持有,以及其它5位高管通过曹国伟代持的新浪股份,已经降到了4.8%。
从资本游戏的层面看,这是一次几近完美的行动。
MBO所需资金,多为中信资本、美林证券等机构提供的借款,曹国伟等人借助新浪股价高企的时机让“债主”们套现离场,自己也获得部分好处,或许也无可厚非。
新浪微博架构猜想定时轮询服务端,获得几分钟之后:采用Jsonp的方式STK_*****这些js中的callback的方法是动态生成的进入页面:直接获得html代码,应该是采用了全页面缓存这里面缓存的是页面的feed,不缓存好友数,头像这些,这些还是通过XHR来获得的动态页面部分静态化点击微博:出现的也是通过content cache过的这里面没有显示粉丝数,关注数,以及每个feed的评论、转载数,根据新浪微博架构的描述,这些是动态变化的,如果这个也缓存,用户体验以及准确度都达不到要求,老是变动会失去缓存的意义,所以,这些是通过XHR去服务端请求的,如下图:点击粉丝:点击关注采用的技术和点击微博一样,全页面缓存PS:为什么新浪微博更新(新发表,评论,好友数等),需要手工去点击?因为新浪微博采用了全页面缓存的方式,点击的动作刚好触发去做整个页面缓存。
评论:直接返回的是评论内容的HTML,避免页面渲染轮询feed轮询回来的结果通过STK这个方法,来判断是否有更新,如果都为0,则不更新,否则提示有新的更新,然后让用户点击。
返回的是是否有新的评论,新的feed数,可见服务端肯定保存了我当前获得的那条最新记录数,应该是放在vector cache(feed id list)中,架构:To Push or to pull It’S a question新浪采用了什么技术来实现这个最核心的问题的呢?Feed架构Push:简单,但是当量打的时候,则分发到所有粉丝那边就变得比较麻烦,如小潘同学这种微博控,粉丝数有250w+,他发一条消息,如果采用push,简直就是自虐嘛Pull:存储量少,但是要在线进行计算,比如我有40个关注的对象,那我每次需要把40个人的feed都拿出来,然后根据时间进行排序,而且翻页也有问题,所以基本上纯pull不太靠谱新浪应该是采用复合型的方式,push+pullRead:首先读inbox,然后在获取关注列表,然后读取关注列表中的outbox,最后信息进行聚合,生成新的inbox的vector cache当第一次的时候,inbox的hot cache为空,则从所有关注列表的outbox的vector cache中获得id,然后进行聚合,最后生成一个新的inbox 的hot cacheWrite:每个在线用户生成一个inbox,然后当关注的人发表一条微博的时候,会向这个人的inbox中插入一个id,格式如:feed{1,2,3,4…100},这样可以减少所有用户那边插入数据,又可以减少计算的代价Cache前面的Inbox和outBox和索引比较类似,只存储了feed的id列表Social graph这个就是列表和用户的资料最后一个是内容缓存,比如热门的那些内容放到hotCache中,还有就是全页面缓存以及预热生成json和xml给openAPICache 结构第一部分就是inbox:微博我的首页开始的ID列表,完全是内存里面,但是有一个缺点,我们要添加元素需要先GET再SET第二部分outbox发出微博有存储最新ID在于聚合(key为自己)。
大家下午好,在座的大部分都是技术开发者,技术开发者往往对微博这个产品非常关心。
最晚的一次,是12点多收到一个邮件说想了解一下微博底层是怎么构架的。
很多技术人员对微博的构架非常感兴趣,就是一个明星他有300万粉丝,这个技术怎么来实现?今天在这里跟大家分享一下微博的底层机构,让大家对微博的底层技术有更好的了解。
另外不管是做客户端、1.0、2.0、论坛、博客都要考虑架构的问题,架构实际上是有一些共性的。
今天我通过讲解微博里面的一些架构,分析一下架构里面哪些共性大家可以参考。
首先给大家介绍一下微博架构发展的历程。
新浪微博在短短一年时间内从零发展到五千万用户,我们的基层架构也发展了几个版本。
第一版就是是非常快的,我们可以非常快的实现我们的模块。
我们看一下技术特点,微博这个产品从架构上来分析,它需要解决的是发表和订阅的问题。
我们第一版采用的是推的消息模式,假如说我们一个明星用户他有10万个粉丝,那就是说用户发表一条微博的时候,我们把这个微博消息攒成10万份,这样就是很简单了,第一版的架构实际上就是这两行字。
第一颁的技术细节,典型的LAMP架构,是使用Myisam搜索引擎,它的优点就是速度非常快。
另外一个是MPSS,就是多个端口可以布置在服务器上。
为什么使用MPSS?假如说我们做一个互联网应用,这个应用里面有三个单元,我们可以由三种部署方式。
我们可以把三个单元部署在三台服务器上,另外一种部署模式就是这三个单元部署在每个服务器上都有。
这个解决了两个问题,一个是负载均衡,因为每一个单元都有多个结点处理,另外一个是可以防止单点故障。
如果我们按照模式一来做的话,任何一个结点有故障就会影响我们系统服务,如果模式二的话,任何一个结点发生故障我们的整体都不会受到影响的。
我们微博第一版上线之后,用户非常喜欢这个产品,用户数增长非常迅速。
我们技术上碰到几个问题。
第一个问题是发表会出现延迟现象,尤其是明星用户他的粉丝多。
另外系统处理明星用户发表时候的延迟,可能会影响到其他的用户,因为其他的用户同一时间发表的话,也会受到这个系统的影响。
新浪的组织体系新浪网内容丰富、分类详细,其信息组织体系共有17个大类,1万多个细目和20余万个网站,能为用户提供全面、及时的中文信息内容。
新浪网的信息组织体系具有以下特点:1类目设置比较均衡新浪的每个大类平均下辖二级类目28.2个,其中下辖二级类目最多的为教育就业类,共有二级类目46个;所辖二级类目最少的是个人主页类,共有二级类目巧个。
详见表2。
可见,新浪信息组织体系各大类下所辖二级类目数量比较均衡,如按集中的信息数量分级,各大类的分布也比较平衡。
信息量在l万条以下的有3个大类;1万到10万条之间}的有5个,10万条以上的有8个,见表3(需要指出的是,新浪对“国家与地区”按区域直接划分为31个二级类目,分别对应我国的31个省、市、自治区,但其三级类目按主题划分,因此这里未列出“国家与地区”类所集中的信息数量)。
但是,各大类所集中的信息数量差别却较大。
最大的是社会文化类,信息高达2248274条;最小的是参考资料类,只有信息2200条。
这也是网站分类中普遍存在的问题。
3二级以下类目采用版块化显示方式例如,教育就业类最上面的第一个类块是求职招聘就业方面的内容;第二个类块则是热门的综合教育类;第三个类块是各级各类教育;第四个类块是按学科划分的,分为语言、艺术、音乐、计算机等类;第五个类块是与教育相关的机构和主题概念类;最后一个类块是资源类。
显然,这种按同一分类标准划分类目的集中排列方式比按使用频率和字顺组织划分类目的方式,更能清晰地呈现类目关系。
2.3.4设置了“少儿搜索”特色化栏目在新浪网信息组织体系的17个一级类目后,列举了“少儿搜索”,包括卡通漫画、童话、儿童节、美术、体育、智力游戏、玩具、医院、育儿、少年报、科学普及等内容。
为检索少年儿童方面的网站提供了直接人口,这是新浪网区别于其他网站的一大特色。
新浪网还在详细的二级类目列举页面上方设置了“新浪推荐”栏目, 在每级类目的列举页面右侧设置“热门连接”栏目,并进行了简单的归类,这一也是它不同于Yahoo!中国与搜狐之处,为用户快速进人自己感兴趣的项目提供了直接人口,同时又保持了界面的简洁。