解析豆瓣的基础架构
- 格式:pdf
- 大小:348.79 KB
- 文档页数:4
关于豆瓣网的调查分析解密豆瓣运营全过程作者:佚名一、什么是豆瓣?豆瓣网由前某物流咨询公司CTO杨勃于2005年3月创办,启动资金是杨勃几个朋友共计不到20万人民币的天使投资,以独到的书评、影评、乐评主题社区著称,因为开创了国内Web2.0新模式而闻名。
从构想到技术实现均由杨勃一人完成,业内对此有“一个人的豆瓣”的评价。
豆瓣的得名来自于杨勃曾经居住的北京朝阳门附近的豆瓣胡同。
(一)alexa数据1.alexa排名:1699(3月平均)2. 每百万用户登陆数:391(3月平均)3. 单个用户页面浏览量:9.1(3月平均)(二)网站相关数据官方页面数据:1. 成立于2005年3月6日2. 注册成员数:1450443. 城市居民数:22258(注册成员中按城市自主分类者)4. 成立小组数:5981备注:以上具体数据均为2006/4/18页面即时数据。
页面观察数据:1.平均每天增加注册成员900人左右2.平均每天增加城市居民数150人左右3.平均每天增加小组数50个左右4.小组数据:超过1500个小组是10人以上,最多人数小组为“爱看电影”(5537人);60%的小组为5人(含5人)小组,其中1人小组占40%。
备注:以上观察数据均为2006/4/7—2006/4/18时间段内页面观察所得。
从以上数据,豆瓣的用户发展数目比起同级别排名的网站并不算突出;从数据图表可见,它的用户曲线和访问曲线都是比较平缓的,考虑到它的网站性质和经营策略,豆瓣的用户基数和用户上升幅度虽然不高,但目标用户比例较高,用户的流失相对减少。
(三)网站发展状况以下为引用的内容:●2004年9月杨勃为自己的旅行网站制作了商业计划书,并且将这个网站命名为“驴宗”,在论证这个商业计划时朋友的建议让杨勃放弃了“驴宗”,将眼光投到“书”这个更宽广的领域。
●从2004年10月开始开发,经历了5个月,2005年3月6日,杨勃的豆瓣网开张了,并且第一天就有用户注册。
一、豆瓣网的创建及介绍.2005年3月,一家名为豆瓣网的Web2.0网站出现在人们视野,而后如一匹黑马迅速壮大,占据了阅读者、影迷、音乐爱好者以及图书音像商阵营中一个举足轻重的位置。
创建人为杨勃,起初创建之时,杨勃只是为“想看看有多少人和自己读同样的书”而编写了一个简单的程序,并以其工作所在地点——北京“豆瓣胡同”为其命名。
豆瓣网的建立与网络Web2.0技术的兴起和发展有莫大关系。
Web2.0是对Web1.0的信息进行扩展,丰富,使其更加多元化和个性化。
主要的Web2.0的元素有如博客、播客、社区、P2P下载服务等,其特征是资源由多人共同创建,共同分享,豆瓣网正是这样一个Web2.0网站。
信息的共享使豆瓣成为一个以青年知识分子为主要受众群体的书影音信息资料汇集地和评论交流社区。
豆瓣提供了书籍、影片、音乐的评论,但是没有任何不利于版权保护的下载服务,是一家以健康为网站主题之一的Web2.0网站。
截止到2010年底,豆瓣已经有注册用户超过4600万,其中活跃用户数2000万,人均访问停留时间:9.9分钟。
Alexa排名约为全球160已经成为全球为数不多的web 2.0的领头企业。
毋庸置疑,豆瓣已经在某些程度成为中国web 2.0的典型代表,在中国、美国,甚至全球的互联网上,豆瓣都是第一家以算法来推算用户的需求这样的模式存在的网络公司。
二、豆瓣网的功能(一)信息共享平台与其他书评、影评网站不同,豆瓣网的书籍、影视、音乐条目都由用户自行添加补充完整,例如对于影视条目,可以补充同一作品的不同海报和剧照,这充分体现了Web2.0时代的资源共享,充分交互的特性,打破了以往一对多传播的规律,开启多对多传播的方向。
这一方面使信息资源的容量不断扩充丰富,给于更多用户的信息查询获取,另一方面也极大的调动用户的积极性,使之不仅成为信息资源的获益者,更成为主动参与者、创造者,共同推动数据库的更新扩容,推动信息资源的传播共享。
豆瓣运营模式分析豆瓣运营模式与大多数社交网站的运营模式有相似之处。
其运营不像传统的运营,传统企业的运营模式包括行政层面、销售层面、生产层面、技术层面、资金管理层面。
其实豆瓣作为一个以网站为主要生产加工销售平台的一类企业,很明显其行政层面会很简单,其生产层面的事几乎没有,因为其生产为内容生产,而内容的生产又是以用户自主生产为其内容生产机制。
故其网站是用户自行生产产品自行消费产品,这样一来,豆瓣的运营模式中的生产模式全部省略了。
只剩下技术层面、销售层面和资金管理层面的运营。
技术运营豆瓣作为细分的社交网站,其最为突出和核心的技术运营便是豆瓣网用户自行编辑内容形成极具个性的个人中心和丰富的网站分享中心。
豆瓣网集合了web2.0 时代的各项重要技术运用,其中包括社会性网络服务(SNS)、维客(wiki)、聚合内容(RSS)、标签提取(TAG)、博客(BLOG),这些技术让豆瓣的“趣味相投”功能和“个人形象塑造”以及评论导向功能的实现成为可能。
豆瓣上“推测你喜欢”“在哪儿买这本书”“评分点评”最为典型“推测你喜欢”,首先是A人用大家熟悉的博客技术撰写了一篇读书笔记,然后这篇博客人为的或自然而然的因为标签技术即TAG 技术而进行了一定的贴标,然后聚合内容的功能在此基础上进行处理,这时候来了一位B人(想找跟自己趣味相投的A人),于是因为某个标签搜索到A人的博客,于是他又基于豆瓣的TAG和内容聚合功能找到发现了与A兴趣类似的事物和人,即“推测你喜欢”这是第一种推测你喜欢。
于是千千万万的A和B 构成了豆瓣上的趣味圈。
第二种便是你已经标下你所看所想看或者收藏什么的,豆瓣的这些技术会自动找到你可能感兴趣的东西,即是根据你的行为推断的你爱好,这是第二种推测你喜欢。
其实这些技术现在非常的普遍,但是将他们组合的这么完美和符合寻找趣味相投这类需求才是豆瓣成功的关键所在。
并且是将此运营很早的网站。
这样方便快捷的找到用户未曾看过但很符合自己胃口的新事物。
一、前言——豆瓣是什么?豆瓣是一个集评论、blog、交友、书目推荐于一体的社区网络。
由于它秉持“以书会友”目的,定位于一个“发现”网站,所以被形容为“小众文艺网站”。
其内容由用户产生,用户自由发表有关书籍、电影、音乐的评论,搜索他人推荐,所有的内容、分类、筛选、排序都由用户产生和决定。
主要通过用户点击由Google提供的广告,及购买电子商务网站的相关产品回扣,来获得收入。
2005年豆瓣面世,启动资金只有20万,开发者只有杨勃一人。
豆瓣成立3年后团队也只有25人。
但是3年来不仅营利,而且。
这样一个团队是如何打造出看似与他们实力不相等的成绩的呢?二、豆瓣的市场定位——抓住有价值的小众2005年豆瓣以书评网站面目面世。
以书为切入点进入市场,不过是它锁定自己受众的一个手段。
从豆瓣的前期推广中,分析其受众:1.以书为切入点,必要求其受众是读书之人,爱书之人。
这些人的特点是有求知欲,文化素质较高,善于思考,长于语言文字表达,并且习惯于文字表达。
这就为豆瓣高质量的评论的产生打下了良好的基础。
2.因为个人经历、生活环境、成长历练等每个人喜欢的有很大关系。
所有书实为小众文化。
当用户在欣赏期间在豆瓣上找到志趣相投之人,特别是一本冷门读本时,受众心理对交流的渴望急剧提升。
因智慧火花的碰撞,而油然而生的喜悦之情都会归功于豆瓣,萌生对豆瓣的热爱和忠诚。
豆瓣借此满足小众需求,培育以“兴趣”为媒介扩展人脉关系优越条件,从而成功抓住其第一批用户,更为小组产生提供了天然催化剂。
3.豆瓣最初以电子邮件和在《读书》《万象》高端读书类杂志投放广告的方式来向市场推广自己。
如此,它吸收到的用户还善于使用网络获取知识和交际。
豆瓣实际是利用这些拥有并活跃于博客的用户将豆瓣介绍推广出去。
豆瓣成功的市场推广采用的是人际传播方式实现的。
豆瓣网的成长历程可以证明:首先,网友topku在自己的博客上提到了豆瓣网,那代表着用口碑传播开始自发并行;其次,IT评论人洪波在博客上提到豆瓣网,从那以后,豆瓣网开始成为网上的主流话题之一;当网站创始人杨勃听用户说,有朋友在日常谈话里提到了“豆瓣”,口碑传播终于蔓延到线下。
豆瓣网的品牌构筑及其影响摘要品牌识别是品牌战略制定者立志建立或保持的一系列特定的品牌联想,这些联想表达了品牌所代表的价值理念,还表达了组数成员对顾客的承诺。
豆瓣作为第二媒介时代的先驱和典范,其品牌的树立过程尤为值得当下各媒介主体借鉴。
本文探析豆瓣在建立个人品牌过程中是如何实现品牌的个性,以及如何科学处理品牌与顾客的关系并以此发展为盈利模式。
关键词豆瓣;品牌个性;品牌影响豆瓣网自2005年3月正式打标上线截止到2009年4月,网站注册用户数量即将突破300万大关,这个专注于小众文化类产品的评论推荐制网站将原本分散的小众文化标签聚集起来,最终形成一个大众文化氛围;此外,尤为值得一提的是,豆瓣在如今Web2.0这样一个各媒介主体各显神通的时代,成功构建了一个无可比拟的品牌标识,使其有着其他主体不可比拟的用户粘着度和迅猛的资本扩张态势。
作为个人的品牌是品牌识别中一个最为突出的要点,这其中包括品牌个性以及品牌与顾客关系两点,以下我们针就这两点对豆瓣的品牌构建做分类探析。
1 品牌个性1.1品牌理念的个性化——给网众的生产能力赋权豆瓣最鲜明的特点就是用户的自产自消,“它不再局限于‘意义生产’,也不仅局限于目前较受关注的‘用户生产内容’(UGC user-generated content),用户除了制造内容本身以外,还涵盖了生产媒介内容、生产媒介渠道以及生产连接用户的网络或用户身处的社群等诸多方面。
”[1]在此所指的“赋权”是指当下媒体赋予网络受众的操作权利,不仅体现出用户的主体性,也显示出当下ICT[2]发展的一种个性化趋势。
而所谓的“意义生产”,霍尔的编码译码范式是一个典型范式,“编码位于传播者一端,是指将信息转化成便于媒介载送或受众接受的具体符号或代码;译码位于收传者一端,指的是将接收到的符号或代码还原为传播者所传达的原初的那种信息或意义。
”[3]而以豆瓣为典范的Web2.0无疑颠覆了这种用户与媒介之间“给什么要什么”的关系,用户在同媒介接触和使用过程中有了真正的生产行为。
豆瓣网B2C电子商务模式分析———基于SNS网络基础唐和燕(新疆石河子大学 832003)【摘 要】针对豆瓣网的商业模式、技术模式、经营模式、管理模式等方面,进行B2C电子商务模式系统化的分析,总结出了其成功因素与不足,并提出了一系列改进方案。
【关键词】SNS;豆瓣网;B2C;社交网站引言豆瓣是一家Web2.0网站,主要以书评、影评和乐评为特色,吸引了一大批忠实的用户。
这一模式拥有很高的粘性,并逐渐对网民购书、购碟产生影响。
豆瓣主要通过用户点击及购买电子商务网站的相关产品,来获得收入。
截止到2010年底,豆瓣已经有注册用户超过4100万,其中活跃用户数2000万,日均pv3000万,人均访问停留时间:9.9分钟。
alexa排名约为全球160名,已经成为全球为数不多的web 2.0的领头企业。
毋庸置疑,豆瓣已经在某些程度成为中国web 2.0的典型代表,在中国、美国,甚至全球的互联网上,豆瓣都是第一家以算法来推算用户的需求这样的模式存在的网络公司。
豆瓣网的模式特别适合于营销的精确到达。
豆瓣网最重要的收入来源,是和购物网站的合作。
在豆瓣网提供的服务中,产品比价是非常重要的部分。
每次有用户通过豆瓣网上的链接进入当当、卓越这样的大型网上商城购物,双方就会按照事先约定的比例进行利润分成。
同时也和大学生教育培训主流媒体有相关合作。
1.豆瓣网电子商务模式分析1.1商业模式1.1.1战略目标书籍、电影、音乐其实是一个非常普遍的需求,其背后的人群也是非常庞大的,豆瓣网的战略目标是在现有的基础上找到一条合理的路径以吸引更多的用户。
2010年开始主推豆瓣社区,力图从兴趣分享型网站向更接近线下生活的社区转变,并借此拓展更多的商业空间。
1.1.2目标用户以受过高等教育的青年大学生为主。
4000多万豆瓣用户80%以上的用户生活在北京、上海、天津、重庆、广州、成都、武汉、南京、杭州12个一线城市;18~35岁占92.5%,其中25岁以上的占据46%;月收入大于3000元占42.8%;本科以上学历超过70%,研究生以上学历17%。
网站思路豆瓣表面上看去是一个评论(书评、影评、乐评)网站,但实际上它却提供了书目推荐和以共同兴趣交友等多种服务功能,它更像一个集BLOG、交友、小组、收藏于一体的新型社区网络。
在杨勃的眼中,“人”才是最重要的。
如果说门户类网站还是以“物”为第一要素,一些社会类网站则把“人”提到了第一要素,那么,豆瓣,则是第一个把“人”和“物”放在同等重要地位的网站。
随着豆瓣英文版的推出,豆瓣有望成为中国第一家向外输出模式的网站,而实际上,豆瓣自身就是集众家所长的结果。
至于豆瓣究竟借鉴了哪些网站哪些元素呢?据杨勃介绍一共有三个方面。
一是简约素雅的界面风格,来自于flickr,包括它的分享概念;二是电子商务方面,借鉴了亚马逊(Amazon),比如用户评论和推荐;三是社会网络(SNS)的一些元素,把人和人的社会关系真实地搬到网上,不过一般的社会网络是没有媒介的,而豆瓣用相同兴趣作为媒介。
杨勃将豆瓣的核心思想总结为,“可以发现不同的东西,并且适合自己”,他解释说,朋友的推荐往往对购买某种产品非常关键,现在豆瓣扩大了推荐的群体,你会相信特定陌生人的推荐,这“可以理解为一种以书等具体物体为媒介的人脉关系网”。
产品体验豆瓣是100%的动态网站。
呈现给每个注册用户的主页都是各不相同的,而同一个用户在不同时间上豆瓣,也会看到不同的首页。
动态、个性,这都是豆瓣带给用户的web2.0体验。
以目前的豆瓣首页举例,在用户登陆之前,左上方是搜索功能,可以搜索一切豆瓣已有记录的书、电影和唱片,右上方是豆瓣网的使用引导,这两项是固定不变的。
左下方是“近期好评”,是站内评论的提取,显示5条,提取内容包括评论人图像、ID、被评论产品名、评论题目、部分评论内容、评论等级及回应数,根据用户投票是否“有用”而动态调整。
右下方是“过去几分钟里,豆瓣知道”,显示12项最新站内用户对产品的标识,是即时变动的。
在用户登陆之后,首页左边的架构不变,右上方被替换成“号外”,通知关于豆瓣的一切新闻。
豆瓣整个基础架构可以粗略的分为在线和离线两大块。
在线的部分和大部分网站类似:前面用,用Nginx做反向代理,形成负载均衡的一层;应用层主要是做运算,将运算结果返回给前面的DAE平台是这两年建起来的,现在大部分豆瓣的应用基本都跑在DAE上面了;应用后面的基
以DPark能够大幅提升性能。
另外,因为DPark的编写使用了函数式语言的特点,所以可以写的非常简洁:
到目前(2014年3月),DPark的集群规模和处理数据量已经比去年多了一倍左右,一天要处
理60~100T B左右的数据。
团队
当前,我所负责的豆瓣平台部一共包括四个部分:核心系统,这块也是由我直接带领的,共6名工程师;DAE,现在是彭宇负责,共4名工程师;DBA两人;SA两人。
平台部负责的项目大多是跟业务无关的东西,贴近应用层的主要在产品线团队做,这个分工跟豆瓣工程团队的发展历史有关。
早期豆瓣工程师还不多的时候,就已经分为两种倾向,一种是偏业务的,就是去做用户能看得见的东西;另一种是支持性的,运行在业务层下面、不被用户所感知的东西。
下面这一层就衍变成了平台部门。
在豆瓣,不管是做产品还是做平台的工程师,技术实力都比较强,一个项目应该从哪个部门发起,并不是看这个任务的难度,而是看它是公共的还是业务特有的。
有些项目即使未来可能会成为公共的,但一开始只是一个产品线需要,那么它也会从产品线发起。
比如豆瓣的短信服务,最开始是产品线有需求,所以这些服务都是由他们发起完成的,平台这边主要负责提供建设服务的架构,比如DoubanService,告诉他们一个服务怎样去写、怎样去部署、怎样去对用户开放。
短信服务后来成为很多产品线都在使用的服务,同时这个系统本身也越来越成熟,那么它逐渐就被转移到SA团队来进行维护。
核心系统组做过的项目,包括刚才提到的DPark、BeansDB,还有MooseFS这些二次开发的,还有搜索服务、信息推送的长连接服务等,大大小小差不多有十几个。
有些项目处于维护状态,所以需要的人不是那么多。
跟豆瓣其他工程团队一样,平台部也强制大家做code review。
这对于核心系统来说很重要的一点在于,code review是一个知识共享的过程:我们人少项目多,所以很多项目都是一个人做主力,很容易就变成其他人不知道你这个项目具体是什么情况,而强制code review就可以实现一种公开透明的状态,让大家都了解每个项目在做什么。
在平台部,因为你做的所有东西都会影响到全公司,测试显然很重要,我们还做了另一件事来进行质量保证,那就是一个项目由谁来主导上线,谁就要负责这个项目的故障响应——所有运维、调整系统等SA的工作,你这个第一负责人都要参与。
你做的东西的好坏会影响到自己晚上能不能睡好觉,所以大家就会比较谨慎。
灰度上线也是我们这边的通用做法。
平台部还有一点跟产品线不一样的是,平台部没有产品经理,所以你的工作方向更多是自己去找的,每个人自己发现问题的能力更重要。
我们每个月都会问大家,你这个月想要解决什么问题?如果方向大家一致认可,那就去做。
最后,对于新技术的引入上,豆瓣整体是比较偏激进的,我们鼓励大家去看看新的技术。
当然我们也不会看到新的就上,这里面有一些限制:一个是比较重要的服务如果要上新的技术,一定要有成功案例,且成功案例有跟我们量级差不多的规模,这样可以降低风险;另一个是对于引入的新技术一定要吃透——大部分引入的技术肯定是要做二次开发的,所以拿进来的技术你必须保证能完全理解它的代码结构,出了问题能修,能去掉自己无法掌控的东西。
这也是为什么豆瓣不太可能在重要的地方引入Java的原因,除非别无选择,我们一般都是Python、C和Go。
人人都是产品经理()中国最大最活跃的产品经理学习、交流、分享平台。