解析豆瓣的基础架构
解密豆瓣运营全过程

关于豆瓣网的调查分析解密豆瓣运营全过程作者:佚名一、什么是豆瓣?豆瓣网由前某物流咨询公司CTO杨勃于2005年3月创办,启动资金是杨勃几个朋友共计不到20万人民币的天使投资,以独到的书评、影评、乐评主题社区著称,因为开创了国内Web2.0新模式而闻名。
从构想到技术实现均由杨勃一人完成,业内对此有“一个人的豆瓣”的评价。
豆瓣的得名来自于杨勃曾经居住的北京朝阳门附近的豆瓣胡同。
(一)alexa数据1.alexa排名:1699(3月平均)2. 每百万用户登陆数:391(3月平均)3. 单个用户页面浏览量:9.1(3月平均)(二)网站相关数据官方页面数据:1. 成立于2005年3月6日2. 注册成员数:1450443. 城市居民数:22258(注册成员中按城市自主分类者)4. 成立小组数:5981备注:以上具体数据均为2006/4/18页面即时数据。
页面观察数据:1.平均每天增加注册成员900人左右2.平均每天增加城市居民数150人左右3.平均每天增加小组数50个左右4.小组数据:超过1500个小组是10人以上,最多人数小组为“爱看电影”(5537人);60%的小组为5人(含5人)小组,其中1人小组占40%。
备注:以上观察数据均为2006/4/7—2006/4/18时间段内页面观察所得。
从以上数据,豆瓣的用户发展数目比起同级别排名的网站并不算突出;从数据图表可见,它的用户曲线和访问曲线都是比较平缓的,考虑到它的网站性质和经营策略,豆瓣的用户基数和用户上升幅度虽然不高,但目标用户比例较高,用户的流失相对减少。
(三)网站发展状况以下为引用的内容:●2004年9月杨勃为自己的旅行网站制作了商业计划书,并且将这个网站命名为“驴宗”,在论证这个商业计划时朋友的建议让杨勃放弃了“驴宗”,将眼光投到“书”这个更宽广的领域。
●从2004年10月开始开发,经历了5个月,2005年3月6日,杨勃的豆瓣网开张了,并且第一天就有用户注册。
豆瓣用户分析及产品营销策略 38页PPT文档

4、豆瓣互动营销平台
豆瓣产品
豆瓣产品架构—豆瓣为用户提供全方位立体兴趣社交服务
社区
• 豆瓣猜(登录首页) • 友邻广播 • 个人页面 • 小组 • 小站
• 实验中的虚拟社区
• 博客订阅器 • 生活、文化、兴趣、科技 • 豆瓣实验室 • 其他产品 ……
精神维度
立足于精神交流、评论与分享的文化社区媒体
页
海报(图片/
flash/app)
线上活动 粉丝相册 照片墙/ 官方相册
公告栏
官方日记
论坛
品牌头像
关注粉丝 留言板
顶部背景可 更换,全页 面背景也可 作定制化设 计。
视频
投票 音频
所有模块的位置可以 根据需要随意拖拽。
豆瓣小站
轻博客版公共主页 分类标签
Flash模块
日记
豆瓣汽车站 商业主题公共主页
如何在豆瓣 做互动营销
用户体验流程与传播机制
start
豆瓣 用户
Banner / 豆友导图
Ta的好友
广播流
成为粉丝 参与互动
浅互动 带来 二次传播
其他豆瓣用户
广播流
投票 评论 喜欢 推荐
深互动 带来 二次传播
豆瓣FM音频广告
品牌小站
软性推广位
成为粉丝 参与互动
同城活动
创作UGC
分享
线上活动
好友广播
生活维度
立足于提高用户生活品质的生活分享平台
豆瓣猜
内容性的Pinterest
阿尔法城 infograph版社交
九点
连接+站外内容聚合
豆瓣产品
豆瓣读书
中国最大的读书分享与评论社区 频道覆盖核心人群年龄:25-45岁
豆瓣网案例分析

一、豆瓣网的创建及介绍.2005年3月,一家名为豆瓣网的Web2.0网站出现在人们视野,而后如一匹黑马迅速壮大,占据了阅读者、影迷、音乐爱好者以及图书音像商阵营中一个举足轻重的位置。
创建人为杨勃,起初创建之时,杨勃只是为“想看看有多少人和自己读同样的书”而编写了一个简单的程序,并以其工作所在地点——北京“豆瓣胡同”为其命名。
豆瓣网的建立与网络Web2.0技术的兴起和发展有莫大关系。
Web2.0是对Web1.0的信息进行扩展,丰富,使其更加多元化和个性化。
主要的Web2.0的元素有如博客、播客、社区、P2P下载服务等,其特征是资源由多人共同创建,共同分享,豆瓣网正是这样一个Web2.0网站。
信息的共享使豆瓣成为一个以青年知识分子为主要受众群体的书影音信息资料汇集地和评论交流社区。
豆瓣提供了书籍、影片、音乐的评论,但是没有任何不利于版权保护的下载服务,是一家以健康为网站主题之一的Web2.0网站。
截止到2010年底,豆瓣已经有注册用户超过4600万,其中活跃用户数2000万,人均访问停留时间:9.9分钟。
Alexa排名约为全球160已经成为全球为数不多的web 2.0的领头企业。
毋庸置疑,豆瓣已经在某些程度成为中国web 2.0的典型代表,在中国、美国,甚至全球的互联网上,豆瓣都是第一家以算法来推算用户的需求这样的模式存在的网络公司。
二、豆瓣网的功能(一)信息共享平台与其他书评、影评网站不同,豆瓣网的书籍、影视、音乐条目都由用户自行添加补充完整,例如对于影视条目,可以补充同一作品的不同海报和剧照,这充分体现了Web2.0时代的资源共享,充分交互的特性,打破了以往一对多传播的规律,开启多对多传播的方向。
这一方面使信息资源的容量不断扩充丰富,给于更多用户的信息查询获取,另一方面也极大的调动用户的积极性,使之不仅成为信息资源的获益者,更成为主动参与者、创造者,共同推动数据库的更新扩容,推动信息资源的传播共享。
豆瓣运营模式分析

豆瓣运营模式分析豆瓣运营模式与大多数社交网站的运营模式有相似之处。
其运营不像传统的运营,传统企业的运营模式包括行政层面、销售层面、生产层面、技术层面、资金管理层面。
其实豆瓣作为一个以网站为主要生产加工销售平台的一类企业,很明显其行政层面会很简单,其生产层面的事几乎没有,因为其生产为内容生产,而内容的生产又是以用户自主生产为其内容生产机制。
故其网站是用户自行生产产品自行消费产品,这样一来,豆瓣的运营模式中的生产模式全部省略了。
只剩下技术层面、销售层面和资金管理层面的运营。
技术运营豆瓣作为细分的社交网站,其最为突出和核心的技术运营便是豆瓣网用户自行编辑内容形成极具个性的个人中心和丰富的网站分享中心。
豆瓣网集合了web2.0 时代的各项重要技术运用,其中包括社会性网络服务(SNS)、维客(wiki)、聚合内容(RSS)、标签提取(TAG)、博客(BLOG),这些技术让豆瓣的“趣味相投”功能和“个人形象塑造”以及评论导向功能的实现成为可能。
豆瓣上“推测你喜欢”“在哪儿买这本书”“评分点评”最为典型“推测你喜欢”,首先是A人用大家熟悉的博客技术撰写了一篇读书笔记,然后这篇博客人为的或自然而然的因为标签技术即TAG 技术而进行了一定的贴标,然后聚合内容的功能在此基础上进行处理,这时候来了一位B人(想找跟自己趣味相投的A人),于是因为某个标签搜索到A人的博客,于是他又基于豆瓣的TAG和内容聚合功能找到发现了与A兴趣类似的事物和人,即“推测你喜欢”这是第一种推测你喜欢。
于是千千万万的A和B 构成了豆瓣上的趣味圈。
第二种便是你已经标下你所看所想看或者收藏什么的,豆瓣的这些技术会自动找到你可能感兴趣的东西,即是根据你的行为推断的你爱好,这是第二种推测你喜欢。
其实这些技术现在非常的普遍,但是将他们组合的这么完美和符合寻找趣味相投这类需求才是豆瓣成功的关键所在。
并且是将此运营很早的网站。
这样方便快捷的找到用户未曾看过但很符合自己胃口的新事物。
豆瓣

一、前言——豆瓣是什么?豆瓣是一个集评论、blog、交友、书目推荐于一体的社区网络。
由于它秉持“以书会友”目的,定位于一个“发现”网站,所以被形容为“小众文艺网站”。
其内容由用户产生,用户自由发表有关书籍、电影、音乐的评论,搜索他人推荐,所有的内容、分类、筛选、排序都由用户产生和决定。
主要通过用户点击由Google提供的广告,及购买电子商务网站的相关产品回扣,来获得收入。
2005年豆瓣面世,启动资金只有20万,开发者只有杨勃一人。
豆瓣成立3年后团队也只有25人。
但是3年来不仅营利,而且。
这样一个团队是如何打造出看似与他们实力不相等的成绩的呢?二、豆瓣的市场定位——抓住有价值的小众2005年豆瓣以书评网站面目面世。
以书为切入点进入市场,不过是它锁定自己受众的一个手段。
从豆瓣的前期推广中,分析其受众:1.以书为切入点,必要求其受众是读书之人,爱书之人。
这些人的特点是有求知欲,文化素质较高,善于思考,长于语言文字表达,并且习惯于文字表达。
这就为豆瓣高质量的评论的产生打下了良好的基础。
2.因为个人经历、生活环境、成长历练等每个人喜欢的有很大关系。
所有书实为小众文化。
当用户在欣赏期间在豆瓣上找到志趣相投之人,特别是一本冷门读本时,受众心理对交流的渴望急剧提升。
因智慧火花的碰撞,而油然而生的喜悦之情都会归功于豆瓣,萌生对豆瓣的热爱和忠诚。
豆瓣借此满足小众需求,培育以“兴趣”为媒介扩展人脉关系优越条件,从而成功抓住其第一批用户,更为小组产生提供了天然催化剂。
3.豆瓣最初以电子邮件和在《读书》《万象》高端读书类杂志投放广告的方式来向市场推广自己。
如此,它吸收到的用户还善于使用网络获取知识和交际。
豆瓣实际是利用这些拥有并活跃于博客的用户将豆瓣介绍推广出去。
豆瓣成功的市场推广采用的是人际传播方式实现的。
豆瓣网的成长历程可以证明:首先,网友topku在自己的博客上提到了豆瓣网,那代表着用口碑传播开始自发并行;其次,IT评论人洪波在博客上提到豆瓣网,从那以后,豆瓣网开始成为网上的主流话题之一;当网站创始人杨勃听用户说,有朋友在日常谈话里提到了“豆瓣”,口碑传播终于蔓延到线下。
豆瓣网的品牌构筑及其影响

豆瓣网的品牌构筑及其影响摘要品牌识别是品牌战略制定者立志建立或保持的一系列特定的品牌联想,这些联想表达了品牌所代表的价值理念,还表达了组数成员对顾客的承诺。
豆瓣作为第二媒介时代的先驱和典范,其品牌的树立过程尤为值得当下各媒介主体借鉴。
本文探析豆瓣在建立个人品牌过程中是如何实现品牌的个性,以及如何科学处理品牌与顾客的关系并以此发展为盈利模式。
关键词豆瓣;品牌个性;品牌影响豆瓣网自2005年3月正式打标上线截止到2009年4月,网站注册用户数量即将突破300万大关,这个专注于小众文化类产品的评论推荐制网站将原本分散的小众文化标签聚集起来,最终形成一个大众文化氛围;此外,尤为值得一提的是,豆瓣在如今Web2.0这样一个各媒介主体各显神通的时代,成功构建了一个无可比拟的品牌标识,使其有着其他主体不可比拟的用户粘着度和迅猛的资本扩张态势。
作为个人的品牌是品牌识别中一个最为突出的要点,这其中包括品牌个性以及品牌与顾客关系两点,以下我们针就这两点对豆瓣的品牌构建做分类探析。
1 品牌个性1.1品牌理念的个性化——给网众的生产能力赋权豆瓣最鲜明的特点就是用户的自产自消,“它不再局限于‘意义生产’,也不仅局限于目前较受关注的‘用户生产内容’(UGC user-generated content),用户除了制造内容本身以外,还涵盖了生产媒介内容、生产媒介渠道以及生产连接用户的网络或用户身处的社群等诸多方面。
”[1]在此所指的“赋权”是指当下媒体赋予网络受众的操作权利,不仅体现出用户的主体性,也显示出当下ICT[2]发展的一种个性化趋势。
而所谓的“意义生产”,霍尔的编码译码范式是一个典型范式,“编码位于传播者一端,是指将信息转化成便于媒介载送或受众接受的具体符号或代码;译码位于收传者一端,指的是将接收到的符号或代码还原为传播者所传达的原初的那种信息或意义。
”[3]而以豆瓣为典范的Web2.0无疑颠覆了这种用户与媒介之间“给什么要什么”的关系,用户在同媒介接触和使用过程中有了真正的生产行为。
豆瓣网技术架构的发展历程

Python
• • • •
开发迅速 Battery Included 第三方库成熟 社区成长中
•
CPUG: /
Quixote
• 简单,轻量,易于实现REST风格的URL • 当时还没有Django, TurboGears, Pylons这些选择,只有一
个笨重的ZOPE
Internet
Lighttpd
SCGI
App
FS
MySQL
Memcache
Static Files
问题出现
• 1.2M动态请求/天 • 磁盘IO成为瓶颈 • 需要寻找新机房
解决方案
• • • •
购买两台1U服务器
• •
pippin 和 meriadoc (后改名merry) 双核, 4G内存,250G SATA*3
露
• CPU:memcache对象序列化/反序列化
解决方案
•
第二台应用服务器上线
• • •
lighttpd的mod_scgi只能round-robin lighttpd 1.5不稳定 mod_proxy
•
proxy.balance = fair (load based, passive balancing)
def get_subject(subject_id): subject = mc.get(‘s:’+subject_id) if subject is None: store.farm.execute(“select xxx, xxx from subject where id=%s”, subject_id) subject = Subject(*store.farm.fetchone()) mc.set(‘s:’+subject_id, subject) return subject
豆瓣网分析

商业模式
1、产品定位 1)豆瓣表面上看去是一个评论(书评、影评、乐评)网站,但实际上它却提供了书目推 荐和以共同兴趣交友等多种服务功能,它更像一个集BLOG、交友、小组、收藏于一体的 新型社区网络。 2)切入点:图书。 豆瓣网就是要帮助用户去发现更多自身不知道但是却十分有价值的东西。对于一本图书, 无论是专家还是普通的读者,不同的用户会都有不同的感受(UGC模式丰富网站内容) 3)把书评变为实际的商业模式,从而对购买者起到导向作用是豆瓣网成功的关键: 目前,豆瓣网已经逐步扩展到电影、音乐、旅游等领域。豆瓣网目前通过和当当网、卓越 网进行合作,产生的购买双方进行分成,此外还有一定的广告收益。
但是…
如果你想在豆瓣上看影视剧的话,那你就失望了, 豆瓣是让用户来“感受&评价&分享”的,所以他并没 有影视剧的视频。
豆瓣网有明确指出版权问题
豆瓣音乐
记录你想听的、在听和听过的唱片,顺便 打分、添加标签及个人附注、写评论。根据 你的口味,豆瓣会推荐适合的唱片给你。 许多小众音乐人支撑起了独特的音乐氛围
• .豆瓣融资 • · 2006年,豆瓣完成第一轮融资,投资方式联创 策源,金额为200万美元。 • · 2009年底,豆瓣获得挚信资本和联创策源总额 近千万美元的第二轮投资。 • · 2011年9月13日豆瓣确认已完成第三轮5000万 美元融资。本轮融资投资方分别为挚信资本、红 杉资本和贝塔斯曼亚洲投资基金,其中挚信资本 亦是豆瓣第二轮投资力。
豆瓣网分析
概况
盈利模式
资本模式
经营模式
技术模式
豆瓣
在豆瓣上,用户可以自由发表有关书籍、电影、音乐的评论,可以搜索别 人的推荐,所有的内容、分类、筛选、排序都由用户产生和决定,甚至在 豆瓣主页出现的内容上也取决于用户的选择。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
豆瓣整个基础架构可以粗略的分为在线和离线两大块。
在线的部分和大部分网站类似:前面用,用Nginx做反向代理,形成负载均衡的一层;应用层主要是做运算,将运算结果返回给前面的DAE平台是这两年建起来的,现在大部分豆瓣的应用基本都跑在DAE上面了;应用后面的基
以DPark能够大幅提升性能。
另外,因为DPark的编写使用了函数式语言的特点,所以可以写的非常简洁:
到目前(2014年3月),DPark的集群规模和处理数据量已经比去年多了一倍左右,一天要处
理60~100T B左右的数据。
团队
当前,我所负责的豆瓣平台部一共包括四个部分:核心系统,这块也是由我直接带领的,共6名工程师;DAE,现在是彭宇负责,共4名工程师;DBA两人;SA两人。
平台部负责的项目大多是跟业务无关的东西,贴近应用层的主要在产品线团队做,这个分工跟豆瓣工程团队的发展历史有关。
早期豆瓣工程师还不多的时候,就已经分为两种倾向,一种是偏业务的,就是去做用户能看得见的东西;另一种是支持性的,运行在业务层下面、不被用户所感知的东西。
下面这一层就衍变成了平台部门。
在豆瓣,不管是做产品还是做平台的工程师,技术实力都比较强,一个项目应该从哪个部门发起,并不是看这个任务的难度,而是看它是公共的还是业务特有的。
有些项目即使未来可能会成为公共的,但一开始只是一个产品线需要,那么它也会从产品线发起。
比如豆瓣的短信服务,最开始是产品线有需求,所以这些服务都是由他们发起完成的,平台这边主要负责提供建设服务的架构,比如DoubanService,告诉他们一个服务怎样去写、怎样去部署、怎样去对用户开放。
短信服务后来成为很多产品线都在使用的服务,同时这个系统本身也越来越成熟,那么它逐渐就被转移到SA团队来进行维护。
核心系统组做过的项目,包括刚才提到的DPark、BeansDB,还有MooseFS这些二次开发的,还有搜索服务、信息推送的长连接服务等,大大小小差不多有十几个。
有些项目处于维护状态,所以需要的人不是那么多。
跟豆瓣其他工程团队一样,平台部也强制大家做code review。
这对于核心系统来说很重要的一点在于,code review是一个知识共享的过程:我们人少项目多,所以很多项目都是一个人做主力,很容易就变成其他人不知道你这个项目具体是什么情况,而强制code review就可以实现一种公开透明的状态,让大家都了解每个项目在做什么。
在平台部,因为你做的所有东西都会影响到全公司,测试显然很重要,我们还做了另一件事来进行质量保证,那就是一个项目由谁来主导上线,谁就要负责这个项目的故障响应——所有运维、调整系统等SA的工作,你这个第一负责人都要参与。
你做的东西的好坏会影响到自己晚上能不能睡好觉,所以大家就会比较谨慎。
灰度上线也是我们这边的通用做法。
平台部还有一点跟产品线不一样的是,平台部没有产品经理,所以你的工作方向更多是自己去找的,每个人自己发现问题的能力更重要。
我们每个月都会问大家,你这个月想要解决什么问题?如果方向大家一致认可,那就去做。
最后,对于新技术的引入上,豆瓣整体是比较偏激进的,我们鼓励大家去看看新的技术。
当然我们也不会看到新的就上,这里面有一些限制:一个是比较重要的服务如果要上新的技术,一定要有成功案例,且成功案例有跟我们量级差不多的规模,这样可以降低风险;另一个是对于引入的新技术一定要吃透——大部分引入的技术肯定是要做二次开发的,所以拿进来的技术你必须保证能完全理解它的代码结构,出了问题能修,能去掉自己无法掌控的东西。
这也是为什么豆瓣不太可能在重要的地方引入Java的原因,除非别无选择,我们一般都是Python、C和Go。
人人都是产品经理()中国最大最活跃的产品经理学习、交流、分享平台。