新浪微博技术架构
阿里巴巴腾讯等互联网企业 组织架构

京东组织架构
二、对组织机构设计前期调研
区域中心和办事处由交易中心统一管理,其它为配套职能部门。改制上市后董事会 决策功能得到强化。
钢银组织架构
董事会
总经理/副总经理
技 交 市 人 财 风 融资 董 术 易 场 事 务 控 采购 秘 中 中 部 部 部 部 中心 办 心心
二、对组织机构设计前期调研
搜索业务群组
hao 123
搜 索
业事
百 度 糯
务业米
及群、
团
百
队
度
外
卖
金融服务事业群组 百百百金 度度度融 金钱互市 融包联场 业及网研 务支证究
付券与 业业策 务务略
团 队
新浪采用矩阵型
组织架构,加强
横向联系且便于
进行项目管理。
CEO曹国伟直管
微博板块。2013 新
年起未产生重大 浪
调整。
二、对组织机构设计前期调研
二、对组织机构设计前期调研2015年12月14日最新组织架构
李彦宏
Helen
向海龙 王海峰
朱光
李明远 刘骏
移动服务事业群组
贴移 吧动
L B
和云 S
移事 事
动业 业
游部 部
戏
业
务
张亚勤 王湛
新兴业务事业群组 百 新国 度 兴际 大 业化 市 务业 场 和务 公 用部 关户 及消 政费 府业 关务 系
新浪云开发平台开发指南

新浪 SAE 分布式 Web 服务应用平台——云计算技术在网络推广中的应用 1)什么是 Sina App EngineSina App Engine(以下简称 SAE)是新浪研发中心于 2009 年 8 月开始内部开发,并 在 2009 年 11 月 3 日正式推出第一个 Alpha 版本的国内首个公有云计算平台,SAE 是 新浪云计算战略的核心组成部分。
SAE 作为国内的公有云计算, 从开发伊始借鉴吸纳 Google、 Amazon 等国外公司的公有 云计算的成功技术经验,并很快推出不同于他们的具有自身特色的云计算平台。
SAE 选择在国内流行最广的 Web 开发语言 PHP 作为首选的支持语言,Web 开发者可以在 Linux/Mac/Windows 上通过 SVN、SDK 或者 Web 版在线代码编辑器进行开发、部署、调 试,团队开发时还可以进行成员协作,不同的角色将对代码、项目拥有不同的权限; SAE 提供了一系列分布式计算、存储服务供开发者使用,包括分布式文件存储、分布 式数据库集群、分布式缓存、分布式定时服务等,这些服务将大大降低开发者的开发 成本。
同时又由于 SAE 整体架构的高可靠性和新浪的品牌保证,大大降低了开发者的 运营风险。
另外,作为典型的云计算,SAE 采用“所付即所用,所付仅所用”的计费 理念,通过日志和统计中心精确的计算每个应用的资源消耗(包括 CPU、内存、磁盘 等) 。
第 1 页总之,SAE 就是简单高效的分布式 Web 服务开发、运行平台。
2)SAE 整体架构 SAE 从架构上采用分层设计,从上往下分别为反向代理层、路由逻辑层、Web 计算服 务池。
而从 Web 计算服务层延伸出 SAE 附属的分布式计算型服务和分布式存储型服务, 具体又分成同步计算型服务、 异步计算型服务、 持久化存储服务、 非持久化存储服务。
各种服务统一向日志和统计中心汇报,参考下图:7 层反向代理层:HTTP 反向代理,在最外层,负责响应用户的 HTTP 请求,分析请求, 并转发到后端的 Web 服务池上,并提供负载均衡、健康检查等功能。
智慧城市解决方案

∙分享智慧城市解决方案∙智慧园区为提升园区服务能力的灵活性、快速反应性及可扩展性,软通动力推出可自适应管理并支持智慧产业发展的管理平台,包括云数据中心和智慧应用平台。
∙城市运营指挥中心将城市作为单一的系统来进行查看和管理,为城市管理者提供实时及历史视图,以便可以优化城市各层面的操作。
∙电子政务平台作为一个集成的政府管理工具,通过高度抽象和概括的方式构建出信息化工作平台的软件体系和应用模型。
∙智慧旅游平台强调技术和业务的紧密融合,以“SNS+微博社区”为核心构建的一体化数字景区服务平台,提供全生命旅游服务。
∙数字出版集成服务平台集合从策划、出版、制作加工、版权管理、发行、交易、支付结算到智慧终端阅读的全产业链服务运营平台。
∙食品溯源解决方案融合条形码、二维码、IC卡、RFID无线射频识别等先进技术,为食品溯源提供统一平台,实现食品生命周期的全程跟踪,使食品安全达到更好的可控制、可跟踪、可追溯。
∙云数据中心基于云计算基础架构,提出了一套全新的云数据中心解决方案,助力于提升整个城市管理和公共服务水平,创造一个更加和谐的城市环境。
∙智慧城市体验展示中心运用创新的展示手段,智慧化的演示流程,新型的演示设备,构建的一个极具现代感,科技感,时代感的智慧化展厅,成为城市对外展示宣传的重要窗口。
∙智慧社区以物联网、云计算、三网融合等技术为基础,由专业服务商为不同的用户群体量身定制的智能信息系统,为居民提供了“更安全、更舒适、更便捷、更节能”的生活环境。
∙智慧楼宇解决方案通过各系统的协同工作和信息整合,实现楼宇全局能耗的监测与管理、楼宇局部按需节能精确控制、以及实际能耗分析及管理的虚拟化仿真等功能。
标准化、。
新浪公司介绍

营销经验
十多年的网络营销经验,在科学总结和 归纳的基础上,推出了“LMPACT”网络营 销理念,以“选择决定营销效果”作为理念 的核心,从方法和介质两个层面,对包括互 动(Interactive)、用户粘性 (Magnetism)、聚合力(Popularity)、公 信力(Authoritative)、创意(Creative)和 精准性(Target)在内的六个网络营销要素 进行科学评估选择,企业在网络推广中可根 据以上六个维度,衡量媒体价值及营销策略 的合理性。当企业充分考虑并组合运用到位 时,网络营销会实现最大的ROI,从而实现 扩大传播影响、赢得受众的关注,转化消费 者行为及树立品牌口碑的效果。最受欢迎的社交 互动平台最具价值的无线 互联网品牌
业务频道
• 新浪网主要提供网络媒体及娱乐服务,以成为世界各地中国人的全功能网上生活社区为发展方向。
• 新浪网为全球用户提供全面及时的中文资讯、多元快捷的网络空间,以及轻松自由地与世界交流的先进手段。
1. 2. 3. 4. 5. 6.
新闻中心 体育频道 娱乐频道 科技频道 财经频道 汽车频道
网站简介
新浪网是由王志东创立,和搜狐、网易、腾讯并称为“中 国四大门户”。新浪网下辖北京新浪、香港新浪、台北新浪、北 美新浪等覆盖全球华人社区中文网站的全球最大中文门户网站。 旗下五大业务主线:即提供网络新闻及内容服务的新浪网、提供 移动增值服务的新浪无线(SINA Mobile)、提供Web 2.0服务及游 戏的新浪互动社区(SINA Community)、提供搜索及企业服务的 新浪企业服务,以及提供网上购物服务的新浪电子商务(SINA ECommerce)向广大用户提供包括地区性门户网站、移动增值服务、 搜索引擎及目录索引、兴趣分类与社区建设型频道、免费及收费 邮箱、博客、影音流媒体、楚游、分类信息、收费服务、电子商 务和企业电子解决方案等在内的一系列服务。 新浪在全球范围 内注册用户超过2.3亿,日浏览量超过7亿次,是中国大陆及全球 华人社群中最受推崇的互联网品牌。凭借领先的技术和优质的服 务,新浪深受广大网民的欢迎并享有极高的声誉,2003年-2006年, 新浪连续荣获由北京大学管理案例研究中心,《经济观察报》评 出的“中国最受尊敬企业”。2006年,荣获世界企业品牌竞争力 试验室《中国100家最佳雇主排行榜》第61名称号。中国互联网 协会2007年发布的《2007中国互联网调查报告》中,新浪在门户 和博客两大大领域的用户年到达率指标中高居榜首,同年,新浪 被北京大学新闻与传播学院、信息产业部分别评为“十大创新媒 体”及“中国互联网年度成功企业”。
新浪 网站运营策划方案

新浪网站运营策划方案一、背景及概述新浪网是中国领先的综合性门户网站,始建于1998年,旗下有新闻、娱乐、体育等多个频道。
作为中国互联网行业的先行者之一,新浪网承载着海量的用户访问量和用户需求,为用户提供了丰富的内容和服务。
然而,随着互联网的发展,新浪网面临着激烈的竞争和日益多元化的用户需求,如何保持自身的竞争力和吸引力成为了一项全新的挑战。
因此,制定一套有效的网站运营策划方案,将对新浪网站的长期发展起到至关重要的作用。
二、目标与定位1. 目标:通过优化网站内容和提升用户体验,提高网站的访问量和用户留存率,确保网站在激烈的竞争中保持领先地位;2. 定位:坚持以新闻、财经、体育、娱乐等为主要内容,同时加强新媒体传播、技术创新等方面。
三、关键策略1. 提升网站内容质量(1)加大新闻报道力度,关注用户热点话题,提供全面、深入的报道,提高用户粘度;(2)扩大视频、图片等多媒体内容的覆盖面,以满足用户对视觉体验的需求;(3)加强原创内容的制作,增加专题报道和深度分析,提高内容的深度和广度。
2. 优化用户体验(1)优化网站页面布局,提高页面加载速度,丰富网站功能,方便用户使用;(2)建立个性化推荐系统,根据用户的浏览记录和兴趣偏好,为其推送定制化内容;(3)加强社区交流和互动,提升用户参与度,丰富用户体验。
3. 加大新媒体宣传(1)积极开展社交媒体营销,扩大新浪网在微博、抖音、微信等平台的影响力;(2)探索社交电商,与知名博主、网红合作,开展精准营销,吸引更多用户参与;(3)推出APP版本,提升移动端用户体验,拓展用户群体。
4. 加强技术创新(1)加强人工智能技术的应用,提高网站内容推荐的准确性;(2)注重大数据分析,深入了解用户需求,为网站运营提供有力的数据支持;(3)推进区块链技术研发,加强网站内容的可信度和透明度。
四、运营计划1. 网站内容运营(1)建立内容运营团队,加大投入,提升新闻报道的质量和数量;(2)加强与合作伙伴的联动,共享资讯资源,丰富网站内容;(3)举办线上线下有奖活动,吸引用户参与,增加用户粘度。
实时位置数据集成与分析处理解决方案

实时GIS解决方案2013年7月易智瑞(中国)信息技术XXX——制定及修订记录——* 修订类型分为A - ADDED M - MODIFIED D –DELETED注:对该文件内容增加、删除或修改均需填写此记录,详细记载变更信息,以保证其可追溯性。
1前言2013年8月5日,住房和城乡建设部公布2013年度国家智慧城市试点名单,确定103个城市(区、县、镇)为2013年度国家智慧城市试点,至此住建部确定的试点已达193个。
智慧城市正在紧锣密鼓的建设中,而支撑智慧城市其中一项非常重要的技术手段是物联网。
2013年,国务院发布了《国务院关于推进物联网有序健康发展的指导意见》,为我国物联网发展指明了方向。
经过几年的技术和市场培育,加之我国在物联网领域的自主创新能力不断增强,可以预见物联网即将进入高速发展期。
预计到2015年的时候,全球与互联网相连的物体将达60亿件。
物联网技术的核心和基础依然是互联网技术,是在互联网技术基础上的延伸和扩展的一种网络技术,它是通过网络及各类感应设备来实现物与物、物与人之间的信息交换和通讯。
通过物联网技术可以收集物联网节点的各种信息,从而对环境、事物、过程等进行全实时、可视化的监控和管理,各领域的用户可以借助这一技术实现从信息化向智能化的转变。
物联网的核心理念在于感、传、知、控,进而实现人与人、人与物、物与物之间的有机了解。
作为这种了解的基础,位置或者地理信息是其重要的组成部分。
采用物联网技术,把各类感应设备嵌入和装备到与空间地理位置相关的城市部件(摄像头、路灯、电杆等)、建筑物、铁路、桥梁、隧道、公路、大坝、管道(石油、给排水)、电网等各种设施中,利用互联网及移动通信等网络技术,再结合地理信息可视化及信息集成方式,把此类与空间位置相关的感应设备及其感应信息映射在电子地图上,实现物联网与地理信息的集成与整合,建立可视化的物联网实时GIS原型系统。
那么面对纷繁浩杂的传感设备,如何方便快捷的接入这些设备产生的实时数据,并对其在地图上进行可视化的监控、分析并智能化为人为决策提供支持,是当前用户所面临的亟需解决的问题。
我国主要SNS网站营销价值浅析

我国主要SNS网站营销价值浅析摘要:社交平台不断引领潮流、创造奇迹,极大地改变了人们的生活和信息传播方式。
社交网络的便捷性和即时性等特点使得越来越多的个人以及企业利用SNS来开展营销,催生了网络营销这种炙手可热的推广营销方式,给微时代的企业带来了新的商业契机和营销模式。
本文简要阐述了三种SNS营销工具的价值及特点。
关键字:SNS 营销价值正文:1 绪论1.1 SNS的理解SNS(Social Network Software)即社会化网络服务网站,是近几年最热门的互联网应用之一,其理论基础是六度空间理论六度空间理论,,平台都是基于`喻几”架构的,而中的社会性则推动了人际网络的构建。
目前比较知名的国内的的网站有人人网、校内网、开心网、豆瓣网、、聚友等网站,。
就是为用户提供通过互联网创建并维护人际关系网络的服务,帮助用户通过个人的人际关系网络满足其各方面需求与兴趣的网站。
目前网站主要有两种,一种是实名制的真实可信任网络,鼓励用户和将现实中的社交关系转移到互联网来维护,如朋友、同学、校友、同事、亲人等等强联系人,并鼓励用户拓展人脉,让用户利用朋友的朋友找到可以拓展的人脉资源另一种则是依靠用户之间的共同兴趣来聚合同类用户,用户通过需求和兴趣来形成圈子、拓展人脉,并且分享与交流共同感兴趣的信息,也是为了满足自身的需求。
由于是建立并维护互联网人际关系的有效工具与平台,因此,网站聚合了大量用户,用户之间通过日志、活动、群组等应用和服务来分享个人信息、建立圈子、组织活动等,网站有着巨大的用户流量和注册用户数。
1.2 各具特色的SNS网站1.2.1 综合性SNS新浪微博:由新浪网推出,提供微型博客服务类的社交网站。
开心网:是国内SNS的带动者,在国内居于霸主地位。
人人网(校内网):从校园走向社会的庞大的社区网络1.2.2垂直SNS公关圈:公关行业的SNS家园。
迈点蓝:酒店行业的SNS社区。
驴友录:面向驴友、户外运动爱好者的SNS社区。
PPT课件讲解高德地图

实时路况预警
车载导航可以实时获取路 况信息,提醒用户绕行拥 堵路段,节省时间和燃油 成本。
车载娱乐与社交
车载导航支持音乐播放、 电台收听、社交等功能, 提供丰富的驾驶体验。
移动出行服务
共享单车
高德地图支持共享单车出 行方式,提供单车位置查 询、租借等功能,方便市 民短途出行。
网约车服务
高德地图提供网约车服务 ,支持在线叫车、支付等 功能,提高出行效率。
高德地图PPT课件讲解
目录
CONTENTS
• 高德地图简介 • 高德地图的技术架构与实现 • 高德地图的特色功能 • 高德地图的商业应用场景 • 高德地图的未来发展与趋势 • 高德地图案例分析
01
高德地图简介
高德地图是什么
高德地图是高德软件有限公司开发的一款基 于互联网的电子地图服务。
它以提供精准、详实的地图信息为核心,通 过与各类生活服务进行深度融合,形成了强 大的出行服务功能。
05
06
4. 为市民提供出行建议,减少拥堵时间。
案例二
总结词:通过高德地图的定位和路径规 划功能,提高物流公司配送效率。
3. 减少配送时间和成本,提高客户满意 度。
2. 利用路径规划功能,为配送员制定最 优路线。
详细描述
1. 运用高德地图的定位功能,实时追踪 货物和车辆位置。
案例三
详细描述
2. 提供语音导航、实时路况等特 色服务,满足用户需求。
06
高德地图案例分析
案例一:某城市交通拥堵的解决方案
总结词:通过高德地图的交通大数据分析,为 城市交通拥堵提供有效解决方案。
01
02
详细描述
1. 利用高德地图的交通大数据平台,实时 监测城市交通因,如道路设计不合理 、车辆流量过大等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
首先给大家介绍一下微博架构发展的历程。新浪微博在短短一年时间内从零发展到五千万用户,我们的基层架构也发展了几个版本。第一版就是是非常快的,我们可以非常快的实现我们的模块。我们看一下技术特点,微博这个产品从架构上来分析,它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式,假如说我们一个明星用户他有10万个粉丝,那就是说用户发表一条微博的时候,我们把这个微博消息攒成10万份,这样就是很简单了,第一版的架构实际上就是这两行字。第一颁的技术细节,典型的LAMP架构,是使用Myisam搜索引擎,它的优点就是速度非常快。另外一个是MPSS,就是多个端口可以布置在服务器上。为什么使用MPSS?假如说我们做一个互联网应用,这个应用里面有三个单元,我们可以由三种部署方式。我们可以把三个单元部署在三台服务器上,另外一种部署模式就是这三个单元部署在每个服务器上都有。这个解决了两个问题,一个是负载均衡,因为每一个单元都有多个结点处理,另外一个是可以防止单点故障。如果我们按照模式一来做的话,任何一个结点有故障就会影响我们系统服务,如果模式二的话,任何一个结点发生故障我们的整体都不会受到影响的。
我们微博第一版上线之后,用户非常喜欢这个产品,用户数增长非常迅速。我们技术上碰到几个问题。第一个问题是发表会出现延迟现象,尤其是明星用户他的粉丝多。另外系统处理明星用户发表时候的延迟,可能会影响到其他的用户,因为其他的用户同一时间发表的话,也会受到这个系统的影响。我们就考虑这个系统怎么改进。首先是推模式,这肯定是延迟的首要原因,我们要把这个问题解决掉。其次我们的用户越来越多,这个数据库表从一百万到一亿,数据规模不一样处理方式是有差别的。我们第一版单库单表的模式,当用户数量增多的时候,它不能满足就需要进行拆分。第二个是锁表的问题,我们考虑的是更改引擎。另外一个是发表过慢,我们考虑的是异步模式。
第二版我们进行了模块化,我们首先做了一个层,做了拆分,最右边的发表做了异步模式。第二个服务层,我们把微博基础的单元设计成服务层一个一个模块,最大是对推模式进行了改进。首先看一下投递模式的优化,首先我们要思考推模式,如果我们做一下改进把用户分成有效和无效的用户。我们一个用户比如说有一百个粉丝,我发一条微博的时候不需要推给一百个粉丝,因为可能有50个粉丝不会马上来看,这样同步推送给他们,相当于做无用功。我们把用户分成有效和无效之后,我们把他们做一下区分,比如说当天登陆过的人我们分成有效用户的话,只需要发送给当天登陆过的粉丝,这样压力马上就减轻了,另外投递的延迟也减小了。
我们再看数据的拆分,数据拆分有很多方式,很多互联网产品最常用的方法,比如说如可以按照用户的UID来拆分。但是微博用户的一个特点就是说大家访问的都是最近的服务器,所以我们考虑微博的数据我们按照时间拆分,比如说一个月发一张表,这样就解决了我们不同时间的惟度可以有不同的拆分方式。第二个考虑就是要把内容和索引分开存放。假如说一条微博发表的地址是索引数据,内容是内容数据。假如说我们分开的话,内容就简单的变成了一种key-value的方式,key-value是最容易扩展的一种数据。比如说一个用户发表了一千条微博,这一千条微博我们接口前端要分页放,比如说用户需要访问第五页,那我们需要迅速定位到这个记录。假如说我们把这个索引拆分成一个月一张表,我们记录上很难判断第五页在哪张表里,我们需要索引所有的表。如果这个地方不能拆分,那我们系统上就会有一个非常大的瓶颈。最后我们想了一个方法,就是说索引上做了一个二次索引,改变我们还是按照时间拆分,但是我们把每个月记录的偏移记下来,就是一个月这个用户发表了多少条,ID是哪里,就是按照这些数据迅速把记录找出来。
异步处理,发表是一个非常繁重的操作,它要入库、统计索引、进入后台,如果我们要把所有的索引都做完用户需要前端等待很长的时间,如果有一个环节失败的话,用户得到的提示是发表失败,但是入库已经成功。所以我们做了一个异步操作,就是发表成功我们就提示成功,然后我们在后台慢慢的消息队列慢慢的做完。另外新浪发表了一个很重要的产品叫做MemcacheQ,我们去年做了一个对大规模部署非常有利的指令,就是stats queue,适合大规模运维。
第二版我们做了这些改进之后,微博的用户和访问量并没有停止,还有很多新的问题出现。比如说系统问题,单点故障导致的雪崩,第二个是访问速度问题因为国内网络环境复杂,会有用户反映说在不同地区访问图片、js这些速度会有问题。另外一个是数据压力以及峰值,MySql复制延迟、慢查询,另外就是热门事件,比如说世界杯,可能会导致用户每秒发表的内容达到几百条。我们考虑如何改进,首先系统方面循序任意模块失败。另外静态内容,第一步我们用CDN来加速,另外数据的压力以及峰值,我们需要将数据、功能、部署尽可能的拆分,然后提前进行容量规划。
另一方面我们还有平台化的需求,去年11月我们就说要做开放平台,开放平台的需求是有差异的,Web系统它有用户行为才有请求,但是API系统特别是客户端的应用,只要用户一开机就会有请求,直到他关闭电脑这种请求一直会不间断的过来,另外用户行为很难预测。
系统规模在持续的增大,另外也有平台化的需求,我们新架构应该怎么做才能满足这些需要?我们看一下同行,比如说Google怎么样考虑这个问题的?Google首席科学家讲过一句话,就是一个大的复杂的系统,应该要分解成很多小的服务。比如说我们在Google.com执行一个搜索查询的话,实际上这个操作会调动内部一百多个服务。因此,我们第三版的考虑就是先有服务才有接口最后才有应用,我们才能把这个系统做大。 现在我们看一下第三版,首先我们把底层的东西分成基础服务,基础服务里面比如说分布式的存储,还有分层,我们做了一些去中心化、自动化的操作。在基础服务之上有平台服务,我们把微博常用的应用做成各种小的服务。然后我们还有应用服务,这个是专门考虑平台各种应用的需求。最上面我们有API,API就是新浪微博各种第三方应用都在上面跑。四
平台服务和应用服务是分开的,这样实现了模块隔离,即使应用服务访问量过大的话,平台服务不会首先影响。另外我们把微博的引擎进行了改进,实现了一个分层关系。用户的关注关系,我们改成一个多惟度的索引结构,性能极大的提高。第四个层面就是计数器的改进,新版我们改成了基于偏移的思路,就是一个用户他原来读的一个ID比如说是10000,系统最系的ID是10002的话,我们和清楚他有两条未读。原来的版本是采用绝对技术的,这个用户有几条未读都是用一个存储结构的话,就容易产生一致性的问题,采用这种偏移的技术基本上不会出错。
另外基础服务DB冷热分离多维度拆分,在微博里面我们是按照时间拆分的,但是一个大型的系统里面有很多业务需要有不同的考虑。比如说私信这个就不能按照时间来拆分,这个按照UID来拆分可能更简单。然后我们突出存储还做了一个去中心化,就是用户上传图片的速度会极大的提高,另外察看其他用户的图片速度也会极大的提高。另外是动态内容支持多IDC同时更新,这个是在国内比较新颖的。
下面给大家介绍一下新浪微博怎么样打造一个高性能架构。到目前为止有五千万用户使用新浪微博,最高发表3000条以上每秒,然后一个明星用户发表的话,会被几百万用户同时读到。这些问题的本质是我们架构需要考虑高访问量、海量数据的情况下三个问题。易于扩展、低延迟、高可用和异地分布。我们每天有数十亿次外部网页以及API接口的需求,我们知道微博的特点是用户请求是无法cache的。因此面对这个需求我们怎么样扩展?几点思路。第一我们的模块设计上要去状态,我们任意一个单元可以支持任意节点。另外是去中心化,避免单点及瓶颈。另外是可线性扩展。最后一个是减少模块。
我们要做一个高性能的系统,要具备一个低延迟、高实时性,微博要做到高实时性这是核心的价值,实时性的核心就是让数据离CPU最近,避免磁盘的IO。我们看淘宝核心系统专家余锋说过的一句话“CPU访问L1就像从书桌拿一本书,L2是从书架拿一本书,L3是从客厅桌子上拿一本书,访问主存就像骑车去社区图书馆拿一书”。我们微博如果要做到非常实时的话,我们就需要把数据尽量离CPU节点最近。所以我们看一下cache设计里面怎么达到这个目标。首先INBOX,这个数据我们需要放再一个最快的地方,因为用户随时访问。OutBOX里面的最近发表就是L1cache,还有一个是中期的,这个因为访问少一点,它可以被踢。最后一部分内容体有三部分。L0是本地的,我们需要把一些经常访问的,比如说明星发表微博的内容体本地化,因为它被访问的概率非常大。然后L1里面存放着最近发表的,还有一个是中期的。我们通常用L2就可以了,L1我们可以理解成它就是一个存储。
一个好的架构还需要举行高可用性。我们看一下业界的指标,S3是99.9%,EC2是99.5%,我们另外一个同行Face book在这方面它是没有承诺的,就是接口可用写。微博平台目前承诺的是99.95%,就是说一天365天故障率应该小于9个小时。这个怎么达到?第一我们要做容量规划,地个是要做好监控以及入口的管理,就是说有些服务如果访问量过了的话,我们要有一个开关可以拦住他。我们通过这个图表可以清楚的看到,比如说我们要做L1的cache,我们剩余空间有多少,比如说80%,就说明这个数据有可能会丢失,有可能会对我们的系统造成影响。
另外一个层面就是接口监控,我们目前有Google维度的接口监控,包括访问错误失败率。然后要做架构,给大家一个很重要的经验分享,就是说监控的指标尽量量化。比如说他延迟30秒是小问题,如果是延迟10分钟我们就要立即采取措施了,就是所有可以量化的指标都要量化。
然后我们看监控怎么样更好的做?我们看亚马逊的VP说过的一句话,就是说监控系统确实特别好,可以立即告诉我们哪里有故障,但是有20%的概率我们人是会出错的。所以我们一个大型系统就应该要为自动化设计,就是说尽可能的将一些运作自动化。比如说发布安装、服务、启用、停止。我们再看另外一句,Google的工程师是怎么做的。他是这么做的,比如说第一周是处理线上的业务,这一周他处理了很多事情,处理了很多系统的情况,剩下的系统问题是不需要他做的,他只要把这一周碰到的情况用程序的方法来解决,下次再碰到这种情况很简单的一个按钮就可以处理了。我们目前也在向自动化这方面努力,就是我们的工具在持续增加。
另外一个异地分布,在国内网络环境下,比如说IDC灾难,机房检修甚至是机房掉电,我们也碰到过中国最好的机房也会掉电,所以要每个服务单元都能支持多机房部署。另外做多机房部署有一个好处,就是用户的访问速度会提高。多IDC分布静态内容就不说了,基本上大的互联网公司都会做,它非常成熟基本上没有什么问题,比如说图片等等的静态内容。动态内容的CDN分布是业内的难点,国内很少有公司能够做到非常成熟的多机房动态内容发布的成熟方案,它的核心就是分布式存储。一款理想的分布式存储产品它有哪些需求呢?首先它要支持海量规模、可扩展、高性能、低延迟、高可用。第二个是需要多机房分布,能够满足国内负责的网络环境,还要具备异地容灾能力。第三个就是要调用简单,具备丰富数据库特性。因此分布式存储需要解决一个多对多的数据复制。