SDCC2015-搜狗-刘建-搜狗商业平台基础架构演化史——快速迭代业务下基础架构演化实践
网店运营推广师考试模拟题(含参考答案)

网店运营推广师考试模拟题(含参考答案)一、单选题(共43题,每题1分,共43分)1.落地页优化时建议不要超过()屏A、1B、4C、3D、2正确答案:C2.SEM账户结构大致分为四个层级,从高到低依次是()A、推广计划推广组(推广单元)账户关键词与创意B、账户推广组(推广单元)推广计划关键词与创意意C、账户推广计划推广组(推广单元)关键词与创意D、推广计划账户推广组(推广单元)关键词与创意正确答案:C3.当用户触发信息流展示面之后,进入的页面是指()。
A、A 跳转面B、B 交互面C、C 数据面D、D 产品面正确答案:A4.下面不属于速卖通DSR要素的是A、提供的商品描述的准确性B、沟通质量及回应速度C、物品运送时间合理性D、卖家服务态度满意度正确答案:D5.当人的心理状态和预期状态与画面中塑造的任务的原型相吻合的时候,达到()最大化。
A、投射效应B、风格统一C、简洁原则D、对称效应正确答案:A6.旗舰店店铺入驻天猫平台保证金为()。
A、TM标8万,R标4万B、TM标10万,R标5万C、TM标10万,R标3万D、TM标8万,R标2万正确答案:B7.网页权重中关于链接建设的相关描述不正确的是A、链接主要用来告知用户所链接页面的重要程度B、一个页面得到的链接越多,链接质量越高C、内部链接是指自建网站内部页面与页面之间的相互链接关系,一般详情页的权重最高D、链接主要分为内部链接和外部链接两种形式正确答案:C8.中国最大的第三方品牌及零售平台是()。
A、天猫B、淘宝C、京东D、拼多多正确答案:A9.店铺评分时,动态分飘红代表DSR三项同行平均A、低于B、优于C、等于D、接近于正确答案:B10.下列关于SEO优化的说法不正确的是()A、做好SEO优化有助于提升店铺的总体流量B、SEO优化与付费推广是相辅相成,互相促进的C、SEO可能会降低付费推广的转化率和推广效果D、SEO优化流量的变化趋势和直通车推广流量的变化趋势是正相关的正确答案:C11.亚马逊评价体系中()的好坏,可以直接影响到该条Listing的曝光和排名。
原创内容营销考核试卷

8.原创内容营销的__________阶段是确定内容方向和目标的关键环节。
9.为了提高原创内容的传播力,可以采用__________等策略。
10.原创内容营销应遵循__________原则,确保内容的合法性和道德性。
四、判断题(本题共10小题,每题1分,共10分,正确的请在答题括号中画√,错误的画×)
D.跟进竞争对手
5.以下哪种内容形式最不适合原创内容营销?()
A.图文
B.短视频
C.音频
D.长篇小说
6.原创内容营销的关键指标是什么?()
A.点击率
B.转化率
C.留存率
D. PV/UV
7.以下哪个环节不属于原创内容营销的实施过程?()
A.内容创作
B.内容发布
C.数据分析
D.竞价推广
8.以下哪个因素对原创内容营销效果影响最大?()
A.发布时间
B.话题热度
C.用户群体
D.平台算法
17.原创内容营销中,哪些类型的互动可以促进用户参与?()
A.投票
B.评论
C.分享
D.竞赛
18.以下哪些方法可以用来评估原创内容营销的效果?()
A.跟踪销售数据
B.分析用户反馈
C.检测品牌提及度
D.观察用户留存率
19.在原创内容营销中,哪些做法有助于建立品牌形象?()
A.用户行为分析
B.内容效果分析
C.营销成本分析
D.竞争对手分析
9.以下哪些措施可以提高原创内容营销的搜索引擎排名?()
A.优化关键词
B.提高内容质量
C.增加外链
D.使用原创图片
10.原创内容营销中,哪些方法可以帮助提升用户留存率?()
电商1+X网店运营推广(中级)试题库含答案

电商1+X网店运营推广(中级)试题库含答案一、单选题(共40题,每题1分,共40分)1、以下哪种情况,会造成广告展现量高,但是点击量小?()A、定向不够精准,广告投放给了对产品没有需求的人群B、创意有特色、形态新颖C、出价偏低D、账户结构搭建不够科学正确答案:A2、新品/滞销品进行标题优化,应该尽量选择下列哪种关键词()。
A、行业热词B、曝光度高的词C、竞争度小的词D、行业短词正确答案:C3、以下哪种信息流广告定向方式覆盖人群最高?()A、地域:福建;年龄:25-50岁;兴趣分类:家装建材;兴趣关键词:红木家具B、地域:福建;年龄:25-50岁;兴趣关键词:家装建材、红木家具C、地域:福建;年龄:25-50岁;兴趣关键词:红木家具D、地域:福建;年龄:25-50岁;兴趣分类:家装建材正确答案:D4、FAB商品卖点提炼法,是FAB销售法则在网店推广领域的一个实际应用。
以下属性属于A(Advantage)的是()。
A、功能B、包装C、形状D、商品理念正确答案:A5、关于商品产出的描述错误的是()。
A、转化率的上涨意味着商品产出的提升B、商品产出高意味着商品对平台流量使用的效率高C、商品产出由点击率、转化率和客单价三个指标决定D、平台倾向于把流量给到商品产出高的商品正确答案:A6、在信息流推广过程中,账户转化优化不包含()。
A、转化工具优化B、落地页优化C、人群定向优化D、应用下载页优化正确答案:C7、当进行推广计划地域设置的时候,设置了只有江苏ip消费者才有机会看到推广商品,以下能看到推广信息的是()。
A、江苏人在北京居住B、北京人在江苏居住C、坐高铁路过江苏D、江苏附近省市正确答案:B8、以下哪个方面不能决定商品权重?()A、商品产出B、作弊处罚C、商品单价D、商品人气正确答案:C9、下列店铺运营环节,哪一个不属于推广职责范围内的?()A、让买家进店B、让买家看到店铺C、让客户买后再来D、让买家购买正确答案:C10、以下不属于信息流推广三大定向方式的是()。
什么是云营销?

战后世界营销的发展阶段已经清晰表明,中国市场正在进入新时代。
平媒主导阶段:二战结束后的20年,是平面报刊与广播媒体主宰传播的时代,媒体的集中度很高,这才会诞生奥格威式的经典长文案(如著名的劳斯莱斯广告)。
电视主导阶段:70年代起,西方进入电视时代后,商业广告片(TVC)在营销中的作用大幅提升,奥美的品牌形象理论、罗瑟·里夫斯的USP(独特销售主张),里斯与特劳特的定位论、舒尔茨的IMC(整合营销传播),都是为了解决信息爆炸时代“一见钟情”的传播效果问题。
互联网主导阶段:遥控器时代并非信息爆炸的终结,互联网时代,尤其是计算机普及后,视频网站崛起与电视频道争夺观众、手机电视机的电脑化(所谓三屏合一),靠一个文案、一个图形创意设计、一条TVC就能解决品牌建立与维护的时代结束了。
社交化媒渠(媒体即销售渠道)主导阶段:今天的消费者拥有了更多的主导权、参与度与口碑传播工具。
当企业在传统媒体上建立品牌形象的时候,新兴企业将通过B2C、O2O、SNS 等多种传播、渠道、交易的整合,将订单拿到了手里。
这是中国正在爆发的专业电商品牌如凡客诚品、玛萨玛索、梦芭莎、麦包包、维棉、雅库等,发起的对日用消费品销售份额的“掠夺”:即线上(电商)对线下(实体终端)销售份额的侵蚀。
企业的营销管理实践,在发生不可思议的创新变化:自上世纪末海尔“海鲜论”开始的高效供应链体系,在苏宁的门店管理系统中实现:一个集ERP系统优化、数据挖掘分析、企业SOA平台建设、财务组织优化、人力资源培训、会员服务、仓储配送等多个方面全面整合企业管理体系和信息化系统。
这个抽象的管理系统背后是什么?物流:用相当于原来1/3的人员就实现了进出货差错率几乎为零;库存周转率:提高了60%;资金占用率:下降了40%以上———想知道这些数字代表了什么,翻一下看2011年苏宁与国美年报里的经营指标对比即知。
中小企业离管理信息化有多远?管理软件:没用过SAP、Oracle、用友、金蝶的,总用过Salesforce、管家婆或任我行CRM。
如何才能成为出色的架构(狗)师

如何才能成为出色的架构(狗)师CSDN:请简单介绍下您和目前的工作,以及关注的领域。
刘建:大家好,我博士毕业于北京京航空航天大学计算机学院,目前担任搜狗架构师,主要负责搜狗商业平台的基础研发和平台架构方向,涉及数据存储、分布式计算、服务化、安全等以及广告计费、报文等核心业务服务。
目前主要关注大数据基础平台、流式计算、效率提升工具。
之前在IBM研究院从事SaaS平台中身份联邦的研发工作。
CSDN:您是如何成长为一名架构师的?以及对架构是怎样的理解?刘建:我觉得要成为架构师,主要是学习能力+好奇心+实践经验。
我在研究生和在IBM研究院工作阶段主要方向是面向服务计算,当时对架构比较有兴趣,阅读过大量与架构相关的书籍:比如SoftwareArchitectureBootcamp、重构、设计模式等,也捣腾过SEDA 并且有过实践,得到的各方面的指导也偏宏观,因此会不自觉的从宏观和整体性的方向去思考问题,把握系统,会主动思考系统的瓶颈以及目前所负责部分的不足以及优化的方向。
初来搜狗时负责网盟广告平台研发,后来调整为负责商业平台基础研发和平台架构。
有幸经历了搜狗广告业务的快速发展,广告物料数从千万级到十亿级的爆炸式增长阶段。
在此期间,先后主导和参与了统一用户中心、统一权限中心、数据库分库分表框架、SOA框架、数据平台等的设计和研发工作,并完成了Hadoop、Storm、Spark、Kafka、Thrift等开源软件的升级和引入,积累了较多的架构实践经验,从而成长为架构师。
个人认为架构主要涉及到两个层次:分别为基础架构和业务架构。
我个人更多的侧重于基础架构。
我认为一个好的架构需要能够尽可能的具备通用性,满足高性能、高可用、高可扩展性等特点,另外能够快速定位故障点,具备较快的故障恢复能力,更好的运维及监控能力等,在其进化升级过程中尽可能的保证兼容性,能够平滑进行迁移和切换。
CSDN:能否全面介绍下搜狗商业平台的基础架构?有着怎样的特点和难点?刘建:搜狗商业平台涉及搜索推广、网盟推广、品牌推广商业广告投放平台架构设计和研发,提供十亿级以上在线广告管理及相关支持。
搜狗搜索引擎的市场定位策略

搜狗搜索引擎的市场定位策略搜狗搜索引擎作为中国领先的互联网公司之一,一直以来都在市场竞争中保持着较强的竞争力。
在激烈的搜索引擎市场竞争中,搜狗通过灵活的市场定位策略不断提升自身的竞争力和用户满意度。
本文将探讨搜狗搜索引擎的市场定位策略,并分析其通过定位策略实现的市场竞争优势。
一、搜狗搜索引擎的定位搜狗搜索引擎的定位是以“智能、便捷、专业”为核心价值观,致力于为用户提供高质量、高效率的搜索服务。
搜狗以技术创新为驱动力,通过大数据、人工智能等前沿技术,为用户提供个性化、精准的搜索结果。
搜狗坚持以用户需求为导向,努力实现用户体验的不断优化和提升。
二、1. 用户体验为核心搜狗搜索引擎将用户体验放在首位,通过技术创新和不断优化搜索算法,提供个性化的搜索结果。
搜狗搜索将根据用户的搜索习惯、地理位置等因素,为用户呈现最相关、最贴合的搜索结果。
同时,搜狗搜索还提供丰富的搜索扩展功能,如快速翻译、知识问答等,为用户提供更便捷、全面的搜索体验。
2. 深度合作与整合资源搜狗搜索引擎积极与各类垂直领域合作伙伴深度合作,整合各类优质资源,从而提供全面、多样的搜索服务。
搜狗通过与电商、旅游、新闻等行业的合作,为用户提供更准确、更全面的搜索结果。
搜狗还与各大视频、音乐等媒体平台合作,提供一站式的搜索服务,满足用户多样化的搜索需求。
3. 强调数据安全和隐私保护搜狗搜索引擎在市场定位中强调用户数据安全和隐私保护的重要性。
搜狗致力于建立安全可靠的搜索平台,保护用户的搜索历史、账号信息等隐私数据不被泄露和滥用。
搜狗通过加密技术、数据分析等手段,确保用户对搜索引擎的信任度和使用体验,增强搜狗在市场中的竞争力。
三、搜狗搜索引擎的市场竞争优势1. 技术优势搜狗搜索引擎凭借着强大的技术实力和持续的技术创新,取得了在搜索领域的竞争优势。
搜狗通过数据挖掘、机器学习等算法技术,提供更准确、更智能的搜索结果。
搜狗搜索引擎还拥有自主研发的语音识别和图像识别等技术,满足用户多样化的搜索需求。
劳顿《管理信息系统》习题集_第6章_中文

管理信息系统》第13版(Laudon/Laudon)第章商务智能基础:数据库与信息管理单项选择题.1)一组字符组成一个字,一个文字或者一个完整的数字称之为一个字段参考答案:FALSE难度系数:12)用以描述某一特定实体的特征或性质被称为属性参考答案:TRUE难度系数:13)程序-数据依赖是指当文件和软件程序需要更新和维护时,存储在其中的数据也需要作出相应变更。
参考答案:TRUE难度系数:24)DBMS将数据的逻辑视图与物理视图进行了区分参考答案:TRUE难度系数:25)文件中的每一条记录都至少包含一个关键字段.参考答案:TRUE难度系数:16)非关系型数据库技术被用于管理对表和关系的灵活性要求不高的数据集参考答案:TRUE 难度系数:17)数据治理制定相关政策与流程来管理企业数据的整体性和安全性参考答案:TRUE难度系数:28)由于HTML是一种跨平台语言,为此它是一种受到后端数据库青睐的方法参考答案:FALSE难度系数:29)数据字典是一种由终端使用者和程序员用以在数据库中操作数据库管理系统中相关数据的语言参考答案:FALSE难度系数:1110)在关系数据库中,复杂的数据群组必须经过精简来消除多对多关系参考答案:TRUE难度系数:111)数据仓库可以在旧系统基础上进行更新参考答案:TRUE12)一个数据仓库通常包含了几个规模较小的数据集市参考答案:FALSE难度系数:213)OLAP支持多维数据分析参考答案:TRUE难度系数:214)除了数据存储在非常大的数据库情况之外,OLAP都能够使用户快速获得对突发问题的参考答案:FALSE难度系数:215)内存计算主要依靠计算机的内存(RAM)参考答案:TRUE难度系数:316)在基于网络的服务器环境下,中间件的作用在于:将来自于公司内部数据库的信息传递给以网页形式呈献给用户的网络服务器上参考答案:TRUE难度系数:217)使用网络接口的缺点在于网络接口对于内部数据库要做出大量的改变参考答案:FALSE 难度系数:118)公共网关接口是一种处理网络服务器数据的规范参考答案:TRUE难度系数:219)数据库管理是一项通过制定政策与流程来将企业数据当成一类企业资源进行管理的组织职能参考答案:TRUE难度系数:2220)数据清洗与数据清理流程相同参考答案:TRUE难度系数:121)以下哪一项最好的概述了实体与属性之间的关系?A)实体-客户与属性-产品B)实体-客户与属性-购买C)实体-产品与属性-购买D)实体产品与属性-客户参考答案:B难度系数:322)以下哪一项不是传统文件环境的问题之一?A)数据不一致B)程序-数据依赖C)缺乏对临时需求的灵活性D)数据安全性低参考答案:B难度系数:2A)参照完整性约束B)将程序与数据分开C)运用数据字典D)最大限度地减少存放重复数据的独立文件参考答案:D难度系数:324)描述实体的特征或特性的被称为A)字段B)元组C)关键字段D)属性参考答案:D难度系数:125)以下哪一项非数字数据存储相关项是与数据库最类似的?A)卡片目录B)现金出纳收据C)医务室发票D)办公室购物清单参考答案:A3难度系数:226)由造成的难题使得企业试图进行客户关系管理,供应链管理或者从不同数据源整合成为企业信息系统的难度增大A)批量处理B)数据冗余C)数据独立性D)在线处理参考答案:B难度系数:127)在多个数据文件中出现的相同数据被称为A)冗余B)重复C)独立D)划分参考答案:A难度系数:128)数据库管理系统能够A)根据不同的逻辑视图来访问物理数据库B)根据不同的分析视图来访问逻辑数据库C)根据不同的分析视图来访问物理数据库D)根据不同的物理视图来访问逻辑数据库参考答案:A难度系数:229)逻辑视图能够A)展现在存储媒介上数据的组织方式及其结构C)生成补充报告D)展现出终端用户能看到的数据形式参考答案:D难度系数:230)中端电脑的数据库管理系统不包括以下哪一项A)DB2.B)Oracle.C)MicrosoftSQLServer.D)MicrosoftAccess.参考答案:D431)逻辑数据库模型的哪一类将数据存储在二维表中A)非关系数据库B)移动数据库C)关系数据库D)层级数据库参考答案:C难度系数:132)OracleDatabaseLite是一款A)小型手持计算机设备上的数据库管理系统B)网络数据库管理系统C)大型机关系数据库管理系统D)中端机数据库管理系统参考答案:A难度系数:333)MicrosoftSQLServer是一款A)小型手持计算机设备上的数据库管理系统B)网络数据库管理系统C)大型机关系数据库管理系统D)中端机数据库管理系统参考答案:D34)客户这张表中,关于单个客户的信息会被存储在单个中A)字段B)行C)列D)表参考答案:B难度系数:135)关系数据库中,一条记录用专业术语被称为A)元组B)行C)实体D)字段参考答案:A难度系数:2536)识别表中每一行所有信息的唯一标识的字段被称为A)主键B)关键字段C)主字段D)唯一ID参考答案:A难度系数:237)表中唯一识别每条记录的字段被称为A)主键B)关键字段C)主字段D)唯一ID参考答案:B难度系数:238)在关系数据库中,用以获得有用的数据集合的三项基本操作是A)select,project,andwhere.B)select,join,andwhere.C)select,project,andjoin.D)select,from,andjoin.参考答案:C难度系数:239)选择操作是指A)联合多个表,为用户提供比单个表更多的信息B)创建一个只有列组成的子集C)辨识从哪张表中选择列D)建立一个子集,包含文件中所有符合设定标准的记录参考答案:D 难度系数:140)连接操作是指A)联合多个表,为用户提供比单个表更多的信息B)辨识从哪张表中选择列C)创建一个只有列组成的子集D)将元素组合成片段参考答案:A难度系数:141)投影操作是指A)联合多个表,为用户提供比单个表更多的信息6B)创建一个只有列组成的子集C)将元素组合成片段D)辨识从哪张表中选择列参考答案:B难度系数:142)大数据不指代A)少于十亿条记录的数据库B)数据结构是给结构化的数据库C)机器生成的数据(传感器)D)社交媒体的内容(推特和脸书)参考答案:A难度系数:243)以下哪一项技术能够用以分析由大型网络零售商所生成的社交媒体数据?A)OLAPB)数据仓库C)数据集市D)Hadoop参考答案:D难度系数:244)数据字典作为重要的数据管理工具,其职能体现在A)设定了数据的属性B)建立了数据库中数据元素的清单C)展示了终端用户或者商务人员看到数据的形式D)保证了数据处于更新的状态参考答案:B难度系数:245)用以存储数据元素的定义与数据特性(用法,表示形式,管理权,授权,安全性)的自动化和人工化的文件被称为A)数据字典B)数据定义图C)实体-关系图D)关系字典参考答案:A难度系数:246)用于增加和更改数据库中数据的专门语言称为A)数据存取语言B)数据操纵语言7C)结构化查询语言D)数据定义语言参考答案:B难度系数:147)现如今最受欢迎的数据操纵语言是A)Access.B)DB2.C)SQL.D)CrystalReports.参考答案:C难度系数:248)DBMS通常包含报告生成工具,其目的在于A)生成和展示数据B)将数据以易于阅读的方式呈现C)以图表方式展现数据D)体现出预测分析参考答案:B难度系数:249)简化数据以最小化冗余以及棘手的多对多关系的过程被称为B)数据清理C)数据清洗D)数据定义参考答案:A难度系数:150)用以描述整个数据库的关系的原理图被称为A)数据字典B)交互关系图C)实体关系图D)数据定义图参考答案:C难度系数:251)表示实体之间存在的一对一关系由下列哪一个表示A)两根短竖线结尾的连线B)一根短竖线结尾的连线C)一条短线和一个箭头结尾的连线D)一条短线和一个箭头结尾上加一短线的连线参考答案:A8难度系数:352)以下哪一项不是网络数据挖掘的技术之一?A)内容挖掘B)网络结构挖掘C)网络服务器挖掘D)网络使用挖掘参考答案:D难度系数:253)假设你正在为一家零售服装连锁店工作,它们的主要销售对象是购物商场,而你正在为你的消费者以及其偏好作分析。
盘点:搜狗十年的3个发展期和6大关键词

盘点:搜狗十年的3个发展期和6大关键词搜狗是中国最早为搜索引擎领域作出贡献的企业之一,成立于2004年12月,较早进入行业的搜狗在逐步与“巨头”百度展开竞争,不断地拓展市场。
在经历了十年的发展过程中,搜狗共经历了三个发展时期以及不断推出的六大关键产品,下面,我们将对此进行盘点。
一、搜狗的发展历程第一阶段:2004-2008年,互联网时代的迅猛崛起期,搜狗以推出的免费输入法吸引了大量用户,搜狗输入法的发布也直接带动了搜狗首页的流量。
这个时期是搜狗发展的关键时期,搜狗一步步扩大了自己的用户群体。
第二阶段:2009-2013年,移动互联网时代的到来,是搜狗实现新的突破和快速发展的时期。
搜狗在这一阶段进一步开拓了移动互联网市场,推出了搜狗输入法、搜狗地图、搜狗浏览器和搜狗翻译等关键产品,并与微软、移动和五大电信公司等国内外著名企业建立了合作。
第三阶段:2014-至今,人工智能时代的到来,搜狗进一步规模化、差异化和聚焦化发展,将搜狗输入法升级为智能输入法,引入高度智能化的语音输入、识别等技术,实现商业化的落地,成为国内语音输入领域的领先者。
二、搜狗的六大关键产品1、搜狗输入法:是搜狗的第一个关键产品,也扮演了搜狗成长的重要角色。
输入法逐渐开发出了拼音输入和五笔输入两个版本,并且引入了人工智能技术。
在搜狗输入法的推动下,搜狗首页的流量逐渐增加。
2、搜狗浏览器:是搜狗在移动互联网时代推出的重要产品之一。
该浏览器在功能上做了大量的优化,提供了更高效、更快捷的浏览体验,使搜狗在移动互联网领域的影响力逐渐得到了提升。
3、搜狗地图:是搜狗在移动互联网时代推出的另一个产品,该地图为用户提供了更贴心的定位服务,也让搜狗在移动互联网市场中有了更大的话语权。
4、搜狗翻译:搜狗语音翻译是2018年推出的重大产品。
该产品以人工智能和大数据技术为支撑,实现了实时翻译,帮助人们更好的融入全球化社会。
5、搜狗搜索:在十年的发展历程中,搜狗一直致力于提高自己的搜索引擎技术,逐步增强能力。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 性能降低 vs 数据不一致
流式计算框架概览 数据层 文件(日志文件或者应用生成)、数据库 Kafka Producer Pump
(Mysql Trigger)
接入层
服务层
Binlog Tunnel
(Mysql Binlog)
实时日志发布订阅框架(基于Kafka)
消费层
Kafka Comsumer
主库
从库
从库
主库
从库
从库
主库
从库
从库
数据库分库分表框架 – 使用场景
• 迁移步骤
– 框架集成:数据源配置的平滑迁移 – 接口迁移:应用程序接口逐步迁移 – 数据迁移:数据通过脚本迁移
• 涉及停机时长
1
接口A 接口B
2
接口A 框架A 接口B Compass 接口A
3
接口B
接口A Compass
4
接口B Compass
• 我们所做的工作
– 分布式会话 – 单机多机,保证架构可水平迁移
• 应用分布式计算框架:Hadoop
存储水平化
• 存储的水平可扩展性
– 读 更多的副本(可通过复制技术等)
• 网络延时 • 一致性
– 写 拆分数据,提供更多写实例
• 我们所做的工作
– 数据库分库分表框架 - Compass – MongoDB分库分表框架 – 数据库全量/实时报文水平切分
服务化测试框架 线上引流 框架
服务单元 测试框架 服 务 注 册 服 务 管 理
服务化基础框架:Polaris 客户端 服务端
服务化基础框架:Polaris
• 服务化基础框架:Polaris
– 基于Thrift
• 接口可描述性高,通过接口交互 • 高性能、跨语言 • 多种编码方式 • 社区活跃度高 • 缺点:类型侵入
Kafka集群
* 高吞吐率,高可靠性 * 同一主题支持多消费者 * 消费者水平扩展,无单点问题 * 权限控制:
流式计算阶段应用 • 应用点:日志 • 双路比对:降低风险
商业广告平台
报告 日志查 API API 询 API 报告
广告API
双写
报告 API 报告 API 日志
日志库 日志库 (新) 数据比对
– 多版本并行研发,项目风险增加,回归成本变高
服务化
• 资源私有
– 数据库资源:广告、用户、资金… – 短信/邮件通道 ;图片服务;登录授权服务;
• 基于接口交互
– 功能自治/独立演化,可维护性大大增强 – 降耦合,降低协作成本 – 提供基于接口的服务,沉淀公有基础组件
服务化框架概览 服务追踪框架
框架A
框架 集成
接口 迁移
数据
拆分
…
水平化阶段 - 之前
• 商业广告平台体系结构通过快速原型构建
– 业务逻辑垂直拆分:Oracle主从库+多Schema – 报告统计:数据库 + SQL – 应用服务器:负载均衡 商业广告平台
报告统计 (后台)
报告 库
广告 库
日志 库
水平化阶段 – 之后
• 存储水平化
搜狗商业平台基础架构演化实践
搜狗 刘建
关于我
刘建
架构师
搜狗商业平台研发部架构负责 人,有多年大规模分布式互联 网架构设计和实践经验。 @kersus
主要内容
搜狗商业平台基础架构概述
水平化阶段
服务化阶段
-- 水平扩展那些事 -- 探究 “更好”的协作方式 -- 为了“更好”的客户体验
流式计算阶段
总结及展望
• 基于数据库交互
业务高速发展带来的风险及挑战
• 性能问题 • 可维护性
– 公有基础模块越来越多,同一个功能存在多个 模块和版本:缓存、短信、消息、数据、报告 存储…
• 协作问题
– 团队协作日益复杂:多种语言和多种不同类型 的数据
• 成本 vs 收益 降低
搜狗商业平台基础架构演化阶段
流式计算 服务化 水平化 初始阶段
– 语言:Java、C++、Python… – 协助方式:RMI、Hession、ICE、HTTP/JSON, TCP+自定义格式、依赖相关类库(数据库连 接)…
• 公有基础组件被无限制使用,散落各处
– 权限、消息、邮件、基础公有类库 、工具包… – 依赖类库:类库升级复杂,包冲突变多
• 业务版本的可维护性问题
数据库分库分表框架 - Compass
• 支持主从库、分库、分表、分库分表 • 读写分离/负载均衡 • 遵循标准数据源DataSource接口
分库数据源
路由策略
连接池监控管理
数据源可用
主从数据源(1)
主从选择 策略
主从数据源(2)
主从选择 策略
主从数据源(N)
主从选择 策略
数据源 心跳探测
数据源不可用
服务化
水平化
初始阶段
All-In-One,快速原型,基于开源/经验 功能优先,团队独立,协作较少
基础架构构建经验 • 接口兼容性
– 基础架构演化虽是一个长期行为,最好尽早统一 – 接口兼容为一段时间内同类框架共存提供了基础
• 控制风险
– 尽量避免一刀切 – 双路和灰度方案 – 监控优先
• 易用性
– 提升开发效率,降低出错几率
广告管理
报告统计
广告管理
HTTP
报告库
广告库
报告库
广告库
…
…
服务化阶段 – 之后 • 服务化:基于接口交互,有效降低沟通成本; • 业务独立性:业务逻辑统一化,接口化 • 可维护性:各组件职责清晰,可独立扩容和部署 聚合层
商业广告平台 商业广告 WS
服务层
报告 报告 报告 API API API
报告 报告 广告 API API API
Storm
应用层
应用(监控、安全、审核、统计分析…)
实时日志发布订阅框架 • 生产者消费者松耦合(基于数据格式接口) • 基于Kafka
日志
监控
Kafka Producer
* 统一部署 * 断点续传 * 自定义扩展
监控 管理
* 主题管理 * 顺序号管理 * 节点监控
Kafka Mirror
线下环境
– 服务提供者提供客户端的可维护性问题,包括语言、 平台、框架、依赖等,会导致维护成本增加
• 通过“本地调用远程调用”两阶段进行平滑迁 移,从低优先级服务开始,能有效降低风险 • 关注服务全流程管理:服务注册、服务发现、服 务调用(文档)、服务追踪、监控与度量、服务 下线
主要内容
搜狗商业平台基础架构概述 水平化阶段
-- 水平扩展那些事
服务化阶段
-- 探究 “更好”的协作方式 -- 为了“更好”的客户体验
流式计算阶段
总结及展望
面临问题 • 一个实例:搜狐矩阵广告审核
客服
仅审核选择 投放了搜狐 矩阵的广告
广告审核平台
查询广告 是否投放 搜狐矩阵
网盟投放平台
客户
选择是否投放 搜狐矩阵
定时推送 具备相关性 的广告
广告
• 关注数据的全局计算、聚合统计
– 全库聚合统计/查询迁移困难(数据库、MongoDB) – 聚合框架效率低(涉及排序,过滤的话)
• 保持兼容性,从影响小的功能点开始,平滑迁移
– “框架集成”“接口迁移”“数据迁移”
• 保持下一次水平扩展的简单性(存储)
– 124 vs 14(2个为1组,部署在一组物理机上)
节点
Producer
日志写入 日志写入
Kafka集群
流式计算阶段 – 之后
商业广告平台 商业广告WS
报告 报告 报告 API API API
报告 报告 广告 API API API
报告 日志查 API API 询 API
报告
报告 报告 优化 API API API
报告库
广告库
日志库
优化库
…
日志写入 优化写入 其他…
广告量增长迅速 • 数据库健康度低
– 旭日在线广告:~8000万级 – IO及CPU压力较大,健康度在警戒线之上
• 访问超时率高
– 99%<4秒
– 广告列表/批量操作等平均响应用性能需求
– 计算资源:无法在要求的时间给出计算结果 – 存储资源:IO、TPS
• 水平化分类
报告 日志查 API API 询 API
报告
报告 报告 优化 API API API
报告库
报告统计
广告库
日志库
优化库
…
服务化阶段 – 实践总结 • 公共基础组件逐步形成,实现共享、避免重复开 发,如:统一登录、用户管理、权限管理、日志、 监控、数据平台…等等 • 尽可能的通过接口描述语言(IDL)进行交互
• 开源软件
– 关注开源社区及主流开源组件 – 基于业务需求选择和优化开源组件,关注成本和收益
搜狗商业广告平台基础架构图
业务系统 核心服务
(业务相关) 唯一序列号服务
资金服务
计费服务 统一登录服务 统一配置服务
图片服务 分布式缓存
(Memcache)
审核服务 统一权限服务 统一调度服务
消息/邮件服务 分库分表框架
主要内容
搜狗商业平台基础架构概述 水平化阶段
-- 水平扩展那些事
服务化阶段
-- 探究 “更好”的协作方式 -- 为了“更好”的客户体验
流式计算阶段
总结及展望
面临问题
• 核心资源被多个业务同时使用
– 例如:广告核心库被多个业务同时使用
• 数据库连接数噩梦:定位问题难、联动大、效率低