中国数据资产管理峰会-唯品会大数据

合集下载

大数据应用金点子:十大创意案例

大数据应用金点子:十大创意案例

大数据应用金点子:十大创意案例大数据已经成为当今企业竞争中最重要的武器之一。

越来越多的企业开始投入大量资源来实施大数据项目,以求在竞争中获得优势。

但是,如何应用大数据才能真正获得商业价值呢?下面将介绍十个创意案例,这些案例中的企业通过创新应用大数据,实现了商业价值的突破。

1. 美团外卖大数据优化配送路线美团外卖作为国内外知名的外卖平台,拥有海量订单数据。

美团将这些数据与实时路况、天气预报等信息结合起来,通过机器学习等技术对外卖配送路线进行优化,提高送餐效率,减少了成本,降低了配送时间误差率。

2. Ping An通过大数据创新保险模式Ping An通过收集用户的医疗数据和基因数据,结合人工智能技术,为用户提供更为个性化的保险服务。

用户在网上购买保险时,只需上传相关数据,系统即可自动定制保险方案,减少不必要的保险费用。

3. 京东大数据解决虚假评论问题虚假评论一直是电商平台的一个痛点问题,京东通过大数据技术解决了这个问题。

京东将大量的用户评论数据和用户行为数据结合起来,通过建模的方式排除和过滤虚假评论。

4. 滴滴大数据提高乘客和司机匹配成功率滴滴通过大数据技术提高乘客和司机匹配成功率。

滴滴把乘客和司机的位置数据、历史订单数据等结合起来,运用机器学习算法,快速匹配司机和乘客,提高了预约时间内的匹配成功率。

5. 中国石化利用大数据实现智能加油站中国石化通过收集终端设备数据、POS交易数据等,实现加油站油品库存管理、客户服务等功能的智能化。

通过建立大数据模型,可以根据用户车型、出行路线和消费倾向等因素,实现精准定制的服务。

6. 中信银行应用大数据打造智能风控中信银行通过海量客户数据和交易数据、市场数据等结合起来,利用AI 技术和风控模型进行分析,建立智能化风险管理体系。

中信银行预计在未来五年内,每年风险管理费用可下降50%以上。

7. 唯品会大数据提高营收和用户粘性唯品会通过深入挖掘用户行为数据,借助机器学习算法,从而提高用户粘性和订单转化率。

唯品会案例分析范文

唯品会案例分析范文

唯品会案例分析范文唯品会是中国领先的在线特卖电商平台,提供优质品牌商品和服务。

该案例分析将从公司背景、市场定位、商业模式、运营策略和未来发展等方面进行分析。

一、公司背景唯品会成立于2024年,总部位于中国广东深圳。

公司始终坚持“为消费者提供高品质商品和服务”的理念,以“唯品会品质节”为核心理念,致力于为会员提供真正优质、超高折扣的品牌商品。

凭借独特的商业模式和精细的运营管理,唯品会迅速崛起并成为中国特卖市场的领导者。

二、市场定位唯品会的市场定位是高品质、折扣、特卖。

公司专注于销售一线品牌的高品质商品,并在特定时间段提供超高折扣,吸引消费者购买。

通过专注特卖市场,唯品会成功打造了自己的特色和竞争优势。

三、商业模式唯品会的商业模式主要有三个核心要素:会员制、精选品牌和限时限量。

首先,唯品会采用会员制,只有注册会员才能进入购物平台进行购物。

这种模式可以有效提高用户黏性,并通过个性化推荐和活动促销来增加用户参与度。

其次,唯品会只销售一线品牌的精选商品,确保商品品质和品牌溢价。

最后,唯品会采用限时限量的模式,即限时销售有限数量的商品,以创造稀缺感和购买冲动。

四、运营策略唯品会在运营方面采取了一系列策略来保持竞争优势。

首先,唯品会注重品牌合作伙伴关系的建立和维护。

通过与品牌商的合作,唯品会能够提供真正的一线品牌和高品质商品,增强用户购买的信任感。

其次,唯品会注重用户体验和商品质量的把控。

公司提供多种配送和支付方式,确保用户可以顺利购买,并且通过质量把关保证商品的品质。

最后,唯品会注重数据分析和市场营销策略的优化。

通过对用户行为和购买数据的分析,唯品会能够精准制定个性化推荐和促销活动,提高用户转化率和消费频次。

五、未来发展唯品会在未来的发展方向主要包括提升用户体验、扩大品牌合作和拓展国际市场。

首先,唯品会将进一步优化用户体验,提高购物平台的功能和界面设计,并提供更便捷的购物和配送服务。

其次,唯品会将继续加强与品牌商的合作伙伴关系,扩大产品线和供应链,进一步提供更多优质商品给用户选择。

安徽唯品会物流有限公司介绍企业发展分析报告

安徽唯品会物流有限公司介绍企业发展分析报告

Enterprise Development专业品质权威Analysis Report企业发展分析报告安徽唯品会物流有限公司免责声明:本报告通过对该企业公开数据进行分析生成,并不完全代表我方对该企业的意见,如有错误请及时联系;本报告出于对企业发展研究目的产生,仅供参考,在任何情况下,使用本报告所引起的一切后果,我方不承担任何责任:本报告不得用于一切商业用途,如需引用或合作,请与我方联系:安徽唯品会物流有限公司1企业发展分析结果1.1 企业发展指数得分企业发展指数得分安徽唯品会物流有限公司综合得分说明:企业发展指数根据企业规模、企业创新、企业风险、企业活力四个维度对企业发展情况进行评价。

该企业的综合评价得分需要您得到该公司授权后,我们将协助您分析给出。

1.2 企业画像类别内容行业仓储业-其他仓储业资质一般纳税人产品服务空1.3 发展历程2工商2.1工商信息2.2工商变更2.3股东结构2.4主要人员2.5分支机构2.6对外投资2.7企业年报2.8股权出质2.9动产抵押2.10司法协助2.11清算2.12注销3投融资3.1融资历史3.2投资事件3.3核心团队3.4企业业务4企业信用4.1企业信用4.2行政许可-工商局4.3行政处罚-信用中国4.5税务评级4.6税务处罚4.7经营异常4.8经营异常-工商局4.9采购不良行为4.10产品抽查4.12欠税公告4.13环保处罚4.14被执行人5司法文书5.1法律诉讼(当事人)5.2法律诉讼(相关人)5.3开庭公告5.4被执行人5.5法院公告5.6破产暂无破产数据6企业资质6.1资质许可6.2人员资质6.3产品许可6.4特殊许可7知识产权7.1商标7.2专利7.3软件著作权7.4作品著作权7.5网站备案7.6应用APP7.7微信公众号8招标中标8.1政府招标8.2政府中标8.3央企招标8.4央企中标9标准9.1国家标准9.2行业标准9.3团体标准9.4地方标准10成果奖励10.1国家奖励10.2省部奖励10.3社会奖励10.4科技成果11 土地11.1大块土地出让11.2出让公告11.3土地抵押11.4地块公示11.5大企业购地11.6土地出租11.7土地结果11.8土地转让12基金12.1国家自然基金12.2国家自然基金成果12.3国家社科基金13招聘13.1招聘信息感谢阅读:感谢您耐心地阅读这份企业调查分析报告。

唯品会的企业分析报告

唯品会的企业分析报告

理论争鸣Theory of schools of thought contend■ 韩大宝唯品会的企业分析报告摘要:唯品会,一家采用“特卖+低至一折的限时抢购+每天上新”销售模式的购物网站。

依托互联网搭建属于自己销售平台来向顾客销售品牌折扣商品。

中包括全国一线品牌的服饰鞋包、化妆品、母婴等各种商品。

自唯品会上市至今已经连续15季度实现盈利,迅速超越其他购物网站成为全球最大的特卖网站。

[ 唯品会的快速发展使我们感受到中国电子商务广阔的市场正在蓬勃发展,同时它也证明了一个企业创新的重要性。

关键词:渠道;广告投放;物流体系回顾唯品会的成长历史,唯品会有独特的销售模式、优秀的企业文化、完善的物流体系以及正规的渠道采购,这让唯品会快速地从各类购物网站中崛起,成为了中国第三大电商。

下面我们从这四个方面来分析唯品会的成功。

1唯品会的商业模式首先唯品会在中国创造性的提出了“特卖”这一商业模式,采用“特卖+低至一折的限时抢购+每天上新”销售模式,极大的满足消费者的购物体验。

唯品会创立初期,大部分顾客被折扣和特卖所吸引,原先所需要在线下购买的各大品牌商品现在通过购物网站就能直接购买,并且有极高的折扣和正品的保证。

通过市场细分我们不难看出唯品会的客户群体主要是女性消费者,其中20岁至40岁的女性消费者占大多数,她们有一定的消费能力,熟悉网络购物,并且对折扣、特卖和正品这类词汇十分敏感。

但传统的B2C和C2C网站针对国内外一线品牌合作不多,并且没有能够较好地抑制虚假产品的出现,更没有大规模的折扣活动。

唯品会所推出的产品限时折扣和最低折扣的模式极大程度的满足了客户的购物需求,增强了客户的购买动力,限时,是催促消费者在短时间下单购买的动力,这能够避免消费者因犹豫而丢失订单,这样一来,一旦消费者没有抢购到满意的商品她们就还会持续地关注唯品会其他折扣商品或者下一期的折扣商品。

另外,唯品会向外界不断宣扬精致优雅的生活品质,提倡独立个性的的生活理念,这种有品位、有内涵的生活态度也与当代女性的消费观念相吻合。

唯品会的线上销售模式案例分析

唯品会的线上销售模式案例分析

唯品会的线上销售模式案例分析唯品会作为中国最大的在线特卖电商平台之一,以其独特的销售模式和商业策略在市场中取得了巨大的成功。

本文将对唯品会的线上销售模式进行案例分析。

一、唯品会的背景介绍唯品会成立于2008年,是中国最早的特卖电商平台之一。

平台以销售一些品牌服装、鞋子、包包等配件为主,通过限时特价销售模式吸引消费者。

其独特的销售模式和商业策略使其快速在中国电商行业崛起,成为行业的领先者。

二、唯品会的商业模式1. 会员制度唯品会采用会员制度,用户需要通过注册成为会员才能购买产品。

会员制度能够有效提高用户的黏性和忠诚度,并通过针对会员推出个性化的优惠券、促销活动等方式增加用户的购买欲望。

2. 限时特卖唯品会采用限时特卖的销售模式,即在限定的时间内销售特定品牌的特价商品。

这种销售模式增加了商品的稀缺性,激发了消费者的购买欲望,同时也增加了消费者对品牌的好感度。

3. 品牌合作唯品会与众多知名品牌进行合作,通过与这些品牌合作销售限量款、过季款等商品,吸引了大量消费者对这些品牌商品的购买。

这种合作模式也使得品牌方能够在唯品会平台上迅速清空库存,降低了库存风险。

4. 数据驱动和个性化营销唯品会通过大数据分析和智能算法,对用户的购物习惯和兴趣进行深入挖掘,从而向用户推送个性化的商品推荐。

这种精准的推荐能够提高用户的购买转化率,并增加用户在平台上的停留时间。

三、唯品会的成功因素1. 抢购文化唯品会通过限时特卖和限量发售等方式创造了一种抢购的文化氛围,使用户对商品产生紧迫感,从而提高购买的欲望。

2. 大数据分析唯品会充分利用大数据分析和智能算法,对用户进行细分和个性化的营销,提供精准的商品推荐和购买引导,从而不断推动销售增长。

3. 全渠道销售唯品会在线上线下渠道齐全,通过线上销售和线下店面相结合的方式,提供更加便捷的购物体验,满足消费者的多样化购物需求。

4. 品牌合作与供应链管理唯品会与众多知名品牌进行合作,通过与品牌方的紧密合作,保持商品的新鲜度和更新速度,同时也提供了更多的选择和购买机会。

唯品会客户关系管理策略分析

唯品会客户关系管理策略分析

对其他电商企业的借鉴意义
重视客户关系管理
电商企业应充分认识到客户关系管理的重要性,通过精细化运营、多元化营销手段等方式,提高客户满意度和忠诚度 ,实现持续增长。
创新是关键
在电商行业竞争日益激烈的背景下,电商企业需要不断创新,探索新的商业模式和营销手段,以应对市场变化。
售后服务是品牌形象的重要组成部分
更多选择。
对客户数据的收集和户在官网、APP、社交媒体等渠道的浏览、购买、咨询等
行为收集客户数据。
02
数据分析
唯品会运用大数据技术对客户数据进行分析,包括客户购物偏好、消费
能力、活跃度等,以更准确地了解客户需求,为客户提供个性化服务。
03
数据应用
基于客户数据分析结果,唯品会可以实现精准营销,向客户推送符合其
04
唯品会客户关系管理的优 化策略与建议
优化策略一:提升数据收集与分析能力
建立完善的客户数据平台
整合多源数据,包括交易数据、用户行为数据、社交媒体数据等 ,以全面了解客户需求和购买行为。
利用先进的数据分析技术
运用大数据技术、人工智能等技术,深度分析客户数据,洞察客户 喜好、购买习惯等,以更精准地满足客户需求。
06
结论与展望
对唯品会客户关系管理策略的总体评价
精细化运营
唯品会通过数据分析和用户行为研究,实现了对客户的精 细化分层和个性化运营,提高了客户满意度和忠诚度。
多元化营销手段
唯品会采用了包括会员特权、优惠券、限时秒杀等多种营 销手段,有效激发了客户的购物欲望,提升了销售额。
完善的售后服务
唯品会在售后服务方面做得非常到位,包括退换货、质量 保证等,为客户提供了良好的购物保障,树立了品牌形象 。

唯品会电商运营战略

唯品会电商运营战略

唯品会电商运营战略唯品会是中国领先的在线销售平台,专注于时尚、美妆和家居等品类。

作为一家电商企业,唯品会采用了多种战略来实现其业务目标。

本文将探讨唯品会电商运营的战略,并阐述其成功之处。

一、定位战略唯品会在电商市场中选择了明确的定位,在时尚、美妆和家居领域取得了巨大成功。

通过聚焦特定品类,唯品会能够更好地满足目标消费者的需求,打造自己的竞争优势。

该定位战略为唯品会提供了资源整合和市场推广的便利,使其成为该领域的佼佼者。

二、供应链战略唯品会通过建立强大的供应链系统,确保产品质量和供应的稳定性。

这一战略使唯品会能够提供独一无二的产品,吸引消费者并增加他们的忠诚度。

此外,供应链战略还帮助唯品会实现更高的运营效率和更好的成本控制,提高了盈利能力。

三、会员营销战略唯品会注重会员管理和营销,建立了庞大的忠诚会员群体。

通过提供独特的会员福利和个性化的推荐服务,唯品会增强了用户粘性并吸引更多潜在消费者加入。

会员营销战略有效地提高了复购率和客户生命周期价值,为唯品会带来了持续的收入增长。

四、移动战略随着移动互联网的快速发展,唯品会早早意识到移动渠道的重要性,并制定了全面的移动战略。

唯品会推出了功能齐全的手机应用程序,便于用户随时随地进行购物。

通过与移动支付和社交媒体平台的合作,唯品会进一步扩大了用户群体和市场曝光度。

移动战略使唯品会在移动购物领域占据了领先地位。

五、数据驱动战略唯品会充分利用数据分析和技术创新来指导决策和优化运营。

通过大数据分析,唯品会能够深入了解消费者需求和行为模式,为供应链和推广活动提供科学依据。

此外,唯品会还通过技术创新提升用户体验,例如引入虚拟试衣间功能和智能推荐系统。

数据驱动战略为唯品会提供了持续的竞争优势。

六、品牌合作战略唯品会与众多国际和国内品牌建立了战略合作伙伴关系,获得了更多独家商品和限量版产品。

通过与知名品牌的合作,唯品会提升了其品牌形象和市场影响力,吸引了更多消费者的关注和购买欲望。

电商企业盈利模式分析——以唯品会为例

电商企业盈利模式分析——以唯品会为例

摘要随着“互联网+”的快速增长,越来越多的商家找到发展契机,逐渐与互联网融合,另一方面,越来越多人接受这种方便的购物模式,人们的日常生活也逐渐离不开网购。

B2C作为电子商务的其中一种方式已经逐渐成为网购市场发展的主要推动力。

在市场竞争如此之大的环境下,电子商务企业必须评估当前自身盈利模式的优劣,对其进行改进以适应市场环境的变化从而摆脱难以盈利的局面,才能推动自身企业更加长久地发展。

成立于2008年的唯品会,不到5年的时间就在美国上市,股价也出现明显上升趋势。

“天天有3折”的特殊商业模式,保证了唯品会的快速发展和壮大。

随着我国B2C电子商务的快速发展,许多知名电子商务企业逐渐在该网购大潮中站稳了脚跟。

然而,机遇与压力并存,机会与风险并在。

唯品会是如何在这样一个讯息万变而风险机会并存的环境中成为佼佼者。

本文从这一角度出发,探讨了我国B2C 电子商务企业如何成功实现盈利,并运用科学的方法进行财务评价,以对B2C电子商务行业的持续健康发展进一步作出贡献。

关键词:互联网+ 电子商务盈利模式唯品会AbstractWith the rapid growth of "Internet +", more and more businesses find development opportunities and gradually integrate with the Internet. On the other hand, more and more people accept this convenient shopping mode, and People's Daily life is gradually inseparable from online shopping. As one of the ways of e-commerce, B2C has gradually become the main driving force for the development of online shopping market. In such a competitive market environment, e-commerce enterprises must evaluate the advantages and disadvantages of their current profit model and improve it to adapt to the changes in the market environment so as to get rid of the situation of difficult to make profits, so as to promote the long-term development of their enterprises.Vipshop, founded in 2008, has gone public in the us in less than five years and its share price has risen sharply. "30% Every day " special business model, to ensure the rapid development and growth of Vipshop. With the rapid development of B2C e-commerce in China, many well-known e-commerce enterprises have gradually gained a firm foothold in the online shopping tide. However, opportunities and pressures coexist, and opportunities and risks coexist. Vipshop is how to become a leader in such an environment where information is changing and risks and opportunities coexist. From this point of view, this paper discusses how China's B2C e-commerce enterprises successfully achieve profits, and USES scientific methods to make financial evaluation, in order to make further contributions to the sustainable and healthy development of B2C e-commerce industry.Keywords:Internet+ e-commerce profit model vipshop目录1.绪论 (1)1.1研究背景 (1)1.2研究目的及意义 (2)1.3研究内容和方法 (2)1.3.1研究内容 (2)1.3.2研究方法 (3)1.4国内外研究现状 (3)1.5文献综述 (4)2.电商企业盈利模式概述 (6)2.1盈利模式的定义 (6)2.2电商企业盈利模式的种类 (6)3.唯品会的盈利模式分析 (7)3.1唯品会简介 (7)3.2唯品会盈利模式构成要素 (7)3.2.1利润点 (7)3.2.2利润对象 (8)3.2.3利润源 (9)3.2.4利润杠杆 (9)3.2.5利润屏障 (10)3.3唯品会财务状况分析 (12)3.3.1唯品会营收、成本情况 (12)3.3.2成本收入分析 (13)4.唯品会盈利模式存在的问题及原因分析 (15)4.1唯品会盈利模式存在问题 (15)4.1.1用户使用后的体验有待提高 (15)4.1.2用户受众有限、年轻用户吸引力不够 (15)4.1.3营业收入、增速等指标处于瓶颈期 (16)4.2唯品会盈利模式存在问题的原因分析 (16)5.唯品会盈利模式的经验与启示 (18)5.1唯品会盈利模式的经验 (18)5.2对电商企业盈利模式的启示 (18)5.2.1企业要不断创新,打造个性化服务 (18)5.2.2积极发展第三方物流,慎重选择合适物流配送模式 (19)5.2.3增强网络支付安全性 (19)6.结束语 (21)参考文献 (22)致谢.................................... 错误!未定义书签。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• Don’t reinvent the wheel
框架 算法
• 基础架构/数据很重要
– 模块化 – 通用化
• Things Change
半年前不用,可能现在用;
Spark,Hbase
08:11:11
36
THANK YOU

树立质量法制观念、提高全员质量意 识。20. 10.1620 .10.16F riday, October 16, 2020
– 元数据管理系统,数据质量工具 – ETL Gp完整迁移开始 – Query GP扩容40节点
• 2014 Q1
– 全部ETL@Hadoop – ~200 nodes cluster + 40 Ad-Hoc EDW – Hybrid node configuration
离线混合平台-2
• Referene:
– 供应商:数据魔方
• 对内:
– 高管:手机数据仪表盘,经营分析 – 商务:选品,比价 – 物流:分仓,预调拨 – 产品/运营:指导产品分析和决策,经营分析,效果评估,产品优化 – 金融:供应商贷款, – 消费者:个性化推荐,唯品白条 – 营销:个性化EDM,个性化Push,CRM – 业务安全:风控
产品 服务
应用
接入
平台服务
数据产品 数据服务
数坊 分析师平台
自助 取数平台
自助 报表平台
VRC 开发者平台
Sqoop/VDP/Flume/Kafka
对外服务
画像计算
VRE
计算
存储 调度
分析统计任务 HIVE HDFS
VRE实时算法预测
MLLib实时训练
Presto
SPARK
Storm
R
GP
Druid
Hbase
Job调度/Yarn调度
Redis Cluster源自运 监测 维 控试数据平台的建设
• 离线计算分析平台选建设
– 混合平台:Hadoop+Greenplum – 迁移策略和计划 – daily job, hourly job, min job – 扩容,扩容,扩容 – 离线和实时的混合 – 开放平台
HeatMap
大屏幕
登录热力地图 注册热力地图 订单热力地图 购物车访问热 力地图
业务集合 域流量集合
08:11:11
7
16
实时页面加载时间监控
实时PV分布监控
商业CDN质量分析
App Service Quality
• Spark Streaming, 30 sec mini-batch • 进去可以看到每个pool,每个服务器,每个url的请求次数,响应时间,错误率,在过
去两周的各个维度的统计数据和曲线; • 可以看到pool之间的互相调用关系, 调用量… • 全无入侵,应用上线即插即用;
Data Service Quality
大数据在唯品会特卖模式的业务价值
大数据对于数据化运营
应用于唯品会
全面客户关系管理
08:11:11
24
数据化运营-数据产品
• 对外:
08:11:11
12
Challange
• 实时计算作为平台 • 离线和实时的融合 • 离线向实时的迁移成本
应用实践
• 业务应用
– 运营分析 – 帮助公司买 – 帮助公司卖
• 技术开发和运营
– Telescope 业务监控(storm) – Logview/Titan 服务监控(spark) – Application logging(Spark) – CDN日志分析 (Hive) – Site speed分析(storm) – 安全审计分析(impala/storm)

安全在于心细,事故出在麻痹。20.10. 1620.1 0.1608: 11:1108 :11:11 October 16, 2020

踏实肯干,努力奋斗。2020年10月16 日上午8 时11分 20.10.1 620.10. 16

追求至善凭技术开拓市场,凭管理增 创效益 ,凭服 务树立 形象。2 020年1 0月16 日星期 五上午8 时11分 11秒08 :11:112 0.10.16
– 流量一直增加 – 大促流量狂涨 – 计算复杂度一直增加 – 不停拆分。。。 – 每次改代码
• 怎么办?
– 逐个模块拆分 – 一开始就按模块写不同instance – 一开始就Shard – Twemproxy – 优化数据结构 – Pipeline/Batch – 不求100%准确hll log – Redis Cluster
PC用户
Adapter
算法模 型1
算法模 型2
移动用户
Adapter
算法模 型3
算法模 型4
stockd
Item redis bmsd
Profile redis
Flume>kafka
Storm/C++
Binlog>kafka
hadoop
08:11:11
EP Business Rule
Debug Platform
• 2014Q2:开始有机会在小流量新版首页尝试技术主导
– 机器学习+业务规则 – 首页动态生成个性化推荐模块 – 首页动态生成个性化排序页面 – 提高了首页到列表页转化率,降低了跳出率,提高了销售
08:11:11
30
我们走过的路
• 2014 Q3-Now: 首页和列表页的个性化排序
– 机器学习train model – Hadoop 生成 user profile/brand profile – Storm 计算实时转化销售数据,用户实时行为和意图 – 实时排序首页和列表页
– 自有调度平台开发 + 自有抽取系统+ – Hadoop 流量开始迁移 + – GP交易数据 + Query GP
• 2013 Q3:
– 自有调度平台+抽取迁移 – Hadoop流量迁移结束(70), 交易数据迁移开始 – GP交易数据+Query GP – 核心数据小时级ETL
• 2013 Q4
Training Data
27
挑战
• 用户
– 数据稀疏,有效反馈少 – 长尾严重 – 用户体验,50ms返回
• ITEM
– 冷启动 – 特征难抽取,比如图片素材
• 场景
– 缺少上下文 – 没有明显意图,不同于“搜索”
28
底层数据
品牌
– 历史和实时销售数据 – 价格,品类,颜色尺码风格,季节 – 品牌相似性
打点日志
binlog
消息 数据实时 增量抽取
应用开发:
任务配置 可视化编程
Esper EPL
平台组件:
输入组件 输出组件
UDF
VRC Portal:
任务发布 日志查看 监控告警
Flume/VDP/VM
VRC
S
模型训练 效果反馈
模型训练平台
Render & Router Layer
Candidate Scan Layer
产品-数据产品及服务
数据 魔方
用户 数据
仪表盘
供应商
管理及运营
比价系统
数据 仪表盘
打法一: 数据从按天更新向实时化转变 丰富数据可视化交互方式
数据 魔方
打法二: 合规前提下,开放更多数据给供应商 丰富数据接口格式及实时性
比价 系统
打法三: 实时比价与价高告警 比价数据与销售转化率数据关联分析
系统架构
– 列表页排序优化
• ~15%销售金额提升
– Overall: ~17%
08:11:11
33
推荐关键点
用户
推荐
ITEM
场景
34
解决之道
数据
推荐
系统
算法
35
一些小结
• 技术选型:
– 业界标准best practice – 成熟技术: 技术本身的成熟度,和我们队这个技术的把控力 – reference customer/implementation – 用最合适的技术,而不是最先进的技术
• 实时计算平台的建设
– Binlog2Kafka VDP – MySQL2Kafka – Spark vs Storm – Redis Challenge – 稳定性挑战 – 开放平台
• 碰到的问题
离线平台的演化-1
• 2012 年底:CDC调度+GP10节点 系统稳定 • 2013 Q1:CDC调度+ETL Gp + Query Gp, Tuning • 2013 Q2:
– Netflex, LinkedIn, eBay
• GreenPlum + Hadoop
– 保护现有投资 – Hadoop 海量数据分析 – ETL复杂计算 – 权限打通
• Greenplum:
– GP擅长adhoc query速度快, – 分析师适应 – 不足够scalable – 长期成本
• Hadoop
• 下一步
– 更多引入个性化因子(feature) – 细化user/brand profile ,更多数据 – 引入更多其他算法,做到算法可以灵活替代 – 不但个性化排序和推荐,还可以有更多
08:11:11
31
个性化推荐下一个阶段
• 实时,实时,再实时
– 实时计算商品品牌信息,用户profile – 实时推荐 – 实时算法迭代更新 – 实时Abtest verify
• 选择:
– Critical 的Redis – Non-critical 的Hbase – 积累经验,逐渐往Hbase dual write – 其实Hbase也不便宜,就是scale不动系统 – Redis某种程度上也可以实现
相关文档
最新文档