阿里数据整合及数据管理体系解读

合集下载

阿里巴巴的大数据分析和商业智能技术

阿里巴巴的大数据分析和商业智能技术

阿里巴巴的大数据分析和商业智能技术大数据分析和商业智能技术是现代商业的重要组成部分。

在这一领域中,阿里巴巴作为全球最大的电子商务公司之一,一直保持着领先地位。

通过使用其所拥有的海量数据和先进的技术,阿里巴巴能够对其客户和用户需求做出更准确的预测和分析,提高商业效能和用户满意度。

大数据技术是阿里巴巴的核心竞争力之一。

阿里巴巴的生态系统涵盖了电商、金融、物流、云计算等多个领域,拥有庞大的用户数据和海量的销售数据,同时还能获取到来自社交媒体、物流、金融机构等方面的大量数据。

阿里巴巴通过使用自己的大数据平台——阿里云数据平台,能够将不同来源的数据快速准确地整合,并提供高效的分析和挖掘。

阿里巴巴的商业智能系统通过对大数据的深度挖掘和分析,能够为企业提供更加智能化的商业洞察。

通过对用户行为、购买历史和产品偏好等方面的分析,阿里巴巴能够预测用户的需求,满足客户的个性化需求,提高客户满意度和忠诚度。

对于企业来说,商业智能技术能够帮助企业更好地了解市场需求和用户行为,提高产品和服务的开发效率和质量,优化销售和营销策略,从而实现更高的商业价值。

阿里巴巴的商业智能系统还可以通过对供应链、物流和金融等领域的数据进行分析和挖掘,为供应商、物流公司、金融机构等不同商业参与者提供更加智能化的服务。

例如,阿里巴巴的供应链金融平台——菜鸟金融,通过使用自有的大数据分析和风控技术,可以为供应商提供全流程的供应链金融服务,从而解决中小企业的融资难题。

阿里巴巴的物流系统——菜鸟网络,则通过使用大数据技术,实现了快递配送的智能化和高效化管理,提高了物流效率和用户满意度。

总之,阿里巴巴是大数据分析和商业智能技术的佼佼者,其应用领域涵盖了电商、金融、物流、云计算等多个领域。

阿里巴巴的大数据分析和商业智能技术不仅带来了商业价值的提升和用户满意度的提高,更为中国新经济的发展贡献了重要的力量。

阿里指标管理体系

阿里指标管理体系

阿里指标管理体系阿里指标管理体系:构建高效运营的关键导语:随着阿里巴巴的崛起,其独特的经营模式和管理理念备受瞩目。

阿里指标管理体系作为阿里巴巴的核心管理方法之一,具有一定的创新性和实用性。

本文将以阿里指标管理体系为中心,详细阐述这一管理方法的特点、优势以及如何构建高效运营的关键。

一、阿里指标管理体系的特点阿里指标管理体系是阿里巴巴集团在日常经营中所采用的一种管理方法。

相比传统的管理方式,阿里指标管理体系具有以下几个特点:1.定量化和可视化:阿里指标管理体系重视对关键业务指标的定量化和可视化。

通过将业务指标明确化、量化化,并通过数据可视化的方式展示出来,使每个员工都能清晰地了解自己的工作目标和任务。

2.分级管理和授权:阿里指标管理体系采用分级管理和授权的方式,将权责下放到各个层级的管理者手中。

每个管理者都要制定自己的指标,并将其分解给下属,从而形成一套层级分明、链接紧密的目标体系。

3.自由度和激励机制:阿里指标管理体系鼓励员工拥有自主权和创新精神。

通过给予员工一定的自由度,鼓励他们提出自己的想法和创新,并通过激励机制来奖励他们的成果。

二、阿里指标管理体系的优势阿里指标管理体系相较于传统的管理方式,具有以下几个优势:1.提高企业运营效率:阿里指标管理体系通过定量化和可视化的方式,使每个员工都清楚自己的工作目标和任务,并能够及时了解自己的绩效状况。

这有助于员工更加专注和高效地完成自己的工作,从而提高整体运营效率。

2.优化资源配置:阿里指标管理体系通过将业务指标进行分解和量化,使每个员工都对自己的工作进行有针对性的规划和管理。

这有助于优化资源的分配,确保每个环节都能够得到充分的关注和资源支持。

3.激发员工的积极性和创造力:阿里指标管理体系通过给予员工一定的自主权和创新空间,激发他们的积极性和创造力。

员工可以根据自己的实际情况和创新思维提出自己的指标,并通过实际行动来实现。

三、构建高效运营的关键构建高效运营的关键在于以下几个方面:1.设定明确的目标和指标:在构建高效运营的过程中,首先需要设定明确的目标和指标。

阿里集团大数据建设OneData体系

阿里集团大数据建设OneData体系

层次结构

据 化
表数据分布 情况
表关联使用 情况
CDM核心架构
汇总事实表 明细事实表 明细维表
维度
Star Scheme
指标
规范化
设计方法-DWD模型设计
识别业务过 程
选择事实表 的类型
确定粒度及 选定维度
添加度量
冗余维度
流量 维度冗余事实表带来的好处与弊端 DWD层关联相关数据和组合相似数据的原则 DWD层事实宽表垂直划分和水平切割
定位
OneData体系架构
名词术语(一)
名词
解释
数据域
数据域是业务板块中有一定规模且相对独立的数据业务范围。 面向业务分析,将业务过程或者维度进行抽象的集合。 为保障整个体系的生命力,数据域是需要抽象提炼、并且长期维护 和更新的,但不轻易变动。在划分数据域时,既能涵盖当前所有的 业务需求,又能在新业务进入时无影响的被包含进已有的数据域和 扩展新的数据域。
逻辑结构 业务板块
核心架构
举例 电商业务
数据域
交易域
业务过程
维度
支付
订单
修饰类型
时间 周期
修饰词
原子指标
最近1天
支付方式 花呗
支付金额 pay_amt
派生指标
度量 属性
最近1天通过花呗 支付的支付金额 pay_amt_1d_009
支付金额 pay_amt
订单ID 创建时间
……
1.数据域:是指一个或多个业务过程或者维度的集合 2.原子指标:基于某一业务过程下的度量。例如:支付+金额=支付金额; 3.派生指标=原子指标+时间修饰+其他修饰词+原子指标;属性是用来刻画某个实体对象维度的数据形态;事实叫做度量,如购买数量 4.修饰:指针对原子指标的业务场景限定抽象。例如:最近N天

阿里巴巴运营团队管理系统

阿里巴巴运营团队管理系统

阿里巴巴运营团队管理系统1. 简介阿里巴巴运营团队管理系统是阿里巴巴集团内部用于管理运营团队的一套信息化系统。

该系统主要用于协调和管理运营团队的日常工作,包括任务分配、进度跟踪、数据分析等功能。

通过使用该系统,运营团队成员可以更加高效地协作,提高工作效率。

2. 功能特点2.1 任务管理阿里巴巴运营团队管理系统提供了一个任务管理模块,用于创建、分配和跟踪任务。

每个任务可以设置优先级、截止日期和责任人等信息,方便运营团队成员在任务管理过程中进行有效的协调和通信。

团队成员可以随时查看任务的进度和状态。

2.2 日程管理系统中的日程管理功能可以帮助运营团队成员安排和管理日常的工作计划。

用户可以创建日程,设置开始时间和结束时间,以及相关的提醒和重复规则。

该功能还支持团队成员之间的日程共享,方便协同工作。

2.3 数据分析阿里巴巴运营团队管理系统还提供了数据分析功能,支持对运营数据进行统计和分析。

用户可以根据自定义的指标和时间范围,生成图表和报告,帮助团队成员更好地了解业务情况,并做出相应的决策。

2.4 通知和消息系统中的通知和消息功能可以方便运营团队成员进行实时沟通和交流。

用户可以通过系统发送消息、评论、提醒等,也可以接收来自系统的通知和提醒。

这有助于加强团队的交流和协作,提高工作效率。

2.5 权限管理系统中的权限管理功能可以根据团队成员的角色和职责,对系统的功能和数据进行访问控制。

管理员可以设置不同用户的权限级别,确保只有经授权的人员才能访问和操作相关信息,提高数据的安全性。

3. 使用场景阿里巴巴运营团队管理系统适用于各类运营团队,包括市场营销团队、数据分析团队、客户服务团队等。

以下是一些使用场景的示例:•任务协作:运营团队成员可以通过系统创建和分配任务,设置优先级和截止日期,团队成员之间可以进行任务的协同处理。

•跟踪进度:团队成员可以实时查看任务的进度和状态,了解各项任务的完成情况,帮助团队更好地规划工作。

阿里指标管理体系 -回复

阿里指标管理体系 -回复

阿里指标管理体系-回复【阿里指标管理体系】是指阿里巴巴集团针对企业经营过程中的各项业务目标和关键绩效进行管理的一套完整的指标体系。

这一管理体系借鉴了科学的管理理论和实践经验,通过建立指标体系来进行全面的绩效评估,并定期进行调整和优化,以实现企业战略目标的有效落地。

在阿里巴巴的指标管理体系中,主要包括以下几个步骤:第一步:确定关键业务指标(KPI)阿里巴巴首先要确定关键业务指标,这些指标直接关系到企业的核心业务,并且具备可衡量性和可优化性。

这些指标的选择需要与企业的战略目标相一致,并且在一定程度上能够反映企业核心竞争力。

例如,阿里巴巴可能会关注网站的访问量、转化率、用户活跃度等。

第二步:设定目标细分在确定了关键业务指标后,阿里巴巴将这些指标进行细分,并且根据不同业务部门和团队的实际情况,设定相应的目标值。

这些目标值需要具备可行性和挑战性,能够激发员工的积极性和创造力,并且需要与企业整体目标相一致。

第三步:制定执行计划为了实现设定的目标,阿里巴巴会制定具体的执行计划。

这些执行计划包括资源配置、工作流程安排、岗位职责明确等,以确保各项工作按照计划有序进行。

此外,阿里巴巴还会设定合适的时间节点和里程碑,对目标的达成情况进行监控和评估。

第四步:实施监控与反馈阿里巴巴非常注重对业务指标的监控和反馈。

通过数据分析和报表制作,可以及时获取业务指标的实时情况,并与设定的目标进行比较,找出偏差和不足之处。

同时,阿里巴巴还会通过定期组织评审会议,进行业务指标的全面评估和反馈,以确定进一步的改进措施和优化方向。

第五步:持续优化与改进基于对业务指标的监控和反馈,阿里巴巴会不断进行优化和改进。

通过与业务团队的沟通交流,阿里巴巴可以了解员工的实际需求和问题,并及时提供支持和帮助。

此外,阿里巴巴还会不断关注市场动态和竞争对手的动向,及时调整和优化指标体系,确保企业战略目标的实现。

总结起来,阿里巴巴的指标管理体系是一个完整的管理体系,通过确定关键业务指标、设定目标细分、制定执行计划、实施监控与反馈以及持续优化与改进,来实现企业战略目标的有效实施。

浅谈以大数据分析阿里巴巴绩效管理

浅谈以大数据分析阿里巴巴绩效管理

浅谈以大数据分析阿里巴巴绩效管理目录一、引言 (1)二、大数据、绩效管理相关含义解析 (1)(一)大数据的相关含义解析 (1)(二)绩效管理的相关含义解析 (1)三、以市场大数据分析阿里巴巴公司存在的绩效管理问题 (2)(一)与其他公司相比,阿里残酷的绩效考核 (2)(二)阿里巴巴不仅看重结果,过程也要好。

使员工倍感压力 (3)四、对阿里巴巴公司存在问题的个人见解 (4)(一)提倡将企业员工与绩效、及其表现结合,多方位评价员工 (4)(二)提高团队绩效,减缓个人压力,增强员工幸福感 (4)五、结论 (4)参考文献 (4)浅谈以大数据分析阿里巴巴绩效管理一、引言如今随着科技的不断进步,社会不断发展的这个新时代。

在很多领域都进入一个全新的发展状态。

各行各业在不断发展的同时,只有不断地发现自身问题,改良企业管理制度,才能让企业平稳发展。

阿里巴巴公司是中国公司典型的范例,这个公司的规模大,且影响力毫无疑问是非常巨大的!能够在阿里巴巴工作的人不管是从能力,还是履历各方面都是非常优秀的,但是同样该企业也存在着与脱离时代的主流的制度管理。

当然其中不乏有诸多优秀先进的制度和管理思想。

在大数据时代,各企业的员工对制度的反馈,在数据分析中都可以一目了然,很直观地反映了该企业管理制度的优点和缺点。

二、大数据、绩效管理相关含义解析(一)大数据的相关含义解析大数据或称巨量资料、海量资料,指的是所涉及的资料量规模巨大到透过目前主流软件工具,在合理时间内达到获取、管理、处理并整理成为帮助企业经营决策更积极目的的资讯。

进一步,当今大数据的重点其实已经不仅在于数据规模的定义,它更代表着信息技术发展进入了一个新的时代,代表着爆炸性的数据信息给传统的计算机技术和信息技术带来的技术调战和困难,代表着大数据处理所需的新的技术和方法,也代表着大数据分析和应用在企业中有着非常广泛的应用。

(二)绩效管理的相关含义解析绩效管理是在充分的沟通基础上所形成的企业内部各级员工和管理者为实现企业目标和利润而进行的绩效计划制定、绩效沟通、考核评价、结果应用和绩效提升等若干工作内容共同组成的有机整体,是人力资源管理中起到监管和激励作用的关键环节,绩效管理水平的高低是衡量员工工作绩效、能力和考评的主要途径绩效,主要指的是企业组织对企业未来发展所期望的一种结果,是组织为了实现企业目标达到所期待的结果而在不同层面有效输出的具体展现,换句话说,绩效主要指的是组织或个人,在一定的资源环境条件下,对目标任务所完成的出色程度,它是对企业效率的达成以及目标实现程度的衡量与反馈。

阿里onedata指标体系

阿里onedata指标体系

阿里onedata指标体系
阿里onedata指标体系是阿里巴巴集团旗下的一款数据分析与决策支持工具,
它的设计目的是为企业提供全面的数据指标体系,帮助企业管理者更好地进行数据分析与决策。

阿里onedata指标体系通过提供一系列的数据指标,能够帮助企业管理者全面
了解企业的经营状况,并提供参考依据来进行决策。

这些指标包括但不限于销售额、利润率、库存周转率、客户满意度等。

通过对实时数据的监控和分析,阿里onedata指标体系能够帮助企业在经营过程中发现问题、优化流程,并制定相应的
决策措施。

阿里onedata指标体系的设计思想是简单易用且高效。

它提供了直观的数据展
示方式,以图表、表格等形式呈现数据,让使用者能够快速洞察数据背后的现象和趋势。

同时,它支持个性化的定制,使用者可以根据自身的需求选择适合自己的指标,对数据进行深度分析。

阿里onedata指标体系还具备数据共享的功能。

它可以将企业内部不同部门的
数据整合在一起,打破信息孤岛,实现企业内部数据的共享与协作。

这有助于企业管理者更全面地了解企业各个方面的情况,为决策提供更加准确的数据支持。

总体来说,阿里onedata指标体系是一个功能强大、易用性好的数据分析与决
策支持工具。

它通过提供全面的数据指标和直观的数据展示方式,帮助企业管理者更好地进行数据分析和决策,进而提升企业的经营效率和竞争力。

阿里云大数据产品体系介绍

阿里云大数据产品体系介绍

目录大数据产品框架数据计算平台数据加工与分析服务与应用引擎大数据应用场景记录 统计大规模计算GB计算复杂程度数据量TBPB网站独立数据 集市论坛小型电商小型EDW BI/DWMPP淘宝支付宝 CRMERPHPC语言识别影音识别图像识别关系网络图像比对 行为DNA刷脸精准广告大数仓消费预测征信搜索排序EB深度学习大数据产品框架应用加速器分析引擎 推荐引擎 兴趣画像分类预测规则引擎 标签管理ID-Mapping计算引擎数据加工和分析工具离线计算 流计算 数据开发 ETL 开发调度系统机器学习分析型数据库数据可视化工具数据采集CDP (离线)数据服务和应用引擎数据管理数据 地图数据 质量智能 监控阿里云大数据集成服务平台是阿里巴巴集团统一的大数据平台,提供一站式的大数据开发、管理、分析挖掘、共享交换解决方案,可用于构建PB 级别的数据仓库,实现超大规模数据集成,对数据进行资产化管理,通过对数据价值的深度挖掘,实现业务的数据化运营。

目录大数据产品框架数据计算平台数据加工与分析服务与应用引擎大数据离线计算服务 MaxCompute离线计算流计算分析型数据库大数据计算服务(MaxCompute ,原ODPS)是由阿里巴巴自主研发的大数据产品,支持针对海量数据(结构化、非结构化)的离线存储和计算、分布式数据流处理服务,并可以提供海量数据仓库的解决方案以及针对大数据的分析建模服务,应用于数据分析、挖掘、商业智能等领域。

存储易用安全计算●支持TB 、PB 级别数据存储 ●支持结构化、非结构化数据存储●集群规模可灵活扩展,支持同城、异地多数据中心模式●支持海量数据离线计算●支持分布式数据流式处理服务 ●支持SQL 、MR 、Graph(BSP)、StreamSQL 、MPI 编程框架 ●提供丰富的机器学习算法库●支持以RESTful API 、SDK 、CLT 等方式提供服务●不必关心文件存储格式以及分布式技术细节●经受了阿里巴巴实践检验●数据存储多份拷贝 ●所有计算在沙箱中运行MaxCompute 的优势和能力高效处理海量数据1、跨集群技术突破,集群规模可以根据需要灵活扩展,支持同城、异地多数据中心模式2、单一集群规模可以达到10000+服务器(保持80%线性扩展)3、不保证线性增长的情况下,单个集群部署可以支持100万服务器以上4、对用户数、应用数无限制,多租户支持500+部门5、100万以上作业及2万以上并发作业安全性1、所有计算在沙箱中运行2、多种权限管理方式、灵活数据访问控制策略3、数据存储多份拷贝易用性1、开箱即用2、支持SQL、MR、Graph、流计算等多种计算框架3、提供丰富的机器学习算法库4、ODPS支持完善的多租户机制,多用户可分享集群资源自主可控经过实践验证1、阿里巴巴自主研发2、整套平台经受了阿里巴巴超大规模数据应用的实践验证离线计算流计算分析型数据库离线计算流计算分析型数据库自主可控•使用Hadoop组件开发受制于开源社区,最多只能维护一个分支•开源社区组件太多,版本问题,打包问题,升级维护成本太高Hadoop核心技术架构发展缓慢•一些技术阿里要比开源社区更早实现(如分布式文件系统多master实现等)没有一个Hadoop发行版可以满足阿里巴巴的业务场景•如异地多数据中心、数据安全性等要求Hadoop社区分化严重,发展状况有隐忧当前Yahoo、Facebook等公司使用的都是自己的私有版本流计算 StreamCompute离线计算流计算分析型数据库●阿里云流计算(StreamCompute)是一个通用的流式计算平台,提供实时的流式数据分析及计算服务●整个数据处理链路是进行压缩的,链路是即时的,完全以业务为中心,数据驱动解决用户实际问题实时ETL 监控预警实时报表实时在线系统对用户行为或相关事件进行实时监测和分析,基于风控规则进行预警用户行为预警、app crash预警、服务器攻击预警数据的实时清洗、归并、结构化数仓的补充和优化实时计算相关指标反馈及时调整决策内容投放、无线智能推送、实时个性化推荐等双11、双12等活动直播大屏对外数据产品:数据魔方、生意参谋等低延时高效流数据处理,根据不同业务场景的时效性需要,从数据写入到计算出结果秒级别的延迟高可靠●底层的体系架构充分考虑了单节点失效后的故障恢复等问题,可以保证数据在处理过程中的不重不丢, Exactly-Once 语义保证●通过定期记录的checkpoint数据,自动恢复当前计算状态,保证数据计算结果的准确性可扩展计算能力和集群能力具有良好的可扩展性,用户可以通过简单的增加Worker节点数量的方式进行水平扩展,可以支持每天PB级别的数据流量开发方便●SQL支持度高:标准SQL,语义明确,门槛低,只需要关心计算逻辑,开发维护成本低●完善的元数据管理:SQL天然对元数据友好,SQL优化支持离线计算流计算分析型数据库功能特性BI分析的发展方向离线计算流计算分析型数据库分析型数据库概述离线计算流计算分析型数据库分析型数据库(Analytic DB),是一套实时OLAP(Realtime-OLAP)系统。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

前段时间给大家推荐了《大数据之路--阿里巴巴大数据实践》,这本书确实内容非常详实,全是干货,值得反复品味。

刚刚看完第9章,讲的是数据整合及管理体系,觉得非常好,设计得非常精妙,只看看觉得还不能深刻理解,遂做个读书笔记按照自己理解重构整理一遍,同时补充上自己的解读分享给大家,推荐给准备搭建数据产品或者数据平台的人。

传统企业的业务变化相对不快,但使用一般的表格文档来管理数据过程也已经越来越困难,更何况互联网这样迅速变化的业务,做好数据整理及管理的难度可想而知,但阿里的数据团队还是形成了完成的方法体系,并把其工具化。

也只有完备方法体系下构建的工具能满足复杂的数据管理需求。

阿里大数据建设方法论的核心就是,从业务架构设计到模型设计,从数据研发到数据服务,做到数据可
管理、可追溯、可规避重复建设。

目标是建设统一的、规范的数据接入层(ODS )和数据中间层(DWD和
DWS ),通过数据服务和数据产品,完成服务于阿里巴巴的大数据系统建设。

所以数据管理体系是包含具体
的方法论以及相关的产品两个部分,通过产品把方法论固化为标准的流程和操作,达到数据管理的目的。

数据体系架构
数据管理体系包括了业务板块划分、数据域提炼、业务过程梳理、原子指标/度量定义、派生指标定义及
管理,维度分析整理以及数据模型的设计。

通过下面的体系架构图来看看数据体系建设的过程、以及每一步做什么和如何做。

另外,如何定义每个术语的涵义,准确定义术语非常关键,有时候描述不清楚复杂的流程、场景最根本是因为对其中的一些概念没有非常很好的厘清。

业务板块:根据业务的属性划分出相对独立的业务板块,业务板块间指标和业务重叠性较低,比如电
商板块涵盖淘宝、天猫、天猫国际、 B2B 系,金融板块涵盖支付宝、花呗、蚂蚁微贷等。

业务板块非常宏观,
可以想象成贾不死的 7大生态。

规范定义:结合行业的数据仓库建设经验和阿里数据自身的特点,设计出的一套过程方法和数据规范命 名体系,规范定义
将用于模型设计中。

规范定义指以维度建模作为理论基础,构建总线矩阵,划分和定义数 据域、业务过程、原子指标 /度量、修
饰类型、修饰词、时间周期、派生指标规则,下图是它们之间的关系, 以及具体实例。

规范定义实例
修矗型
维度
▼ . 1

■ T
楼饰词
戶子洁标!
岖廈隱性!
1
嚴生拦标
<■-
一 一 _
子指标十対刖息割十幔茶词
1
J ----- 1…
二二
— — —
— | — --- ---- na ___ —.1 ——
—j T V
r* .m
_
J — * ・■ — — —
一 一 一 —
1
ir ' 疋总事实表 [杷明唧审冥聚合的事
寰表】
(
明鉅車寬袁
盘原始板度的明堀救据) (把逍担鍵度轲理化的霍表:.
___ t..
ivritw
■近1夫通址奄
的丫 *TTff ](1
009
P*V..WTfl
支讨督糾
P*v _a*Tit
喙巧茗呼
t 金tt 古式
模型设计:以建模理论为基础,基于维度建模总线架构,构建一致性的维度和事实,同时设计出一套表命名规范系统。

维度建模理论很多书上都讲过,这里就不单独整理了。

术语定义及说明
我们重点说说数据域、业务过程、修饰词、原子指标、派生指标。

数据域:是面向业务分析的,将业务过程或者维度进行抽象组合的集合。

其中业务过程是一个个不可拆分的行为事件,在业务过程之下定义指标;维度是指度量的环境,如买家下单事件,买家是维度,订单数量是度量。

数据域是抽象提炼出来的,并且不轻易变动,既能涵盖当前所有业务的业务需要,又能在新业务进入时无影响的分配到已有的数据域中,如果所有分类都不合适才会扩展新的数据域。

数据域不同于产品的功能模块和业务线,是从分析的角度来组织数据指标、维度,功能模块是面向用户功能和管理功能的分类。

从下面的两个表格能很清楚的看出不同,功能模块和业务线是随时扩展的。

那么划分数据域有什么作用呢?主要是因为经过抽象后数据域相对功能模块和业务过程来说少很多,是有效归纳、组织业务过程的方式、同时方便定位指标/度量。

业务过程:指企业的业务活动事件,如下单、支付、退款都是业务过程,这里要注意,业务过程是一个不可拆分的行为事件。

修饰词:指除了统计维度以外的对指标进行限定抽象的业务场景词语,修饰词隶属于一个修饰类型,如在日志域的访问终端类型下,有修饰词PC端、无线端,有点像属性名和具体属性值的意思。

修饰类型是为
了方便管理、使用修饰词。

原子指标:和度量含义相同,基于某一业务时间行为下的度量,不可拆分的指标,具有明确业务含义的名词,如支付金额。

原子指标有确定的字段名称(中英文)、数据类型、算法说明、所属的数据域和业务过程。

原子指标名称=动作+度量,例如支付金额、注册用户数。

除了这些标准度量值的原子指标,还
有些是为了派生指标而建的原子指标,后面讲派生规则时会说到,例如排名型的top_xxx_xxx 。

派生指标:=一个原子指标+多个修饰词+时间周期。

可以理解为对原子指标业务统计范围的圈定,说总支付金额是个笼统的高度概括的汇总指标,其业务范围时间并不明确。

加上修饰词后的派生指标
如:最近1天北京买家支付金额(最近1天是时间周期、北京是修饰词、买家作为维度)。

派生指标的英文名=原子指标英文名+时间周期修饰词+序号(_002 );中文名由时间周期修饰词+【其它修饰
词】+原子指标。

厂 F ~h一:1” I w ---- 」__ t ・・ I r = 「一—-------------------------------------------------------------------------------------- ---- ---- - ---- ----- 一一.一丁—一11 "
F图是常用的时间周期修饰词,整理的非常详细
最后说说派生指标的类型和不同类型指标的生成规则,这里的规则不容易理解,需要结合例子花些时间慢慢体会为什么有的是在原子指标的基础上派生,有的必须新建原子指标然后再派生。

其实规则很简单就是
没有可用的原子指标或者不是简单增加限定条件的指标,需要先创建原子指标,例如排名型,TOP10并不能
作为一个原子指标,其并无实际含义,但” Top_n搜索关键词“有明确的业务涵义就可作为原子指标,然
后再扩展”最近60天天猫Top_10搜索关键词“。

派生指标类型及规则
派生指标:分为事务型指标、存量型指标和复合型指标。

事务型指标是指对业务活动进行衡量的指标,
一般会对应一个事件。

例如新发商品数、新增注册会员数、订单支付金额,订单支付金额对应订单支付事
件,这类指标在原子指标上派生。

存量型指标是指对实体对象(商品、会员)某些状态的统计,例如商品总
数、注册会员总数,这类指标需维护原子指标及修饰词,在此基础上创建派生指标,对应的时间周期一般为
“历史截至当前某时间”。

复合型指标是组合事务型指标和存量型指标而成的,例如浏览UV-下单买家数转
换率,有些创建新原子指标,有些在事务型或者存量型指标基础上增加派修饰词派生。

这里说的创建新原子
指标,书上并没有讲地很清楚,理解起来也非常绕,我理解是无法从已有的原子指标派生时,比如计算方式不同,就需要新建原子指标,然后再派生,也不是直接做成原子指标,因为原子指标是无法使用限定词的。

相关文档
最新文档