通用语义层数据建模方法论 V1.0-public
通用语义层数据建模方法论-V1.0-public-课件PPT

Life Product Costs Key Measures
Life Underwriting Costs Key Measures
Life Claim Summary (实际上也是Key Measures )
14
IWS主题模型示例
Physical Data Model
Model: Insurance
语义层的设计成果不能在多个BI工具中使用,过于 依赖BI工具.重用程度不高
如何解决这些问题呢? 即 能够享有通用语义层带来 的价值,又能够规避这些
问题。
可扩展性差
语义层的扩展于与分拆影响较大,难以后期维护 ,为了降低影响范围,大多是在原来基础上,新 增其他功能,致其复杂度越来越高;
11
经过敏思苦想、群策群力,终于有了答案。。。。
SYB_CLASSIFICATION
Policy Rating Category
SYB_CATEGORY
Policy Rating Category Description SYB_VERYLONGSTRING
Prefered rating indicator
SYB_INDICATOR
Occupation Class Code
数据集市一般根据应用来设计,集市表成“碎片”,且 指标多次重复计算,集市之间存在误差(可能因为维 IV 度、指标口径不明确、加工频度、刷新频度、脚本错 误等)
数据集市根据实际需要分为明细汇总表、轻粒度汇总
Ⅴ 表、高度汇总表,至于为何这么分,并没有讲出所以
然来
5
以往数据仓库类项目模型设计成果示例
当事人
SYB_NUMERIC
All Entries Indicator SYB_INDICATOR
【onemodel】数据模型建设方法论

数据模型建设方法论数据模型是数据分析和数据管理中的核心概念,用于描述现实世界中的数据和数据关系。
建设一个合适的数据模型能够帮助企业更好地管理和利用数据,提高决策效率和业务竞争力。
本文将介绍数据模型建设方法论,包括数据模型的定义、分类、设计和实现等方面。
数据模型建设方法论数据模型是数据分析和数据管理中的核心概念,用于描述现实世界中的数据和数据关系。
建设一个合适的数据模型能够帮助企业更好地管理和利用数据,提高决策效率和业务竞争力。
本文将介绍数据模型建设方法论,包括数据模型的定义、分类、设计和实现等方面。
一、数据模型的定义数据模型是指对现实世界中的数据和数据关系进行抽象和描述的一种形式化表达方式。
数据模型可以通过图形化方式呈现,例如实体关系图 (ER 图)、数据流程图等。
数据模型主要包括数据实体、数据属性、数据关系和数据约束等元素。
二、数据模型的分类根据不同的分类标准,数据模型可以分为不同的类型。
以下是常见的几种数据模型分类方式:1. 概念模型和逻辑模型概念模型是指对现实世界中的数据和数据关系进行概念抽象和描述的数据模型。
逻辑模型是指对概念模型进行逻辑设计和实现的数据模型。
2. 关系模型和面向对象模型关系模型是指采用关系代数和二维表格方式表示数据和数据关系的数据模型。
面向对象模型是指采用面向对象编程思想和类、对象、继承、多态等方式表示数据和数据关系的数据模型。
3. 静态模型和动态模型静态模型是指对数据和数据关系进行静态描述的数据模型。
动态模型是指对数据和数据关系进行动态描述的数据模型,包括数据流模型、事件驱动模型等。
三、数据模型的设计数据模型的设计是指根据业务需求和数据特点,设计合适的数据模型,主要包括数据实体的识别、数据属性的定义、数据关系的确定和数据约束的设置等。
四、数据模型的实现数据模型的实现是指根据设计好的数据模型,采用合适的数据库管理系统 (DBMS) 或数据管理工具,实现数据模型并将数据导入到系统中。
面向对象的数据建模方法介绍

面向对象的数据建模方法介绍面向对象的数据建模是一种在软件开发过程中广泛应用的方法,旨在通过将现实世界的事物抽象成对象,对事物之间的关系进行建模和描述。
本文将介绍面向对象的数据建模方法,包括实体关系模型(ERM)、统一建模语言(UML)和面向对象数据库。
一、实体关系模型(ERM)实体关系模型是一种常用的数据建模方法,用于表示现实世界中各个实体之间的关系。
在ERM中,实体用矩形框表示,属性用椭圆表示,关系用菱形表示。
通过定义实体、属性和关系之间的约束和限制,可以精确描述现实世界的结构和行为。
举例来说,假设我们要建立一个图书馆管理系统,可以使用ERM来描述图书、读者和借阅等实体之间的关系。
图书可以有属性如书名、作者和出版日期,读者可以有属性如姓名、年龄和性别,而借阅则将图书和读者关联起来,表示读者借阅了某本图书。
二、统一建模语言(UML)统一建模语言是一种广泛使用的面向对象建模语言,用于描述软件系统的结构和行为。
UML提供了一系列图表,包括类图、对象图、用例图和活动图等,可以方便地对系统进行建模和分析。
在UML中,类图是最常用的图表之一,用于表示系统中的类和类之间的关系。
每个类都有属性和方法,与ERM中的实体和属性类似。
通过类图可以清晰地展示系统的结构,帮助开发人员理解和设计软件系统。
三、面向对象数据库面向对象数据库是一种将面向对象思想应用于数据库管理系统的方法。
传统的关系型数据库以表格形式存储数据,而面向对象数据库则将数据存储为对象,更贴近面向对象的思维方式。
面向对象数据库支持复杂的数据结构和对象之间的继承关系,可以更方便地进行数据操作和查询。
使用面向对象数据库可以有效地解决关系型数据库中数据表之间的复杂关系和数据冗余的问题。
总结:面向对象的数据建模方法是一种有效的软件开发方法,可以帮助开发人员更好地理解和描述现实世界中的事物和关系。
通过实体关系模型、统一建模语言和面向对象数据库等方法,可以将复杂的现实世界映射为清晰的数据结构,并支持系统的设计和开发。
第7章语义建模

数据库原理与应用
信息学院软件工程系
1
第7章 语义建模
关系数据理论(即“模式设计理论”)主要
研究的问题是如何构造合理的关系,使之 能准确地反应现实世界,有利于应用和具 体的操作。
优秀的数据库设计是应用成功的基石
2
7.1 概述 理解数据含义是永远不会停止的任务 “语义建模”:是对试图表示语义的所有 行为的一个恰当描述
3.设计一组正规的常用的完整性规则
4.设计一组用来操作这些正规对象的操作符
对象、规则和操作符组成一个扩展的数据模型
4
7.2 ER模型
7.2.1 概念模型
7.2.2 E/R图
数据的三种范畴
5
7.2.1 概念模型(Conceptual Model)
概念模型的用途
用于信息世界的建模
器件只能存放在一个仓库,仓库与器件--1:1
如果规定一个仓库可以存放多种器件,但是一种 器件只能存放在一个仓库,仓库与器件--1:n 如果规定一个仓库可以存放多种器件,同时一种 器件可以存放在多个仓库,仓库与器件--m:n
19
多个实体型间的联系
多个实体之间可以有不同的联系
例如:零件、供应商、仓库三个实体
多个实体型间的多对多联系
24
多个实体型的1:n联系
同一实体集内各实体间的联系
一对多联系---实例
职工实体集内部具有领导与被领
导的联系:某一职工(干部)“ 领导”若干名职工,一个职工仅 被另外一个职工直接领导 这是一对多的联系
同一实体型内 部的1:n联系 1 领导 职工 n
统一建模语言

统一建模语言统一建模语言(UML)是一种定义良好、易于表达、功能强大且普遍适用的建模语言。
它融入了软件工程领域的新思想、新方法和新技术。
它的作用域不限于支持面向对象的分析与设计,还支持从需求分析开始的软件开发的全过程。
1.UML的结构UML的结构包括基本构造块、支配这些构造块如何放在一起的规则(体系架构)和一些运用于整个UML的机制。
(1)构造块。
UML有三种基本的构造块,分别是事物(thing)、关系(relationship)和图(diagram)。
事物是UML中重要的组成部分,关系把事物紧密联系在一起,图是很多有相互相关的事物的组。
(2)公共机制。
公共机制是指达到特定目标的公共UML方法,主要包括规格说明(详细说明)、修饰、公共分类(通用划分)和扩展机制四种。
●规格说明:规格说明是事物语义的文本描述,它是模型真正的核心。
●修饰:UML为每一个事物设置了一个简单的记号,还可以通过修饰来表达更多的信息。
●公共分类:包括类元与对象(类表示概念,而对象表示具体的实体)、接口和实现(接口用来定义契约,而实现就是具体的内容)两组公共分类。
●扩展机制:包括约束(添加新规则来扩展事物的语义)、构造型(用于定义新的事物)、标记值(添加新的特殊信息来扩展事物的规格说明)。
(3)规则。
UML用于描述事物的语义规则分别是为事物、关系和图命名。
给一个名字以特定含义的语境,即范围;怎样使用或看见名字,即可见性;事物如何正确、一致地相互联系,即完整性;运行或模拟动态模型的含义是什么,即执行。
UML对系统架构的定义是系统的组织结构,包括系统分解的组成部分、它们的关联性、交互、机制和指导原则等这些提供系统设计的信息。
而具体来说,就是指5个系统视图,分别是逻辑视图、进程视图、实现视图、部署视图和用例视图。
●逻辑视图:以问题域的语汇组成的类和对象集合。
●进程视图:可执行线程和进程作为活动类的建模,它是逻辑视图的一次执行实例,描绘了所设计的并发与同步结构。
语义数据模型名词解释

语义数据模型是一种用于表示和处理数据的模型,它强调数据之间的语义关系,即数据的含义和关联。
这种模型有助于更好地理解数据,使计算机系统能够更智能地处理和分析信息。
以下是对语义数据模型中一些关键名词的解释:1. 语义(Semantic):语义是指词语、符号或数据的含义。
在语义数据模型中,强调数据的语义是关键,以确保数据不仅仅是存储的一堆字节,而且有实际的含义和理解。
2. 数据模型(Data Model):数据模型是对数据组织、存储和操作的一种抽象描述。
语义数据模型定义了数据的结构、关系和语义,以更好地反映现实世界中的概念和关联。
3. 三元组(Triple):语义数据模型通常使用三元组的结构来表示数据,其中包含了主语(Subject)、谓语(Predicate)和宾语(Object)。
这种结构可以表示主语和宾语之间的关系,而谓语则描述了这种关系的性质。
4. RDF(Resource Description Framework):RDF是语义数据模型的一种标准表示方法,用于描述网络上的资源。
RDF使用三元组来表示资源之间的关系,其中资源通过统一资源标识符(URI)进行标识。
5. OWL(Web Ontology Language):OWL是一种用于表示本体的语言,本体是一种形式化的共享知识的方式。
在语义数据模型中,本体被用于定义实体之间的关系,以及对实体属性和行为的约束。
6. SPARQL(SPARQL Protocol and RDF Query Language):SPARQL是一种用于查询RDF数据的标准查询语言。
通过SPARQL,可以从语义数据模型中检索出符合一定条件的数据,实现对语义数据的灵活查询。
7. 本体(Ontology):在语义数据模型中,本体是对领域中概念和关系的形式化描述。
它定义了领域内实体之间的关系,有助于更好地理解和组织数据。
8. 语义网(Semantic Web):语义网是一种建立在语义数据模型基础上的网络,旨在使信息更容易被理解和共享。
语义大模型 分类
语义大模型分类
语义大模型是一个复杂的概念,涵盖了多种分类方法。
一种常见的分类是基于模型的规模和复杂性,可以将语义大模型分为简单模型和复杂模型。
简单模型通常包括基于词袋模型或N-gram模型的文本语
义表示模型,这些模型通常较为基础,能够处理基本的文本分类和语义匹配任务。
而复杂模型则包括主题模型和经典词嵌入模型等,这些模型能够处理更复杂的语义任务,如情感分析、问答系统等。
此外,还可以根据模型的表示方法和应用场景对语义大模型进行分类。
例如,基于词袋模型的文本表示方法是一种简单的文本表示方法,它将每个词作为一个独立的维度进行向量表示,能够反映词之间的简单语义关系。
而主题模型则是一种更复杂的文本表示方法,它能够挖掘出不同文档中隐含的主题,并自动发现隐含的主题结构信息。
以上信息仅供参考,建议查阅语义大模型的专业书籍或者咨询该领域专家以获取更全面的信息。
数据模型基本概念及建模方法论
数据模型基本概念及建模方法论数据模型是数据库设计过程中的关键步骤,它用于描述现实世界中的实体、属性和关系,这些内容会被转化为关系型数据库的表结构。
数据模型包含了数据的逻辑结构和组织方式,并通过建模方法论来指导我们进行数据的抽象和设计。
本文将介绍数据模型的基本概念以及常用的建模方法论。
1.数据模型的基本概念1.1 实体(Entity):在现实世界中可以独立存在并具有唯一标识的事物。
实体可以是具体的,如一个人、一辆车,也可以是抽象的,如一个订单,一个公司。
1.2 属性(Attribute):实体具有的特征或者性质,用于描述实体的一些方面。
属性可以是简单的,如一个人的姓名、性别,也可以是复杂的,如一个产品的描述、详细内容。
2.1实体-关系模型(E-R模型):E-R模型是最基本也是最常用的数据模型之一,它通过实体、属性和关系来描述现实世界中的实体和它们之间的关系。
E-R模型的核心是实体和实体之间的关系,实体通过属性来描述实体的特征。
2.2属性-关系模型(A-R模型):A-R模型是对E-R模型的扩展和补充,它将属性看作是独立存在的,可以被多个实体使用,从而增加了模型的灵活性和复用性。
通过将属性提取到一个独立的实体中,可以避免数据冗余和数据一致性的问题。
2.3面向对象建模方法(OO模型):OO模型是一种用于建立逻辑模型和实现模型的方法,它将现实世界中的事物看作是对象,通过封装、继承和多态来描述对象之间的关系。
OO模型充分利用了面向对象编程的特性,如封装、继承和多态,使得模型更加直观、灵活和易于维护。
2.4关系模型(RDB模型):关系模型是一种用于建立数据库的方法,它通过用关系、属性和约束来描述数据和数据之间的关系。
关系模型将数据组织为一个或多个关联的表,每个表包含多个行和列,行表示一个实体,列表示实体的属性。
关系模型是最常用和最成熟的数据模型之一,大部分商业数据库都是基于关系模型实现的。
3.数据建模的过程3.1需求分析:收集用户需求,理解业务流程和数据处理逻辑,明确数据建模的目标和范围。
数据模型基本概念及建模方法论
崔大强 技术经理
NCR(中国)有限公司数据仓库事业部
内容安排
什么是数据模型 数据模型相关术语 数据模型方法论 建模注意事项
2
什么是数据模型?
以数学的方式对现实事物的一种抽象表达,„ 特征: 内容:描述了数据、及其之间的关系 形式:反映了数据的组织与管理形式
设计人员:业务人员、IT人员
设计目标
设计蓝图,指导整个数据仓库系统的建设 业务语言,业务人员与技术人员沟通的手段和方法 业务视图,独立于数据库技术实现
设计内容:实体、关系和属性 建模方法:3NF的设计方法 后续工作:物理数据模型的输入
7
物理数据模型
Physical Data Model(PDM)物理数据模型
解
决 方 案 集 成
使用工具:
ERWin
交付项目:
物理数据模型(PDM) 《物理数据模型说明书》 《数据库描述语言DDL》
33
物理数据模型命名规范
序号 主题
1 PARTY 2 OFFER
缩写
PAR OFR
中文
参与人 产品策划
3 FINANCE
4 LOCATION 5 ADVERTISEMENT 6 EVENT 7 NETWORK 8 REFERENCE CODE
31
Step 5: 确认模型 (2)
1. 通过回答以下问题,持续地对模型的范围进行验证: • • 这一模型组件的含义、与业务的关系是什么? 这一模型组件驱动的业务需求是什么?
2. 对模型是否已经满足所有业务需求、业务问题及限制条件等,进行验证 3. 绝对不要考虑任何与物理实施相关的问题! 4. 当所有回答业务需求所必须的数据已经齐备时,停止对模型进行优化
语义模型整理(共10张PPT)
领域本体: l概念化
l形式化 l明确 l共享
本体解析体系:
l语义类型 l语义体系
l映射
语义模型需要攻克的难点
如何将高分辨率遥感影像中建筑物的特征转化成如下的编码
遥感影像特征
89gm)和近红外波段B4(1. 5、建筑物分类编码(分成面状和线状文件) 7、将最终的语义模型嵌入到Mapinfo中 1、语义是指/数据(符号)所指代的概念的含义以及这些含义之间的关系,是对数据的抽象或者更高层次的逻辑表示。 2、边缘检测与形状特征模型建立 68gm )、B3(0. 《面向异构数据库集成的语义模型构建技术研究》赵寒 89gm)和近红外波段B4(1. 《基于语义模型的数字图书馆知识组织信息抽取策略》牟冬梅 5、建筑物分类编码(分成面状和线状文件) 语义模型是通过模型作为媒介来实现数据语义关系形式化描述的一种方式。 现在我们面临的难点是我们已经找到了方法及思路,却因为没有编程基础现在感觉无从下手。
语义模型参考文献
《面向异构数据库集成的语义模型构建技术研究》赵寒 《基于语义模型的数字图书馆知识组织信息抽取策略》牟冬梅
现在我们面临的难点是我们已经找到了方法及思路,却因为没有编程基础现在感觉 无从下手。希望董老师能给与我们指导!!!
1通、过语第义二对是种指于方/数式高据产分(生符的辨号语)所率义指可遥代以的感被概计影念算的像机含理义解以和及处这理些,可含以义被之获间取的、关传系递,是、对共数享据。的抽象或者更高层次的逻辑表示。 1、语义自是指动/数提据取(符首号)先所指需代要的概对念遥的含义以及这些含义之间的关系,是对数据的抽象或者更高层次的逻辑表示。 高分辨率感遥影感像影像进建行筑物一自些动提遥取感影
2、实现高分辨率遥感影像建筑物自动提取的关键在于建立一个语义模型,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
② 提炼建模方法论,指导项目实际操作;少走
弯路。
缓冲层,(缓冲区、转换映射区、基础数据区) 通用语义层(存储明细数据、可多次复用的数
个险、银保、团险、财务、电销等
据,解决维度与指标一致性的问题)
数据集市(DM) 分主题汇总(考虑复用)、特定应用汇总
Age Band
SYB_BAND
Hazardous Occupation Indicator SYB_INDICATOR
Hazardous Activity Indicator
SYB_INDICATOR
Poor Health Indicator
SYB_INDICATOR
Smoker classification
演讲人
备注
下次课程安排 下次课程安排
回顾数据仓库数据架构演变过程
1.0 实施方法
1.5 实施方法
个险
银保
电销
团险
财务接 口文件
个险
银保
电销
团险
财务接 口文件
缓冲层,(ODS) 个险、银保、团险、财务、电销等
数据集市(DM) 明细汇总表,高度汇总表
缓冲层,(ODS) 个险、银保、团险、
财务ቤተ መጻሕፍቲ ባይዱ电销等
整合层(DW) 统一建模
LRiefeinIsnPPusooruallriinccayycnecTPeeIrnerPdmmoicilBuiacmtayonrFBdeaantdures ID
SSYYSSBBYY__BBBB__AAIIDNNNDDDICATOR
<pk>
Policy Assignment Indicator
SYB_INDICATOR
BO中的通用语义层实践中遇到了一系列的问题
可理解性差
语义层过于复杂,难以理解,尤其是新老人员交 替,沟通成本很高
可复用性差
语义层的设计成果不能在多个BI工具中使用,过于 依赖BI工具.重用程度不高
如何解决这些问题呢? 即 能够享有通用语义层带来 的价值,又能够规避这些
问题。
可扩展性差
语义层的扩展于与分拆影响较大,难以后期维护 ,为了降低影响范围,大多是在原来基础上,新 增其他功能,致其复杂度越来越高;
访问复杂的企业数据
① 降低BI项目的投入成本,保护现有 IT数据投资
② 扩展现有的BI平台的安全模式 ③ 支持多数据源的语义层,提高服务
质量 ④ 支持完整BI项目生命周期,项目开
发、测试、投产 ⑤ 语义层与数据源的变化相同步 ⑥ 支持和扩展数据库的安全性 ⑦ 预定义的可重用的查询、参数、过
滤、计算、值列表等
Life Product Costs Key Measures
Life Underwriting Costs Key Measures
Life Claim Summary (实际上也是Key Measures )
IWS主题模型示例
Physical Data Model
Model: Insurance
通用语义层模型的粒度尽可能保留到最细交易粒度(汇总处理除外),以保 持模型间的连通性,并能够最大程度、最快速地响应新需求;
以Sysbase 的IWS模型为指导思想,进行通用语义层设计
核心主题: Life Policy Event Life Claim Transactions
其他应用主题视图: Life Quotations & Proposals
通用语义模型设计面向管理决策和经营分析,是公共维度和共性基础指标的 实现载体,支持80%以上的共性应用需求;
通用语义模型设计采用维度化的逆范式设计模式,通常采用以下策略:
➢ 预连接处理:按照总线架构维度和事实表的要求,将分散在多张相关实体表的数 据属性进行预连接操作,使相关的维度尽可能组织在特定的维表或者事实表,如 保单维、保单责任维、代理人维、客户维、赔案维等;
特点:
① 缓冲层与数据集市模型设计思路与以往类似; ② 整合层,参考了IBM的IIW、TD的FS_LDM模型,进行客户
化;或者据此设计公司内部的企业模型;
③ 用户应用多样化,充分利用BI工具分析功能; ④ 管理驾驶舱实际上是仪表盘+固定报表
项目实施过程中遇到的困难、困惑
项目困难、困惑
增量信息难以捕获,造成模型设计难以保存历史,造 I 成了模型设计有些“四不象”,实际上并没有学习到
SYB_CLASSIFICATION
Policy Rating Category
SYB_CATEGORY
Policy Rating Category Description SYB_VERYLONGSTRING
Prefered rating indicator
SYB_INDICATOR
Occupation Class Code
演讲人
备注
下次课程安排 下次课程安排
通用语义层起源与BO
通用语义层(Common Semantic Layer),检称CSL, 最早起源与BO,目的在于 让业务用户能够通过自己的业务术语,自由安全的访问、分析以及分享信息的技术, 其特点是:
① 业务用户自主操作 ② 提高用户对于各种企业数据的操作体验 ③ 提供一致可信的数据,确保同一业务术语的引用能够贯穿整个企业 ④ 让所有的商务智能工具都可以使用(只能用于BO) ⑤ 让信息部门可以控制和确保信息访问的安全性
通用语义层带来的价值
给业务用户带来的价值
给IT 用户带来的价值
① 简洁一致的用户体验,让业务用户 可以简便的访问企业内的数据;
② 减少企业的培训成本; ③ 保障业务用户始终使用可信的信息 ④ 业务用户自创式创建各种商务智能
的内容 ⑤ 可重用的查询、计算、参数、过滤
条件、值列表简化用户使用 ⑥ 为普通用户提供了一个简化的界面,
SYB_NUMERIC
All Entries Indicator SYB_INDICATOR
保单来源
<Undefined>
Column_16
<Undefined>
Life Policy Rating
Life Insurance Policy Rating ID
SYB_ID
<pk>
Gender
SYB_TYPE
Program Code
SYB_CLASSIFICATION
Class Code
SYB_CLASSIFICATION
ISO Class
SYB_CLASSIFICATION
Reinsurance Code SYB_CATEGORY
Coverage Code
SYB_CLASSIFICATION
IRPM Factor
SYB_CODE
Impairment Rating Code
SYB_CODE
Drinker Indicator
<Undefined>
标准件标志
<Undefined>
Policy Life Cycle Status
Policy Life Cycle Status ID SYB_ID
<pk>
Status Name
➢ 预计算处理:按照总线架构维度和事实表的要求,对事实表中的基础指标进行加 工计算,保证基础指标逻辑加工的“Golden Copy”,如保单事件、核保事件、 保全事件、查勘事件、理赔事件等;
➢ 汇总处理:针对共性的复杂指标,按照对应的维度进行提前聚合处理,以保证共 性复杂指标逻辑加工的“Golden Copy”,避免重复加工,提供数据一致性和响 应效率,如保单层面指标汇总,机构层面指标汇总,产品层面指标汇总,代理人 层面指标汇总,客户层面指标汇总等;
Package: Life Policy Key Measures 保单各类指标汇总快照
Diagram: Life Policy Key Measures
Author: ADMIN
Date: 2004/2/11
Version: 4.0.276
Insurance Policy
Policy ID
SYB_ID
SYB_NAME
Status Description
SYB_VERYLONGSTRING
All Entries Indicator
SYB_INDICATOR
Life Life Insurance Policy Properties
IPnosLluicraiyfnCecoevPIenroaligsceyuAPmrroaopuennrttcieBseanIDdPSSoYYBBli__cIBDyANFD e<pak>tures
行业模型的精髓
ETL过程设计简单,代理主键的使用、更新与维护混 II 乱
整合层按照范式的要求进行存储,在计算集市时,非
III
常的不方便,效率低下,因此常将一些常见的维度信 息关联好,存储起来,集市计算时使用
数据集市一般根据应用来设计,集市表成“碎片”,且 指标多次重复计算,集市之间存在误差(可能因为维 IV 度、指标口径不明确、加工频度、刷新频度、脚本错 误等)
数据集市(DM) 明细汇总表DM1,高度汇总表DM2
固定 报表
灵活 查询
多维 分析
特点:
① 源数据一般直接抽取到缓冲层,缓冲层逻辑上在细分为全
量区、增量区;
② 基于缓冲层(当时叫ODS层)加工数据集市,集市分为明
细汇总表、高粒度的汇总表;
③ 用户应用多集中在报表统计;
固定 报表
灵活 查询
多维 分析
管理驾驶舱