数据中心建模方案

合集下载

onedata建模方法论

onedata建模方法论

onedata建模方法论(原创版4篇)《onedata建模方法论》篇1OneData 是一种数据建模方法论,旨在帮助企业构建高质量的数据仓库。

该方法论包括以下主要内容:1. 数据仓库定义:OneData 将数据仓库定义为一个集成的、稳定的、易于访问的数据存储库,用于支持企业管理、决策和分析需求。

2. 数据建模流程:OneData 提出了一套完整的数据建模流程,包括需求分析、概念设计、逻辑设计、物理设计和实施等阶段。

在每个阶段,都有相应的方法和工具支持。

3. 数据模型设计:OneData 强调数据模型设计的重要性,提出了一些设计原则,如实体完整性、属性完整性、参照完整性和数据一致性等。

OneData 还提供了一些数据模型设计工具,如ER 图、数据字典和数据流图等。

4. 数据仓库实现:OneData 提供了一些数据仓库实现的技术和工具,如数据清洗、数据转换、数据加载、数据存储和数据查询等。

OneData 还强调了数据仓库的性能和安全性的重要性。

5. 数据仓库管理:OneData 提供了一些数据仓库管理方法和工具,如数据质量管理、数据备份和恢复、数据安全和数据审计等。

OneData 还强调了数据仓库的可用性和可扩展性的重要性。

《onedata建模方法论》篇2OneData 是一种数据仓库建模方法论,其核心思想是将数据仓库视为一个企业级的数据中心,通过建立一套完整的数据模型来实现数据的统一管理和运营。

OneData 方法论主要包括以下方面:1. 数据仓库概念模型设计:该阶段主要通过业务领域模型的设计,将企业的业务需求转化为数据模型,包括数据实体的定义、属性的设计以及实体之间的关系等。

2. 数据仓库逻辑模型设计:该阶段主要通过数据模型的逻辑设计,将概念模型转化为具体的数据表结构,包括数据表的定义、表之间的关系、索引的设计等。

3. 数据仓库物理模型设计:该阶段主要通过数据模型的物理设计,将逻辑模型转化为具体的数据存储结构,包括数据分区、数据备份、数据恢复等。

数据中心机房IT硬件管理知识图谱模型的应用路径探索

数据中心机房IT硬件管理知识图谱模型的应用路径探索

一、银行业机房IT硬件设备现状近年来,随着技术快速发展与精细化管理逐步普及,银行业对机房IT硬件设备运维也提出了更高的要求。

传统模式下,IT硬件管理包含了主机管理、服务器管理、存储管理、网络管理等多种类型,这些硬件不但与应用系统及机房的SPC资源(空间资源、供配电资源、空气调节资源)有着复杂的关联关系,同时在IT硬件内部也存在复杂的关联性。

此外,当前在机房环境中部署的IT硬件设备类型和数量都非常庞大,运维人员在进行日常管理或变更实施的过程中,经常需要对IT硬件设备开展端到端的关联分析,期间涉及多个部门及工作条线,往往很难在短时间内获取全面的关联信息,因此也难以满足数据中心日益精细化的运维需求。

一般来说,传统机房的IT硬件管理通常分散在不同部门,且针对不同类型的IT硬件均配置了不同的管理系统,但彼此之间却缺乏IT硬件层面的关联关系,同时也缺乏IT硬件与应用系统及机房关键基础设施资源的关联关系,更没有全面统一的IT硬件可视化视图。

在此背景下,当需要开展日常运维及变更管理时,往往会消耗大量时间来梳理IT硬件存在的各种关联关系,从而降低了数据中心机房的运维效率。

此外,从分离的部门及条线汇总的IT硬件关联信息经常分散在各种不同的文档、图表中,不够直观方便且沟通效率较低,一旦在特殊情况下需要临时梳理IT硬件的关联关系,将可能因忽略某些重要关系而造成安全隐患。

为了解决上述问题,本文设计提出了一种适用于机房IT硬件设备的知识图谱模型及可视化实现方法,以期在改善机房IT硬件管理效率的同时,进一步提高整体IT环境的快速响应能力。

二、IT硬件知识图谱建模思路1.运维对象分布当前,数据中心机房承载了企业的大部分业务信息系统,包含不同种类的运维对象(见表1)。

表1 数据中心机房运维对象种类这些运维对象间存在着复杂的关联关系,从数据中心机房全局角度看,可以分为A应用层、I平台层、F关键基础设施层。

其中,A应用层主要包括各类应用对象,根据应用类型不同可分为渠道服务、外部接口、管理分析、业务支持、核心系统等。

数据中心建设方案(简版)

数据中心建设方案(简版)

企业数据中心系统平台技术方案建议书第1章总体建设方案1.1总体建设思路图、数据中心构建思路图按照对数据中心的理解,完整的数据中心应该具备IT基础设施(主机、存储、网络)、企业级ETL平台、数据存储中心、数据共享服务、应用层、统一门户、数据管控平台。

1.2功能框架图、功能框架系统功能框架分为企业级ETL平台、存储与计算中心、服务层、应用层、统一门户、统一平台管控。

企业级ETL平台:负责企业数据中心数据采集、加工、汇总、分发的过程,完成企业级数据标准化、集中化,实现数据脉络化、关系化,实现统一的数据处理加工,包括:非实时数据处理和实时数据处理,提供数据抽取、数据转换、数据加载、数据汇总、数据分发、数据挖掘等能力。

存储与计算中心:建立统一的数据中心数据模型,以及统一的数据存储与计算,具体提供关系数据库、分布式非关系数据库、分布式文件、分布式计算,实现统一的数据存储与计算。

数据共享服务:通过数据服务标准化开放访问,帮助企业IT建设中,应用和数据分离,引入更多的应用开发商,促进应用的百花齐放和应用的专业性;基于标准化接口,实现对标签、客户视图、指标等数据查询API封装,实现与周边系统实时互动,体现数据价值,减少数据冗余,保证数据安全,保证数据的一致性。

应用层:应用层的应用使用服务层提供的各种数据服务。

本期应用层包括:经分应用、流量运营、ESOP应用、VGOP应用、指标库、流量运营战略地图、掌上分析、自助业务分析、区域洞察、渠道运营、自助分析、客户标签库、实时营销、LTE互联网管控策略。

统一门户:提供统一域名分配、负载均衡、鉴权管理、统一管控平台接入、应用注册、应用发布、应用访问数据信息等功能,同时提供数据中心被应用访问的频次,被应用访问的数据范围,提供数据资产的评估,为应用上下线和数据开放提供依据。

统一平台管控:面向开发人员、运维人员实现数据、应用、资源的统一管控,包括:数据资产管控、开发管理、监控管理、调度管理、系统管理、安全管理。

数据中心建模方案

数据中心建模方案

数据中心建模方案前言每个行业有自己的模型,但是不同行业的数据模型,在数据建模的方法上,却都有着共通的基本特点。

什么是数据模型数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,来表示现实世界中事务的相系的一种映射。

在这里,数据模型表现的抽象的是实体和实体之间的关系,通过对实体和实体之间关系的定义和描述,来表达实际的业务中具体的业务关系。

数据仓库模型是数据模型中针对特定的数据仓库应用系统的一种特定的数据模型,一般的来说,我们数据仓库模型分为几下几个层次。

数据仓库模型通过上面的图形,我们能够很容易的看出在整个数据仓库得建模过程中,我们需要经历一般四个过程:•业务建模,生成业务模型,主要解决业务层面的分解和程序化。

•领域建模,生成领域模型,主要是对业务模型进行抽象处理,生成领域概念模型。

•逻辑建模,生成逻辑模型,主要是将领域模型的概念实体以及实体之间的关系进行数据库层次的逻辑化。

•物理建模,生成物理模型,主要解决,逻辑模型针对不同关系型数据库的物理化以及性能等一些具体的技术问题。

因此,在整个数据仓库的模型的设计和架构中,既涉及到业务知识,也涉及到了具体的技术,我们既需要了解丰富的行业经验,同时,也需要一定的信息技术来帮助我们实现我们的数据模型,最重要的是,我们还需要一个非常适用的方法论,来指导我们自己针对我们的业务进行抽象,处理,生成各个阶段的模型。

为什么需要数据模型在数据仓库的建设中,我们一再强调需要数据模型,那么数据模型究竟为什么这么重要呢?首先我们需要了解整个数据仓库的建设的发展史。

数据仓库的发展大致经历了这样的三个过程:•简单报表阶段:这个阶段,系统的主要目标是解决一些日常的工作中业务人员需要的报表,•以及生成一些简单的能够帮助领导进行决策所需要的汇总数据。

这个阶段的大部分表现形式为数据库和前端报表工具。

•数据集市阶段:这个阶段,主要是根据某个业务部门的需要,进行一定的数据的采集,整理,按照业务人员的需要,进行多维报表的展现,能够提供对特定业务指导的数据,并且能够提供特定的领导决策数据。

数据机房工程方案

数据机房工程方案

数据机房工程方案1.引言数据机房是现代企业信息化建设中必不可少的基础设施,是企业信息系统安全稳定运行的重要保障。

为了建设一座性能卓越、设备完备的数据机房,需要进行科学规划和合理设计,以满足企业对数据存储、处理和传输的需求。

本文将从机房选址、机房规划、机房建设、机房设备选择和机房安全等方面进行详细分析,并提供一套完整的数据机房工程方案。

2.机房选址机房选址是数据机房工程的第一步,选址的好坏将直接影响到后期建设和运营。

在选址时需要考虑以下几个因素:(1)位置:机房应位于离企业主要办公区较近的地方,方便数据传输和管理。

(2)环境:机房周围环境应干净整洁,空气清新,避免有害气体和尘埃的影响。

(3)供电和网络:机房应有稳定的供电和网络支持,避免停电和断网情况的发生。

(4)安全:机房应位于安全可靠的地方,避免发生火灾、水灾等意外情况。

3.机房规划机房规划是对机房空间、设备和功能进行统一设计和布局的工作。

在规划时需要考虑以下几个方面:(1)空间需求:根据企业的业务需求和数据量确定机房的空间需求,包括机柜、机架、数据中心等空间。

(2)设备配备:对机房所需要的设备进行详细规划,包括服务器、存储设备、网络设备等。

(3)安防需求:根据机房的安全需求进行布防系统规划,包括监控摄像头、报警系统等。

(4)环境控制:对机房的温度、湿度、气流等环境进行合理规划,保证设备的正常运行和运行安全。

4.机房建设机房建设是根据规划方案进行具体施工的过程。

在建设时需要注意以下几个方面:(1)施工质量:保证建设的质量,包括墙体、地面、天花板等的施工。

(2)材料选择:选择符合国家规定标准的环保材料进行建设。

(3)工程管理:对施工过程进行全程管理,及时解决施工中的问题。

(4)安全施工:做好现场施工安全措施,保证施工人员的安全。

5.机房设备选择在机房设备选择方面,需要根据机房规模和业务需求进行合理选择。

包括服务器、存储设备、网络设备等。

需要考虑设备的性能、可靠性、维护服务等因素,保证设备的稳定运行和长期使用。

数据中心能耗优化的建模与算法研究

数据中心能耗优化的建模与算法研究

数据中心能耗优化的建模与算法研究随着云计算、大数据、人工智能等技术的快速发展,数据中心已经成为了现代社会中不可或缺的一个组成部分。

而数据中心的能源消耗也成为一个逐渐被关注的问题。

如何优化数据中心的能耗,在保证计算质量和服务质量的前提下,尽量减少能耗,成为了当前数据中心优化研究的热点话题。

数据中心的能耗主要来自于计算设备和冷却设备。

因此提高计算设备的利用率和冷却设备的效率,是优化数据中心能耗的两个重要方面。

其中,计算设备的利用率又与任务调度和资源管理紧密相关,而冷却设备的效率也与环境控制和物理布局密切相关。

面对如此复杂的能耗优化问题,我们需要建立适合的模型和算法来进行分析和解决。

本文的主要目的即在于探讨数据中心能耗优化的建模和算法研究方面的进展和未来发展趋势。

1. 建模方法数据中心能耗优化的建模方法包括建立物理模型、数学模型、仿真模型和模拟模型等。

其中,物理模型和数学模型是最为传统的建模方法,也是较为普遍的方法。

物理模型主要是通过实验和测试,获取数据中心各个组成部分的能源消耗和运行状况,以此来建立数据中心的能耗模型。

物理模型的优点是可靠性高,结果可追溯性好,但其缺点是需要较大的时间和成本投入,且无法全面考虑数据中心复杂的逻辑关系。

数学模型则是通过数据分析和数学方法建立能耗优化模型。

数学模型主要分为静态模型和动态模型两种。

静态模型是基于数据中心的一些基本属性和约束条件,通过最优化求解器求解得到的最优解。

而动态模型则是基于实时监控数据,通过实时计算和调整来实现能耗的优化。

相比物理模型,数学模型的优势是可模拟性好,模型建立周期较短,但也有缺点,例如数据建模和求解器的选择较为困难,误差分析较为复杂等。

2. 算法研究针对数据中心能耗优化问题,现有的算法方法主要可以分为以下几种:(1)基于负载预测的调度算法。

该算法利用对负载的预测,实现任务的调度和资源的分配,从而达到能源消耗的优化。

其中,负载预测可以采用传统的ARMA模型、卷积神经网络等方法,调度算法可以采用遗传算法、模拟退火算法等优化算法来实现。

数据中心建模方案

数据中心建模方案

数据中心建模方案1.需求分析:在建模过程之前,需要对数据中心的业务需求进行全面的分析。

这包括对系统性能、容量、可用性和安全性等方面的评估,并提取关键需求和目标。

2.系统设计:在需求分析的基础上,进行数据中心的整体设计。

这包括确定数据中心的逻辑和物理拓扑,确定硬件设备和软件组件的选择,以及制定网络和存储架构等。

3.服务模型:建立数据中心的服务模型,即将数据中心的功能和服务按照模块化的方式进行划分和描述。

通过服务模型,可以清晰地了解每个模块的功能、依赖和接口等。

4.数据模型:建立数据中心的数据模型,即对数据进行分类、整合和管理的模型。

数据模型包括数据的结构、存储和处理方式,并与服务模型进行对应。

5.性能建模:根据需求分析的结果,对数据中心的性能进行建模和评估。

通过建立性能模型,可以预测和优化数据中心的性能,提高系统的响应速度和负载均衡能力。

6.安全建模:对数据中心的安全进行建模和评估。

这包括对数据的保护机制、访问控制和备份策略等的建模,以及对系统的漏洞和风险进行评估和管理。

7.虚拟化建模:对数据中心进行虚拟化建模,即将物理资源抽象为虚拟资源,并进行动态分配和管理。

虚拟化建模可以提高数据中心的资源利用率和灵活性,降低成本和维护工作量。

8.容灾建模:对数据中心进行容灾建模,即在系统设计和架构中考虑灾备和容错能力。

容灾建模包括冗余和备份机制的设计,以及灾备计划和故障恢复策略的制定。

9.监控和管理:建立数据中心的监控和管理体系。

通过建模,可以实现对数据中心各个组件和系统的实时监控和管理,及时发现和解决问题。

总之,数据中心建模方案是一项系统性的工作,旨在实现高性能、高可靠性、高安全性和高灵活性的数据中心架构。

通过合理的建模方法和步骤,可以有效地规划和设计数据中心,满足不同业务需求,并提高数据中心的管理效率和运营效果。

大数据中心建设思路PPT81页

大数据中心建设思路PPT81页
光纤交换机
磁盘柜
存储
备份服务器
BI 应用服务器群
ETL/Monitor/Analysis
BI应用服务器可由多个服务器组成应用集群
数据中心建设的终极目标
企业统一数据模型
数据边界——顶层信息模型
实现最终目标的困难
网省电力数据应用所面临的挑战
数据中心的建设策略
短期见效、应用驱动展现全局指标数据,早出成果,短期见效,以应用促建设非源头数据直接导入,健全全局类指标数据转移部分业务系统查询功能切断统计途径
数据分析模型
………
主题1
主题2
主题n
………
基于主题域侧重于对企业范围内数据进行整合明细数据与聚合数据共享从技术而言是3NF模式
数据仓库模型
数据模型在数据仓库架构中所处的位置
企业级概念数据建模目的
主题
主题
主题
主题
主题
主题
主题
主题
主题
业务数据
业务数据
业务数据
业务数据
业务数据
业务数据
业务数据
业务数据
业务数据
产品主题描述国网公司提供的电能、热能与国网公司所提供服务的描述与价格信息以及与服务质量、服务效果相关的各类记录
设备
设备主数据用于描述企业发电、输电、配电、供电四大类在网运行设备资源、运行和调度信息、测试、破坏和环境等信息
电网
电网主题域包含了市场的电力价格、预测相关信息,网间、电厂电网的交易信息,以及电力调度中设备产生的相关数据
1
2
3
业务部门主导
过程中不断出成果
切断原有数据统计、汇报方式
数据中心的建设方式
1、自顶向下(追溯法\分析应用法)既先分析报表中指标数据,再根据指标的构成进行追溯分析,直至建设粒度到最小的、不可再分的业务细节数据;这种方式有利于梳理统计类指标,分析企业中各统计指标的口径。侧重纵向数据关联。2、自下而上(数据整合法)这种建设思路是先建立企业的概念模型,然后利用数 据仓库和企业建模标准等思想进行全面的数据模型设计、物理模型设计。侧重横向分析和标准建设。3、折中建设
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据中心建模方案前言每个行业有自己的模型,但是不同行业的数据模型,在数据建模的方法上,却都有着共通的基本特点。

什么是数据模型数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,来表示现实世界中事务的相系的一种映射。

在这里,数据模型表现的抽象的是实体和实体之间的关系,通过对实体和实体之间关系的定义和描述,来表达实际的业务中具体的业务关系。

数据仓库模型是数据模型中针对特定的数据仓库应用系统的一种特定的数据模型,一般的来说,我们数据仓库模型分为几下几个层次。

数据仓库模型通过上面的图形,我们能够很容易的看出在整个数据仓库得建模过程中,我们需要经历一般四个过程:•业务建模,生成业务模型,主要解决业务层面的分解和程序化。

•领域建模,生成领域模型,主要是对业务模型进行抽象处理,生成领域概念模型。

•逻辑建模,生成逻辑模型,主要是将领域模型的概念实体以及实体之间的关系进行数据库层次的逻辑化。

•物理建模,生成物理模型,主要解决,逻辑模型针对不同关系型数据库的物理化以及性能等一些具体的技术问题。

因此,在整个数据仓库的模型的设计和架构中,既涉及到业务知识,也涉及到了具体的技术,我们既需要了解丰富的行业经验,同时,也需要一定的信息技术来帮助我们实现我们的数据模型,最重要的是,我们还需要一个非常适用的方法论,来指导我们自己针对我们的业务进行抽象,处理,生成各个阶段的模型。

为什么需要数据模型在数据仓库的建设中,我们一再强调需要数据模型,那么数据模型究竟为什么这么重要呢?首先我们需要了解整个数据仓库的建设的发展史。

数据仓库的发展大致经历了这样的三个过程:•简单报表阶段:这个阶段,系统的主要目标是解决一些日常的工作中业务人员需要的报表,•以及生成一些简单的能够帮助领导进行决策所需要的汇总数据。

这个阶段的大部分表现形式为数据库和前端报表工具。

•数据集市阶段:这个阶段,主要是根据某个业务部门的需要,进行一定的数据的采集,整理,按照业务人员的需要,进行多维报表的展现,能够提供对特定业务指导的数据,并且能够提供特定的领导决策数据。

•数据仓库阶段:这个阶段,主要是按照一定的数据模型,对整个企业的数据进行采集,整理,并且能够按照各个业务部门的需要,提供跨部门的,完全一致的业务报表数据,能够通过数据仓库生成对对业务具有指导性的数据,同时,为领导决策提供全面的数据支持。

通过数据仓库建设的发展阶段,我们能够看出,数据仓库的建设和数据集市的建设的重要区别就在于数据模型的支持。

因此,数据模型的建设,对于我们数据仓库的建设,有着决定性的意义。

一般来说,数据模型的建设主要能够帮助我们解决以下的一些问题:•进行全面的业务梳理,改进业务流程。

在业务模型建设的阶段,能够帮助我们的企业或者是管理机关对本单位的业务进行全面的梳理。

通过业务模型的建设,我们应该能够全面了解该单位的业务架构图和整个业务的运行情况,能够将业务按照特定的规律进行分门别类和程序化,同时,帮助我们进一步的改进业务的流程,提高业务效率,指导我们的业务部门的生产。

•建立全方位的数据视角,消灭信息孤岛和数据差异。

通过数据仓库的模型建设,能够为企业提供一个整体的数据视角,不再是各个部门只是关注自己的数据,而且通过模型的建设,勾勒出了部门之间内在的联系,帮助消灭各个部门之间的信息孤岛的问题,更为重要的是,通过数据模型的建设,能够保证整个企业的数据的一致性,各个部门之间数据的差异将会得到有效解决。

•解决业务的变动和数据仓库的灵活性。

通过数据模型的建设,能够很好的分离出底层技术的实现和上层业务的展现。

当上层业务发生变化时,通过数据模型,底层的技术实现可以非常轻松的完成业务的变动,从而达到整个数据仓库系统的灵活性。

•帮助数据仓库系统本身的建设。

通过数据仓库的模型建设,开发人员和业务人员能够很容易的达成系统建设范围的界定,以及长期目标的规划,从而能够使整个项目组明确当前的任务,加快整个系统建设的速度。

如何建设数据模型建设数据模型既然是整个数据仓库建设中一个非常重要的关键部分,那么,怎么建设我们的数据仓库模型就是我们需要解决的一个问题。

这里我们将要详细介绍如何创建适合自己的数据模型。

数据仓库数据模型架构数据仓库的数据模型的架构和数据仓库的整体架构是紧密关联在一起的,我们首先来了解一下整个数据仓库的数据模型应该包含的几个部分。

从下图我们可以很清楚地看到,整个数据模型的架构分成5 大部分,每个部分其实都有其独特的功能。

数据仓库数据模型架构从上图我们可以看出,整个数据仓库的数据模型可以分为大概5 大部分:•系统记录域(System of Record):这部分是主要的数据仓库业务数据存储区,数据模型在这里保证了数据的一致性。

•内部管理域(Housekeeping):这部分主要存储数据仓库用于内部管理的元数据,数据模型在这里能够帮助进行统一的元数据的管理。

•汇总域(Summary of Area):这部分数据来自于系统记录域的汇总,数据模型在这里保证了分析域的主题分析的性能,满足了部分的报表查询。

•分析域(Analysis Area):这部分数据模型主要用于各个业务部分的具体的主题业务分析。

这部分数据模型可以单独存储在相应的数据集市中。

•反馈域(Feedback Area):可选项,这部分数据模型主要用于相应前端的反馈数据,数据仓库可以视业务的需要设置这一区域。

通过对整个数据仓库模型的数据区域的划分,我们可以了解到,一个好的数据模型,不仅仅是对业务进行抽象划分,而且对实现技术也进行具体的指导,它应该涵盖了从业务到实现技术的各个部分。

数据仓库建模阶段划分我们前面介绍了数据仓库模型的几个层次,下面我们讲一下,针对这几个层次的不同阶段的数据建模的工作的主要内容:数据仓库建模阶段划分从上图我们可以清楚地看出,数据仓库的数据建模大致分为四个阶段:业务建模阶段业务建模,这部分建模工作,主要包含以下几个部分:•划分整个单位的业务,一般按照业务部门的划分,进行各个部分之间业务工作的界定,理清各业务部门之间的关系。

•深入了解各个业务部门的内具体业务流程并将其程序化。

•提出修改和改进业务部门工作流程的方法并程序化。

•数据建模的范围界定,整个数据仓库项目的目标和阶段划分。

领域建模阶段领域概念建模,这部分得建模工作,主要包含以下几个部分:•抽取关键业务概念,并将之抽象化。

•将业务概念分组,按照业务主线聚合类似的分组概念。

•细化分组概念,理清分组概念内的业务流程并抽象化。

•理清分组概念之间的关联,形成完整的领域概念模型。

逻辑建模阶段逻辑建模,这部分的建模工作,主要包含以下几个部分:•业务概念实体化,并考虑其具体的属性•事件实体化,并考虑其属性内容•说明实体化,并考虑其属性内容物理建模阶段物理建模,这部分得建模工作,主要包含以下几个部分:•针对特定物理化平台,做出相应的技术调整•针对模型的性能考虑,对特定平台作出相应的调整•针对管理的需要,结合特定的平台,做出相应的调整•生成最后的执行脚本,并完善之。

从我们上面对数据仓库的数据建模阶段的各个阶段的划分,我们能够了解到整个数据仓库建模的主要工作和工作量,希望能够对我们在实际的项目建设能够有所帮助。

数据仓库建模方法大千世界,表面看五彩缤纷,实质上,万物都遵循其自有的法则。

数据仓库得建模方法同样也有很多种,每一种建模方法其实代表了哲学上的一个观点,代表了一种归纳,概括世界的一种方法。

目前业界较为流行的数据仓库的建模方法非常多,这里主要介绍范式建模法,维度建模法,实体建模法等几种方法,每种方法其实从本质上讲就是从不同的角度看我们业务中的问题,不管从技术层面还是业务层面,其实代表的是哲学上的一种世界观。

我们下面给大家详细介绍一下这些建模方法。

范式建模法(Third Normal Form,3NF)范式建模法其实是我们在构建数据模型常用的一个方法,该方法的主要由Inmon 所提倡,主要解决关系型数据库得数据存储,利用的一种技术层面上的方法。

目前,我们在关系型数据库中的建模方法,大部分采用的是三范式建模法。

范式是数据库逻辑模型设计的基本理论,一个关系模型可以从第一范式到第五范式进行无损分解,这个过程也可称为规范化。

在数据仓库的模型设计中目前一般采用第三范式,它有着严格的数学定义。

从其表达的含义来看,一个符合第三范式的关系必须具有以下三个条件:•每个属性值唯一,不具有多义性;•每个非主属性必须完全依赖于整个主键,而非主键的一部分;•每个非主属性不能依赖于其他关系中的属性,因为这样的话,这种属性应该归到其他关系中去。

由于范式是基于整个关系型数据库的理论基础之上发展而来的,因此,本人在这里不多做介绍,有兴趣的读者可以通过阅读相应的材料来获得这方面的知识。

根据Inmon 的观点,数据仓库模型得建设方法和业务系统的企业数据模型类似。

在业务系统中,企业数据模型决定了数据的来源,而企业数据模型也分为两个层次,即主题域模型和逻辑模型。

同样,主题域模型可以看成是业务模型的概念模型,而逻辑模型则是域模型在关系型数据库上的实例话。

图5. 范式建模法从业务数据模型转向数据仓库模型时,同样也需要有数据仓库的域模型,即概念模型,同时也存在域模型的逻辑模型。

这里,业务模型中的数据模型和数据仓库的模型稍微有一些不同。

主要区别在于:•数据仓库的域模型应该包含企业数据模型得域模型之间的关系,以及各主题域定义。

数据仓库的域模型的概念应该比业务系统的主题域模型范围更加广。

•在数据仓库的逻辑模型需要从业务系统的数据模型中的逻辑模型中抽象实体,实体的属性,实体的子类,以及实体的关系等。

以笔者的观点来看,Inmon 的范式建模法的最大优点就是从关系型数据库的角度出发,结合了业务系统的数据模型,能够比较方便的实现数据仓库的建模。

但其缺点也是明显的,由于建模方法限定在关系型数据库之上,在某些时候反而限制了整个数据仓库模型的灵活性,性能等,特别是考虑到数据仓库的底层数据向数据集市的数据进行汇总时,需要进行一定的变通才能满足相应的需求。

因此,笔者建议读者们在实际的使用中,参考使用这一建模方式。

维度建模法维度建模法,Kimball 最先提出这一概念。

其最简单的描述就是,按照事实表,维表来构建数据仓库,数据集市。

这种方法的最被人广泛知晓的名字就是星型模式(Star-schema)。

图6. 维度建模法上图的这个架构中是典型的星型架构。

星型模式之所以广泛被使用,在于针对各个维作了大量的预处理,如按照维进行预先的统计、分类、排序等。

通过这些预处理,能够极大的提升数据仓库的处理能力。

特别是针对3NF 的建模方法,星型模式在性能上占据明显的优势。

同时,维度建模法的另外一个优点是,维度建模非常直观,紧紧围绕着业务模型,可以直观的反映出业务模型中的业务问题。

相关文档
最新文档