企业数据仓库概要设计说明书

合集下载

某公司数据库设计说明书

某公司数据库设计说明书

某公司数据库设计说明书1. 引言本文档旨在为某公司的数据库设计提供详细的说明。

数据库是组织和存储数据的关键组件,良好的数据库设计能够提高数据的可靠性和可用性,提升系统的性能和效率。

2. 数据库设计目标某公司数据库设计的主要目标是: - 保证数据的完整性和一致性 - 提供高性能和高可用性的数据库 - 支持数据的快速检索和查询 - 确保系统的可扩展性和灵活性3. 数据需求分析在进行数据库设计之前,首先需要对数据需求进行分析。

某公司的主要业务需求包括: - 客户管理:保存客户的基本信息和购买记录 - 订单管理:跟踪和管理订单信息 - 产品管理:管理公司所提供的产品信息- 员工管理:管理公司员工的信息和权限4. 数据库架构设计为了满足上述业务需求,某公司的数据库架构设计如下:4.1. 客户表(Customers)客户表用于存储客户的基本信息,包括姓名、联系方式等。

字段名类型描述ID int 客户ID姓名varchar 客户姓名联系方式varchar 客户联系方式………4.2. 订单表(Orders)订单表用于存储订单信息,包括订单编号、客户ID、订单状态等。

字段名类型描述订单编号int 订单编号客户ID int 客户ID订单状态varchar 订单状态订单日期date 下单日期………4.3. 产品表(Products)产品表用于存储公司提供的产品信息,包括产品编号、名称、价格等。

字段名类型描述产品编号int 产品编号产品名称varchar 产品名称产品价格decimal 产品价格………4.4. 员工表(Employees)员工表用于存储员工的信息,包括姓名、职位、联系方式等。

字段名类型描述员工ID int 员工ID姓名varchar 员工姓名职位varchar 员工职位联系方式varchar 员工联系方式………5. 数据库性能优化为了提升数据库的性能和效率,可以采取以下优化措施: - 使用索引来加速数据的检索和查询 - 范式化数据库以减少数据冗余 - 合理分布数据以减轻单个数据库服务器的负载 - 定期进行数据库备份和优化6. 数据库安全性保障为了保障数据库的安全性,可以考虑以下安全措施: - 控制数据库用户的访问权限,限制非授权用户的访问 - 定期更新数据库服务器的安全补丁 - 加密敏感数据,如客户的密码和支付信息 - 定期进行数据库备份以应对数据丢失的风险7. 数据库维护计划为了保证数据库的稳定运行,建议制定数据库维护计划,包括: - 定期检查数据库的健康状态,如性能监测和空间使用情况 - 定期备份数据库以应对数据丢失的风险 - 定期优化数据库以提升性能和响应速度 - 定期更新数据库服务器的软件和硬件8. 总结本文档为某公司的数据库设计提供了详细的说明,并提出了相关的性能优化和安全保障措施。

企业数据仓库概要设计说明书

企业数据仓库概要设计说明书

新年快乐XXXX企业数据仓库概要设计说明书ETL概要设计分册(文档编码:OM-BIDW-C008 )(版本01.00.000)未经许可,不得以任何形式抄袭XXXX版权所有,翻板必究OM数据仓库XXXX企业数据组2009年3月文档变更历史目录1 概述 (4)2 设计原则和前提 (5)2.1 整体部署 (5)2.2 前提条件 (6)2.3 设计原则 (6)3 整体框架 (7)3.1 ETL系统架构图 (7)3.2 ETL系统功能模块描述 (7)4 数据抽取模块 (9)4.1 假设与约定 (9)4.2 模块功能图 (9)4.3 各子模块功能及处理流程 (11)5 数据加载模块 (11)5.1 假设与约定 (11)5.2 数据加载模块图 (11)5.3 数据加载功能模块描述 (12)6 作业调度模块 (13)6.1 模块概述 (13)6.2 假设与约定 (13)6.3 作业调度流程 (13)6.4 ETL作业种类及调度实现方法 (14)7 监控管理模块 (15)7.1 监控管理模块图 (15)ETL监控内容 (16)附录1控制表及控制文件设计 (16)附录2:文件目录及编码说明 (19)1概述ETL是数据仓库系统开发中至关重要的一个过程,它涉及到对源数据的抽取、整合及各种转换,并最终形成面向用户的分析数据。

由于数据仓库系统的数据源来自于多个分散的业务系统,对不同业务系统的数据整合及清洗转换将是一个复杂的过程,ETL过程决定了数据仓库系统获取数据的准确性。

另外由于ETL包括数据抽取、数据清洗、数据转换及数据加载等数据处理过程,这些处理过程分散在不同的系统平台及开发工具上,对这些作业过程的统一调度将是一个重要的问题,作业调度涉及到系统的稳定性。

网关(通道、产 品)服务器数据组服务器载加据数该服务器完成两项功能: 1接口文件服务器,所有 被接入DW 的数据文件必须通 过该服务器中转2、数据备份,来自网关的 数据文件将长期保留在该服 务器上,作为文件备份2设计原则和前提2.1整体部署数据仓库ETL 整体部署图网关通道数据库服务器是数据仓库的外围数据库系统,数据仓库中的绝 大部分数据都将来自网关通道数据库服务器基于目前短彩部自身情况的考虑,在数据源服务器和数据仓库服务器之 间增加一台FTP 文件服务器,其功能有二:接口文件服务器,所有被接入DW 的数据文件必须通过该服务器中转数据备份,接口机FTP !务器数据仓库(Dvy 服务器来自网关的数据文件将长期保留在该服务器上,作为文件备份2.2前提条件ETL概要设计将基于下面的前提条件ETL逻辑:XXXX企业的数据虽然分布在不同的通道,但是各通道数据的共性度非常高,因此ETL中不存在逻辑复杂的转换(Transformation )及数据质量管理等流程,整个ETL只需要实现抽取(Extraction )和加载(Loading) 两个功能即可ETL工具:自主开发,具体开发语言待定?;作业调度工具:自主开发,具体开发语言待定?。

仓储系统概要设计说明书.doc

仓储系统概要设计说明书.doc

仓储管理系统概要设计说明书编制:编制日期:审核:审核日期:批准:批准日期:1. 引言1.1编写目的根据的需求分析,编写出系统的基本需求,和基本的数据流图,要实现整个系统,需要对用户的需求进行设计,概要设计主要是利用比较抽象的语言对整个需求进行概括,确定对系统的物理配置,确定整个系统的处理流程和系统的数据结构,接口设计,实现对系统的初步设计。

1.2项目背景设计出一个仓库管理系统,通过计算机来简化借仓库管理工作,充分利用现代科技来提高仓库管理的效率,使得仓库管理员工的工作更加方便,提高工作效率1.3 设计原则为确保仓库管理系统的可靠性和实用性,在系统方案设计中,应遵循下列设计原则:可靠性原则:在设计上应采用成熟的先进技术,关键设备应进行备份,并具有必要的冗余和容错能力;采用JDBC数据库连接池、AJAX等技术以满足在多用户并发的情况下,系统可稳定运行;保证各类数据的正确性和完整性;保证系统能够稳定可靠地处理大量数据;系统有严格的差错控制处理能力;系统有完善的数据备份与恢复机制,保证数据恢复稳定可靠。

安全性原则:为保障系统信息的安全准确,系统的各环节具备多重保密和认证措施,包括完善的“用户-角色-权限”模式的权限管理以及页面访问控制机制,保证非法用户不能进入系统,用户在许可的范围内使用系统各模块;确保在联网的情况下,各类数据传输安全可靠;系统有完善的数据备份和恢复管理制度;系统通过日志的方式记录所有用户的使用情况,以备核查。

易维护性原则:系统应采用模块化设计,便于安装、配置、维护和使用。

2. 总体设计2.1 设计目标使仓库信息管理员更好地管理仓库入库、出库情况以及库存信息,目标针对于仓库货物的流通情况,能够方便的实现进出产品的出入库功能和信息的查询,并能够明了的反映库存信息情况以及库位使用信息,优化库位存储。

系统要求有一定不合法的法操作的判断能力和容错能力以不至于偶尔的误操作致使系统崩溃或是数据彻底丢失2.2 需求规定a仓库管理的具体操作功能(包括):药品代码、药品入库、药品出库、药品移库;b仓库信息的管理:库存信息、入库信息、出库信息、移库信息、库位信息;c一些必要的附加功能操作:生成和查看报表、库存警报。

数据仓库-系统设计说明书

数据仓库-系统设计说明书

数据仓库-系统设计说明书数据仓库-系统设计说明书1、引言1.1 目的本文档旨在详细描述数据仓库系统的设计方案,包括系统的架构、数据模型、数据抽取、转换和加载(ETL)流程、安全性、可用性等方面的内容。

1.2 范围本文档适用于数据仓库系统的设计过程,涵盖了系统的各个方面,以确保系统的正常运行和可扩展性。

2、系统架构2.1 总体架构本节描述数据仓库系统的总体架构,包括各个组件之间的关系和数据流。

2.2 数据仓库层次结构本节详细描述数据仓库系统的层次结构,包括数据仓库、数据集市、数据源等各个层次的定义和关系。

3、数据模型3.1 维度模型本节描述数据仓库系统所采用的维度模型,包括事实表和维度表的定义和关系。

3.2 元数据管理本节描述数据仓库系统中元数据的定义、管理和使用方式,包括元数据的存储、检索和更新机制。

4、数据抽取、转换和加载(ETL)流程4.1 数据抽取本节描述数据仓库系统中数据抽取的方式和流程,包括抽取数据的来源、频率和目标。

4.2 数据转换本节描述数据仓库系统中数据转换的方式和流程,包括数据清洗、数据集成、数据转换和数据加载的过程。

4.3 数据加载本节描述数据仓库系统中数据加载的方式和流程,包括数据加载的频率、目标和验证机制。

5、安全性5.1 用户权限管理本节描述数据仓库系统中用户权限的管理方式和机制,包括用户的注册、认证和授权过程。

5.2 数据访问控制本节描述数据仓库系统中数据访问控制的方式和机制,包括数据的保护、加密和审计功能。

6、可用性6.1 高可用性架构本节描述数据仓库系统中实现高可用性的架构设计,包括负载均衡、冗余备份和自动故障恢复机制。

6.2 容灾备份方案本节描述数据仓库系统中实现容灾备份的方案,包括数据的备份、复制和恢复策略。

7、本文档涉及附件本文档涉及的附件包括数据仓库系统的系统架构图、数据模型图、ETL流程图等相关文档。

8、本文所涉及的法律名词及注释本文所涉及的法律名词及注释包括但不限于《数据保护法》、《网络安全法》等相关法律和条款。

企业数据仓库概要设计说明书ETL概要设计分册

企业数据仓库概要设计说明书ETL概要设计分册

百度文库- 让每个人平等地提升自我XXXX企业数据仓库概要设计说明书ETL概要设计分册(文档编码:OM-BIDW-C008)(版本01.00.000)未经许可,不得以任何形式抄袭XXXX版权所有,翻板必究OM数据仓库XXXX企业数据组2009年3月文档变更历史日期版本作者修改内容评审号变更控制号发布日期2009-04-02 01.00.000 黄浩建立初始版本2009-04-02目录1概述 (4)2设计原则和前提 (5)2.1整体部署 (5)2.2前提条件 (6)2.3设计原则 (6)3整体框架 (7)3.1ETL系统架构图 (7)3.2ETL系统功能模块描述 (7)4数据抽取模块 (9)4.1假设与约定 (9)4.2模块功能图 (9)4.3各子模块功能及处理流程 (11)5数据加载模块 (11)5.1假设与约定 (11)5.2数据加载模块图 (11)5.3数据加载功能模块描述 (12)6作业调度模块 (13)6.1模块概述 (13)6.2假设与约定 (13)6.3作业调度流程 (13)6.4ETL作业种类及调度实现方法 (14)7监控管理模块 (15)7.1监控管理模块图 (15)ETL监控内容 (16)附录1:控制表及控制文件设计 (16)附录2:文件目录及编码说明 (19)1概述ETL是数据仓库系统开发中至关重要的一个过程,它涉及到对源数据的抽取、整合及各种转换,并最终形成面向用户的分析数据。

由于数据仓库系统的数据源来自于多个分散的业务系统,对不同业务系统的数据整合及清洗转换将是一个复杂的过程,ETL过程决定了数据仓库系统获取数据的准确性。

另外由于ETL包括数据抽取、数据清洗、数据转换及数据加载等数据处理过程,这些处理过程分散在不同的系统平台及开发工具上,对这些作业过程的统一调度将是一个重要的问题,作业调度涉及到系统的稳定性。

2 设计原则和前提2.1 整体部署通道服务器1通道服务器...通道服务器N数据抽取网关(通道、产品)服务器数据抽取数据抽取数据组服务器数据加载接口机FTP 服务器该服务器完成两项功能:1、接口文件服务器,所有被接入DW 的数据文件必须通过该服务器中转2、数据备份,来自网关的数据文件将长期保留在该服务器上,作为文件备份数据仓库ETL 整体部署图✧ 网关通道数据库服务器是数据仓库的外围数据库系统,数据仓库中的绝大部分数据都将来自网关通道数据库服务器✧ 基于目前短彩部自身情况的考虑,在数据源服务器和数据仓库服务器之间增加一台FTP 文件服务器,其功能有二:◆ 接口文件服务器,所有被接入DW 的数据文件必须通过该服务器中转 ◆ 数据备份,来自网关的数据文件将长期保留在该服务器上,作为文件备份2.2 前提条件ETL概要设计将基于下面的前提条件✧ETL逻辑:XXXX企业的数据虽然分布在不同的通道,但是各通道数据的共性度非常高,因此ETL中不存在逻辑复杂的转换(Transformation)及数据质量管理等流程,整个ETL只需要实现抽取(Extraction)和加载(Loading)两个功能即可✧ETL工具:自主开发,具体开发语言待定?;✧作业调度工具:自主开发,具体开发语言待定?。

数据库设计说明书(精选五篇)

数据库设计说明书(精选五篇)

数据库设计说明书(精选五篇)第一篇:数据库设计说明书数据库设计说明书引言1.1编写目的说明编写这份数据库设计说明书的目的,指出预期的读者。

1.2背景说明:a.说明待开发的数据库的名称和使用此数据库的软件系统的名称;b.列出该软件系统开发项目的任务提出者、用户以及将安装该软件和这个数据库的计算站(中心)。

1.3定义列出本文件中用到的专门术语的定义、外文首字母组词的原词组。

1.4参考资料列出有关的参考资料:a.本项目的经核准的计划任务书或合同、上级机关批文;b.属于本项目的其他已发表的文件;c.本文件中各处引用到的文件资料,包括所要用到的软件开发标准。

列出这些文件的标题、文件编号、发表日期和出版单位,说明能够取得这些文件的来源。

外部设计2.1标识符和状态联系用途,详细说明用于唯一地标识该数据库的代码、名称或标识符,附加的描述性信息亦要给出。

如果该数据库属于尚在实验中、尚在测试中或是暂时使用的,则要说明这一特点及其有效时间范围。

2.2使用它的程序列出将要使用或访问此数据库的所有应用程序,对于这些应用程序的每一个,给出它的名称和版本号。

2.3约定陈述一个程序员或一个系统分析员为了能使用此数据库而需要了解的建立标号、标识的约定,例如用于标识数据库的不同版本的约定和用于标识库内各个文卷、、记录、数据项的命名约定等。

2.4专门指导向准备从事此数据库的生成、从事此数据库的测试、维护人员提供专门的指导,例如将被送入数据库的数据的格式和标准、送入数据库的操作规程和步骤,用于产生、修改、更新或使用这些数据文卷的操作指导。

如果这些指导的内容篇幅很长,列出可参阅的文件资料的名称和章条。

2.5支持软件简单介绍同此数据库直接有关的支持软件,如数据库管理系统、存储定位程序和用于装入、生成、修改、更新数据库的程序等。

说明这些软件的名称、版本号和主要功能特性,如所用数据模型的类型、允许的数据容量等。

列出这些支持软件的技术文件的标题、编号及来源。

数据库设计说明书【范本模板】

数据库设计说明书【范本模板】

数据库设计说明书1. 引言在使用任何数据库之前,都必须设计好数据库,包括将要存储的数据的类型,数据之间的相互关系以及数据的组织形式。

数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能够有效地存储数据.为了合理地组织和高效率地存取数据,目前最好的方式,就是建立数据库系统,因此在系统的总体设计阶段,数据库的建立与设计是一项十分重要的内容。

由于数据库应用系统的复杂性,为了支持相关程序运行,数据库设计就变得异常复杂,因此最佳设计不可能一蹴而就,而只能是一种“反复探寻,逐步求精”的过程,也就是规划和结构化数据库中的数据对象以及这些数据对象之间关系的过程.1。

1 编写目的数据库设计的好坏是一个关键。

如果把企业的数据比做生命所必需的血液,那么数据库的设计就是应用中最重要的一部分,是一个系统的根基。

用于开发人员进行项目设计,以此作为编码的依据,同时也为后续的数据库维护工作提供了良好的使用说明,也可以作为未来版本升级时的重要参考资料。

数据库设计的目标是建立一个合适的数据模型。

这个数据模型应当是满足用户要求,既能合理地组织用户需要的所有数据,又能支持用户对数据的的所有处理功能。

并且要具有较高的范式,数据完整性好,效益高,便于理解和维护,没有数据冲突.2。

外部设计外部设计是研究和考虑所要建立的数据库的信息环境,对数据库应用领域中各种信息要求和操作要求进行详细地分析,了解应用领域中数据项、数据项之间的关系和所有的数据操作的详细要求,了解哪些因素对响应时间、可用性和可靠性有较大的影响等各方面的因素.2。

1 标识符和状态数据库表前缀: afunms用户名:root密码:root权限:全部有效时间:开发阶段说明:系统正式发布后,可能更改数据库用户/密码,请在统一位置编写数据库连接字符串,在发行前请予以改正。

2.2 使用它的程序本系统主要利用jsp作为前端的应用开发工具,使用MySQL作为后台的数据库,Linux或Windows均可作为系统平台。

企业数据仓库详细设计专项说明书dss详细设计分册

企业数据仓库详细设计专项说明书dss详细设计分册

XXXX公司数据仓库概要设计阐明书DSS具体设计分册(文档编码:OM-BIDW-C008)(版本01.00.000)未经许可,不得以任何形式抄袭xxxx版权所有,翻板必究OM数据仓库短彩技术部数据组3月文档变更历史1概述DSS(Dispatch Supervisor System)调度监控系统贯穿了整个数据仓库,是数据仓库数据解决旳控制中心,是数据仓库中粒度建立旳技术支撑,它控制着数据旳流向,一切与数据解决有关旳进程(存储过程)都将由DSS来调度启动。

与其她业务型系统相比,前者旳绝大部分旳进程都是由系统顾客手工触发(例如点击按钮),系统显式启动相应旳预设进程;而在数据仓库中,特别是数据解决过程中,绝大部分旳进程(存储过程)都是由DSS隐式启动,不需要人工干预。

1.1 DSS功能模块DSS系统重要涉及调度模块和监控模块三大功能模块:调度、监控及顾客权限管理DSS系统模块逻辑图✧调度:调度模块重要是完毕调度数据旳配备及调度旳具体实行◆配备调度数据:录入调度所必须旳配备数据,例如程序名、参数、依赖关系等,该功能模块通过WEB页面录入◆调度实行:调度实行是整个系统旳核心模块。

它根据调度配备数据完毕“生成程序参数”、“判断程序执行条件”以及“执行程序”三个环节旳功能。

✧监控:监控模块重要是负责对系统调度过程及成果旳监控◆平常调度查询:涉及查询“程序旳完毕状况”、“程序依赖数据”、“程序执行旳条件”等信息◆监控例行报警:重要是将调度失败旳限度显示出来,便于及时旳解决失败旳调度。

✧顾客权限管理:由于调度监控系统关系到整个数据仓库旳运作,因此在该模块中必须要加强权限旳管理,一旦调度关系紊乱,整个系统也许会崩溃。

顾客权限重要是控制“调度配备数据”模块中旳权限1.2 系统商定与假设1.2.1调度对象调度旳对象是存储过程。

由于调度实行是由ORACLE作业结合ORACLE存储过程来完毕旳,因此,我们将调度对象统一抽象为存储过程,即任何旳执行动作都必须要封装在存储过程中。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

XXXX企业数据仓库概要设计说明书(文档编码:OM-BIDW-C001)(版本01.00.000)未经许可,不得以任何形式抄袭XXXX企业版权所有,翻板必究XXXX企业数据组2009年3月文档变更历史目录1前言 (3)2术语 (3)3系统环境及功能 (4)4系统数据流 (6)5系统内部功能框架 (7)5.1 数据源层(Data Source) (8)5.1.1 描述 (8)5.1.2 目标 (8)5.2 数据装载层(ETL) (8)5.2.1 描述 (8)5.2.2 目标 (8)5.3 假定与约束 (9)5.4 数据仓库层(ODS、EDS、DM) (9)5.4.1 描述 (9)5.4.2 目标 (9)5.4.3 假定与约束 (10)5.4.4 系统模块(System Build Blocks) (11)5.5 前端展现层(Client Access) (12)5.5.1 描述 (12)5.5.2 目标 (12)5.5.3 假定与约束 (12)5.5.4 需要的技能 (12)5.5.5 待确定问题 (13)5.6 元数据管理(MetaData Management) (13)5.6.1 描述 (13)5.6.2 目标 (13)5.6.3 假定与约束 (14)5.6.4 需要的技能 (14)5.7 调度监控系统(Dispatch Supervisor System) (14)5.7.1 描述 (14)5.7.2 目标 (14)5.7.3 假定与约束 (15)5.7.4 (15)1前言本文档根据上次短彩部和互联网部的会议内容,从整个系统的高度形成公司基于短彩及技术部的数据仓库总体概念框架,对整个系统架构设计所需的功能模块进行明确划分,明确各功能模块的职责范围。

2术语✧OM(OPEN MOBILE):XXXX企业科技有限公司✧DW(Data Warehouse):数据仓库,数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合✧ETL(Extraction-Transformation-Loading):数据抽取、转换和加载✧ODS(Operational Data Store):运营数据存储✧EDS(Enterprise Data Store):企业数据存储✧DM(Data Market):数据集市✧DSS(Dispatch Supervisor System):调度监控系统✧MetaData Management:元数据管理3系统环境及功能系统环境及功能如下图所示:✧WAP系统:考虑二期接入✧应用下载系统:考虑二期接入✧其他外围系统:暂时没有,作为后期扩展而设计OM数据仓库的主要用户角色有:✧高层管理人员;该类用户主要是公司相关领导,通过OM数据仓库作出相应的决策,该类用户往往浏览OM数据仓库的企业KPI指标及相关报表。

✧业务/经理人员;该类用户主要是各部门领导如产品部、商务部、财务部等相关部门领导等,主要使用OM数据仓库查看部门KPI指标,浏览相关报表,进行多维分析等工作;✧业务分析员;这类用户主要是资深的分析人员,通过OM数据仓库浏览报表并进行多维分析等工作✧系统管理人员;该类用户对OM数据仓库进行系统的监控及维护等工作,并为其他用户提供支持;OM数据仓库应提供给用户如下的功能:✧多维分析:多维数据分析是针对特定的分析主题进行多维数据模型的建模,使管理决策人员在多维数据模型的基础上进行快速、稳定和交互性的访问,通过切片、切块、旋转等操作进行各种复杂的分析和预测工作。

✧专题分析:专题分析模块利用各类主流的数理统计方法,通过不同分析工具(或模型)为专业分析人员(Super User)提供灵活、专业分析的工具,解决一些跨越主题的统计分析需求。

本部分列举了一些较为复杂的分析模型,例如:客户流失预警分析、客户消费行为分析、客户发展分析、高额/欺诈分析、大客户异动分析、客户消费模型分析、业务推出对其它业务的影响分析的测算分析等等。

✧指标展示与告警:系统对用户非常关心的关键指标进行多种方式的展示,如展现企业每天经营的整体运营情况,主要包括一些实时性的业务关键指标如每天更新的客户数、活动客户数、总上行量、总下行量、下行成功量、收入、每天新增客户数、流失客户数等指标;对于相关指标可设置告警值,若指标值超出告警上下限则进行告警;✧系统管理功能:为保证OM数据仓库能够稳定和安全的运行,系统应提供充分的系统管理功能,以对整个数据仓库系统的运行进行管理、协调及监控、系统备份和数据备份等等。

4系统数据流按照数据仓库的设计思路及功能,系统的数据流框架如下图所示:数据流框架5系统内部功能框架系统的内部功能模块如下:系统功能模块图从上图可以看到系统包括数据源层(Data Source)、数据装载层(ETL)、数据仓库层(Stage\ODS\EDS\DM)、前端展示层(Client Access)、系统管理层(System Management)、元数据管理层(MetaData Management)及调度监控层(Dispatch Supervisor System)等。

5.1 数据源层(Data Source)5.1.1描述OM数据仓库的数据来自于MS SQL外部数据源,数据平台相对单一。

5.1.2目标由于用户常常需要访问以不同形式存放且处于不同平台上的业务数据及其他外部数据,因此需把这些外部数据经过数据抽取和转换等操作以标准一致且易于理解的方式存储在STAGE中5.2 数据装载层(ETL)5.2.1描述数据在进入数据仓库前,先存储在STAGE存储区,这部分数据是直接将数据源层的数据加载得到的,不做任何的逻辑处理。

数据装载层对业务数据及其他外部源数据经过数据抽取、清洗、转换等操作形成标准一致、清洗后的数据,并存放在数据仓库系统中STAGE数据库中。

5.2.2目标数据装载层定义了数据从数据源系统存储到数据仓库中所进行的数据转换及数据清洗规则。

它负责从源数据系统抽取数据并经各种转换操作后加载数据进入数据仓库系统中。

从数据源系统进行数据抽取、数据转换和数据加载时应该要迅速并尽量减小对数据源系统、网络和数据仓库环境的影响。

5.3 假定与约束✧公司业务系统环境相对简单;✧基于ETL方法公司的数据转换规则相对简单;✧临时空间对于数据获取层来说可以单独开发。

为了简化和优化ETL处理过程,临时空间中存储的数据可以是持续存储的;数据处理过程中的统计信息可以存放在临时空间中,但临时空间的数据对于前端用户来说应该是不可见的,临时空间的数据既可以是关系型的也可以以文件的形式存在。

✧目前的假设是数据获取层和数据处理层的临时空间可以共享,它们在物理上并不分开;5.4 数据仓库层(ODS、EDS、DM)5.4.1描述数据仓库层是整个数据仓库系统的核心,进入数据仓库的所有数据都是在STAGE存储区经过一定的业务逻辑进行处理过的数据。

ODS-EDS-DM的设计模式,体现了数据仓库设计的两个基本点:粒度和维度。

从ODS-EDS-DM,数据的粒度依次递增,也就是ODS存储的是接近于原始数据源的明细数据,到DM模式,数据已经是经过深度汇总的;另一方面,ODS存储的是运营数据,基本上体现不了主题,而当数据经过深度汇总到DM模式,每个模式基本上就是一个主题,而主题的两个基本内容就是维度和计算值,因此在DM是根据一定维度进行深度汇总得到的面向主题的数据,也是直接面向业务部门不同用户的数据。

5.4.2目标将数据粒度化,通过具体的业务模型进行规范,使得数据在模型上规范化。

✧数据预处理:充分利用数据仓库中数据静态化的特点,将数据预处理,生成不同粒度的处理数据;✧数据复用:数据仓库最核心的元素是数据,数据的复用度是数据仓库设计优劣的一个标准。

数据的复用可以减少重复调度带来的系统负荷及数据不一致性问题;✧数据结构优化:通过适度的粒度和维度设计,可以达到结构优化的目的。

即将不同主题和粒度的数据存放在不同的物理表中。

5.4.3假定与约束✧临时空间对于数据提升层来说可以单独开发。

为了简化和优化ETL处理过程临时空间中存储的数据可以是持续存储的;数据处理过程中的统计信息可以存放在临时空间中,但临时空间的数据对于前端用户来说应该是不可见的,临时空间的数据既可以是关系型的也可以以文件的形式存在。

✧目前的假设是数据获取层和数据传送层的临时空间在物理上不分开并且可共享;5.4.4系统模块(System Build Blocks)数据仓库层可以进一步分解如下:STAGE模式,该模式的数据是直接从外部数据源中(文本文件)导入,不做任何的处理。

次,即数据按照粗细分成4种粒度,STAGE模式的粒度最大,对应的数据的细节也是最细的;而粒度最小的DM模式的数据的细节是最粗的。

而从最大粒度的STAGE到最小粒度的DM模式,都需要业务驱动,既数据每个粒度的处理都是根据业务来进行5.5 前端展现层(Client Access)5.5.1描述用户与数据仓库的所有的交互需要在在前端展现层实现。

在前端展现层需要实现应用信息的读取,一是元数据管理。

应用信息读取模块提供工具让用户可以快速方便的得到他们想需要的信息。

这个模块可以让用户通过读取数据仓库中不同层的数据存储来查阅报表进行分析,如同自己拥有一个信息系统。

5.5.2目标该层的主要目标是让用户从纷繁的存储数据中得到所需要有用的业务信息。

还为了提供工具给用户,以便用户可以自由灵活的选择自己的需要。

这些工具以及在Data Mart中准备好的数据可以有效的帮助用户作决策。

5.5.3假定与约束前端工具获取数据的途径会选择最优。

虽然这样可能会增加整合的工作,但要是工具能最大程度上适应商务上的应用,这个是值得的。

有大量需要查看静态报表和做简单查询的用户,有小部分需要动用大规模资源做分析。

5.5.4需要的技能商务方面的认识,信息分析方面的知识,关于前端工具代码的编程,数据仓库的管理,数据仓库的结构以及Internet的安全知识。

5.5.5待确定问题WEB页面的展示方式5.6 元数据管理(MetaData Management)5.6.1描述元数据是描述数据仓库中数据的数据,元数据描述数据仓库环境中中的数据,例如数据源接口的格式、数据仓库中的表结构、ETL的各种转换任务、装载任务等,都是元数据。

元数据管理就是需要将所有元数据集中统一管理,形成元数据库。

在OM数据仓库环境中有三类元数据:✧系统构建元数据。

该部分元数据是在构建数据仓库应用(例如数据转换)和进行数据库设计、构建时产生的元数据,该部分元数据占了数据仓库环境元数据的绝大部分。

相关文档
最新文档