数据标准化体系的建立

合集下载

数据标准化 体系化

数据标准化 体系化

数据标准化体系化数据标准化体系化数据是当今社会的重要资源,数据的质量、效率、安全、合规等问题已经成为全球领先企业和政府机构亟需解决的问题。

为了实现企业数据的高效利用,需要建立一套数据标准化体系,以便提高数据的可重复性、互操作性和可管理性。

本文将介绍数据标准化的概念、意义以及建立数据标准化体系的步骤和方法。

概念解释数据标准化是指在数据的收集、存储、传输等过程中,按照一定的规范进行处理,使数据具有良好的可重复性、互操作性和可管理性。

数据标准化主要包括数据类型的规范、数据命名规范、数据格式规范、数据字典规范等。

数据类型规范数据类型规范是指为数据定义一套标准的数据类型,例如整型、浮点型等,以保证在数据传输和处理过程中数据类型能够保持一致。

一致的数据类型可以大大提高数据的可重复性和互操作性,减少数据处理中的错误。

数据命名规范数据命名规范是指为数据定义一套标准的命名方式,例如使用具有描述性的名称和规范的名称缩写等。

命名规范可以帮助数据管理员和使用者更容易地识别和理解数据,减少因为名称混乱而引起的错误。

数据格式规范数据格式规范是指为数据定义一套标准的格式,例如日期格式、数字格式等。

数据格式规范可以帮助保证数据在传输和处理过程中的一致性,降低因为格式不一致而引起的错误。

数据字典规范数据字典规范是指为数据定义一套标准的数据词汇和数据描述,包括数据元素名称、数据元素类型、数据元素长度、合法值表等。

数据字典规范可以帮助用户更容易地理解和使用数据,并提供了有效的数据管理工具。

建立数据标准化体系的步骤和方法建立一个有效的数据标准化体系可以提高数据管理的效率,降低管理成本,提高数据的质量和可靠性。

下面将介绍建立数据标准化体系的步骤和方法。

1.明确数据标准化的目的明确数据标准化的目的是关键,这需要明确数据标准化的实际应用场景以及什么需要标准化。

一个金融机构想要建立一个有效的数据标准化体系,可能需要规定数据的格式、数据属性、数据元数据等,以保证数据能够在多个系统中无缝传输。

大数据标准体系建设方法论-概述说明以及解释

大数据标准体系建设方法论-概述说明以及解释

大数据标准体系建设方法论-概述说明以及解释1.引言1.1 概述随着互联网、物联网、移动互联等技术的快速发展,大数据已经成为当前社会经济发展的重要驱动力。

大数据的应用已经渗透到各个行业领域,为企业提供了更多的商业机会和发展空间,然而,大数据的应用也面临着标准化和规范化的挑战。

建立完善的大数据标准体系对于推动大数据应用的发展具有重要意义。

大数据标准化可以帮助企业降低数据管理成本、提高数据安全性、促进数据共享与交换,同时也有助于促进行业内的技术交流与合作。

因此,建设大数据标准体系已经成为当前大数据发展的必然趋势。

本文将从大数据标准的重要性、基本原则以及构建方法等方面进行详细探讨,旨在为大数据标准化工作提供一定的参考和指导。

1.2 文章结构本文将分为三个主要部分来阐述大数据标准体系建设的方法论。

首先,在引言部分将概述大数据标准体系建设的背景和意义,介绍文章的结构和目的。

其次,正文部分将分为三个小节,首先探讨大数据标准的重要性,其次介绍大数据标准的基本原则,最后详细阐述大数据标准体系的构建方法。

最后,在结论部分将对全文内容进行总结,展望未来大数据标准体系建设的发展方向,并提出一些结束语。

通过这样的结构安排,希望能够全面而系统地呈现大数据标准体系建设的方法论,为相关研究和实践提供有益的指导。

1.3 目的本文旨在探讨大数据标准体系建设的方法论,旨在帮助企业和组织在大数据时代更好地规范数据管理、提高数据质量、提升数据分析能力。

通过对大数据标准的重要性、基本原则以及构建方法进行深入分析和探讨,旨在为相关领域的决策者、数据管理者和技术人员提供一套系统性的指导和思路。

希望通过本文的分享,可以促进大数据标准体系的完善和落地实施,推动大数据在各行各业的应用和发展,为社会和经济的发展做出贡献。

2.正文2.1 大数据标准的重要性在当今信息爆炸的时代,大数据已经成为企业决策和发展的重要驱动力。

然而,随着数据量的不断增长和数据来源的多样化,管理和利用大数据也面临着巨大的挑战。

数据标准化体系的建立

数据标准化体系的建立

数据标准化体系的建立企业信息资源管理(IRM)基础标准是指决定企业信息系统质量的、因而也是企业信息资源开发利用的最基础的标准,包括数据元素标准、信息分类编码标准、用户视图标准、概念数据库标准和逻辑数据库标准。

1.1 数据元素标准数据元素(Data Elements)是最小的、不可再分的信息单元,其标准化具有化学元素在化学世界中的重要意义。

本项目要建立的数据元素标准,除了遵循国家与行业标准外,还要从本企业信息化的需要做补充,并且用工具软件来支持其建立和管理应用。

数据元素命名规范:采用词组结构“修饰词-基本词-类别词”命名数据元素。

例.“社会保险编号”(SOCIAL-SECURITY-NUMBER)是一个数据元素,其结构是:类别词基本词修饰词类别词(Class Word)是数据元素命名中的一个最重要的名词,用来识别和描述数据元素的一般用途或功能,一般不具有行业特征,条目比较少。

常用的类别词有:数量(AMOUNT)名称(NAME)编号(NUMBER)代码(CODE)系数(CONSTANT)百分比(PERCENT)计数(COUNT)正文(TEXT)日期(DATE)时间(TIME)…………….基本词(Prime Word)是类别词的最重要的修饰词,它对一大类数据对象进一步分类(反映小类数据对象),一般具有行业特征,条目比较多。

例如,制造业常用的基本词有:会计(ACCOUNTING)预算(BUDGET)雇客(CUSTOMER)分配(DISTRIBUTION)员工(EMPLOYEE)工程(ENGINEERING)设备(FACILITY)库存(INVENTORY)制造(MANUFACTURING)市场(MARKET)税金(TAX)订单(ORDERS)付款(PAYMENTS)计划(PLANNING)采购(PROCUREMENT)产品(PRODUCT)研究(RESEARCH)销售(SALES)供应商(SUPPLIER)…………………..数据元素标识规范:采用英文缩略语标识数据元素。

国家能源集团数据标准体系方案

国家能源集团数据标准体系方案

国家能源集团数据标准体系方案一、数据标准体系构建背景与意义随着信息技术的快速发展,数据已经成为企业决策的重要依据。

国家能源集团作为国内能源行业的领军企业,数据的规范化和标准化对于提升企业核心竞争力、保障信息安全、促进业务协同等方面具有重要意义。

因此,构建一套完善的数据标准体系,是国家能源集团的迫切需求。

二、数据标准化原则与方法1. 标准化原则统一性:数据标准应统一制定,避免出现多个标准不一致的情况。

适用性:数据标准应符合企业实际业务需求,具有可操作性。

扩展性:数据标准应具有一定的前瞻性,能够适应未来业务发展的需要。

2. 标准化方法采用国际、国内通用的数据标准,结合企业实际情况制定具体的数据标准。

通过数据元定义、数据分类与编码、数据交换格式等手段,规范数据的表达方式和交换方式。

三、数据元定义与规范1. 数据元定义数据元是数据的最小单元,包括数据名称、数据类型、数据长度等属性。

2. 数据规范对于每个数据元,应明确其含义、取值范围、精度等信息,以确保数据的准确性和一致性。

四、数据集成和接口一致性要求1. 数据集成方式采用ETL(Extract, Transform, Load)等方式实现数据的抽取、转换和加载。

2. 接口一致性要求制定统一的接口规范,确保不同系统之间的数据交换具有一致性。

五、数据的时效性管理机制和持久化策略1. 时效性管理机制制定数据的生命周期管理规则,对于不同类型的数据设定不同的存储期限。

2. 持久化策略采用关系型数据库或非关系型数据库等手段,实现数据的持久化存储。

六、分布式系统中数据备份与恢复方案1. 数据备份方案采用全量备份和增量备份相结合的方式,确保数据的完整性和可靠性。

2. 数据恢复方案根据备份情况,制定相应的恢复策略,确保在出现故障时能够快速恢复数据。

数据治理-数据标准建设方案

数据治理-数据标准建设方案

数据治理数据标准建设方案XXX科技有限公司20XX年XX月XX日目录一数据标准建设方法论 (3)1.1 标准分类 (4)1.2 现状调研 (4)1.3 标准设计 (5)1.4 标准映射 (6)1.5 标准执行 (7)1.6 维护增强 (8)二数据标准分类 (8)三数据标准现状调研 (9)四基础数据标准设计 (11)4.1 数据标准设计方法 (11)4.2 数据标准设计原则 (12)4.3 客户主题数据标准设计 (13)4.4 产品主题数据标准设计 (14)4.5 合约主题数据标准设计 (17)4.6 事件主题数据标准设计 (18)4.7 渠道主题数据标准设计 (19)4.8 专有类数据标准设计 (20)五分析类数据标准设计 (22)5.1 指标标准设计原则 (23)5.1.1 指标准入原则 (23)5.1.2 指标粒度原则 (24)5.2 指标分类框架 (24)5.3 指标标准设计 (25)5.3.1 指标命名规则 (25)5.3.2 指标定义 (26)5.3.3 指标信息项 (26)六数据标准映射 (27)七数据标准执行 (28)八数据标准维护与增强 (29)一数据标准建设方法论通常来说,IT系统由硬件、软件、数据和通讯等四个部分构成。

数据是指信息的可再解释的形式化表示,具有业务和技术两种属性。

业务属性包括数据的业务定义、分类和规则等,技术属性包括数据的类型、格式、形态等。

数据标准就是描述和阐释数据业务属性和技术属性的规范文档。

IT系统应根据数据标准的规定,采集数据,生产数据,存储数据,交换和共享数据。

数据标准中定义的数据范围,广义地说,应包括IT系统中的全部数据。

但从标准建设的经济性和实用性出发,一般主要包括IT系统中需要与其他系统(包括人机间)进行交换和共享的部分,即该部分数据是否存在业务应用的需求和数据交换的需求。

基于上述认识,我们认为数据标准建设总的原则如下图所示,是由业务部门的业务需求和IT系统的数据交换需求共同驱动的。

国家能源集团数据标准体系方案

国家能源集团数据标准体系方案

国家能源集团数据标准体系方案全文共四篇示例,供读者参考第一篇示例:国家能源集团数据标准体系方案随着中国能源行业的快速发展,国家能源集团在不断壮大壮大的也面临着巨大的数据管理与利用压力。

为了更好地提高数据的管理效率和数据的利用价值,国家能源集团急需建立完善的数据标准体系方案。

本文将围绕国家能源集团数据标准体系方案展开讨论,探讨其重要性、构建要点及实施步骤等方面。

一、数据标准体系的重要性数据是企业发展的重要资产,而数据标准体系则是保障数据质量和提高数据利用效率的基础。

建立数据标准体系可以实现以下几个方面的重要性:1. 统一标准:建立数据标准体系可以实现数据的统一标准化管理,避免数据冗余和数据混乱现象的发生,确保数据的一致性和准确性。

2. 数据质量保障:通过建立数据标准体系,可以规范数据的采集、存储、处理和分析流程,提高数据的质量和可靠性,减少数据错误的发生。

3. 提升数据利用效率:建立数据标准体系可以使数据更易于被发现、共享和利用,提高数据的利用效率和价值,为企业决策提供可靠的数据支持。

4. 安全保密:建立数据标准体系可以规范数据的权限管理和数据访问控制,保护数据的安全性和隐私性,避免数据泄露和数据滥用的风险。

建立数据标准体系对于国家能源集团来说具有重要的意义,可以提高数据管理的效率和水平,推动企业数据化转型升级。

为了构建完善的数据标准体系,国家能源集团可以从以下几个要点入手:1. 制定数据管理政策:制定明确的数据管理政策是建立数据标准体系的第一步。

政策要明确数据的采集、存储、处理和共享规范,规定数据管理的责任和权限,确保数据管理工作有序进行。

2. 设计数据架构:设计合理的数据架构是建立数据标准体系的关键。

数据架构要考虑数据的层次结构、数据的关系和数据的流程,确保数据可以按照一定的规范和标准进行管理。

3. 制定数据标准:制定统一的数据标准是建立数据标准体系的核心。

数据标准包括数据命名规范、数据格式规范、数据元素规范等内容,要求所有数据都符合标准进行管理。

数据标准建立 方案

数据标准建立 方案

数据标准建立方案一、背景随着信息化和数字化的加速发展,数据已经成为企业运作和发展中不可或缺的关键资产。

由于数据来源和格式的多样性,企业内部存在着数据标准化不够统一的现象,导致了数据管理和应用的效率低下,信息交换和共享存在风险和障碍。

建立数据标准已经成为企业在数字化转型过程中的关键任务之一。

二、数据标准建立的意义和目标1. 提高数据质量:通过建立统一的数据标准,积极清洗和整理数据,提高数据的准确性、完整性和一致性,从而保证数据的质量。

2. 降低成本:统一的数据标准可以降低数据管理和维护成本,避免重复建设和重复投入,提高资源的有效利用,降低运营成本。

3. 提升效率:建立数据标准后,能够加快数据的交换和共享,提高企业内外部信息的处理效率和实时性。

4. 支撑决策:标准化的数据能够为企业管理层提供更准确、及时、可信的数据支撑,为决策提供科学依据。

5. 促进合作:数据标准的建立有利于不同部门间的信息共享和协作,促进企业内各项业务的高效协同。

三、数据标准建立方案1. 定义数据标准的范围和目标:数据标准的范围应该包括数据定义、命名规范、数据格式、数据分类、数据采集、存储、传输等方面,确保对企业内外数据进行规范管理和使用。

目标包括提高数据质量和准确性、降低管理成本、提高信息处理效率等。

2. 分析现状,制定数据标准化策略:针对企业现有的数据来源、格式、使用等情况进行深入分析,结合业务需求,制定符合实际情况的数据标准化策略和规划。

建立数据审核和监控机制,确保数据标准得到有效的执行和持续改进。

3. 制定数据标准化流程和规范:设计并落实数据标准化的流程和规范,包括数据定义、命名规范、数据格式标准、数据采集和录入规范等,建立数据管理的全流程和闭环。

4. 推行数据标准化方案:在企业内部开展数据标准化方案的宣传和培训工作,提高员工对数据标准化的认知和重视程度。

建立数据标准化的考核机制,对标准化执行情况进行监测和评估。

5. 应用数据标准化的技术工具:结合现有技术手段,利用数据治理平台、数据质量管理工具等技术手段,加强对数据标准的监控和管理,提高数据治理的效率和质量。

企业数据标准化

企业数据标准化

企业数据标准化的建立是企业信息化的基础工作,提高了数据的共享性,为广东电网公司提供了统一的信息视图、数据规范及符合电力行业标准的编码标准。

建立广东电网公司数据信息资源的统一标准化管理的原则可以包括:• 统一标准的数据定义:减少数据定义的二义性;•统一标准的企业数据模型:该企业数据模型必须是一个全企业范围的定义库,能适跨应用、跨业务地完整表述企业数据的统一的完整数据视图;• 统一标准的存储管理:统一规划使用存储资源,提高存储资源使用效率;• 统一标准的性能管理:根据实际业务需求,合理分配资源,确保对数据的访问性能能够满足业务的需要;• 统一标准的数据质量管理:数据管理需要通过应用标准方法论和原则,实现对有价值的商业信息和数据进行完整的生命周期的管理,从而支持广东电网公司的业务。

• 其它管理:提供对数据的其他统一标准化管理,包括统一编码标准;企业级数据标准的制定是一个系统工程,涉及到多方面的原因,成功的因素主要包括如下几点:• 高层领导参预:为了实施跨部门、跨功能的企业数据标准,驱动企业高层领导的支持是势在必行的;• 清晰的范围界定:大规模的企业数据标准化工作往往因为人为因素和组织冲突而宣告失败。

而范围界定清晰的、分步走的、具有可测量结果的企业数据标准化实现方案能在短期内提供业务价值;• 企业数据模型设计的稳定性:稳定性并不意味着企业数据模型的一成不变;相反,大多数的变化应该不需要任何人去重写应用系统;• 数据小组的能力:跨业务的数据整合体现了企业数据模型的主要价值,需要有小规模的、训练良好的、灵便的建模小组和事务专家。

一个完整的企业级数据标准化建设体系包括企业数据标准化策略,数据标准,数据标准化工作流程,组织架构,数据管理。

数据模型是数据标准的主要实体,涵盖了数据字典、逻辑数据模型、元数据标准。

数据规范通常包括了数据建模规范、数据编码规范、数据集成规范。

通过对广东电网公司现行的数据标准化建设的现状了解和评估,结合中国电力行业标准化的策略和毕博在国内外电网公司数据规划的经验,制定符合广东电网公司实际情况的企业级数据标准化的策略。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据标准化体系的建立企业信息资源管理(IRM )基础标准是指决定企业信息系统质量的、因而也是企业信息资源开发利用的最基础的标准,包括数据元素标准、信息分类编码标准、用户视图标准、概念数据库标准和逻辑数据库标准。

1.1数据元素标准数据元素(Data Elements )是最小的、不可再分的信息单元,其标准化具有化学元素在化学世界中的重要意义。

本项目要建立的数据元素标准,除了遵循国家与行业标准外,还要从本企业信息化的需要做补充,并且用工具软件来支持其建立和管理应用。

数据元素命名规范:采用词组结构“修饰词-基本词-类别词” 命名数据元素。

例.“社会保险编号” (SOCIAL -SECURITY -NUMBER )是一个数据元素,其结构是:社会保险编号类别词基本词修饰词类别词(Class Word )是数据元素命名中的一个最重要的名词,用来识别和描述数据元素的一般用途或功能,一般不具有行业特征,条目比较少。

常用的类别词有:数量(AMOUNT )名称(NAME )编号(NUMBER )代码(CODE )系数(CONSTANT )百分比(PERCENT )计数(COUNT )正文(TEXT)日期(DATE )时间(TIME )基本词( Prime Word )是类别词的最重要的修饰词, 它对一大类数据对象进一步分类 反映小类数据对象) ,一般具有行业特征,条目比较多。

例如,制造业常用的基本词有: 会计( ACCOUNTING )预算( BUDGET ) 雇客( CUSTOMER ) 分配( DISTRIBUTION ) 员工( EMPLOYEE ) 工程( ENGINEERING ) 设备( FACILITY ) 库存( INVENTORY )制造( MANUFACTURING ) 市场( MARKET ) 税金( TAX ) 订单( ORDERS ) 付款( PAYMENTS ) 计划( PLANNING ) 采购( PROCUREMENT ) 产品( PRODUCT )研究( RESEARCH ) 销售( SALES ) 供应商( SUPPLIER )数据元素标识规范 :采用英文缩略语标识数据元素。

例 .社会保险号码可标识为:SCL_SCR_NO 。

利用数据元素的命名规范和标识规范,识别定义出企业的所有数据元素,并执行一致定 控制,消除“同名异义”和“同义异名”的对象,就构成了一个企业的数据元素标准。

1.2 信息分类编码标准信息分类编码( Information Classifying and Coding展成了一门学科,有自身的研究对象、研究内容和研究方法。

码是提高劳动生产率和科学管理水平的重要方法。

美国新兴管理学的开创者莫里斯 L ·库克 (Morris L · Cooker )说:“只有当我们学会了分类和编码,做好简化和标准化工作,才会 出现任何真正的科学的管理” 。

在信息化时代,信息的标准化工作越来越重要,没有标准化 就没有信息化,信息分类编码标准是信息标准中的最基础的标准。

信息分类编码简称 “代码”, 本项目要实现代码唯一化,即“一人一码” ,“一物一码” ,“一机构一码” ,“一事件一码” ,)是标准化的一个领域,已发在工业社会中,信息分类和编信息分类就是根据信息内容的属性或特征,将信息按一定的原则和方法进行区分和归类,并建立起一定的分类系统和排列顺序,以便管理和使用信息。

信息编码就是在信息分类的基础上,将信息对象(编码对象)赋于有一定规律性的、易于计算机和人识别与处理的符号。

具有分类编码意义的数据元素是最重要的一类数据元素。

应遵照《GB/T 20529.1-2006 企业信息分类编码导则第1部分:原则与方法》和有关于信息分类编码的标准规定,按照“国际/ 国家标准—行业标准—企业标准”的序列原则,引用或建立的信息分类编码标准。

编码对象的分类要求按照信息资源规划的方法,将信息分类编码对象划分为 A 、B、C三种类型,建立企业信息分类编码标准,是适合企业信息化建设需要的。

A 类编码对象:在信息系统中不单设编码库表,代码表寓于主题数据库表之中的信息分类编码对象,称之为A类编码对象。

这类编码对象具有一定的分类方法和编码规则,其码表内容一般随信息的增加而逐步扩充,很难一次完成。

虽然不单设编码库表,但其码表可以从数据库表中抽取出来作为一个虚表(是数据库表的一个投影)在信息系统中使用。

这类编码对象一般在具体的应用系统中有较多的使用。

如身份证号码(国家标准),客户编码、职工编码、设备编码(企业标准)等,都是A 类编码。

B 类编码对象:在信息系统中单独设立编码库表信息分类编码对我们称之为B类编码象,对象。

这类码表内容具有相对的稳定性,可以组织力量一次编制出来。

这类编码表一般都较大,像一些数据库表一样,在应用系统中往往被多个模块所共享,作为一些单独的库表管理是方便的。

如国家行政区划编码、职称编码(国家标准)、生产统计项目编码(行业标准)、设备配件编码(企业标准)等等,都是B类编码。

C类编码对象:在应用系统中有一些码表短小而使用频度很大的编码对象,如人的性别代码、文化程度代码和婚姻状况代码等等,如果都设立编码库表,不仅系统运行时资源开销大(或内外存交换编码信息频繁),还给系统管理带来一系列的问题,把这类对象统一设一个编码库来管理就可以了。

按上述规则识别、定义、列出企业所有各类编码对象,对每一编码对象制定编码规则,并按编码规则编制列出“代码- 名称”一览表,即为企业的信息分类编码标准。

1.3用户视图标准用户视图(User View )是一些数据元素的集合,它反映了最终用户对数据实体的看法。

用户视图是数据在系统外部(而不是内部)的样子,是系统的输入或输出的媒介或手段,数据流就是用户视图的流动。

常见的用户视图有:输入的表单;打印的报表;更新的屏幕数据格式;查询的屏幕数据格式。

企业要建立网络化的信息系统,就要取消大量的报表信息传递,为此,需要分析用户视图,建立用户视图标准。

用户视图登记:用户视图登记应包括用户视图名称、用户视图分类编码、用户视图记录数和生存期等。

a )用户视图名称:用一短语表示用户视图的意义和用途。

b )用户视图分类编码规则:DXX X X XX X其中:——大类按用户视图流向分类,编码取值: 1 =输入,2=存储,3 =输出;——小类按用户视图类型分类,编码取值: 1 =单证,2=账册,3 =报表,4=其它;——序号是指同一大类、小类中的用户视图的顺序,编码取值:01 ~99 ;——族码是指同一用户视图拆分出的部分子视图编码,取值: A ~Z 。

用户视图组成:用户视图应由数据项/ 数据元素及其结构关系组成。

复杂的用户视图应做规范化分析,如复杂报表应拆分,描述每一部分的组成。

1.4概念数据库标准概念数据库(Conceptual Database)是最终用户对数据存储的看法,是对用户信息需求的综合概括。

简单说,概念数据就是主题数据库的概要信息。

概念数据库一般用数据库名称及其内容的描述来表达:概念数据库标识,概念数据库名称(信息内容描述)其中:概念数据库标识:用字符串(英文缩略语)表达;概念数据库名称:通常的汉语名词;信息内容描述:用自然语言(中文)或数据项/ 属性列表描述。

例:“机构”和“员工”概念数据库:ORGN 机构(机构代码,机构名称,机构基本信息)EMPL 员工(员工代码,姓名,自然信息,简历,培训记录,⋯)1.5逻辑数据库标准逻辑数据库(Logical Database)是系统分析设计人员的观点,是对概念数据库的进一步分解和细化,一个逻辑主题数据库由一组规范化的基本表(Base Table)构成。

基本表是按规范化的理论与方法建立起来的数据结构,一般要达到三范式(3-NF )。

逻辑数据库用下述格式表示:i = 1 ,2,⋯n )其中:逻辑数据库标识和逻辑数据库名称:即一级基本表的标识和名称,采用概念数据库的标识和名称;基本表i标识和基本表i名称:即二级基本表的标识和名称,一个逻辑数据库可包括多个二级基本表(i=1,2, ,⋯二级,n 基)本表的标识主部与一级基本表标识相同,后缀可用字符串(汉语拼音或英文)表达;二级基本表名称,继承一级基本表名称再增加注明的缩略语;属性表:每一属性由数据元素标识和数据元素名称表示,属性间用逗号分开;主键:用相应属性标识表示,多个属性标识用加号连接。

例.“机构”和“员工”逻辑数据库的简化E-R图表达法:主键:机构代码ORGN 机构基本信息机构代码,机构名称,成立日期,人员总数,主键:机构代码+职务代码ORGN_LD 领导班子机构代码,职务代码,任命日期,员工代码,主键:机构代码+员工代码ORGN_MM 机构成员机构代码,员工代码EMPL 员工基本信息主键:员工代码员工代码,员工姓名,出生日期,学历代码,EMPL RS 员工简历主键:员工代码+起始日期员工代码,起始日期,结束日期,所在单位,EMPL TR 培训记录主键:员工代码+起始日期员⋯工⋯代码,起始日期,结束日期,培训地点,培训课程,图5.1 简化E-R图表达法1.6 信息资源管理基础标准的建设信息资源管理基础标准的建设,可以在信息资源规划过程中进行,并在相关的应用系统建设之前(或前期)完成。

具体说,在对用户视图做调研和规范化分析时,从用户视图的组成中,就可以提取数据元素和识别信息分类编码对象,这实际上就开始了用户视图、数据元素和信息分类编码的标准化工作;而按业务主题对用户视图分组,识别定义概念主题数据库,进而细分概念主题数据库为一组基本表,这实际上就开始了概念数据库和逻辑数据库的标准化工作。

这就是说,不需要脱离信息资源规划工作,另组织一些人去专搞数据标准化工作;参与信息资源规划、 开始做起数据标准化工作的人员, 在应用开发之前、 或前期继续做好数据标准化工作, 为数据管理员一直支持应用开发和维护工作,将是最有效的数据标准化建设队伍的组建思 路。

图 5.2 为信息资源管理基础标准框架, 其中的数字只是一般企业的预研估计值, 值将在信息资源规划实施过程中给出。

图 5.2 信息资源管理基础标准示例该套数据标准化体系,需要分三个阶段逐步建设: 第一阶段:信息资源规划需求分析时,重点识别数据元、信息分类编码对象和用户视图 规范化;第二阶段:信息资源规划系统建模时,重点完成概念数据库和逻辑数据库标准; 第三阶段:信息工程实施方案研发时,重点完成五部分标准规范的关联性分析和整体优化,并在后续数据库和应用软件工程实施过程中进一步调整优化完善。

1.7 非结构化数据的存储与处理标准随着信息化手段的日益丰富,支撑应用的数据形式也越来越多样化,不仅有传统的结构 化数据,还出现了大量非结构化数据、半机构化的数据。

相关文档
最新文档