数据质量管理
数据质量管理

数据质量管理数据质量管理是指对企业数据进行规范、完整、准确、及时的管理和监控,以保证数据的可靠性、可用性和一致性。
良好的数据质量管理能够提高企业的决策能力、运营效率和客户满意度。
数据质量管理的标准格式文本包括以下几个方面:一、数据质量管理的重要性数据质量管理在现代企业中具有重要的意义。
首先,数据质量管理能够提高数据的准确性和可靠性,减少因数据错误而导致的决策失误和业务风险。
其次,数据质量管理能够提高数据的一致性和完整性,确保不同部门和系统之间的数据能够互通互用,避免数据冗余和数据不一致的问题。
最后,数据质量管理能够提高数据的及时性和可用性,使企业能够及时获取最新的数据,支持业务决策和运营管理。
二、数据质量管理的原则数据质量管理的实施需要遵循一定的原则。
首先,数据质量管理应该以业务需求为导向,根据企业的业务目标和需求确定数据质量管理的目标和指标。
其次,数据质量管理应该注重数据的完整性和一致性,确保数据的完整性和一致性是数据质量管理的核心任务。
再次,数据质量管理应该注重数据的准确性和可靠性,通过建立数据质量评估和监控机制,及时发现和纠正数据错误和数据异常。
最后,数据质量管理应该注重数据的及时性和可用性,确保数据能够及时提供给相关部门和系统使用。
三、数据质量管理的流程数据质量管理的实施需要按照一定的流程进行。
首先,需要进行数据质量评估,通过对数据的抽样和检测,评估数据的质量状况,确定数据质量管理的重点和难点。
其次,需要建立数据质量管理的指标体系,包括数据的完整性、一致性、准确性和可靠性等指标,为数据质量管理提供明确的目标和标准。
再次,需要建立数据质量管理的责任体系,明确数据质量管理的责任人和责任部门,确保数据质量管理的落地实施。
最后,需要建立数据质量监控和改进机制,通过数据质量监控的手段和方法,及时发现和纠正数据质量问题,持续改进数据质量管理的效果。
四、数据质量管理的关键技术数据质量管理需要借助一些关键技术来支持。
数据质量管理

数据质量管理数据质量管理是指通过一系列的措施和方法,保证数据的准确性、完整性、一致性和可靠性,以满足数据使用者的需求。
在数据质量管理中,需要进行数据采集、数据清洗、数据整合、数据验证和数据监控等一系列步骤,以确保数据的高质量。
一、数据采集数据采集是数据质量管理的第一步,它包括数据源的选择、数据采集方式的确定和数据采集工具的使用等。
在数据采集过程中,需要确保数据的来源可靠、数据采集的过程可控,并采用适当的技术手段对数据进行采集,以保证数据的准确性和完整性。
二、数据清洗数据清洗是指对采集到的数据进行筛选、过滤和校验,去除其中的错误和冗余数据,以提高数据的质量。
数据清洗包括数据去重、数据格式转换、数据填充、数据校验和数据修复等步骤。
通过数据清洗,可以排除数据中的噪声和异常值,提高数据的准确性和一致性。
三、数据整合数据整合是将来自不同数据源的数据进行合并和整合,以便于数据的分析和使用。
在数据整合过程中,需要对数据进行匹配、合并和转换,确保数据的一致性和可靠性。
同时,还需要解决数据格式不一致、数据冗余和数据冲突等问题,以确保数据的完整性和正确性。
四、数据验证数据验证是对整合后的数据进行验证和检查,以确保数据的准确性和可靠性。
数据验证包括数据的逻辑验证、数据的统计验证和数据的业务验证等。
通过数据验证,可以发现数据中的错误和异常,及时纠正并提高数据的质量。
五、数据监控数据监控是对数据质量进行实时监控和管理,以及对数据质量指标进行评估和分析。
数据监控可以及时发现数据质量问题,并采取相应的措施进行修复和改进。
通过数据监控,可以提高数据的可用性和稳定性,保证数据的高质量。
六、数据质量评估数据质量评估是对数据质量进行定量和定性评估,以确定数据质量问题的严重程度和改进的优先级。
数据质量评估可以通过数据质量指标和数据质量报告等方式进行,以便于数据质量管理人员进行决策和改进。
通过数据质量评估,可以不断提升数据的质量水平,满足数据使用者的需求。
数据质量管理

数据质量管理标题:数据质量管理引言概述:数据质量管理是指对数据进行监控、维护和改进的过程,旨在确保数据的准确性、完整性、一致性和可靠性。
在当今信息化时代,数据质量管理变得越发重要,对于企业的决策和运营至关重要。
本文将从数据质量管理的定义、重要性、原则、方法和工具等方面进行详细介绍。
一、数据质量管理的定义1.1 数据质量管理是指对数据进行全面管理和控制,以确保数据的准确性和完整性。
1.2 数据质量管理包括数据采集、存储、处理、分析和应用等全过程的管理。
1.3 数据质量管理旨在提高数据的可信度和可用性,为企业决策提供可靠的数据支持。
二、数据质量管理的重要性2.1 数据质量管理可以提高数据的准确性和完整性,降低数据误差和风险。
2.2 数据质量管理可以提升企业的决策效率和决策质量,提高企业竞争力。
2.3 数据质量管理可以增强数据的可信度和可用性,提高数据的应用价值和效益。
三、数据质量管理的原则3.1 确定数据质量管理的目标和标准,建立数据质量管理体系和流程。
3.2 制定数据质量管理的政策和规范,明确责任和权限,强化数据质量管理的执行力度。
3.3 进行数据质量评估和监控,及时发现和解决数据质量问题,持续改进数据质量管理。
四、数据质量管理的方法4.1 数据质量管理的方法包括数据清洗、数据整合、数据验证、数据监控等多种手段。
4.2 数据清洗是指对数据进行清理、去重、标准化等处理,提高数据的准确性和一致性。
4.3 数据整合是指将分散的数据整合为一体,确保数据的完整性和一致性,提高数据的可用性和价值。
五、数据质量管理的工具5.1 数据质量管理的工具包括数据质量管理软件、数据质量分析工具、数据质量监控系统等。
5.2 数据质量管理软件可以匡助企业建立数据质量管理体系,提供数据清洗、整合、验证等功能。
5.3 数据质量分析工具可以匡助企业对数据进行分析和评估,发现数据质量问题并提出改进措施。
结语:数据质量管理是企业信息化建设的重要环节,对于提高企业的决策效率和效果具有重要意义。
数据质量管理

数据质量管理引言概述:数据质量管理是指对数据进行有效、准确、完整、一致和可靠地管理和维护的过程。
在当今信息化时代,数据作为企业最重要的资产之一,其质量直接影响到企业的决策和运营效率。
因此,数据质量管理变得至关重要。
本文将从数据质量管理的概念、重要性、影响因素、管理方法和未来发展等方面进行详细阐述。
一、数据质量管理的概念1.1 数据质量管理的定义数据质量管理是指通过一系列的策略、流程和技术手段,确保数据在采集、存储、处理和分发的过程中保持高质量的管理和控制。
1.2 数据质量管理的目标数据质量管理的最终目标是确保数据的准确性、完整性、一致性、及时性和可靠性,以支持企业的决策和业务运营。
1.3 数据质量管理的重要性数据质量管理对企业的价值和竞争力至关重要,只有确保数据质量,企业才能更好地利用数据进行决策和创新。
二、数据质量管理的影响因素2.1 数据采集数据质量管理的第一步是确保数据的准确采集,包括数据来源的可靠性、数据采集工具的有效性等。
2.2 数据存储数据存储的方式和结构对数据质量有着直接的影响,包括数据的完整性、一致性和可靠性等。
2.3 数据处理数据处理过程中的算法和逻辑也会影响数据的质量,需要确保数据处理的准确性和一致性。
三、数据质量管理的管理方法3.1 数据质量评估通过数据质量评估工具和方法,对数据进行定量和定性的评估,发现数据质量问题并提出改进措施。
3.2 数据质量监控建立数据质量监控机制,定期监测数据的质量指标,及时发现和处理数据质量问题。
3.3 数据质量改进根据数据质量评估和监控结果,制定数据质量改进计划,持续改进数据质量管理的流程和方法。
四、数据质量管理的未来发展4.1 自动化技术随着人工智能和大数据技术的发展,数据质量管理将更多地采用自动化和智能化技术,提高数据质量管理的效率和准确性。
4.2 数据治理数据治理将成为数据质量管理的重要组成部分,通过建立数据治理框架和机制,实现对数据的全面管理和控制。
数据质量管理

数据质量管理数据质量管理是指通过一系列的管理措施和技术手段,保证数据的准确性、完整性、一致性和可靠性,以提高数据的价值和可信度。
在数据质量管理中,需要进行数据的收集、整理、存储、分析和应用等环节的管理,以确保数据在整个生命周期中的质量得到有效的保障。
一、数据质量管理的重要性数据质量管理对于企业的决策和运营具有重要的意义。
良好的数据质量可以提高决策的准确性和效率,降低决策的风险。
同时,数据质量管理还可以提高企业的运营效率和管理水平,增强企业的竞争力。
二、数据质量管理的原则1. 准确性原则:数据应该准确地反映现实情况,不应存在错误或误差。
2. 完整性原则:数据应该包含完整的信息,不应有遗漏或缺失。
3. 一致性原则:数据应该在不同的系统、环境和时间下保持一致。
4. 可靠性原则:数据应该可靠地支持决策和分析,能够被信任和依赖。
5. 可用性原则:数据应该易于访问、获取和使用,不应存在障碍或限制。
6. 及时性原则:数据应该在需要时及时提供,不应存在延迟或滞后。
三、数据质量管理的流程1. 数据需求分析:根据业务需求和决策需求,确定需要收集和管理的数据类型和范围。
2. 数据收集与录入:通过各种途径和方式,收集和录入数据,包括手工录入、自动采集和数据交换等。
3. 数据清洗与整理:对收集到的数据进行清洗和整理,包括去除重复数据、填充缺失数据、修正错误数据等。
4. 数据存储与管理:将清洗和整理后的数据存储到数据库或数据仓库中,并进行合理的管理和维护。
5. 数据分析与挖掘:利用数据分析工具和技术,对存储的数据进行分析和挖掘,发现其中的规律和价值。
6. 数据监控与评估:建立数据质量监控体系,对数据进行实时监控和评估,及时发现和解决数据质量问题。
7. 数据质量改进:根据监控和评估结果,采取相应的措施和方法,改进数据质量,提高数据价值和可信度。
四、数据质量管理的关键技术1. 数据清洗技术:包括数据去重、数据填充、数据纠错等技术,用于清洗和修正数据中的错误和异常。
数据质量管理

数据质量管理引言概述:数据质量管理是指通过一系列的措施和方法,确保数据的准确性、完整性、一致性和可靠性,以提高数据的可信度和有效性。
在当今信息化时代,数据质量管理对于企业和组织的决策和运营至关重要。
本文将从数据质量管理的定义、重要性、影响因素、评估方法和提升措施五个方面进行详细阐述。
一、数据质量管理的定义1.1 数据质量的概念数据质量是指数据在其整个生命周期中是否满足使用者的需求和期望。
它包括数据的准确性、完整性、一致性、及时性、可靠性等方面。
1.2 数据质量管理的目标数据质量管理的目标是确保数据的准确性、完整性、一致性和可靠性,以满足业务需求和决策支持的要求。
它涉及数据的采集、存储、处理、分析和应用等环节。
1.3 数据质量管理的原则数据质量管理应遵循一些基本原则,包括数据质量责任明确、全员参预、持续改进、技术支持、风险管理和合规性等。
二、数据质量管理的重要性2.1 提高决策质量数据质量管理能够提供准确、完整、一致的数据,为决策者提供可信的数据支持,从而提高决策的准确性和效果。
2.2 优化业务流程通过数据质量管理,可以及时发现和纠正数据错误,提高数据的可靠性和及时性,从而优化业务流程,提高工作效率和客户满意度。
2.3 提升企业竞争力数据质量管理可以减少数据错误带来的损失和风险,提高数据的可信度和有效性,从而提升企业的竞争力和市场形象。
三、数据质量管理的影响因素3.1 数据采集与录入数据采集与录入是数据质量的基础,采集过程中的错误、遗漏和重复等问题会直接影响数据质量。
3.2 数据存储与管理数据存储与管理涉及数据的安全性、完整性和一致性等方面,不合理的存储和管理方式会导致数据质量问题。
3.3 数据处理与分析数据处理与分析过程中的算法、模型和方法等会对数据质量产生影响,不合理的处理和分析方法会导致数据质量下降。
四、数据质量管理的评估方法4.1 数据质量指标体系数据质量指标体系包括准确性、完整性、一致性、及时性、可靠性等指标,用于评估数据质量的好坏。
数据质量管理

数据质量管理数据质量管理是指通过一系列的措施和方法来确保数据的准确性、完整性、一致性和可靠性,以及保障数据的安全性和可用性。
数据质量管理是一个持续的过程,涉及到数据的采集、存储、处理和分析等各个环节。
数据质量管理的重要性不言而喻。
在如今信息化的时代,数据已经成为企业决策和运营的重要依据。
如果数据质量不可靠,将会导致企业的决策错误、运营低效甚至是损失。
因此,数据质量管理成为了企业的重要任务之一。
下面是数据质量管理的标准格式文本:一、数据准确性1. 数据来源的准确性:确保数据来源可靠,如通过合法渠道获得的数据、经过验证的数据等。
2. 数据录入的准确性:确保数据在录入过程中没有错误,如通过双重录入、数据校验等方式进行数据准确性的验证。
3. 数据处理的准确性:确保数据在处理过程中没有错误,如通过算法验证、逻辑验证等方式进行数据准确性的验证。
4. 数据输出的准确性:确保数据输出的结果准确无误,如通过与实际情况对照、与其他数据进行比对等方式进行数据准确性的验证。
二、数据完整性1. 数据采集的完整性:确保数据采集的过程中没有遗漏任何重要数据,如通过设定数据采集的范围、设定数据采集的时间等方式进行数据完整性的验证。
2. 数据存储的完整性:确保数据存储的过程中没有遗漏任何重要数据,如通过设定数据存储的规范、设定数据存储的结构等方式进行数据完整性的验证。
3. 数据处理的完整性:确保数据处理的过程中没有遗漏任何重要数据,如通过设定数据处理的流程、设定数据处理的标准等方式进行数据完整性的验证。
4. 数据输出的完整性:确保数据输出的结果完整无误,如通过与实际情况对照、与其他数据进行比对等方式进行数据完整性的验证。
三、数据一致性1. 数据来源的一致性:确保数据来源的一致性,如通过设定数据来源的规范、设定数据来源的标准等方式进行数据一致性的验证。
2. 数据录入的一致性:确保数据在录入过程中的一致性,如通过设定数据录入的规范、设定数据录入的标准等方式进行数据一致性的验证。
数据质量管理(DQC)

数据质量管理(DQC)数据质量管理(DQC)数据质量管理(Data Quality Management,简称DQC)是指通过一系列的策略、工具和方法,确保数据在整个生命周期中的完整性、一致性、准确性和实用性的过程。
随着大数据时代的到来,数据质量管理越来越受到重视。
本文将探讨数据质量管理的概念、重要性以及一些常用的数据质量管理方法。
一、概念数据质量管理是指通过对数据进行规范化、清洗和维护,以确保数据的准确性、可靠性和完整性,从而提高数据的价值和可信度。
数据质量管理不仅仅关注数据的正确性,还注重数据的及时性、一致性和可用性。
通过数据质量管理,我们可以更好地理解数据,提高决策的准确性,降低数据管理的风险。
二、重要性数据质量管理对于组织和企业来说至关重要。
一方面,高质量的数据能够提供可靠的决策依据,帮助组织做出正确的战略决策和商业决策。
另一方面,低质量的数据可能会给企业带来严重的后果,如财务错误、客户不满、市场失真等。
因此,数据质量管理不仅仅是一项技术工作,更是企业运营和管理的基础。
三、数据质量管理方法1. 数据清洗:数据清洗是数据质量管理的基础步骤,通过识别、纠正和删除数据中的错误、重复、不一致等问题,以保证数据的准确性和一致性。
常用的数据清洗方法包括数据审查、去除重复值、纠正错误数据等。
2. 数据验证:数据验证是确保数据符合预定规范和标准的过程。
通过数据验证,可以验证数据的完整性、格式正确性、范围有效性等。
常见的数据验证方法包括数据格式验证、数据逻辑验证和数据范围验证等。
3. 数据监控:数据监控是指实时或定期对数据进行检查和监控,以及对异常数据进行及时处理的过程。
通过数据监控,可以提前发现并解决数据质量问题,保证数据的即时性和可靠性。
常用的数据监控方法包括数据报表生成、数据可视化和异常数据检测等。
4. 数据治理:数据治理是指通过制定规范、管理流程和角色职责,确保数据质量的持续改进和管理。
数据治理包括数据策略制定、数据安全管理、数据质量指标定义等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
√规则十一:本表的字段与其他表中的字段具有不同的业务含义,相同的统计 口径,在业务上有逻辑公式成立,且两张表的数据不是经同一数据源加工得到。 满足此条件时必须进行逻辑性检验。
数据质量检验的顺序
1、数据源-完整性检验 数据源的完整性检验报异常时应停止ETL加载过程,不需要再进行后续的 检验
2、数据源-原则性检验 数据源的原则性检验报异常时应停止ETL加载过程。不需要再进行后续的 检验
3、数据校验-完整性检验 数据校验的完整性检验报异常时应停止ETL加载过程,不需要再进行后续 的检验
数据值检查
逻辑性检验
数据值检查
异常处 理方式 报警 停止ETL 停止ETL
报警
说明
对单字段的数值检查。不符合 原则性检验时该数据一定是错 误的。 对单表或多个表内字段间逻辑 关系的检查
数据源检验方法
时效性检验 判断在约定的时间内,数据源的数据是否按时到达
完整性检验 HDS数据表与代码表的一致性检查 HDS数据表记录数检查
步骤二确定数据源的时效性检验规则
根据表EIIRECV.EIIRECV_TZ_BS_Y_Q_M_SELLDETAIL的数据到达规律, 定义该表每月最晚到达日期为8日。
步骤三 确定数据源的完整性检验规则
根据数据源检验适用规则的规则二、三:
1、EIIRECV.EIIRECV_TZ_BS_Y_Q_M_SELLDETAIL中包含有外键字段 I_Provin ce (省份代码)、 I_Org (机构代码)、C_Brand(规格)。
2、EIIRECV.EIIRECV_TZ_BS_Y_Q_M_BASIC表也包含字段Out_Sell_Retail_Am ount、Out_Sell_Amount、End_Store_Amount
3、这两张表对应字段具有相同业务含义、不同的统计口径,存在以下汇总关系: EIIRECV.EIIRECV_TZ_BS_Y_Q_M_BASIC 表统计商业企业的系统外批发销售量、 系统外零售量、期末商业库存数据。EIIRECV.EIIRECV_TZ_BS_Y_Q_M_SELL DETAIL表统计商业企业分卷烟规格的系统外批发销售量、系统外零售量、期 末商业库存数据。因此EIIRECV.EIIRECV_TZ_BS_Y_Q_M_SELLDETAIL表中某 商业企业分规格的汇总数据应该等于表EIIRECV.EIIRECV_TZ_BS_Y_Q_M_BA SIC中对应的商业企业的数据。
数据的自治性
数据并不是孤立存在的,数据之间往往存在着各种各样的约束,这种约 束描述了数据的关联关系。数据必须能够满足这种数据之间的关联关系,而 不能够相互矛盾。
数据的真实性、完备性、自洽性是数据本身应具有的属性, 称为数据的绝对质量,是保证数据质量的基础。除了数据的 绝对质量外,还有我们在利用和存贮数据的过程中所产生的 数据质量,包括使用质量、存贮质量和传输质量,称之为过 程质量。
I_Province (省份代码)对应代码表DM.T_DM_GJJ_QGSF中的QGSFDM; I_ Org (机构代码)对应代码表DM.T_DM_GJJ_ZZJG中的ZZJGDM; C_Brand (规格)对应代码表T_DM_GJJ_JY中的THTXBS 。
该表符合规则二的检验条件,需要进行代码一致性检查。 2、该表包含有日期型字段Y,M,但记录条数每月不确定,因此不满足规则三,
数据质量不高已经成为困扰此类项目的开发人员与用户的一个严重问题。
数据质量不高的主要原因
数据质量归类
数据质量示例
数据质量管理方法
数据管理
1 数据管理的目标 2 数据管理的难点与重点
3
数据质量控制方法论
4 案例介绍
数据质量控制方法论
1
数据源检验方法
2
数据源检验适用规则
3
数据检验方法
4
数据检验适用规则
3
数据质量控制方法论
4 案例介绍
数据质量管理的难点与重点
1
数据质量概念
2
数据质量的重要性
3
数据质量不高的主要原因
4
数据质量归类
5
数据质量示例
6数据质量管理方法源自数据质量概念数据本身的数据质量
数据的真实性:
数据必须真实准确的反映实际发生的业务。
数据的完备性:
数据的完备性是说数据是充分的,任何有关操作的数据都没有被遗漏。
数据质量概念
数据的过程质量
数据的使用质量:
数据的使用质量是指数据被正确的使用。再正确的数据,如果被错误的 使用,就不可能得出正确的结论。
数据的存贮质量:
指数据被安全的存贮在适当的介质上。所谓安全是指采用了适当的方案 和技术来抵制外来的因素,使数据免受破坏,备份是我们常使用的技术,如 异地备份和双机备份等,所谓存贮在适当的介质上是指当需要数据的时候能 及时方便的取出。
√规则七:单表或多个表内的字段具有不同的业务含义,相同的统计口径, 在业务上有逻辑公式成立。满足此条件时必须进行逻辑性检验。
数据检验方法
数据校验是对DDS数据库中前台应用直接使用的相关表的检验。数据校验分为时 效性检验和正确性检验两个大类,其中正确性检验又分为完整性检验、原则性检验、
模糊性检验、逻辑性检验。
3
数据质量控制方法论
4 案例介绍
数据质量检验的案例
下面以行业对比报表中的全国卷烟市场分类销量情况表(分价类)为 例来介绍如何根据数据质量管理方案进行各类规则的制定实施过程。
步骤一确定相关的表
全国卷烟市场分类销售情况表(分价类)
在DDS中直接使用的表为:APP_JJYX.T_FT_JJYX_JYSCFLXLQK_JL 对应的HDS中的源表为:EIIRECV.EIIRECV_TZ_BS_Y_Q_M_SELLDETAIL。 因此下面的检验规则主要针对这两张表来制定。
原则性检验 HDS数据表中字段的数值是否在合法的区间内
逻辑性检验 单表或多个表内字段间逻辑关系的检查
数据源检验适用的规则
时效性检验
√规则一:时效性检验适用于HDS中所有的代码表和数据表。
完整性检验
√规则二:包含外键字段的HDS数据表必须进行代码一致性检验。 √规则三:包含日期型字段且可以确定记录数范围的HDS数据表必须进行记 录条数检验。
数据的传输质量:
数据的传输质量是指数据在传输过程中的效率和正确性。在现代信息社 会中,数据在异地之间的传输越来越多,保证传输过程中的高效率和正确性 非常重要。
数据质量重要性
关系建设系统成败
很多数据仓库应用程度不高或最后失败,归根结底都是数据质量不高造成 的。
数据质量好坏关系到结果与预期是否一致
原则性检验
√规则四:HDS数据表中可以确定取值范围的字段必须进行原则性检验。
逻辑性检验
√规则五:单表或多个表内的字段具有相同的业务含义,不同的统计口径,且 存在汇总关系。满足此条件时必须进行逻辑性检验。
√规则六:本表的字段与其他表中的字段的业务含义、统计口径相同。满足此 条件时必须进行逻辑性检验。
数据检验适用的规则
模糊性检验
√规则七:不能进行完整性、原则性检验的情况下,必须进行模糊性检验。 √规则八:规则七不成立时,根据系统的重要程度决定是否进行模糊性检验。
系统的重要程度及哪些系统要进行模糊性检验由客户方确定。 逻辑性检验
√规则九:本表的字段与其它表中的字段具有相同的业务含义,不同的统 计口径,存在汇总关系,且两张表的数据不是经同一数据源加工得到。满足此条 件时必须进行逻辑性检验。
逻辑性检验 由不同数据源加工得到的多个表内字段间逻辑关系的检查
数据检验适用的规则
时效性检验
√规则一:时效性检验适用于DDS中所有的维度表和事实表。
完整性检验
√规则二:包含外键字段的DDS中事实表必须进行代码一致性检验。
√规则三:包含日期型字段且可以确定记录数范围的DDS事实表必须进行记 录条数检验。
步骤五 确定数据源的逻辑性检验规则
根据数据源检验适用规则的规则六、七:
1、EIIRECV.EIIRECV_TZ_BS_Y_Q_M_SELLDETAILL表中不包含字段与其 他表中 的字段具有相同的业务含义、统计口径。因此不满足规则六逻辑检 验。
2、EIIRECV.EIIRECV_TZ_BS_Y_Q_M_SELLDETAILL表中包含有字段 sell(系统外总销量)、 Out_Sell_Retail_Amount (系统外零售 量)、Out_Sel l_Amount (系统外批发销量 ) End_Store_Amount (期 末库存 )、ratio_stoc k_sell(存销比)。
低下的数据质量往往造成开发出来的系统与用户的预期大相径庭
数据质量是决策正确的保障
数据信息是企业重要的战略资源,合理有效的使用正确的数据能指导企业 领导作出正确的决策,提高企业的竞争力。不合理的使用不正确的数据(即差的 数据质量)可导致决策的失败,正可谓差之毫厘、谬以千里。
数据质量是长期困扰开发的难题
4、数据校验-原则性检验 数据校验的原则性检验报异常时应停止ETL加载过程,不需要再进行后续 的检验
5、数据源-时效性检验、数据源-逻辑性检验、数据校验-时效性检验、
数据校验-模糊性检验、数据校验-逻辑性检验 这五类检验方法报异常时,ETL加载正常进行,但需要给出预警提示
数据管理
1 数据管理的目标 2 数据管理的难点与重点
5
数据质量检验的顺序
数据源检验方法
数据源检验是对HDS中的源表进行的数据质量检查。数据源检验分为时效性 检验和正确性检验两个大类,其中正确性检验又分为完整性检验、原则性检验、 逻辑性检验。