数据质量管理系统

合集下载

数据质量管理平台

数据质量管理平台

数据质量管理平台一、概述数据质量管理平台是一种用于监控、评估和改进数据质量的软件系统。

它提供了一系列功能和工具,帮助组织管理和维护高质量的数据,以支持决策制定、业务流程优化和风险管理等活动。

本文将详细介绍数据质量管理平台的主要特点、功能模块以及使用方法。

二、主要特点1. 综合性:数据质量管理平台提供了全面的数据质量管理解决方案,包括数据质量评估、数据清洗、数据监控、数据修复和数据质量报告等功能。

用户可以通过一个统一的平台来管理所有与数据质量相关的活动,提高工作效率。

2. 灵活性:平台可以根据不同组织的需求进行定制化配置,适应各种数据类型和数据源。

用户可以根据实际情况选择需要的功能模块,并进行个性化设置,以满足特定的业务需求。

3. 实时监控:平台具有实时监控数据质量的能力,可以对数据进行实时检测和分析。

用户可以设置监控规则和阈值,当数据质量出现异常时,系统会及时发出警报,帮助用户及时发现和解决问题。

4. 数据修复:平台提供了数据修复功能,可以自动或手动修复数据质量问题。

用户可以根据修复策略和规则,对数据进行清洗、转换和修复,提高数据的准确性和一致性。

5. 数据质量报告:平台可以生成各种数据质量报告,包括数据质量指标、数据质量趋势和数据质量问题等。

用户可以根据需要定制报告内容和格式,并进行定期生成和分发,以便于组织内部和外部的沟通和决策。

三、功能模块1. 数据质量评估:该模块用于评估数据质量,并生成数据质量指标。

用户可以定义评估规则和指标体系,对数据进行质量评估,并生成评估报告。

2. 数据清洗:该模块用于清洗数据,包括数据去重、数据纠错、数据格式转换等功能。

用户可以根据清洗规则和策略,对数据进行清洗操作,提高数据的准确性和一致性。

3. 数据监控:该模块用于实时监控数据质量。

用户可以设置监控规则和阈值,当数据质量超出预设范围时,系统会发出警报,并提供相应的处理建议。

4. 数据修复:该模块用于修复数据质量问题。

数据质量管理平台

数据质量管理平台

数据质量管理平台一、引言数据质量管理是在大数据时代中非常重要的一个环节,它涉及到数据的准确性、完整性、一致性和及时性等方面。

为了保证企业数据的高质量,提高数据分析和决策的准确性,我们需要建立一个数据质量管理平台。

二、平台概述数据质量管理平台是一个集中管理、监控和改进数据质量的系统。

它提供了数据质量评估、数据质量监控、数据质量报告和数据质量改进等功能,匡助企业实现数据质量的全面管理。

三、功能模块1. 数据质量评估模块数据质量评估模块用于对数据进行全面的评估,包括数据的准确性、完整性、一致性和及时性等方面。

通过定义评估指标和评估规则,系统可以自动对数据进行评估,并生成评估报告。

2. 数据质量监控模块数据质量监控模块用于实时监控数据的质量状况。

它可以监控数据的变化、异常和错误,并及时发出警报。

同时,监控模块可以记录数据质量的历史变化,为数据质量改进提供参考。

3. 数据质量报告模块数据质量报告模块用于生成数据质量的报告。

它可以根据用户需求,定期生成数据质量报告,并提供可视化的展示方式,匡助用户了解数据质量的整体状况和趋势。

4. 数据质量改进模块数据质量改进模块用于对数据质量问题进行分析和改进。

它可以根据评估结果和监控数据,找出数据质量问题的根本原因,并提供改进措施。

同时,改进模块可以跟踪改进措施的执行情况,并评估改进效果。

五、平台优势1. 全面的数据质量管理数据质量管理平台提供了全面的数据质量管理功能,覆盖了数据质量评估、监控、报告和改进等方面。

用户可以通过一个平台实现对数据质量的全面管理,提高数据质量的一致性和准确性。

2. 实时监控和预警数据质量管理平台可以实时监控数据的质量状况,并及时发出预警。

这有助于用户及时发现和解决数据质量问题,避免数据质量问题对业务决策产生负面影响。

3. 可视化报告和分析数据质量管理平台提供了可视化的报告和分析功能,匡助用户更好地了解数据质量的整体状况和趋势。

用户可以通过报告和分析结果,找出数据质量问题的根本原因,并制定相应的改进措施。

质量管理体系数据管理

质量管理体系数据管理

质量管理体系数据管理一、引言质量管理体系是指组织为了满足顾客需求、持续改进和达到组织目标而建立、实施和维护的一系列质量管理文件、控制措施和程序。

数据管理在质量管理体系中扮演着至关重要的角色,它涉及到数据的采集、分析、存储和应用,对于持续改进和决策制定起着决定性的作用。

本文将重点探讨质量管理体系数据管理的重要性以及如何有效地开展数据管理工作。

二、数据采集数据采集是质量管理体系数据管理的第一步,它是获取、记录和记录数据的过程。

数据采集可以通过各种手段进行,包括实地观察、实验测试、调查问卷、采购记录等。

在进行数据采集时,应确保数据的准确性、可靠性和完整性,避免数据的虚假、错误或遗漏。

三、数据分析数据分析是针对采集到的数据进行整理、处理和解释的过程。

通过数据分析,可以发现其中的模式、趋势和异常,从而为决策制定提供有力的依据。

常用的数据分析方法包括统计分析、图表分析、趋势分析等。

四、数据存储数据存储是指将分析过的数据进行归档和保存的过程。

数据存储旨在保证数据的安全性和可访问性,以便在需要的时候能够快速地检索和应用。

在进行数据存储时,应采用合适的存储媒介和技术,并制定相应的数据备份和恢复计划,以防止数据的丢失和损坏。

五、数据应用数据应用是将分析和存储的数据应用于决策制定和持续改进的过程。

通过充分利用数据分析得到的信息,可以制定出针对性的改进方案和措施,以提高组织的绩效和满足顾客需求。

数据应用还可以用于制定质量目标、评估过程绩效、追踪产品质量等。

六、数据管理的挑战和解决方案数据管理在实践中常常面临一些挑战,比如数据的获取困难、数据的质量问题、数据的安全性等。

为了解决这些挑战,可以采取以下措施:1. 确保数据采集过程的标准化和规范化,减少数据获取的难度;2. 加强对数据质量的监控和管理,及时修复和清理错误数据;3. 建立安全可靠的数据存储和访问系统,保护数据的机密性和完整性;4. 培训和提升员工的数据管理能力,加强数据管理意识和技能。

数据质量管理平台

数据质量管理平台

数据质量管理平台一、引言数据质量是企业信息化建设中至关重要的一环。

为了保证数据的准确性、完整性、一致性和可靠性,企业需要建立一个数据质量管理平台。

本文将详细介绍数据质量管理平台的标准格式。

二、平台概述数据质量管理平台是一个集中管理、监控和改进数据质量的系统。

它包括数据质量评估、数据质量监控、数据质量改进和数据质量报告等功能模块。

通过该平台,企业可以全面了解数据质量状况,并采取相应措施提高数据质量。

三、功能模块1. 数据质量评估数据质量评估模块用于对企业数据进行全面评估。

它可以自动分析数据的准确性、完整性、一致性和合规性等指标,并生成评估报告。

评估报告可以匡助企业了解当前数据质量状况,找出数据质量问题的根源。

2. 数据质量监控数据质量监控模块用于实时监控数据质量。

它可以对关键数据指标进行监测,并及时发现数据质量异常。

一旦发现异常,系统会自动触发警报,并通知相关人员进行处理。

监控数据质量可以匡助企业及时发现并解决数据质量问题,避免问题扩大化。

3. 数据质量改进数据质量改进模块用于对数据质量问题进行分析和改进。

它可以根据评估报告和监控数据,找出数据质量问题的原因,并提供相应的改进措施。

改进措施可以包括数据清洗、数据标准化、数据验证等。

通过数据质量改进,企业可以提高数据质量水平,提升业务决策的准确性。

4. 数据质量报告数据质量报告模块用于生成数据质量报告。

报告内容包括数据质量评估结果、数据质量监控趋势、数据质量改进效果等。

报告可以定期生成,并自动发送给相关人员。

数据质量报告可以匡助企业监控数据质量的变化趋势,评估数据质量改进效果,并及时调整数据质量管理策略。

四、技术要求1. 数据采集与集成:平台需要支持多种数据源的接入,包括关系型数据库、非关系型数据库、文件系统等。

同时,平台需要提供数据集成功能,将不同数据源的数据进行整合。

2. 数据质量评估:平台需要支持多种数据质量评估方法,包括规则引擎、数据挖掘、统计分析等。

数据质量管理平台

数据质量管理平台

数据质量管理平台数据质量管理平台是一种用于监控、评估和提升数据质量的工具。

它匡助组织管理和维护数据的准确性、完整性、一致性和可靠性,以确保数据的高质量和可信度。

以下是关于数据质量管理平台的详细介绍。

1. 概述数据质量管理平台是一个集成的软件系统,用于监控和管理组织内部的数据质量。

它提供了一套工具和功能,匡助用户识别、分析和解决数据质量问题。

该平台可以与各种数据源和系统集成,包括数据库、数据仓库、数据湖和数据集市。

2. 功能数据质量管理平台具备以下核心功能:- 数据质量监控:实时监测数据的质量指标,如准确性、完整性和一致性。

通过预定义的规则和指标,系统可以自动检测和报告数据质量问题。

- 数据质量评估:对数据进行定期的质量评估,包括数据完整性、一致性和准确性等方面。

通过数据采样和分析,平台可以生成详细的数据质量报告和指标。

- 数据质量改进:根据评估结果,平台提供数据质量改进建议和解决方案。

用户可以根据需求选择适当的改进措施,例如数据清洗、数据转换和数据验证。

- 数据质量管理:平台提供数据质量管理的功能,包括数据质量策略制定、数据质量规则管理和数据质量监管。

用户可以定义和管理数据质量规则,并监控其执行情况。

- 数据质量报告:平台可以生成各类数据质量报告,包括实时报告、定期报告和自定义报告。

报告可以展示数据质量指标、趋势和问题,匡助用户了解数据质量状况。

3. 工作流程数据质量管理平台的工作流程如下:- 数据采集:平台从各种数据源中采集数据,包括数据库、文件和API接口等。

- 数据质量监控:平台实时监测数据的质量指标,如数据完整性、准确性和一致性等。

通过预定义的规则和指标,系统可以自动检测和报告数据质量问题。

- 数据质量评估:平台定期对数据进行质量评估,包括数据完整性、一致性和准确性等方面。

通过数据采样和分析,平台可以生成详细的数据质量报告和指标。

- 数据质量改进:根据评估结果,平台提供数据质量改进建议和解决方案。

数据质量管理系统构建与应用研究

数据质量管理系统构建与应用研究

数据质量管理系统构建与应用研究随着信息时代的到来,数据已经成为组织运营的重要组成部分。

然而,随着数据的不断增长和多样化,数据质量问题也日益突出。

数据质量对企业的决策准确性、客户关系、企业形象等方面有着重要的影响。

面对大数据时代的挑战,构建和应用数据质量管理系统成为了组织中不可或缺的重要任务。

一、数据质量管理系统构建1. 数据质量评估数据质量评估是构建数据质量管理系统的第一步。

评估标准可以包括数据准确性、完整性、一致性、有效性等。

通过收集和分析数据质量指标来评估数据质量,可以为构建数据质量管理系统提供指导。

2. 数据质量规则定义在数据质量管理系统中,数据质量规则是进行数据质量管理的基础。

数据质量规则定义了数据的合法性和一致性要求。

这些规则可以包括数据格式、值域、键值关联等方面的限制。

通过定义数据质量规则,可以保证数据在采集、存储和使用过程中的合法性和准确性。

3. 数据质量监控数据质量监控是数据质量管理系统的核心功能之一。

通过对数据的实时监控和异常检测,可以及时发现和解决数据质量问题。

监控可以包括数据完整性、数据准确性、数据一致性等方面的检测,并提供相关报表和告警信息,帮助组织及时调整和改进数据质量。

4. 数据质量改进数据质量改进是数据质量管理系统的最终目标。

通过对数据质量问题的深入分析和处理,可以逐步提高数据质量水平。

改进方法可以包括数据清洗、数据修复、数据重组等。

这些方法可以帮助组织有效地解决数据质量问题,并提高组织的数据驱动决策能力。

二、数据质量管理系统应用研究1. 企业决策支持数据质量管理系统可以为企业决策提供有力的支持。

通过保证数据的准确性和完整性,企业可以从数据中获取准确的信息,支持决策的制定和实施。

数据质量管理系统可以帮助企业减少决策错误的可能性,提高决策的准确性和效率。

2. 客户关系管理客户关系是企业成功的重要因素之一。

通过数据质量管理系统,企业可以保证客户信息的准确性和一致性,提高客户关系管理的效率和质量。

质量管理体系的数据管理与数据分析

质量管理体系的数据管理与数据分析

质量管理体系的数据管理与数据分析质量管理体系在现代企业中扮演着重要的角色,它能够有效地提高产品和服务的质量,满足客户的需求,并帮助企业实现持续改进。

而数据管理和数据分析则是质量管理体系中至关重要的组成部分。

本文将探讨质量管理体系中的数据管理和数据分析的重要性以及如何有效地进行。

一、数据管理在质量管理体系中的作用在质量管理体系中,数据管理是指对质量相关的数据进行收集、存储、维护和分发的过程。

它可以帮助企业对质量相关的数据进行有效管理,为质量管理提供基础数据支持。

1.1 数据收集与存储数据的收集和存储是数据管理的第一步。

企业可以通过各种手段收集相关的质量数据,包括产品质量测试数据、客户反馈数据、供应商数据等。

这些数据需被准确地记录下来,并以适当的方式进行存储,以便后续分析和利用。

1.2 数据维护与更新数据维护和更新是确保数据质量和有效性的关键步骤。

在质量管理体系中,数据应定期进行维护和更新,以确保数据的准确性和完整性。

同时,必要时还需采取措施防止数据的丢失或损坏,保证数据的可靠性和可用性。

1.3 数据分发与共享质量管理体系中的数据应能够被相关部门和人员方便地访问和利用。

因此,数据管理还包括数据的分发和共享。

通过合适的方式,如数据报表、数据展示等,将数据传递给需要的人员或部门,以支持他们在质量管理方面的决策和行动。

二、数据分析在质量管理体系中的重要性数据分析是质量管理体系的核心环节,它通过对质量数据的分析和解释,揭示潜在问题和机会,并为企业的决策提供依据。

有效的数据分析能够帮助企业进行质量问题的预测和预防,提高工艺的稳定性和产品的一致性。

2.1 监测质量表现通过数据分析,企业可以监测和评估其质量表现。

比如,通过对产品质量测试数据的分析,企业可以及时发现产品质量异常,并采取相应的纠正措施。

同时,通过对客户反馈数据的分析,企业能够了解客户对产品的满意度和需求,从而进行必要的调整和改进。

2.2 发现问题与机会数据分析还可以帮助企业发现潜在的问题和机会。

数据质量管理平台

数据质量管理平台

数据质量管理平台一、引言数据质量管理平台是一种用于监控、评估和改善数据质量的工具,旨在确保数据的准确性、完整性、一致性和可靠性。

本文将详细介绍数据质量管理平台的标准格式,包括平台的概述、功能模块、数据质量指标、数据质量评估流程和改善措施等。

二、概述数据质量管理平台是一个集成化的系统,用于匡助组织监控和管理其数据质量。

它提供了一系列的功能模块,包括数据采集、数据清洗、数据质量评估、数据质量报告和数据质量改善等。

通过使用该平台,组织可以及时发现和解决数据质量问题,提高数据的可信度和可用性。

三、功能模块1. 数据采集模块:该模块用于采集组织内部和外部的数据,支持多种数据源的接入,如数据库、文件、API等。

它能够自动化地提取、转换和加载数据,确保数据的完整性和一致性。

2. 数据清洗模块:该模块用于对采集到的数据进行清洗和预处理,以消除数据中的错误、缺失、重复和不一致等问题。

它提供了丰富的数据清洗规则和算法,可根据业务需求进行配置和定制。

3. 数据质量评估模块:该模块用于对清洗后的数据进行质量评估,以衡量数据的准确性、完整性、一致性和可靠性。

它支持多种数据质量指标的计算和监控,如数据完整性、数据一致性、数据精确性等。

4. 数据质量报告模块:该模块用于生成数据质量报告,向相关人员提供数据质量的详细信息和可视化展示。

报告中包括数据质量指标的统计结果、趋势分析、异常检测和问题定位等,匡助组织快速了解数据质量状况。

5. 数据质量改善模块:该模块用于制定和执行数据质量改善措施,以解决数据质量问题并提高数据质量水平。

它提供了数据质量问题的跟踪和管理功能,支持问题的分析、优先级的确定和改善计划的制定。

四、数据质量指标数据质量管理平台可以根据组织的需求和业务特点,定义和监控一系列的数据质量指标。

以下是一些常见的数据质量指标示例:1. 数据完整性:衡量数据中是否存在缺失值或者空值的情况,如缺少必要字段、空白记录等。

2. 数据一致性:衡量数据在不同数据源或者系统之间的一致性,如数据命名规范、数据格式一致性等。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

检查
质量检查基本功能
•数据稽核 •处理过程检查
• 接口文件级检查 • 仓库数据检查 • 关键指标稽核
数据质量检查点的部署方式
数据源 数据源
一经数据仓库
ETL
省级数据仓库
地市集市 部门集市
检查点
前端应用 前端应用 前端应用
告警
检查结果报告基本过程 • 报告定义 • 报告生成 • 报告展示
检查结果报告的内容 • 消息ID • 告警发生时间 • 发出通知时间 • 解决时间
• 版本管理体系 • 版本管理的工具 • 元数据版本管理
访问控制管理
访问控制管理
用户管理
角色管理
权限管理
修改角色权限 分配角色权限 创建对象权限 修改用户角色 授予用户角色
创建角色 删除用户 修改用户信息 建立用户
介绍纲要
规范编写背景 规范内容说明 总结
总结
本规范是在经营分析系统1.5数据质量管理系统基础上进行加强和完 善:
• 过程查询 • 影响分析 • 血统分析 • 实体关联度分析 • 实体差异分析 • 版本管理 • 变更通知
• 信息采集 • 质量检查 • 结果报告 • 改进处理 • 处理总结
• 知识积累和维护 • 知识使用
• 元数据维护 • 元数据导入/导出 • 元数据维护 • 元数据同步检查 • 元数据实体检查
应用层
• 目录扫描模块 • 检查规则读取模块 • 数据质量检查模块 • 检查结果生成模块 • 代理活动采集模块 • 通信模块
• 用户管理模块 • 检查规则处理模块 • 代理配置处理模块 • 代理活动监控模块 • 检查结果处理模块 • 数据库接口模块 • 通信模块
• 检查规则查看 • 检查规则配置 • 代理配置 • 代理活动监控 • 检查结果查看 • 用户管理 • 通信模块
• 工作分配管理 • 系统使用状况分析 • 项目需求管理 • 项目组织架构管理
数据质量监控目标
目标1
•初步实现经营分析系统数据处理各个环节的全程监控
目标2
•及时发现数据质量问题、及时定位问题、及时解决问题
目标3
•积累数据质量管理经验,提升和强化数据质量管理系统的能力
数据质量监控流程
采集、检查、报告、处理、总结
中国移动省级经营分析系统 数据质量管理业务技术规范v2.0
业务支撑系统部
介绍纲要
规范编写背景 – 编写背景 – 总体说明 – 数据质量管理需求
规范内容说明 总结
背景
中国移动省级经营分析系统经过多年发展,已初步建立了 数据质量管理机制,有效保障了经营分析系统的数据质量。
省级经营分析系统价值的不断显现与稳步提升,以及IT系 统安全管理、风险内部控制等重大管理举措的实施,各省公司 对经营分析系统如何保障数据质量提出了更高要求,以全面及 时地采集、检查、报告、解决和总结经营分析系统各环节的数 据质量问题,保证数据质量的稳定可靠。
数据质量-管理流程
管理机制
• 组织机构职责 • 相关外部组织
控制流程
• 需求变更控制流程 • 数据质量问题处理流程 • 指标口径和业务规则问题处理流程 • 数据变更维护流程 • 错误数据处理流程
质量检查
• 管理流程检查 • 元数据质量检查
数据质量-系统管理
安全管理 版本管理
• 系统的监控与告警 • 系统登录认证管理 • 系统审计与日志管理 • 系统备份与恢复管理
稽核流程
数据维护
数据清洗流程 调度流程
错误数据维护流程
人为调整数据流程
数据装载
数据使用 数据创建
数据转换流程 数据加载流程
数据传递
数据质量问题
数据质量问题
激励
反馈渠道 反馈机制
培训内容 培训时间 培训资金
奖惩制度 奖惩制度的执行
培训
管理
责任心 责任人
培训计划 培训制度
目标 工作优先级
管理问题
系统功能需求
告警管理 • 告警界面 • 告警形式
• 数据处理模块 • 严重级别 • 问题描述 • 目前状态
• 告警升级 • 告警恢复
处理
问题隔离阶段
• 分控方式:由经营分析系统数据处理各个阶段上的分布式检查点独 立执行数据处理流程挂起和问题隔离操作
• 总控方式: 数据处理各个阶段上的分布式检查点向某个中央调度控 制器保送当前问题状态,并由调度控制器执行数据处理流程挂起和 问题隔离操作
系统主要目标
支持对数据质量的全程监控 完善数据质量监控模块,建立有效的数据质量监控机制 建设符合CWM规范的元数据管理平台
实施建议
在建立数据质量管理系统后,需要建立配套的管理机制 各省在遵循CWM标准的前提下,可自行建设元数据管理平台 在规定的应用外,各省可以根据实际情况增加
数据质量管理需求
信 息 需 求 域
信息问题
完整性 唯一性 一致性
度量
合法性 准确性
业务系统数据变化周期
变化频度
实体数据刷新周期
业务元数据
元数据
技术元数据
数据质量问题
流 程 问 题 域
技 术 问 题 域
数据质量问题
数据创建
数据装载
数据校验规则不当 默认值使用不当 数据创建延迟
数据获取
取数时点不同步
数据清洗算法
调度机制 数据转换算法
➢ 引入了数据质量监控模块 ,实现对经营分析系统数据的质量全程监控 和管理
➢ 进一步突出和强调了基于CWM标准的元数据管理和应用 ➢ 完善数据质量管理流程 ➢ 进一步强化了数据质量知识库的功能
元数据管理
建立符合国际主流规范CWM的元数据管理支撑平台 管理整个经营分析系统的技术、业务和管理三类元数据
数据质量监控
采集、检查、报告、处理和总结 把质量问题处理案例记录到知识库中,以便进行知识共享
项目管理支撑
工作分配管理 系统使用状况分析 项目需求管理 项目组织架构管理
介绍纲要
规范编写背景 规范内容说明
总体说明
数据质量管理概述
数据质量的六大基本要素:完整性、唯一性、一致性、精确度、合法性和及时性 从用户视角衡量数据质量,重视用户对数据的满意程度 建立基于CWM标准的元数据管理功能平台 建立数据质量监控手段 通过建立有效的数据质量管理数据质量管理总体应用体系框架 明确规定数据质量管理系统中的元数据支撑功能及其它支撑功能 确定数据质量管理的基本功能和流程
数据质量监控
• 数据质量评估 • 诊断报告展示 • 接口异常分析等模块
信息地图
• 数据实体展现视图 • 数据处理过程展现视图 • 指标视图 •…
需求变更影响评估 数据集市支撑
• 关联实体影响评估 • 受影响实体关联处理过程评估 • 维表变更影响评估 • 灵活展现 • 影响评估报告
项目管理支撑
监控流程 采集
检查
报告
处理
总结
系统管理 知识库管理
元数据库
管理元数据 业务元数据 技术元数据
运行状况信息库
源数据状况 ETL运行状况 仓库运行状况 集市运行状况 前端运行状况
数据质量知识库
源数据类型问题 ETL类型问题 仓库类型问题 集市类型问题 前端类型问题
源系统层
数据源 数据源
ETL
数据仓库
地市集市 部门集市
信息采集点
采集
元数据库
人机接口
检查
报告
外部系统
处理
总结
运行状况信息库
管理/配置模块
数据质量知识库
采集
指导原则
原则1:信息采集点前移 原则2:信息采集点覆盖数据处理的主要过程
信息采集
信息采集点的扩展 信息采集点采集的信息内容
一经数据仓库
数据源 数据源
ETL
省级数据仓库
地市集市 部门集市
信息采集点 前端应用 前端应用 前端应用
问题处理阶段
• 问题分析 • 问题处理
• 向外部系统发送检查报告 • 启动数据质量维护流程
总结
总结的类型
• 数据质量事件总结 • 数据质量问题总结 • 数据质量总体情况总结 • 数据质量阶段性总结 • 其他总结
问题总结
• 对处理环节问题处理的过程和结果进行评估 • 把问题的采集、检查、报告、处理全过程信息进行整理,形
• 源数据类型问题 • ETL类型问题 • 仓库类型问题 • 集市类型问题 • 前端类型问题
存储描述和控制经营分析系 统中数据的数据
存储描述系统运行情况的各 种度量数据,包括数据量、 数据处理周期、数据处理过 程运行情况等
存储数据质量问题的识别、 诊断、处理各阶段的相关信 息
功能层
元数据管理
质量监控支撑 知识库管理 系统管理
前端应用 前端应用 前端应用
源系统层
数据处理流程
主要涉及源系统接口数据、ETL过程、数据仓库、数据集市、前端应用等处理阶段
存储层
元数据库 运行状态信息库 数据质量知识库
• 业务元数据
• 技术元数据
• 管理元数据
• 源数据状况 • ETL运行状况 • 数据仓库运行状况 • 数据集市运行状况 • 前端运行状况
成问题处理案例,存入数据质量知识库中,以便质量管理工 作的改进
阶段总结
• 阶段性总结以数据质量知识库为基础,通过对知识库中各种 数据质量问题案例进行分类查询和统计,得到不同角度的总 结报告
数据质量-技术实现
外部数据 源系统
接口机 Agent
ETL 服务器
Agent
数据仓库 服务器
Agent
数据集市 服务器
数据加载算法
平台孤岛
接口数据获取 数据源不当 过程中失真
数据使用
硬件平台 软件平台
数据传递
相关文档
最新文档