数据生命周期管理

合集下载

数据生命周期管理

数据生命周期管理

数据生命周期管理数据生命周期管理是指对数据从创建到销毁的全过程进行管理和控制的一种方法。

它涵盖了数据的采集、存储、处理、分析、使用和归档等各个阶段。

通过对数据生命周期进行管理,可以确保数据的安全性、可靠性和合规性,提高数据的价值和利用效率。

数据生命周期管理通常包括以下几个阶段:1. 数据采集阶段:在这个阶段,数据管理员负责确定需要采集的数据类型和来源,并制定相应的数据采集计划。

数据可以通过各种方式采集,如传感器、调查问卷、日志文件等。

在采集数据的过程中,需要确保数据的准确性和完整性。

2. 数据存储阶段:在这个阶段,数据管理员需要选择适当的存储介质和存储方式来存储数据。

常见的存储介质包括硬盘、磁带和云存储等。

同时,还需要制定数据备份和恢复策略,以确保数据的可用性和可靠性。

3. 数据处理阶段:在这个阶段,数据管理员负责对数据进行清洗、转换和集成等处理操作,以提高数据的质量和可用性。

同时,还需要制定数据处理流程和规范,确保数据处理的一致性和规范性。

4. 数据分析阶段:在这个阶段,数据管理员需要根据业务需求和分析目标,选择合适的数据分析方法和工具,对数据进行挖掘和分析,以获取有价值的信息和洞察。

数据分析可以匡助企业做出更好的决策和战略规划。

5. 数据使用阶段:在这个阶段,数据管理员需要确保数据的安全性和隐私性,制定相应的数据访问控制策略和权限管理机制,以防止未经授权的访问和使用。

同时,还需要提供方便快捷的数据查询和检索功能,以满足用户的需求。

6. 数据归档阶段:在这个阶段,数据管理员需要根据数据的重要性和价值,制定数据归档策略和周期,将再也不频繁使用的数据进行归档和存档。

归档数据需要进行备份和保护,以防止数据丢失和损坏。

7. 数据销毁阶段:在这个阶段,数据管理员需要根据法律法规和合规要求,制定数据销毁策略和方法,对再也不需要的数据进行安全销毁。

数据销毁需要确保数据无法恢复,并记录销毁过程和结果。

综上所述,数据生命周期管理是一个复杂而关键的过程,需要数据管理员具备丰富的知识和技能。

数据生命周期管理

数据生命周期管理

数据生命周期管理引言概述:数据生命周期管理是指对数据从产生到销毁的整个过程进行有效管理和控制,以确保数据的安全、可靠和合规性。

在数字化时代,数据成为企业最重要的资产之一,因此,合理管理数据生命周期对企业的发展至关重要。

一、数据生命周期管理的定义与意义1.1 数据生命周期管理的定义:数据生命周期管理是指对数据从产生到销毁的全过程进行规划、管理和控制,包括数据的采集、存储、处理、使用、共享和销毁等环节。

1.2 数据生命周期管理的意义:数据生命周期管理可以匡助企业合理利用数据资源,提高数据的质量和价值,降低数据管理的成本和风险,同时满足法律法规和隐私保护的要求。

二、数据生命周期管理的关键环节2.1 数据采集:在数据生命周期的开始阶段,企业需要确定需要采集的数据类型、来源和采集方式,并确保数据的准确性和完整性。

2.2 数据存储:数据存储是数据生命周期管理的核心环节,包括数据的存储介质选择、数据的备份与恢复、数据的安全保护等,以确保数据的可靠性和可用性。

2.3 数据处理与分析:数据处理与分析是数据生命周期管理的关键环节,企业需要建立数据处理与分析的流程和方法,以提取数据的价值和洞察业务的发展趋势。

三、数据生命周期管理的方法与工具3.1 数据分类与标记:企业可以根据数据的敏感程度、重要性和使用频率等因素对数据进行分类和标记,以便在数据生命周期的不同阶段进行相应的管理和控制。

3.2 数据访问权限控制:通过建立合理的权限管理机制,企业可以对不同角色和部门的员工进行数据访问权限的控制,以防止数据的滥用和泄露。

3.3 数据备份与灾难恢复:企业应建立定期的数据备份和灾难恢复机制,以应对数据丢失、损坏和灾难等情况,确保数据的安全和可恢复性。

四、数据生命周期管理的挑战与解决方案4.1 数据隐私与合规性:随着数据泄露和滥用事件的频发,数据隐私和合规性成为数据生命周期管理的重要挑战。

企业应建立合规性框架和隐私保护机制,确保数据的合法使用和保护用户隐私。

数据生命周期管理

数据生命周期管理

数据生命周期管理数据生命周期管理是指在数据的整个生命周期内,对数据进行有效管理和维护的过程。

它涵盖了数据的创建、存储、使用、共享、归档和销毁等各个阶段。

通过合理的数据生命周期管理,可以保证数据的完整性、可用性、安全性和合规性,提高数据的价值和利用效率。

1. 数据创建阶段:在数据创建阶段,需要明确数据的来源和质量要求。

数据可以来自各种渠道,如传感器、数据库、文件等。

在创建阶段,需要对数据进行采集、清洗和转换等处理,确保数据的准确性和可用性。

2. 数据存储阶段:数据存储阶段是指将数据存储在合适的介质中,以供后续的访问和使用。

根据数据的特点和需求,可以选择不同的存储方式,如数据库、云存储、磁带库等。

在存储阶段,需要考虑数据的容量、性能、可扩展性和安全性等因素。

3. 数据使用阶段:数据使用阶段是指将数据应用于业务活动中,支持决策和创新。

在数据使用阶段,需要确保数据的质量和可信度。

可以通过数据分析、数据挖掘、机器学习等技术方法,从数据中提取有价值的信息和知识。

4. 数据共享阶段:数据共享阶段是指将数据与他人或者其他系统共享,促进信息流通和协同工作。

在数据共享阶段,需要确保数据的安全和隐私。

可以通过访问控制、加密、数据脱敏等措施,保护数据的机密性和完整性。

5. 数据归档阶段:数据归档阶段是指将再也不频繁使用的数据进行长期保存和管理。

在数据归档阶段,需要考虑数据的存储成本和访问效率。

可以根据数据的重要性和价值,将数据归档到不同的存储介质中,如磁带库、光盘等。

6. 数据销毁阶段:数据销毁阶段是指对再也不需要的数据进行安全的销毁和清除。

在数据销毁阶段,需要确保数据无法恢复和被滥用。

可以通过物理销毁、数据擦除等方式,彻底清除数据的痕迹。

数据生命周期管理的好处:- 提高数据质量和可信度,减少数据错误和失真。

- 保护数据的安全和隐私,防止数据泄露和滥用。

- 提高数据的可用性和可访问性,加速业务决策和创新。

- 降低数据存储和管理的成本,优化资源利用效率。

数据生命周期管理

数据生命周期管理

数据生命周期管理数据生命周期管理是指在数据的整个生命周期中,对数据进行规划、存储、使用、保护和销毁的过程。

它涵盖了数据的创建、获取、存储、分析、共享、保护和销毁等各个环节。

数据生命周期管理的目标是确保数据的安全、可靠、高效地使用,并满足法规和合规要求。

1. 数据创建阶段:在数据创建阶段,需要确定数据的来源和格式,并进行数据采集和录入。

数据的来源可以是传感器、数据库、文件等多种形式。

数据的格式可以是结构化数据、非结构化数据、半结构化数据等。

在数据创建阶段,还需要对数据进行校验和验证,以确保数据的准确性和完整性。

2. 数据获取阶段:在数据获取阶段,需要从各种数据源中获取数据,并进行数据清洗和转换。

数据清洗是指对数据进行去重、去噪、去空等处理,以提高数据的质量。

数据转换是指将数据从一种格式转换为另一种格式,以适应不同的应用需求。

3. 数据存储阶段:在数据存储阶段,需要选择适当的存储介质和存储方式,并进行数据的备份和恢复。

存储介质可以是硬盘、闪存、云存储等。

存储方式可以是文件存储、数据库存储等。

数据的备份和恢复是为了防止数据丢失和数据损坏,以确保数据的可用性和可靠性。

4. 数据分析阶段:在数据分析阶段,需要对数据进行挖掘和分析,以获取有价值的信息和洞察。

数据挖掘是指通过统计学、机器学习等方法,从数据中发现隐藏的模式和规律。

数据分析是指对数据进行统计、可视化等处理,以提供决策支持和业务洞察。

5. 数据共享阶段:在数据共享阶段,需要确定数据的共享范围和权限,并进行数据的传输和共享。

数据的共享范围可以是企业内部、合作伙伴、公众等。

数据的权限可以是只读、读写、下载等。

数据的传输可以通过网络、存储介质等方式进行。

6. 数据保护阶段:在数据保护阶段,需要对数据进行安全和隐私的保护,以防止数据泄露和滥用。

数据安全包括数据的加密、访问控制、审计等措施。

数据隐私包括数据的匿名化、脱敏、脱标识等措施。

7. 数据销毁阶段:在数据销毁阶段,需要对不再需要的数据进行安全销毁,以防止数据被恶意利用。

数据生命周期管理

数据生命周期管理

数据生命周期管理引言概述:数据生命周期管理是指对数据从产生到最终销毁的全过程进行有效管理的一种方法。

随着数据的快速增长和不断涌现的数据隐私和安全问题,数据生命周期管理变得越来越重要。

本文将从数据生命周期管理的定义、重要性、实施步骤、挑战和最佳实践等五个大点进行详细阐述。

正文内容:1. 数据生命周期管理的定义1.1 数据生命周期的概念和范围1.2 数据生命周期管理的目标和意义1.3 数据生命周期管理的基本原则2. 数据生命周期管理的重要性2.1 提高数据价值和利用率2.2 保护数据安全和隐私2.3 符合合规要求和法规2.4 提升数据管理效率和降低成本3. 数据生命周期管理的实施步骤3.1 数据采集和获取3.2 数据存储和备份3.3 数据处理和分析3.4 数据传输和共享3.5 数据销毁和归档4. 数据生命周期管理面临的挑战4.1 数据量大、种类多4.2 数据隐私和安全问题4.3 数据一致性和完整性4.4 数据存储和访问速度4.5 数据管理人员和技术要求5. 数据生命周期管理的最佳实践5.1 制定明确的数据管理策略和流程5.2 使用合适的数据管理工具和技术5.3 建立有效的数据备份和恢复机制5.4 加强数据安全和隐私保护5.5 定期进行数据清理和归档总结:数据生命周期管理是现代企业不可或者缺的重要环节,它能够提高数据的价值和利用率,保护数据的安全和隐私,同时符合合规要求和法规。

实施数据生命周期管理需要明确的策略和流程,并利用合适的工具和技术进行支持。

在面对数据生命周期管理的挑战时,企业应加强数据管理人员的培训和技术支持,并遵循最佳实践,如建立明确的数据备份和恢复机制,加强数据安全和隐私保护。

惟独通过全面有效的数据生命周期管理,企业才干更好地应对数据的快速增长和变化,提高数据管理效率和降低成本。

数据生命周期管理

数据生命周期管理

数据生命周期管理引言概述:数据生命周期管理是指对数据从创建到销毁整个过程进行全面管理和控制的一种方法。

它包括数据收集、存储、处理、分析和保护等环节,旨在优化数据的使用和价值,并确保数据的合规性和安全性。

本文将从五个方面详细阐述数据生命周期管理的重要性和具体内容。

一、数据收集1.1 数据来源多样化:数据生命周期管理需要考虑各种数据来源,包括传感器、数据库、社交媒体等,以获取全面、准确的数据。

1.2 数据获取和整合:在数据收集阶段,需要采用合适的方法和工具,如API、爬虫等,将数据从各个来源整合到一个统一的平台或系统中。

1.3 数据质量控制:在数据收集过程中,需要对数据进行质量控制,包括数据清洗、去重、校验等,以确保数据的准确性和一致性。

二、数据存储2.1 存储介质选择:根据数据的特点和需求,选择合适的存储介质,如硬盘、云存储等,以满足数据的容量、速度和可靠性要求。

2.2 数据分区和备份:对于大规模数据,可以将其分区存储,提高数据的读写效率。

同时,需要定期进行数据备份,以防止数据丢失和意外情况发生。

2.3 数据加密和权限控制:为了保护数据的安全性,可以采用数据加密技术,对敏感数据进行加密存储。

同时,需要设置合适的权限控制,限制不同用户对数据的访问权限。

三、数据处理3.1 数据清洗和转换:在数据处理阶段,需要对数据进行清洗和转换,去除无效数据和异常值,将数据转换成可用的格式和结构。

3.2 数据集成和关联:将不同来源和格式的数据进行集成和关联,以发现数据之间的关联性和潜在价值。

3.3 数据分析和挖掘:通过数据处理技术和算法,对数据进行分析和挖掘,提取有价值的信息和知识,为决策和业务提供支持。

四、数据分析4.1 数据可视化:将分析结果以可视化的方式展示,如图表、报表等,以便用户更直观地理解和利用数据。

4.2 数据建模和预测:通过建立数据模型和预测算法,对数据进行建模和预测,为未来决策提供参考和预测结果。

4.3 数据报告和分享:将分析结果整理成报告或分享给相关人员,以便他们了解数据分析的结果和结论,并做出相应的决策和行动。

数据生命周期管理

数据生命周期管理

数据生命周期管理引言概述:数据生命周期管理是指对数据在整个生命周期内的管理和控制,包括数据的创建、存储、使用、共享和销毁等过程。

有效的数据生命周期管理可以匡助组织更好地利用数据资源,提高数据的安全性和可靠性,同时也有助于遵守法规和政策要求。

本文将从数据生命周期管理的概念、重要性、流程、最佳实践和工具等方面进行详细阐述。

一、数据生命周期管理的概念:1.1 数据生命周期管理是指什么?数据生命周期管理是指对数据从创建到销毁的全过程管理,包括数据的采集、存储、处理、分析、共享和保护等环节,以确保数据的安全性、可靠性和合规性。

1.2 数据生命周期管理的目的是什么?数据生命周期管理的主要目的是优化数据的利用和价值,降低数据管理成本,提高数据的安全性和合规性,同时也有助于提高组织的决策效率和竞争力。

1.3 数据生命周期管理的原则是什么?数据生命周期管理的原则包括数据分类、数据标记、数据保护、数据合规和数据审计等,通过这些原则来确保数据的完整性、保密性和可用性。

二、数据生命周期管理的重要性:2.1 为什么数据生命周期管理很重要?数据生命周期管理可以匡助组织更好地理解和控制数据的流动和价值,提高数据的利用率和效率,同时也有助于降低数据管理的风险和成本。

2.2 数据生命周期管理对组织有什么好处?数据生命周期管理可以提高组织的决策效率和精度,降低数据管理的复杂性和风险,同时也有助于提高组织的创新能力和竞争力。

2.3 数据生命周期管理对数据安全和合规性的重要性是什么?数据生命周期管理可以匡助组织更好地保护数据的安全性和隐私性,确保数据的合规性和合法性,避免数据泄露和滥用等风险。

三、数据生命周期管理的流程:3.1 数据生命周期管理的流程包括哪些环节?数据生命周期管理的流程包括数据采集、数据存储、数据处理、数据分析、数据共享和数据销毁等环节,每一个环节都需要进行规划和管理。

3.2 数据生命周期管理的流程如何设计?数据生命周期管理的流程设计需要根据组织的需求和特点来确定,包括数据的分类和标记、数据的访问控制和审计、数据的备份和恢复等环节。

数据管理中的数据生命周期管理

数据管理中的数据生命周期管理

数据管理中的数据生命周期管理数据生命周期管理(Data Lifecycle Management,简称DLM)是指在数据管理过程中,根据数据价值和需求,在不同阶段对数据进行合理的管理和处理。

数据生命周期管理主要包括数据的创建、存储、使用、归档和销毁等几个重要阶段,它不仅可以提高数据管理的效率和安全性,还可以降低数据管理的成本和风险。

一、数据的创建和采集阶段数据的创建和采集阶段是数据生命周期管理的第一阶段,也是整个数据管理过程的起始阶段。

在这个阶段,需要明确确定数据的来源和目的,并采用适当的方法和工具来采集和整理数据。

同时,还需要对数据进行必要的清洗和处理,以确保数据的准确性和有效性。

二、数据的存储和备份阶段数据的存储和备份阶段是数据生命周期管理的核心阶段之一。

在这个阶段,需要选择适当的数据存储介质和技术,并建立健全的数据存储结构和管理机制。

同时,还需要定期进行数据备份和恢复,以防止数据丢失和损坏,并确保数据的可用性和完整性。

三、数据的使用和分析阶段数据的使用和分析阶段是数据生命周期管理的关键阶段之一。

在这个阶段,需要充分利用数据的价值和潜力,进行数据挖掘和分析,并生成有用的信息和洞察力。

同时,还需要建立适当的数据分析模型和算法,并采用合理的数据可视化方式,以便更好地理解和应用数据。

四、数据的归档和检索阶段数据的归档和检索阶段是数据生命周期管理的重要阶段之一。

在这个阶段,需要根据数据的重要性和使用频率,将数据进行分类和归档,并建立相应的数据存档和检索系统。

同时,还需要确保数据的安全和保密,以满足法律法规和业务需求。

五、数据的销毁和清除阶段数据的销毁和清除阶段是数据生命周期管理的最后阶段。

在这个阶段,需要根据数据的保留期限和成本效益,对数据进行适时销毁和清除,以防止数据被滥用和泄露。

同时,还需要采用合适的技术和方法,确保数据的彻底清除和不可恢复。

数据生命周期管理在数据管理中具有重要的作用和意义。

通过合理和科学地管理数据的整个生命周期,可以实现数据的高效利用和价值最大化,同时也可以保护数据的安全和隐私。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据量(累积) 访问频率
数据量(累积)
访问频率
0 6个月 1年 5年 10年
18
二、数据生命周期管理理论与方法
数据生命周期管理的总体原则
在数据的整个生命周期中,不同阶段的数据其性能、可用性、 保存等要求也不一样。
通常情况下,在其生命周期初期,数据的使用频率较高,需 要使用高速存储,确保数据的高可用性。
24
三、工行数据生命周期管理实践
规范主要内容
借鉴国际先进数据模型,对工行的各应用系统数据进行提炼和分 类,在数据生命周期的各个阶段制定了有效的管理策略 。
将工行的应用系统按产品线(共20类)进行划分,并在此基础 上对各产品线的数据类别进行了确认;规定了各产品线各类数 据的数据有效期,建立了完整的数据有效期管理工作规范体系 ,确立指导工行各类数据的基本管理原则和具体应遵循执行的 各种办法
一、工行数据管理的总体情况
数据质量管理流程
1、从源头治理 从数据录入、内 部处理入手,把 好数据质量“入 口关”。
3、做好规范管理
完善制度、规范流程、 系统硬控制,把好数 据质量“流转关”。
2、督促问题治理
部署检查规则,实现问题数据发现、 分发、治理、监督、考核闭环管理, 把Байду номын сангаас数据质量“治理关”。
13
一、工行数据管理的总体情况
数据安全管理
为了加强数据安全管理,工行制定了《数据管理办法》和《数 据管理办法实施细则》,明确了各环节的数据安全管理要求, 并采取了一些技术手段进行硬控制。 数据安全的主要管理要求: 使用生产数据必须经过申请和审批,开发测试环境使用生产 数据必须进行数据变形。 涉及敏感信息的生产数据的传输必须采用加密处理或使用专 用邮箱、专用FTP服务器传输等 。 对生产用户进行严格授权管理,防范非授权访问生产数据 。 对生产数据建立和实施严格的备份机制。对数据保存介质进 行分类登记,及时进行清理和转存。
21
物理删除磁盘和磁带上的数据,销毁光盘介质。
目录
一、工行数据管理的总体情况
二、数据生命周期管理理论与方法
三、工行数据生命周期管理实践
22
三、工行数据生命周期管理实践
建立了数据生命周期管理体系
工行数据生命周期管理从组织建设、制度规范、系统工具、日 常管理各方面开展相关工作。
制定了全行统一的《数据生命周期管理技术规范》,并配套发 布了一系列数据清理工具,根据规范制定的策略定期进行清理 ,并将清理的数据归档到历史数据管理应用中。
数据生命周期管理 理论与实践
2012.9
目录
一、工行数据管理的总体情况
二、数据生命周期管理理论与方法
三、工行数据生命周期管理实践
1
一、工行数据管理的总体情况
工行数据管理的指导思想
指导思想
构建合理的数据管理组织架构和数据架构体系,做好数据 治理,促进各应用系统信息高度共享,充分发挥数据价值, 为经营决策提供科学依据 做好信息标准化管理,提高数据有效性、一致性和规范性 做好数据质量管理,确保数据的准确性 做好数据生命周期管理,实现数据从产生到销毁的全过程 规范化管理 做好信息安全管理,确保信息不被泄露
9
一、工行数据管理的总体情况
信息标准化建设总体目标
总体目标:通过统一信息标准制定、发布使用、制度约束、 系统控制等手段,实现工行信息的完整性、有效性、一致性、规 范性、开放性和共享性管理,提高工行信息化水平。
1.完整性:涵盖客户、机构、 产品、帐户等银行全部重 要信息 2.有效性:信息准确度高、理 解上不存在歧义。 3.一致性:做到“五统一”。 4.规范性:制度规范、流程 控制、系统管理等。
管理信息主要从内部管理系统收集,包括资讯平台、制度园地、 人力资源管理、分支机构管理、办公管理等系统。
外部信息主要包括监管机构提供的信息(如征信信息、风险提示 信息等)、行业信息、外部报价信息等。
4
一、工行数据管理的总体情况
数据基础层(建立数据仓库和数据集市)
为了对客户行为和业务管理进行科学分析和预测,需要建立集 合各类业务数据为一体的数据仓库,进行面向各类主题的数据 统计和挖掘分析,为市场营销和管理决策提供科学依据。 工商银行在2002年完成数据大集中之后,就已经意识到数据对 于银行经营管理的重要作用,在姜建清董事长等行领导的关心 指导下,开始着手数据仓库建设工作。10来年,工商银行数据 仓库建设稳扎稳打,已成为各类业务数据集中存储的重要载体 和关键基础平台。
7
一、工行数据管理的总体情况
管理操作层
主要面向客户服务和内部经营管理,包括客户营销、资本管理 、资产与负债管理、信用风险管理、操作风险管理、市场风险 管理、绩效考核管理、内部审计与合规管理等。管理操作层的 基础数据主要来自各个业务系统,有些统计指标类数据是经数 据仓库加工提供。 为满足日常经营管理,提供了以固定报表为主的综合报表统计 平台。 为便于突发性和临时查询需要,提供了基于数据仓库的灵活查 询功能。
20
二、数据生命周期管理理论与方法
数据生命周期管理流程
数据各生命阶段的管理策略
数据生命阶段 管理策略 永久保存:数据从产生开始一直在生产系统中保存, 在线阶段 此类数据不需要进行清理。 (数据产生与使用阶段) 保存一段时间后清理:数据被标记为失效或过期后在 系统中保存一段时间后进行清理。 在线归档:查询频度仍相对较高的数据,通过数据库 形式保存数据,用户仍可以通过系统在线查询;部分 归档阶段 数据通过在线归档一段时间后进入离线归档阶段。 (数据备份与保存阶段) 离线归档:查询频度相对较低的数据,通过光盘或磁 带等介质保存数据,用户无法在线访问,需通过恢复 光盘或磁带介质。 销毁阶段 (数据被销毁至消失)
2
一、工行数据管理的总体情况
构建了分层的数据架构体系
数据采集层 交易信息 客户信息 管理信息 外部信息 数据集成层
风险集市
指标模型层
管理操作层
绩效等经营 管理系统
数据指标
营销等业务 管理系统 资本管理、 操作风险管 理等风险管 理系统
数据仓库
绩效考核
模型
客户关系管理
灵活查询
用 户 统 一 操 作 界 面
17
二、数据生命周期管理理论与方法
数据生命周期的基本原理
数据访问频度与数据量的变化会随着时间的迁移而呈反比例变 化
利用随时间积累,数据访问频 次变化和数据量累积变化成反 比这一客观规律,对数据根据 访问频次进行数据价值评估, 对大量低价值信息采取低成本 的数据保存手段,使数据的价 值和存储的技术和管理相匹配 ,进而大幅降低整体数据存储 成本;
14
目录
一、工行数据管理的总体情况
二、数据生命周期管理理论与方法
三、工行数据生命周期管理实践
15
二、数据生命周期管理理论与方法
背景情况
早期银行的金融产品相对较少,主要是以存贷汇为主,且数据 是以省(市)为单位分布存放,数据量相对较少;此外由于还 还没有数据集中分析挖掘的需求,日常处理对象主要是短期之 内的数据,时间跨度小,处理的数据规模相对可控。 随着各家银行实施了数据大集中,集中存放和处理的数据量急 剧增加,例如工行目前核心银行数据已达150T,数据仓库存放 的数据已达185T;同时随着各类业务的快速发展,银行每天都 在产生大量的数据,并需要对这些数据进行分析挖掘,系统资 源开销和运行效率都面临着越来越大的压力。 为控制在线数据规模、保证应用系统健康高效运行,对数据从 创建到最终销毁的生命周期进行全程管理显得越来越迫切 。
在线阶段
归档
归档阶段
清理
销毁阶段
在线归档 系统 快照 用户 快照 历史数 据管理 结构化 电子影像及文 档服务平台 非结构化
转移
离线归档
老化 表
磁带 光盘 低端磁盘
说明: 在线归档阶段(也被称为近线阶段):将访问频度较低且应用需求不高的数 据从应用中分离出来,保存在另外的磁盘并提供相应的查询; 离线归档阶段:将访问频度较低且应用需求不高的数据从应用中分离出来, 保存在磁带、光盘及低端磁盘上。离线归档后不提供信息联机访问接口,如有 相应的查询要求,需特定的查询工具或将归档数据导入相应系统
科目定制类
6
一、工行数据管理的总体情况
指标模型层(模型部分)
模型是实现各类共用指标成熟的计算方法,主要用来规范和统 一各类指标的计算,达到方法共享和提高数据一致性的目的。
目前已经实现的模型包括如下内容:
客户评价模型 产品定价模型
绩效评估模型
风险计量模型 财务预算模型 。。。
随着时间的推移,数据重要性会逐渐降低,使用频率会随之 下降,应将数据进行不同级别的存储,为其提供适当的可用 性、存储空间,以降低管理成本和资源开销。 最终大部分数据将不再会被使用,可以将数据清理后归档保 存,以备临时需要时使用。
19
二、数据生命周期管理理论与方法
数据生命周期管理流程
清理
23
三、工行数据生命周期管理实践
《数据生命周期管理技术规范》总体情况
《规范》建立了统一的对所有数据的有效期管理的具体标准、 方案、指引和制度,是数据管理的指导方针,提高了数据管理 工作的统一性、系统性、全面性和科学性 《规范》改变了以往根据磁盘容量和依赖于技术人员经验的状 况,使全行有了科学统一的数据管理标准,减少了因数据保留 时间不当而出现应用风险,使中国工行的各类业务系统可以更 好、更稳定地为广大客户提供优质地服务。
客户经理
各级管理人员
信息获取
信息整合 信息反馈及应用
信息加工
信息展现
高级分析用户 (灵活查询) (数据挖掘)
3
一、工行数据管理的总体情况
相关文档
最新文档