报告Informatica主数据管理解决方案_CA.pptx
主数据管理和数据迁移-Informatica

白皮书主数据管理和数据迁移本文档含有 Informatica Corporation 的保密、专有信息和商业秘密信息(“机密信息”),事先未经Informatica 的书面同意,不得进行拷贝、散发、复印或以任何其它方式复制。
尽管我们尽最大努力确保本文档中信息的准确性和完整性,但仍可能存在一些印刷错误或技术误差。
如因使用本文档所含信息而造成任何损失,Informatica 概不负责。
本文档中包含的信息随时可能更改,恕不另行通知。
Informatica 自行决定将这些材料中讨论的产品属性纳入其任何软件产品的发布或升级中,并自行决定任何此类发布或升级的时间安排。
受下列一项或多项美国专利保护:6,032,158;5,794,246;6,014,670;6,339,775;6,044,374;6,208,990;6,850,947;6,895,471;或受下列正在申请的美国专利保护:09/644,280;10/966,046;10/727,700。
此版本发布于 2014 年 11 月白皮书目录MDM 对数据迁移为何至关重要 (2)第 1 个问题:进行苹果与苹果的比较 (2)按时启动:中间步骤 (3)案例:若干产品 (4)第 2 个问题:质量至关重要 (4)案例:整合公司总部系统和本地系统 (5)数据迁移是提升 MDM 价值的途径 (5)主数据管理和数据迁移1本白皮书描述主数据管理对数据迁移项目日益增长的重要性、有用之处和最佳部署选项,其中包括相关案例研究。
MDM 对数据迁移为何至关重要每个新系统均需要数据来促进活动的启动。
大多数新系统需要若干数据。
如今,除了通过邮局地址文件等外部源丰富新系统以外,我们正在将大量遗留源中的数据迁移至新系统。
Informatica 数据迁移工具套件将部署一整套技术和最佳实践流程,旨在解决当今数据迁移场景中涌现的一系列挑战。
但首先,我们一起来看看市场背景。
尽管目标系统可能会涵盖各种功能,但数据源就好比是烟囱式解决方案,每一款解决方案均围绕不同的业务流程、不同的业务领域而设计。
Informatica product overview

清洗
Validate, correct and standardize all data types
集成
Transform and reconcile all data types
分发
Provide right data, at the right time, in the right format
• 无法得到 360度统一客户视 图
• 延迟CRM项目的实施过程 • 降低客户满意度
• 降低用户生产效率和利用率
• 增加客户的交互(通讯、市 场)成本
•
• 无法准确理解客户的利润度
• 无法广泛、合理定义客户营 销策略,限制了收入的增长 机会
•
• 结果丢失收入(例如: 计费错 误)
“据 PWC 估计,全球 500 强的企业中,有 90% 的企业在数据管理方面存在缺陷
6
Informatica解决方案:提供统一的数据服务平台
Improve Decisions & Regulatory Compliance Modernize Business & Reduce IT Costs
业务 驱动 IT 驱动
Merge & Acquire
Increase Business Profitability
7
Informatica 产品平台及 贯穿整个数据生命周期的完整方法论
监督,观察,报告
确保数据一致,提供影响分析与持续的数据质量监控
Data Profiling
Data Quality
访问
Any system in batch or real-time
探查
Search and profile any data from any source
Informatica数据集成产品介绍

元数据共享
• Informatica的局部和全局的元数据库 (Local and global metadata repository) 可以注册各部门级数据市场的信息并可动 态将部门级数据市场与其它分布式信息存 储连接起来,从而可以得到全企业的统一 的数据仓库元数据视角。
PowerCenter与数据仓库系统
产品结构
• • • • • Informatica Server Workflow Manager , monitor Informatica Repository Server Repository Manager Designer
Informatica Server
• 数据集成引擎 • 支持各种操作平台,各种源、目标数据库
Designer
• • • • • • • 可视化设计环境 版本管理 丰富的转换函数 支持复杂条件选择 支持数据驱动的合并 直接支持SCD(慢速变化维) 调试工具
– 提供数据采样、断点、查询中间结果等功能
世界级客户
金融/服务业 制造业/高科技 通信业 保险业 医药
使用Informatica系统的企业
收入增长
200 160
2000 – 2001 的增长率: 30% $152
$197
120
80
$62.4 $30.3
40
$2.1
0 1996
$12.7
1997 1998 1999 2000 2001
Informatica的客户状况
• 100强的60%是Informatica的客户 • 道琼斯工业平均指数的63% • 世界500强
– – – – – 所有顶尖的娱乐集团 15家最大的电信集团,有12家是Informatica的客户 10家最大的金融服务/银行集团,有8家是Informatica的客户 15家顶级的公用事业/能源集团,有11家是Informatica的客户 10家最大的保险集团,有8家是Informatica的客户
Informatica数据隐私管理说明书

Key Benefits• Protection and monitoring of personal and sensitive data to fuel data-driven digital transformation and support for privacy and compliance efforts• Centralized visibility across data platforms and types, providing the support needed for today’s complex environments• Continuous risk analysis of personal and sensitive data,to prioritize resources and investments across functional, geographic, and line of business views• AI-driven detection to uncover high-risk, anomalous data usage • A single view of data subjects’ information to provide identity capabilities (rights and consents requests) required for GDPR, CCPA and other privacy legislation• Automated orchestration and protection with sensitive data intelligence remediates privacy and security risks Metadata-driven Intelligence and Automation to Operationalize PrivacyInformatica® Data Privacy Management helps you discover, classify, analyze, protect and monitor personal and sensitive data across your organization. It leverages artificial intelligence (AI) to deliver actionable data discovery and classification, risk scoring, data subject identity capabilities, behavioral analytics, and automated protection in a single solution. It supports structured, semi-structured and unstructured data in the cloud, on premises, in big data stores, and in relational and mainframe systems.Informatica Data Privacy Management helps you prioritize data protection and privacy investments, policies, processes, and programs:• Discover and classify your sensitive data: Gain global visibility into personal and sensitive data across the enterprise with data classification, discovery, proliferation and process analysis, user access, and activity correlation.• Map individual identities to sensitive data: Understand sensitive data by individual identities and quickly locate an individual’s sensitive data to support privacy requests.• Analyze and monitor privacy risk: Track data risk and remediation of misuse and privacy violations based on multiple factors, customize to your organization’s needs, and identify top risk areas based on privacy regulation requirements. Risk simulation helps you understand the impact of data controls before implementation.• Continuously monitor data movement, access, and user activity: Leverage analytics to detect suspicious or unauthorized data access by continuously correlating, baselining, analyzing, and alerting on high-risk conditions and potential anomalous behaviors that threaten sensitive data.• Protect personal and sensitive data and remediate risk: Automate the orchestration of data security controls to protect data at rest and in use, prevent unauthorized access, and de-identify/anonymize/pseudonymize sensitive data. Initiate remediation workflows with custom scripting, automated email notifications of security policy violations, ServiceNow integration, andout-of-the-box third-party protection integration.Data SheetKey FeaturesDiscover and Classify Sensitive Data• Discover, classify and analyze the risk of sensitive and personal data across the enterprise—in structured data across traditional relational databases, including mainframes; semi-structured and unstructured data in environments such as Hadoop repositories, Amazon S3; file mounts (e.g., CIFS); and SharePoint.• Attain complete sensitive data visibility with dashboards and drill-downs to identify functional and organizational information such as department, application, user, and data storage types.• Gain a complete understanding of data, its movement, and its usage in business processes with proliferation tracking and interactive visualizations—both inside and outside the enterprise and between partner and client organizations.Figure 1. Informatica Data Privacy Management provides 360-degree visibility of sensitive data through its dashboard.Support Regulatory Compliance• Accelerate and continuously measure regulated privacy data compliance with risk scoring based on customizable factors, including data sensitivity, volume, protection, proliferation, location, and user activity.• Apply a combination of data domains to define GDPR, CCPA, PII, PHI, and PCI risks relevantto policies, laws, and regulations.• Leverage subject registry for a single view of data subjects across structured and unstructured data. Provide automated matching and linking of data subjects’ records for privacy legislation compliance and to support the execution and management of subject rights and consent requests.• Enforce compliance with automated remediation, stakeholder notification, continuous monitoring of user behavior and sensitive data proliferation across data stores and geographic locations.About InformaticaDigital transformationchanges expectations: betterservice, faster delivery, withless cost. Businesses musttransform to stay relevantand data holds the answers.As the world’s leader inEnterprise Cloud DataManagement, we’re preparedto help you intelligently lead—in any sector, category, orniche. Informatica providesyou with the foresight tobecome more agile, realizenew growth opportunities, orcreate new inventions. With100% focus on everythingdata, we offer the versatilityneeded to succeed.We invite you to exploreall that Informatica hasto offer—and unleash thepower of data to drive your next intelligent disruption.Worldwide Headquarters 2100 Seaport Blvd., Redwood City, CA 94063, USA Phone: 650.385.5000, Toll-free in the US: 1.800.653.3871IN06_1120_03836© Copyright Informatica LLC 2020. Informatica and the Informatica logo are trademarks or registered trademarks of Informatica LLC in the United States and other countries. A current list of Informatica Protect Personal and Sensitive Data • Identify critical data protection priorities and create plans to support privacy by design objectives.• Protect sensitive data with automated remediation that leverages integrated Informatica Dynamic Data Masking, Persistent Data Masking, and third-party protection methods such as Hortonworks Ranger and Cloudera Sentry.• Integrate with custom scripts, email notifications, system log messages, or ServiceNow tickets. Configure these actions to run when triggered by security policy violations or run them manually when potential risks are detected.For more information, visit the Data Privacy Management Product Page。
Informatica主数据管理提升企业业务价值

Informatica主数据管理提升企业业务价值作者:暂无来源:《中国金融电脑》 2016年第6期日前,在Forrester Research 发布的调研报告中,Informatica MDM在包括数据治理、数据探查和监控、数据质量、大数据部署、集成和处理、安全性以及市场占有率等在内的20个评测标准中获得了最高分。
而在Gartner 发布的《2015 年客户数据解决方案主数据管理魔力象限报告》中,Informatica 也凭借强大的“多领域能力”和“对智能数据平台的投资”连续6 年位居领导者象限。
谈到Informatica 在主数据领域取得的成就,Informatica 公司大中国区首席产品顾问但彬指出,Informatica 作为全球领先的独立软件提供商,始终将“提升数据价值,降低IT 成本,达成业务使命”作为企业价值定位。
Informatica 提供了完整的数据治理解决方案,包括数据获取、清洗、转换、匹配、融合、治理、安全以及交付,几乎涵盖了将大数据转换为商业价值的所有重要功能。
尽管在人们眼中Informatica 是一家技术性质非常强的企业,事实上,其对行业的发展趋势也颇为关注,更希望通过提供“ 技术+ 行业” 的解决方案,助力企业业务转型、创新发展。
有效串联各类散乱的数据Informatica 的MDM 工具经过不断提升,现在已经可以满足后端数据编制和主数据联合需求,而角色友好的UI 则可用于管理,企业用户有望获得跨机构和领域的企业级探查、监控、处理、数据质量、BPM 和数据集成功能,更详细地分析、了解和利用对其业务最为重要的人员、地点和事物之间的关系。
多域MDM 平台外,Informatica还提供了能够在关键业务流程中推动革命性创新方法的由主数据驱动的4 种应用: Product 360、Supplier 360、Customer 360 和适用于Salesforce 的Cloud Customer360,提供了一个类似CRM 的环境,集成地体现一个完整的数据视图,各行业用户都可利用成熟的工具实现满足自身需求的应用。
informatica工作原理 -回复

informatica工作原理-回复Informatica工作原理: 实现数据集成、数据质量和数据管理的关键技术引言:在当今数字化时代,数据成为了企业决策和战略规划的问题。
然而,大量分散在不同系统和数据源中的数据给企业数据分析和管理带来了很大挑战。
为了解决这些问题,许多组织都转向了数据集成和数据管理解决方案。
而其中的佼佼者就是Informatica。
在本文中,我们将深入探讨Informatica工作原理,了解它如何实现高效的数据集成、数据质量和数据管理。
第一部分:数据集成数据集成是将分散在不同数据源中的数据整合在一起,以获得一致、可信的数据视图的过程。
Informatica通过以下步骤实现数据集成:1. 数据源连接:Informatica可以连接到各种数据源,包括数据库、文件、应用程序和云端存储。
它使用统一的接口和驱动程序来实现连接,并建立与数据源之间的通信。
2. 数据提取:Informatica从不同的数据源中提取数据。
这可以通过读取数据库表、文件或执行Web服务调用来实现。
数据提取是通过查询或API 调用来完成的,并将数据保存在Informatica的数据集成引擎中。
3. 数据转换:在数据提取后,Informatica对数据进行转换和清洗,以确保数据的一致性和准确性。
数据转换可以包括数据格式转换、数据清洗、数据合并、数据筛选等操作。
4. 数据加载:一旦数据经过转换和清洗,Informatica将数据加载到目标系统中。
这可以是目标数据库、文件、数据仓库或其他应用程序。
第二部分:数据质量数据质量是确保数据准确性、一致性和完整性的一项关键任务。
Informatica通过以下方式确保数据质量:1. 数据校验:Informatica对数据进行校验,以确保数据的准确性和一致性。
它可以检查数据的完整性、有效性和规范性,并根据预定义的规则和逻辑对数据进行验证。
2. 数据清洗:Informatica清洗数据以去除重复项、缺失值和错误数据。
Informatica主数据管理解决方案精品课件(一)

Informatica主数据管理解决方案精品课件(一)Informatica主数据管理解决方案是一个全面的数据治理解决方案,可以帮助企业更好地管理其不同应用程序中的数据,并提高数据质量。
本课件将向您详细介绍Informatica主数据管理解决方案的基本组成部分,以及如何使用该解决方案来解决数字化转型的挑战。
第一部分:解决方案概述1.1 Informatica主数据管理解决方案的基本概念1.2 该解决方案如何帮助企业处理数据问题1.3 解决方案的主要好处第二部分:解决方案组成2.1 数据模型2.2 数据集成2.3 数据质量2.4 数据分析和报告2.5 安全和合规性第三部分:数据模型3.1 模型的构建3.2 属性定义和管理3.3 数据元素和数据域3.4 属性视图和观点3.5 数据管理第四部分:数据集成4.1 数据同步4.2 数据转换和规范化4.3 数据协调4.4 数据质量表现第五部分:数据质量5.1 数据质量度量和指标5.2 数据质量规则和验证5.3 数据质量监控和报告5.4 数据清理和修正第六部分:数据分析和报告6.1 数据仪表盘和报表6.2 数据可视化和探索6.3 高级数据分析6.4 数据敏感性和保护第七部分:安全和合规性7.1 数据访问和控制7.2 数据保护和加密7.3 合规性和审计7.4 政策管理和执行第八部分:解决方案实现8.1 解决方案建设8.2 项目规划和管理8.3 解决方案评估和验证8.4 解决方案部署和维护结论:通过这个课件,您可以了解Informatica主数据管理解决方案的主要组成部分、优势和应用场景。
这个解决方案可以帮助您改善您的数据管理,提高数据质量,优化数据利用,设立数据规则,并保证数据的安全性和合规性,最终实现企业的数字化转型。
六步法:Informatica数据质量控制方法

六步法:Informatica数据质量控制方法第一篇:六步法:Informatica 数据质量控制方法Informatica 数据质量控制方法一个战略性和系统性的方法能帮助企业正确研究企业的数据质量项目,业务部门与IT 部门的相关人员将各自具有明确角色和责任,配备正确的技术和工具,以应对数据质量控制的挑战。
Informatica 的六步法为帮助指导数据质量控制而设计,从初始的数据探查到持续监测以及持续进行的数据优化。
业务部门与IT 部门的数据使用者—业务分析师、数据管理员、IT 开发人员和管理员,能够在六个步骤的每一步中协同使用Informatica 数据质量解决方案;并在整个扩展型企业的所有数据领域和应用程序中嵌入数据质量控制。
步骤一:探查数据内容、结构和异常第一步是探查数据以发现和评估数据的内容、结构和异常。
通过探查,可以识别数据的优势和弱势,帮助企业确定项目计划。
一个关键目标就是明确指出数据错误和问题,例如将会给业务流程带来威胁的不一致和冗余。
步骤二:建立数据质量度量并明确目标Informatica的数据质量解决方案为业务人员和IT人员提供了一个共同的平台建立和完善度量标准,用户可以在数据质量记分卡中跟踪度量标准的达标情况,并通过电子邮件发送URL来与相关人员随时进行共享。
步骤三:设计和实施数据质量业务规则明确企业的数据质量规则,即,可重复使用的业务逻辑,管理如何清洗数据和解析用于支持目标应用字段和数据。
业务部门和IT部门通过使用基于角色的功能,一同设计、测试、完善和实施数据质量业务规则,以达成最好的结果。
步骤四:将数据质量规则构建到数据集成过程中Informatica Data Quality支持普遍深入的数据质量控制,使用户可以从扩展型企业中的任何位置跨任何数量的应用程序、在一个基于服务的架构中作为一项服务来执行业务规则。
数据质量服务由可集中管理、独立于应用程序并可重复使用的业务规则构成,可用来执行探查、清洗、标准化、名称与地址匹配以及监测。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
案例 Data Quality Framework
KPI Calculation And Aggregation Model (CAAM)
Master Data Quality KPI%
Incompleteor duplicateor ObsoleteorInconsistnetrecords MasterDataRecords- Incompleteor duplicateor ObsoleteorInconsistnetrecords InaccuracyRatio
• 预定义数据模型
• 预定义的业务逻辑和工作流程
• 预定义的用户界面/接口
• 解决不同领域业务问题
• 可用统一的平台扩展到解决其他业务问 题和领域
• 解决特定领域的业务问题 • 扩展到其他业务领域需要购买新的应用
课件
Informatica MDM 简介
经验证的多域主数据方案
Informatica MDM 提供产品、客户、账户等关键数据的 统一视图,快速低成本提升业务运营、客户体验、以及
跨越多行业的客户解决方案 (25+ solutions)
部署情况
大量案例证明在多域主数据部署的 能力
快速部署 平均上线时间: 3-9 个月 最具伸缩性解决方案 最大 450M 主
记录数的成功案例
可验证的多域主数据 几乎一半的客 户都在统一平台上部署了客户和产品域
课件
平台需要的能力
5
数据发布
为应用和数据仓库交付可信的数 据
课件
量化质量,跟踪监控
基于web的积分卡便于共享
基于Web格式的记分卡 是你能够:
查看和共享数据质量记分 卡
下钻到具体数据
制定策略,降低对业务的 影响
数据主管 业务经理
简单易用,不需要任何专业技术
课件
Data Quality 可提供每个实体对象记分卡及监控
纳税人 税金 发票 出口退税
规则
课件
DQA - 业务人员可手工管理不良数据
课件
集团企业数据利用的发展与挑战
• 不同的系统管理各种业
务流程
• 走向精细化协同管理
投资管理
• 利用数据仓库汇集数据
• 但是企业内外协同受信
息流现状的制约
• 面临的问题
• 数据标准
• 数据质量 • 管控流程 • ……
Account Organization
Sales Rep
客户服务
Partner Organization
Diving watch with Watch attrib and Diving
Equip课m件ent attrib
共同参与数据质量工作
数据经理 业务主管
数据 管理人员
记分卡 基于WEB 客户端
1. 分析
IT 开发人员
5. 数据质量报告与 跟踪
数据质量
4. 部署数据质量计 划
2. 确定数据质量规则 和目标
课件
主数据管理的不同实现路径
平台级 MDM
客户
产品
COA
根据客户的特 有需求进行配 置,使用不同
客户需求
• 灵活的数据模型 • 可定制的业务逻辑和工作流程 • 可配置的用户界面/接口
COA Product Customer
应用级 MDM
预置的应用以 解决特定的主
数据问题 (customer,
product, financial)
PIM 样例
“liquid”+”crystal”+”dis play” =
1 concept
Comprehensive data quality
解析 清洗,标准化 匹配, 剔重
从非结构化的数据 构建
结构化数据
Addr = #, street, city, state, zip, country;
识别、纠正数据错误; 将数据转化成标准格
式/术语
Bill = William St, Str = Street
(ENU/DEU) St = Saint (FRA)
Camera = manufacturer, mega
pixels, zoom, and color
Woodd=wood=wud Paper weight:
100g i.s.o. 100kg
统一主数据管理平台方案
但彬 Informatica 中国
Informatica 专注于数据集成的独立软件开发商
• 成立时间: 1993
$900
• 2012年收入为: 8.116亿美元
$800
• 7年平均增长率:每年17%
$700
• 员工人数: 2,810多人
$600
• 合作伙伴: 450多家
$500
产品支持: •Informatica Data Profile
课件
数据清洗
3
数据清洗 Data Quality
产品支持: •Informatica Data Quality •AddressDoctor
关键需求: • 数据清洗 • 数据丰富 • 地址标准化 • 数据监控和报告 • 基于SOA 访问DQ规则 • 根据条件的格式 • 校验规则 • 数据变化,去噪,转换 • 开放式清洗架构
合并 管理
重复 识别
模型 管理
Ora数据仓库 运行、生产、销售
TD数据仓库
客户/市场
2 数据探索
3 数据质量
运营支撑
5
数
据
发 布
分析决策
服
务
仪表板
数据集市
分析报表 课件
数据获取
1
数据集成 Data Integration
关键需求: • 在任意的源和目标数据之间进行数
据访问和发布 • 各种数据格式,各种地方 • 不同的延迟需求 (批量, 实时, 消息队列) • 高性能和高可用 • 支持不同MDM部署风格 • 元数据可视化
完整性 COMPLETENESS
合法性 CONFORMITY
一致性 CONSISTENCY
重复性
关联性
DUPLICATION INTEGRITY
准确性
值域划分
\ACCURACY RANGE
课件
数据质量功能一览
特性 剖析
功能
从非结构化的模式推 演数据的含义
CDI 样例
姓名: 姓+名字 (CHS,KOR,JPN); FN+MN+PN+LN (Latin);
4
数据管理
管理统一、可信、真实的主数据
3
数据清洗
数据清洗和标准化
2
数据探索
剖析、发现数据内容、一致性、数据结构
1
数据获取
从不同的应用和数据源访问、获取数据
课件
ESB
ODS
ESB
统一客户数据平台架构
业务应用
1
遗留数据
企 业
数
据
集
成
平
台
社交媒体 和第三方数据
4
数据管理平台
主数据管理
数据 管控
数据 关联
3. 制定质量提高计划
课件
使用Analyst对数据进行全方位的剖析
Data Steward
使业务人员参与数据分析工作,提高生产力和工作效率,降低IT 人员的依赖性
课件
使用Developer开发具体任务
图形化界面,功能强大,操作简单
课件
流间分析
在处理流程中任意位置进行分析
剖析数据源
剖析处理单元
剖析规则
Product
财务管理
决策支持 人力资源
企业数据仓库
企业数据集成
集团
产业 集团
Account Pricing
Product Organization
Account
Account Zone
Services
课件
从主数据入手,提升主数据质量,是业务管控的基础
• 主数据的重要性——大多数的数据质量问题是主数据问题 • 使治理目标和范围明确 • 主数据系统使咨询内容落地
识别和消除 重复数据
Haidong Song = 宋海东=
2 products in different languages are in fact
the same item
数据丰富
增加附加的属性 和分类
Haidong Song: “single, 1 child, Summit Estate,
DoNot Mail”
金融客户
意外
储蓄
机票
积分
航空客户
健康 养老
业务经理
支付 助学
保险代理
孩子
父母 客户
航段
企业
航空
网上业务 离港
住宅
收件
物流客户
物流
配偶 旅行代理
发件
酒店
客服
票务
旅业客户
课件
企业集团主数据平台集中管理各类主数据
投资管理
客户服务
财务管理
社交媒体
Organizatio n
Acct Rep MDM Account
产品支持: •Informatica PowerCenter •Informatica PowerExchange •Informatica B2B Exchange
课件
数据探索
2
数据探索 Data Profiling
关键需求:
• 发现和记录数据中的所有异常
• 将问题进行分类(完备性、遵从性、 一致性、准确性、唯一性、依赖性)
• 主要的系统集成商、独立软件供