Informatica数据集成产品介绍
Informatica PowerCenter

Informatica PowerCenter 高可扩展性与高性能的企业数据集成标准确立企业数据集成标准Informatica® PowerCenter® 为具备高可扩展性与高性能的企业数据集成软件确立了标准。
PowerCenter 可使您的 IT 组织能够通过单一方式访问、转换和传输数据,无需任何手动编码。
该软件的高可扩展性能可以支持海量数据并满足企业对安全和性能的需求。
PowerCenter 可作为所有企业集成方案的数据集成基础,包括数据仓库、数据治理、数据迁移、面向服务的体系架构 (SOA)、B2B 数据交换以及主数据管理 (MDM)。
•在正确的时间提供正确信息,让业务部门拥有其所需的及时、相关和可信的数据与报告,以便制定更准确、更及时的业务决策 •经济高效地进行扩展,以满足增长的数据需求,节约硬件成本,并降低与数据停机相关的成本和风险 •让开发人员、分析师和管理员团队能够更快更好地协作,共享和重复利用工作成果,以加快项目的交付速度“在我们这一行,至关重要的是能够抢先取得竞争优势和研究项目的投资回报。
不断增长的竞争只会进一步强调这一点,让你更容易理解‘时间就是金钱’这句话的含义。
在此艰难的环境下,Informatica [PowerCenter ] 为进行日常报告助了一臂之力,从而保证我们的团队具备最优的响应度和效率。
”– Alain Afios ,数据处理主管 研发部门,AventisBBVA Compass 是一家金融机构,在世界各地拥有 748 间分行。
该银行必须有效地检测、调查和报告可疑的洗钱活动,以符合国家和国际法规、指令及最佳实践的要求。
同时,该银行也需要降低合规成本。
BBVA Compass 依赖于 PowerCenter 来集成 17 个跨企业的数据源,其中包括拥有不同格式、结构和延迟性的贷款、信用卡、账户及在线银行交易数据。
PowerCenter 提供了金融活动与客户风险的全面视图。
informatica中常用各组件的功能

目录未找到目录项。
Informatica 数据整合分为三类数据集成,即下游集成、中游集成和上游集成下游集成:指数据仓库,显著特点是,从数据流的角度看,数据仓库的主体功能是所有应用系统的下游,所有数据都会流向数据仓库中游集成:指数据交换平台,特点是,任何平台和它的关系都是对等的,它是这个数据枢纽hub的中心点,用来支持所有系统之间数据的数据交换,用于解决数据集成毛团问题。
上游集成:指主数据平台,而且是交易型主数据平台。
用于管理企业核心数据的黄金记录,作为企业核心记录的黄金数据的标准平台。
Informatica 的四个客户端及作用:1,Repository Manager:用于管理Repository本身,如创建文件夹,导入/导出Mapping、Worlkfolw,版本管理,部署,Repository的清除。
2,Designer:用于导入ETL元数据,开发ETL程序。
在Power Center中ETL程序被叫做Mapping,即源到目标的映射。
3,Workflow Manager:用于对Mapping的进行数据源、数据目标、使用的字符集、调优及参数配置等,使Mapping能够运行。
此外,还提供了基本的调度和排程的能力。
4,Workflow Monitor:用于监控运行时的Workflow和session,监控ETL运行是否正常、执行效率及异常时的错误信息。
Power Center的开发过程:0,使用PowerCenter客户端连接域(Domian)和数据库服务器Repository Service;建立一个文件夹(Folder),用于开发学习;1,在客户端PowerCenter Designer中导入源表和目标表的结构定义;注:在Power Center Designer中导入的仅仅是表结构,与执行过程的表名无强相关2,在Designer中,创建Mapping(ETL流程)3,在Designer中,拖动源和目标,以及相应组件进入Mapping4,在Designer中,建立源和目标,以及相应组件之间的映射5,在Workflow Manager中提供相应的配置信息及参数6,通过Workflow Monitor客户端进行监控7,预览执行结果重要概念:Mapping:是一个程序,但它不直接可以执行Session:是一个Mapping的实例,指定相关的配置信息后,可以执行;Workflow:可以执行一个或者多个Session,对Session或者其他Task组件进行排程基础组件:1,Source:源文件数据源可以是数据库表,文本文件,XML文件,SAP等,应用系统、Hadoop,MQ等源文件常用方法:手工创建,通过数据库、文本文件、样例文件导入注意:理论上,源表结构定义继承了数据库中表的定义,但是实践中有可能导入后的数据类型发生变化,如表中varchar2,而导入后变为nvarchar2,从而引起Session执行异常。
Informatica主数据管理解决方案

市场影响力
跨越多行业的平台级解决方案 (Financial Services, Life Sciences,
High Tech …)
超过 50% 的财富 500 企业和全球 500 强企业
Merrill Lynch, Deutsche Bank, Johnson & Johnson, Pfizer, Apple, Kodak, Cadbury, …
Account Organization
Sales Rep
客户服务
财务管理
决策支持 人力资源
企业数据仓库
企业数据集成
集团
产业 集团
Partner Organization
Product
Account Pricing
Product Organization
Account
Account Zone
Services
完整的主数据视图
不同主数据是业务的 不同视角: • 客户角度
• 产品、服务 • 机构 • 资源 • 产品角度 • 客户 • 资源 • 机构 • 供应商角度 • 产品 • 机构角度 • 产品 • 客户 • 资源 • 资源角度 • 机构 • 产品 • 客户
金融客户
意外
储蓄
机票积分航空客户 Nhomakorabea健康 养老
业务经理
•Informatica PowerExchange
•Informatica B2B Exchange
Content Embargo Until June 4th, 2013 at 5:00pm PST
16
数据探索
2
数据探索 Data Profiling
关键需求:
informatica中常用各组件的功能

informatica中常用各组件的功能目录未找到目录项。
Informatica 数据整合分为三类数据集成,即下游集成、中游集成和上游集成下游集成:指数据仓库,显著特点是,从数据流的角度看,数据仓库的主体功能是所有应用系统的下游,所有数据都会流向数据仓库中游集成:指数据交换平台,特点是,任何平台和它的关系都是对等的,它是这个数据枢纽hub的中心点,用来支持所有系统之间数据的数据交换,用于解决数据集成毛团问题。
上游集成:指主数据平台,而且是交易型主数据平台。
用于管理企业核心数据的黄金记录,作为企业核心记录的黄金数据的标准平台。
Informatica 的四个客户端及作用:1,Repository Manager:用于管理Repository本身,如创建文件夹,导入/导出Mapping、Worlkfolw,版本管理,部署,Repository的清除。
2,Designer:用于导入ETL元数据,开发ETL程序。
在Power Center中ETL程序被叫做Mapping,即源到目标的映射。
3,Workflow Manager:用于对Mapping的进行数据源、数据目标、使用的字符集、调优及参数配置等,使Mapping能够运行。
此外,还提供了基本的调度和排程的能力。
4,Workflow Monitor:用于监控运行时的Workflow和session,监控ETL运行是否正常、执行效率及异常时的错误信息。
Power Center的开发过程:0,使用PowerCenter客户端连接域(Domian)和数据库服务器Repository Service;建立一个文件夹(Folder),用于开发学习;1,在客户端PowerCenter Designer中导入源表和目标表的结构定义;注:在Power Center Designer中导入的仅仅是表结构,与执行过程的表名无强相关2,在Designer中,创建Mapping(ETL流程)3,在Designer中,拖动源和目标,以及相应组件进入Mapping 4,在Designer中,建立源和目标,以及相应组件之间的映射5,在Workflow Manager中提供相应的配置信息及参数6,通过Workflow Monitor客户端进行监控7,预览执行结果重要概念:Mapping:是一个程序,但它不直接可以执行Session:是一个Mapping的实例,指定相关的配置信息后,可以执行;Workflow:可以执行一个或者多个Session,对Session或者其他Task组件进行排程基础组件:1,Source:源文件数据源可以是数据库表,文本文件,XML文件,SAP等,应用系统、Hadoop,MQ等源文件常用方法:手工创建,通过数据库、文本文件、样例文件导入注意:理论上,源表结构定义继承了数据库中表的定义,但是实践中有可能导入后的数据类型发生变化,如表中varchar2,而导入后变为nvarchar2,从而引起Session执行异常。
Informatica_(3)组件

Informatica_(3)组件⼀、Informatica介绍Informatica PowerCenter 是Informatica公司开发的世界级的企业数据集成平台,也是业界领先的ETL⼯具。
Informatica PowerCenter使⽤户能够⽅便地从异构的已有系统和数据源中抽取数据,⽤来建⽴、部署、管理企业的数据仓库,从⽽帮助企业做出快速、正确的决策。
此产品为满⾜企业级要求⽽设计,可以提供企业部门的数据和电⼦商务数据源之间的集成,如XML,⽹站⽇志,关系型数据,主机和遗留系统等数据源。
此平台性能可以满⾜企业分析最严格的要求。
Informatica PowerCenter已被全球多家著名企业⽤来建设BI/DW系统,它可集成和分析企业的关键商务信息,优化整个商务价值链的表现和响应速度。
Informatica PowerCenter拥有⼀个功能强⼤的数据整合引擎,所有的数据抽取、转换、装载的功能都是在内存中执⾏的,不需要开发者⼿⼯编写这些过程的代码。
Informatica PowerCenter 数据整合引擎是元数据驱动的,通过知识库和引擎的配对管理,可以保证数据整合过程能够最优化执⾏,并且使数据仓库管理员⽐较容易对系统进⾏分析管理,从⽽适应⽇益增加的数据装载和⽤户群。
⼆、informatica开发步骤:定义源: Desinger定义⽬标: Desinger创建映射: 源--》转换组件--》⽬标Mapping都是由源表、转换组件和⽬标表组成,⽤于描述数据抽取的过程。
源表和⽬标表可以从源和⽬标⽂件夹拖拽到⼯作区,转换组件需要⼿动创建。
Mapping设计的关键就是转换组件的使⽤,这关系到数据抽取的正确性和效率。
定义任务: Workflow Manager创建⼯作流: Workflow Manager⼯作流调度监控 : Workflow Monitor三、转换组件1. 组件列表Source Qualifier 从数据源读取数据Expression ⾏级转换Filter 数据过滤Sorter 数据排序Router 条件分发joiner 异构数据关联连接Lookup 查询连接Aggregator 聚合Update Strategy 对⽬标编辑(insert\update\delete\reject)Union 数据合并Sequence Generator 序列号⽣成器Normalizer 记录规范化Rank 对记录进⾏TOPxTransaction Control 对装载数据按条件进⾏事物控制Stored Procedure 存储过程组件Custom ⽤户⾃定义组件HTTP WWW组件Java Java⾃编程组件其它应⽤组件2. 组件类型Passive类型:流⼊流出组件的⾏数不发⽣变化,如:Expression、Lookup、HTTP组件。
informatica产品选配说明

1. PowerCenter引擎 PowerCenter SE基础 2.PowerCenter无限制开发工具、工作流、监控工具 包 3.PowerCenter知识库管理引擎
2
数据专用接口
通过不同专用的数据接口,PowerCenter可以连接几乎 所有的主流数据类型,包括数据库(Oracle、DB2、 SQLServer、Sybase、Informix、Teradata、Natezza 、GreenPlum等),应用程序(SAP ERP、SAP BW、 Oracle E-biz、peoplesoft、Siebel、SAS、Essbase 等),Web Service、MQ/MSMQ等等,以及大数据接口 (如HDFS、Hive、Hbase等)。实现数据的读取与装载
7
元数据管理选项
产品选配说明 必选。1、每台服务器必须 已2C的倍数选配(例如: 2C/4C/6C/8C等)。2、如要 做集群功能规避单机风险, 必须最少部署两台服务器, 否则无法实现集群功能。3 、如是多台服务器,每台服 务器部署的数量必须1:1相 等。 1、数据库接口、大数据接 口只按照类型不同选配确定 数量。不按照同一个品牌的 库的个数选取。(例如:本 地现有Oracle数据库3个、 DB2数据库3个,那么最终选 取数据接口Oracle*1、 DB2*1)。2、应用程序所选 配的每个类型的个数与拥有 的(以前已经采购过的+现 在准备扩容的) PowerCenter SE的数量1:1 对应。3、注意:数据库和 大数据的类型价格一样,而 应用程序和其他接口价格不 一样
该功能模块选配数量必须与拥 有的(以前已经采购过的+现 在准备扩容的)PowerCenter SE的数量1:1对应。 该功能模块选配数量必须与拥 有的(以前已经采购过的+现 在准备扩容的)PowerCenter SE的数量1:1对应。
Informatica_PowerCenter交流(ETL)

等待时间缩短 75%,产量提高 5 倍,同时硬件 成本降低 50%。
8
Informatica为企业传递信息价值
提升监控 流动人口和 突发事件的能力
加速业务流程 提高决策分析
数据集中共享 与清算
数据集成 提升宏观经济 分析能力,辅助 国家监管及决策
数据大集中 加速业务流程 提高服务能力 及风险监管
BPM/Workflow (human interaction)
Orchestration (process integration)
Business Services
Events
Identity & Access Management
EJB
SOAP
HTTP
JMS
~ Real-time ~
Authentication
Bulk & Message Processing
Data Access
R/W
DB Transaction
Capture
Data Quality Certification
Data Transformation
Format Conversion
Data Traceability
Data Encryption & Masking
使命:让数据为企业的 创新提供强大动力服务
• 客户满意度:TNS 在2010 年度数据集成客户满意度调查中,Informatica 连续第 5 年获得最高
评价;Gartner 2011年报告调查中,Informatica分别在客户支持和技术支持的总体质量方面得到 了迄今为止的最高分。此外,在接受调查的 Informatica 客户中,84% 认可 Informatica 是技术领 导者,超过 90% 的客户指出 Informatica 的技术方向与他们的长期 IT 战略一致
informatica repository table -回复

informatica repository table -回复主题: Informatica Repository表引言:Informatica Repository是一个关键的组件,它存储了Informatica PowerCenter工具的所有元数据信息。
Informatica是一种数据集成工具,用于在不同的应用程序、数据库和系统之间传输和转化数据。
Repository 表是Informatica Repository数据库中用于存储这些元数据信息的表格。
本文将分步回答关于Informatica Repository表的一些问题。
第一部分:Informatica Repository表的基本概述1. Informatica Repository是什么?InformaticaRepository是一个中心化的元数据存储库,用于管理和存储Informatica PowerCenter工具所需的所有元数据信息。
2. 什么是元数据?元数据是描述数据的数据。
在Informatica Repository中,元数据包含了有关源和目标的连接信息、转换逻辑和配置设置等。
3. 为什么需要Informatica Repository表?Informatica Repository表用于存储Informatica工具中的各种元数据,包括源和目标连接信息、转换逻辑和任务配置等。
这些表提供了访问和管理这些元数据的结构和方法。
第二部分:Informatica Repository表的结构和功能1. Informatica Repository表有哪些主要组成部分?Informatica Repository表大致可分为以下几个主要组成部分:- 源和目标连接信息表:用于存储与数据源和数据目标的连接相关的信息,例如数据库的连接字符串、用户名和密码等。
- 转换逻辑表:用于存储ETL转换过程中的逻辑信息,例如数据映射、过滤条件和转换规则等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
产品结构
• • • • • Informatica Server Workflow Manager , monitor Informatica Repository Server Repository Manager Designer
Informatica Server
• 数据集成引擎 • 支持各种操作平台,各种源、目标数据库
• 允许企业将电子商务数据源(XML)与传统数据 源(ERP,CRM, 等)集成起来,以进行更加广泛 的业务分析。对数据源分析可通过DTD或XML模 型来直接解析XML数据。 • 元数据共享 • Informatica的局部和全局的元数据库(Local and global metadata repository)可以注册各部门级 数据市场的信息并可动态将部门级数据市场与其 它分布式信息存储连接起来,从而可以得到全企 业的统一的数据仓库元数据视角。
• 世界1000强
– 10家最大的制造商,有7家是Informatica的客户
• 政府部门
– 13家最大的医药集团,有11家是Informatica的客户 – 美国海陆空三军所有的4个分支(陆军、空军和海军)
2001/2000年数据仓库/分析行 业的许可证收入的增长
• INFA = Informatica • BOBJ = 业务目标 • ASCL = Ascential • BRIO = Brio • HYSL = Hyperion • SGNT = Sagent
Informatica Repository Server
• 全局元数据管理 • 全局元数据共享
– 支持发布、链接
• 元数据交换支持各种设计、前端工具
– Brio,BO,Cognos,Hyperion,Microsoft,MicroStra tegy,Peoplesoft,Seagate Software…
企业级可扩展性和可伸缩性
• Informatica PowerCenter 6可单独实施或可以作 为Informatica PowerCenter 6 Data Integration Hub(DIH)实施,成为企业相关数据转换的核心 集成引擎。Informatica PowerCenter 6 DIH可以 协调和管理多个利用Informatica PowerMart 6建 立的主题数据市场。 • 将杰出的可扩展性和性能相结合,Informatica PowerCenter 6可以访问多种商业数据源。通过 其增强的性能、改善的可伸缩性、及新的并行数 据抽取性能,Informatica PowerCenter 6能在很 短时间处理大量的数据。
世界级标准企业数据集成平台
• Informatica PowerCenter 6是建立可伸缩和可扩展的 Informatica数据集成平台的核心和基础。与Informatica PowerConnect产品一起使用,Informatica PowerCenter 6可以提供对广泛的应用和数据源的支持,包括对ERP系 统的支持(Oracle, PeopleSoft, SAP),对CRM系统的支 持(Siebel),对eCommerce数据的支持(XML, MQ Series),遗留系统,及主机数据。Informatica PowerCenter 6是最突出的分析性数据集成平台。 • Informatica PowerCenter 6是一个可以使大的企业或组织 能够按其复杂的业务信息需求,读取、转换和集成遗留系 统、关系型ERP,CRM,消息信息和电子商务数据的数 据集成平台。
– UNIX (HP-UX™,AIX™,Solaris™),Windows – DB/2, Informix, MS SQL Server™, NCR Teradata, Oracle, Sybase,IMS, VSAM,PeopleSoft EPM™, SAP® BW™, Geac SmartEnterprise Warehouse,MS Access, Flat Files, ODBC and others
18% 13% 9%
•
• ACTU = Actuate • COGN = Cognos • EPNY = E.piphany
• MSTR = Microstrategy
I N F A
B O B J
A C T U
C O G N
E P N Y
பைடு நூலகம்A S C L
B R I O
H Y S L
S G N T
M S T R
并行处理能力
• 可允许用户实施跨多服务器的Informatica PowerCenter 6转换引擎,可使系统性能最 大化。 • 改善的查询缓存使用 • 可以通过允许用户在活动的会话期间向查 询缓存中增加数据行。永久性查询缓存可 被不同的数据匹配共享,因此可以避免对 数据库的重复查询。
对电子商务的支持
• Metadata Exchange
– 提供与各种第三方产品之间的元数据交换能力
PowerCenter 简介
• Informatica PowerCenter 6是世界级的企业 数据集成平台,可帮助企业做出快速、一 致、高质量的决策。此产品为满足企业级 要求而设计,可以提供企业部门的数据和 电子商务数据源之间的集成,如XML,网 站日志,关系型数据,主机和遗留系统等 数据源。此平台性能可以满足企业分析最 严格的要求。
公司简介
• Informatica 作为电子商务分析软件,数据集成和 分析型应用解决方案提供商,拥有包括分析型应 用软件、广泛的支持服务和强大的数据集成平台 在内的综合性产品家族。. Informatica的基础设施 产品以可伸缩的、可扩展的企业级数据集成平台 为特点,并广泛支持来自Informatica和其他的领 先智能商务提供商的数据仓库基础设施和分析型 应用软件的开发和管理。 • Informatica的分析型应用软件也是建立在数据集 成平台之上,旨在为企业解决任何可能出现的有 关相关性、性能、瓶颈、战略和其他的种种问题。
产品优势
• • • • 中央元数据管理 开放、可扩展,可集成至大多数的解决方案 高扩展性,高性能 提供面向对象的开发环境,提高生产效率
产品特性
• • • • • • • • • • 数据集成引擎 元数据管理 协同管理 高性能、高扩展性 可视化设计环境 综合工作流 数据安全集成 分布式体系结构 调试器和其他提高生产效率的工具 国际化支持
• PowerCenter
– 业界领先的企业级数据集成平台
• PowerMart
– 部门级数据集市和分析型应用平台(通过数据集成中心(DIH)扩展)
•
PowerConnect
– 用来抽取ERP,CRM,遗产系统,EAI,主机/AS400数据源和元数据
•
PowerChannel
– 提供在分布式环境下的数据采集功能,支持广域网环境
元数据共享
• Informatica的局部和全局的元数据库 (Local and global metadata repository) 可以注册各部门级数据市场的信息并可动 态将部门级数据市场与其它分布式信息存 储连接起来,从而可以得到全企业的统一 的数据仓库元数据视角。
PowerCenter与数据仓库系统
• WEB Metadata Reporter
– 通过WEB共享元数据信息 – 支持WEB Sphere,Tomcat,JRun,Weblogic
Repository Manager
• 元数据版本管理 • 元数据复制、链接 • 组、用户级别权限管理
– 支持操作类型权限(读、写、修改、执行)
• 支持多用户
• 分布式体系结构,可实施跨多服务器的转换引擎 • 并行执行
– 读、转换、写分离进程 – 多线程 – 支持分区缓冲与分区进程
• 支持多数据源直接合并
Workflow Manager , monitor
• • • • • 协同管理 任务、会话级别调度 支持持久性任务、会话变量 运行时实时监控 支持即时容错恢复
– – – – – 所有顶尖的娱乐集团 15家最大的电信集团,有12家是Informatica的客户 10家最大的金融服务/银行集团,有8家是Informatica的客户 15家顶级的公用事业/能源集团,有11家是Informatica的客户 10家最大的保险集团,有8家是Informatica的客户
Informatica
数据集成平台介绍
上海万纬信息技术有限公司
Informatica 全球纵览
公司
成立于 (1993); Nasdaq: INFA (1999) 在全球拥有850名员工 世界标准数据的综合平台 个性化分析递送 (网络, 无线, 及语音) 交叉价值链的分析应用程序 超过1500客户遍布全世界 100强的60%与道琼斯的 63% 拥有超过200个合作伙伴,涉及销售、市场、供给以及国际 性和地区性的配送等多个领域 包括: i2, PeopleSoft, PwC, Siebel, SAP, Sybase, TCSAsia, Mitsubishi Electric - Japan, Softtek – LAR 2001: $197,000,000 增长30% (YOY)
收入增长
200 160
2000 – 2001 的增长率: 30% $152
$197
120
80
$62.4 $30.3
40
$2.1
0 1996
$12.7
1997 1998 1999 2000 2001
Informatica的客户状况
• 100强的60%是Informatica的客户 • 道琼斯工业平均指数的63% • 世界500强
产品
客户
合作伙伴
财务状况