Teradata数据仓库产品介绍v1.0
Teradata系统架构及特性

Teradata系统架构及特性Teradata基础知识和使用过程中应该注意的问题Teradata系统架构及特性DW项目组赵世辉2010年5月Teradata基础知识和使用过程中应该注意的问题Teradata系列培训基础培训1. 2. 3. Teradata软硬件体系架构原理Teradata数据库对象介绍Teradata工具集介绍中级培训1. Teradata数据库设计规范2. Teradata SQL规范3.数据仓库Teradata平台管理规范高级培训1. 2. 3. 4. 5.| 2Teradata工具使用方法和技巧Teradata程序设计与开发数据库高级管理数据库调优。
内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题目录Teradata软硬件体系结构Teradata数据库原理及特点Teradata 数据保护机制Teradata系统访问配置及连接方式Teradata使用中的一些问题及案例分析| 3内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题Teradata系统的硬件构成BynetBynet线光纤PLine/Sline以太网存储阵列MPP节点AWS| 4备份服务器内部资料请勿外传磁带库Teradata基础知识和使用过程中应该注意的问题Teradata主机结构MPP系统工作站集群模式批量处理优化底层并行线性扩展均衡负载高可用性热备组件RAID技术Clique技术| 5内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题AWS及备份设备收集显示主机、存储、Bynet所有模块运行信息设备管理的统一界面AWS通过TVI进行远程维护和故障通知基于LAN-BASE备份技术由备份服务器处理备份任务,减轻数据库压力备份服务器使用Netvault工具,可在AWS上的客户端操作备份恢复由机械手+磁带驱动器+磁带槽位+磁带组成根据磁带的条码自动实现磁带的拆卸和装填磁带库可远程控制,可多驱动器并行工作和交叉工作| 6内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题扩展知识:Teradata主机产品线55015502550企业入门级数据仓库或部门级的数据集市46节点140 TB5__企业级的数据仓库系统,应用于战略性和操作性的企业智能化的EDW/ADW 1024节点10 PB用途数据集市或开发测试机在极端大量数据环境中的分析扩展性(支持数据量)单节点6 TB1024节点50 PB| 7内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题建行数据仓库生产设备的演变硬件- 18(+1)个TD 5500H节点- *****双核- 144GB内存- 100TB数据库空间软件- OS: Suse Linux 9 - DB: TD V2R6.2硬件- 6个TD 5450H节点- ***** - 24GB内存- 16TB数据库空间硬件- 8个NCR 5251节点- 32C@733MHZ - 32GB内存- 4TB数据库空间软件- OS: MP-RAS 4 - DB: TD V2R5 软件- OS: MP-RAS 4 - DB: TD V2R52008年设备更新2007年设备更新2006年DW上线| 8内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题目录Teradata软硬件体系结构Teradata数据库原理及特点Teradata 数据保护机制Teradata系统访问配置及连接方式Teradata使用中的一些问题及案例分析| 9内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题Teradata数据库底层结构VPROC虚处理软件并行控制软件系统软件Applications/ Utilities (TPA)主机直连Channel Drivers Gateway Software局域网硬件| 10内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题Teradata数据库工作原理SQL请求结果返回基本读写过程解析器解析引擎PE将SQL请求拆分成各AMP的请求以便并行处理PE优化器解析器分解接收到的SQL交易请求,验证语法、权限等分发器优化器产生最优的查询方案信息传递层(MPL)分发所优化的方案到AMP数据通过表PI的HASH值均匀分布到各AMP管理的磁盘(写)AMPAMPAMPAMP信息传递层可汇总各AMP数据,将最终结果返回客户端(读)数据数据数据数据| 11内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题PE( Parsing Engine )一种VPROC,用于解释SQL请求、接收输入记录、审查数据、发送信息到AMP每个节点2个PE,每个PE能并发操作120条会话,每个会话能处理多个请求当多个用户同时访问系统时,Teradata能够通过PE在各节点间自动平衡负载,不需要人工干预可以由工具(TDQM、TDWM)控制查询的执行过程| 12内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题AMP( Access Module Processor )一种VPROC,拥有内存和CPU资源,与一个VDISK连接,管理数据库/表的部分数据每节点根据需求可划分多个AMP控制所有磁盘交互及部分数据库的操作,如读、写、转换、格式化等一个请求可以分发到所有AMP一起共同工作,每个AMP也可以同步工作于多个请求各个AMP并行处理,互不干扰,交易处理结果在信息传递层汇总后,直接返回给应用程序内部资料请勿外传| 13Teradata基础知识和使用过程中应该注意的问题Teradata数据库特点专为海量数据仓库等OLAP应用设计多节点的单一数据库系统跨多代设备线性扩展自动数据分配机制可实现多维并行内嵌分析决策功能采用SPOOL技术易于管理| 14内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题专为数据仓库等OLAP系统设计OLAP数据库VS OLTP数据库OLAP 数据库(Teradata) OLTP数据库(Oracle)数据来源典型业务数据量响应速度用户数量本身不产生数据,来源于生产系统数据在系统中产生中的操作数据基于查询的分析系统基于交易的处理系统复杂查询,经常使用多表连结、全每次交易涉及的数据量小表扫描等,涉及的数据量庞大响应时间与具体查询有很大关系对响应时间要求非常高操作特性用户数量相对较小,其用户主要是用户数量非常庞大,主要是操业务人员与管理人员作人员由于业务问题的不固定,数据库的数据库的各种操作主要基于索各种操作不能完全基于索引进行引进行内部资料请勿外传| 15Teradata基础知识和使用过程中应该注意的问题多节点的单一数据库系统可运行于单个或多个节点多个节点组成一个整体的数据库系统,每个结点有单独的IP地址,都连入系统网络各结点之间自动进行负载平衡并提供结点互为备份的高可靠性客户端可以从不同渠道以不同方式连接,连接时可自动实现负载均衡客户端访问的不是某个具体结点,而是整个数据库数据库资源无法从物理上实现完全的分割| 16内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题不同代设备的线性扩展设备型号5500H 30÷ AMP数量22 5555H 50÷30 42 5600H 80÷单节点TPerf性能每AMP性能1.41.61.9TPerf值是衡量Teradata设备性能的指标,以第一代型号设备5100性能为基准1,后续型号Tperf是与5100的性能比值AMP数量可以根据要求进行增减,但受到磁盘数、背板带宽、接口数量、CPU、内存等限制多代混存会产生资源浪费,一般最多4-5代共存| 17内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题自动数据分配机制通过对PI的哈希运算将数据记录均匀分布到各AMP; 记录RowID由行哈希值和一个32位的UV组成;AMP根据数据记录的RowID确定物理存储位置;最新TD R13提供了Non-PI表解决了传统数据库的“数据重组”问题| 18内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题Teradata的多维并行技术查询并行多个VPROC并行最终结果最终结果查询并行各AMP处理自己的数据步内并行每个VPROC中多进程求和求和多步并行SQL语句的并行任务分解JOIN JOINJOIN JOINjoin表C表C表D步内并行1. Select C 2. Select D 3. C join D表A表A多步并行| 19表B表B内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题内嵌的数据分析功能提供多种OLAP函数累计和CSUM、移动平均MAVG、移动和MSUM、移动差分MDIFF、采样SAMPLE、限定*****等所有函数在Teradata内部以并行方式来工作可以自定义函数UDF可嵌入外部厂商的产品功能SAS、MicroStrategy等BI功能SilkRoute、SAP等企业管理功能| 20内部资料请勿外传Teradata基础知识和使用过程中应该注意的问题SPOOL技术SPOOL是未使用的且连续的数据库空间(类似虚拟内存),与Perm、Temp空间一起以AMP为单位分配,且使用不同Cylinder适合大数据量、并行处理的特点(与传统数据库在内存中处理相比)在工作量适中、无Fallback的系统中,SPOOL最少占总数据库空间的25%―30%好的调优策略可减少对SPOOL空间的占用每个用户的SPOOL的在建立时设置SPOOL的类型Volatile。
Teradata携手中国邮政动态数据仓库打造优质速递服务

I M 公 司 B , BM 公 司 日 前 I 推 出 了新 的储 存 平 台 和 增 强 储 存 产 品 ,I M 称 这 是 “ 司 储 存 B 公 产 品 一 次 最 大 的 全 面 扩 展 ” 。 I M 发 布 的 I M 系 统 储 存 B B
标 是 降 低 储 存 系 统 的 总 体 成
本 。
等 级 保 护 、信 息 安 全 风 险 评 估
等 领域 。
此 外 , 届 亚 洲 C B T的 通 本 eI
即 可 查 询 积 分 , 务 必 保 留 该 信 要
息、
信 展 区将 汇 聚 固 定 电话 、 动 通 移 信 、网 络 、车 载 与 导 航 等 领 域 的
电话 支 付 这 一 新 型 电子 支付 方
式 , 帮 助 银 行 拓 展 电 话 银 行 业
月 9 日上 市 销 售 , 品 起 价 分 别 产
为 2 . 4万 美 元 和 1 . 6万 美 13 02
兀 。
决 方 案 , 聚 焦 行 业 的 前 进 方 向
和 技 术 趋 势 。 针 对 越 来 越 受 重
都 基 于 I M 的 P w r 5+处 理 B o e 器 。 原 来 的 DS 0 0平 台 相 比 , 与 80 新 产 品处 理 负 荷 环 境 的性 能 改 善 了 1% 。 5
注 IT市 场 的 最 新 动 态 , 示 厂 C 展 商 的发展 方 向及技 术突 破 。 最 在 炙 手 可 热 的 数 字 家 庭 领 域 , 届 本 展 会 将 特 别 开 辟 数 字 家 庭 体 验 展 区 ,致 力 于 为 不 同 阶 层 、不 同 需 求 的 家 庭 提 供 相 应 的解 决 方
Teradata大数据一体化平台介绍

产品说明
动态数据仓库产品,支持SSD 动态数据仓库产品,不支持SSD 数据仓库一体机 数据集市一体机,SMP节点 海量数据分析一体机 Hadoop一体机 Aster一体机 Aster数据库软件(仅限部分客户) Hadoop软件 Teradata提供企业云部署环境 双/多系统管理解决方案 虚拟存储/多级存储解决方案 Teradata平台互联互通解决方案 基本功能已集成在Teradata一体机中,数据实验室等额外功能需付费 整合营销解决方案 Teradata-SAS高性能分析一体机 Teradata-SAP分析解决方案 TD提供免费的ABU备份软件,由客户提供网络备份环境 TD提供备份插件,由客户提供带机、带库等备份架构 TD提供完整备份解决方案,包括NBU备份软件,以及Quantum,Da ta Domain等备份设备 包含元数据、数据质量、数据标准等 ETL调度工具 门户产品 管理驾驶舱 前端工具,数据挖掘分析工具
teradatagca可销售产品一览表产品类型产品定位最新产品型号产品说明teradata6750h6750hx动态数据仓库产品支持ssdteradata6700c动态数据仓库产品丌支持ssdteradata2800数据仓库一体机teradata670h670c数据集市一体机smp节点teradata1700海量数据分析一体机haddopappliancehadoop一体机探索平台asterapplianceaster一体机astersoftwareonlyaster数据库软件仅限部分客户hadoopsoftwareonlyhadoop软件teradatadatalabteradata提供企业云部署环境unity双多系统管理解决方案tvs虚拟存储多级存储解决方案querygridteradata平台互联互通解决方案viewpoint基本功能已集成在teradata一体机中数据实验室等额外功能需付费applicationcim整合营销解决方案teradataappliancesasteradatasas高性能分析一体机teradataanalyticssapteradatasap分析解决方案abuappliancebackuputilitytd提供免费的abu备份软件由客户提供网络备份环境tdeteradataextensiontd提供备份插件由客户提供带机带库等备份架构advocatedbartd提供完整备份解决方案包括nbu备份软件以及quantumdatadomain等备份设备数据管控teradata数据管控平台包含元数据数据质量数据标准等etlautomationetl调度工具teradataportal门户产品tetadatadashboard管理驾驶舱合作伙伴产品qlikviewspotfiretableaumicrostrategycelebrus前端工具数据挖掘分析工具其它工具其它产品数据库系统管理软件产品硬件产品数据平台数据仓库数据备份合作产品datamartapplianceintegratedbigdataplatformdatawarehouseapplianceactiveenterprisedatawarehouseappliancehadoopasterbiganalyticsappliancesashighperformanceanalytics规模up8tbup234pbup54p
Teradata案例分析

话费流失预防系统 5.报表管理子系统(FraudSentry*Reporter) 提供一些预定义的统计和管理报表,提供欺 诈记录及客户信息。这些表报是用OLAP动态 报表工具实现的。如主叫号码通话报警统计、 最可疑的前100个通话、按通话类型分析报警 情况、可疑事件详细报表、可疑事件分析与 处理、欺诈事件统计表、反欺诈小组处理事 件统计等等。
话费流失预防系统 介绍
话费流失预防系统(FraudSENTRY)是通过对大 量的客户档案和通话历史数据的分析从而获 取客户的通话行为信息,采用传统的基于规 则的侦测方法和现代先进的神经网络智能技 术为综合分析手段,建立一个通话行为智能 库,可以侦测漫游、客户欺诈、代理商欺诈、 利用盗窃手机通话等几类欺诈行为,当通话 记录或交易出现在正常模式以外时,系统能 马上识别,实时地现场侦测、追踪潜在的恶 意盗打电话者,和预测可能会恶意盗打电话 的客户,防盗打小组在电信公司的经营政策 为指导的原则下,对违反规定的客户采取必 要的措施,以追回损失、降低电信公司经营 风险和防止资产流失的决策支持系统。
7.预测模型子系统(FraudSentry*Predictor)
8.客户分析子系统(CustomerBI)
话费流失预防系统
1.维护界面子系统(FraudSentry*Profiler)
结构
是客户端的交互窗口。Profiler主要用于设 置和修改报警和界限。报警设置将侦测识别 所有通话记录中的各类欺诈行为,知道侦测 什么和如何侦测。正常情况下,报警参数仅 在第一次安装时设置一次。
案例:远传电信(FarEasTone)
降低经营成本 相 互 矛 相 盾 互 矛 盾
提高客户满意度 案例 分析解决? 如何解决?
案例:远传电信(FarEasTone) 降低经营成本
Teradata数据库介绍

SMP 体系架构
Multi-Node MPP
NCR Rack-Based Cabinets
NCR MPP系统的一些特性
Teradata数据库软件:它允许多个SMP运行在Teradata数据库上,并扮演单个 实例角色.
可升级的BYNET连接:当增加节点时,相应的增加了带宽. 并行可升级性:通过安装/升级多个SMPs 实现软件的并行安装和升级. AWS(Administration Workstation) :单点操作控制及升级服务管理. SMP:SMP只需要负责管理各自资源 还有一些冗余的组件:两个BYNET,在一个磁盘组中有两个磁盘控制器,又模
Network-Attached client software Overview
CLI提供对Teradata最大限度的连接和访问性,ODBC作为业内标准是更多的应用程序 可以连接到Teradata
Micro Teradata Director Program (MTDP) 是Teradata 提供的网络连接环境下的TDP实现,它和渠道连接下的TDP功能基本一致,唯一的区别 是它不负责session在多个PEs之间的分配,此功能由运行在Teradata系统上的Connect and Assign Servers 实现
据集成的企业范围的数据库,保证数据的一致性 高可用性 并行装载及卸数处理
强大的并行装载,load与unload工具可升级性,这些工具如:Fastload、 Multiload、TPump、and FastExport
主题
What is Teradata? Teradata数据库竞争优势 Teradata RDBMS 架构 Teradata 系统架构 Teradata 数据库与数据库用户的比较 数据存储和访问
释放数据的能量——Teradata天睿公司大中华区首席执行官辛儿伦访谈

大会的主题是 “ 释放数据 的能
量 ” ,强 调 了两 个 要 点 ,一 是 数 据 潜 藏 巨 大 的 能 量 、数 据 当 中 拥有 更 大 的 洞 察 力 ,这表 明数 据 已 成 为 最
辛 儿 伦: 此 次 大 会 是 由
2 0 1 3年 T e r a d a t a 全球用户大会 T e r a d a t a 全 球 客 户 委员会 主 办、
&E x p o)于 当 地 时 间 l 0月 2 0 ~ 2 4
日在美 国德克萨斯州达拉斯市召开。 大需求。数据的核心是发现价值 ,
大会以 “ 释放 数 据的 能量 ” 为 主题 , 驾 驭 数 据 的 核 心 就 是 分 析 。在 数 据
来 自全球领 先数据驱 动企业的行 业 分 析这 个领 域 , 有 各种 形态 的数据 ,
分析 领 域 最 前 沿 的 发展 方 向 , 能否
具 体介 绍 一下 ?
行官辛儿伦 ( A a r o n Hs i n ) ,清他解析
本 届大会 举行 了近 4 0 0场 专
辛 儿 伦 :本次 大 会上 ,T e r a d a t a
7 4 F l N A N c A l L c 。 M P u T E R O F c H I N A
要 有整合数据 的能力 ;挖掘 、探 索
大 数据 体 系和 信 息化 银 行 建 设 作 为
是客 户营销和 客户服务。在 具备了
大 数据 体 系建 设等 话题 。
ห้องสมุดไป่ตู้
们探 索 、挖 掘 数 据 价 值 的 实 践。 需要强调的是, “ 大 数 据 ”作 为
teradata automation使用手册

teradata automation使用手册# Teradata Automation 使用手册## 1. 引言Teradata Automation 是一个用于管理和优化 Teradata 数据库的工具,它可以帮助用户自动化日常任务,提高工作效率。
本使用手册将详细介绍 Teradata Automation 的功能和使用方法。
## 2. 安装与配置在开始使用 Teradata Automation 之前,首先需要进行安装和配置。
请参考官方文档或联系技术支持以获取详细的安装和配置指南。
## 3. 功能介绍### 3.1 自动化任务调度Teradata Automation 允许用户创建、编辑和删除自动化任务,并设置执行时间。
通过这种方式,可以确保关键任务在规定的时间内自动运行。
### 3.2 数据库监控Teradata Automation 提供实时数据库监控功能,用户可以查看数据库性能指标,如 CPU 利用率、内存使用情况等。
### 3.3 数据备份与恢复Teradata Automation 支持数据备份和恢复操作,用户可以根据需求设置备份计划,并在需要时恢复数据。
### 3.4 错误处理与报警当系统出现错误时,Teradata Automation 可以立即发送警报,并提供错误处理建议。
## 4. 使用教程### 4.1 创建自动化任务打开 Teradata Automation,点击“新建任务”,输入任务名称和描述,选择执行时间,然后保存。
### 4.2 监控数据库性能在主界面中,选择“监控”选项卡,可以看到当前数据库的各项性能指标。
### 4.3 设置数据备份计划在主界面中,选择“备份”选项卡,点击“新建备份计划”,输入计划名称和描述,选择备份频率和保留期限,然后保存。
### 4.4 处理错误与警报当系统出现错误时,Teradata Automation 将在主界面上显示警报信息。
点击警报,可以查看详细信息和处理建议。
teradata like语句

一、Teradata数据库简介Teradata是一种用于大规模数据仓库和分析的关系型数据库管理系统。
它是世界上最大的并行处理数据库之一,被许多大型企业和组织用于数据存储和分析。
Teradata数据库以其高性能、可扩展性和并行处理能力而闻名,是大数据分析和数据驱动型决策的理想选择。
二、Teradata Like语句概述在Teradata数据库中,Like语句是用于在查询数据时进行模糊匹配的关键字。
它使得用户可以在匹配模式中使用通配符来查找满足特定条件的数据。
Like语句通常与SELECT语句一起使用,用于从表中检索符合特定模式的数据行。
三、Like语句的语法在Teradata数据库中,Like语句的基本语法如下所示:SELECT column1, column2, ...FROM table_nameWHERE column_name LIKE pattern;在这个语法中,column1, column2等表示需要检索的列,table_name表示需要检索的表,column_name表示需要进行匹配的列,而pattern则表示匹配模式。
在pattern中,通配符表示零个或多个字符,而_表示一个字符。
四、Like语句的应用实例1. 简单模糊匹配假设我们有一个名为employees的表,其中包含雇员的尊称信息。
我们可以使用Like语句来查找以字母“A”开头的员工尊称:SELECT *FROM employeesWHERE employee_name LIKE 'A';2. 复杂模糊匹配如果我们想要查找以字母“J”开头,且长度为5个字符的员工尊称,可以使用如下查询:SELECT *FROM employeesWHERE employee_name LIKE 'J____';3. 结合通配符我们还可以使用多个通配符结合来进行模糊匹配。
我们可以使用作为通配符,来查找包含字母“S”和“th”之间有0个或多个字符的员工尊称:SELECT *FROM employeesWHERE employee_name LIKE 'Sth';五、Like语句的性能和注意事项虽然Like语句在数据查询中非常灵活,但是它也可能导致性能问题,特别是在对大型表进行模糊匹配时。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
最优性能 = CPU 和 I/O 带宽的平衡
只增加CPU: 没有足够的磁盘保证 CPU得到充分利用
CPU处理能力增强
当前系统
只增加磁盘: 没有足够的 CPU来充分利用这些磁盘
磁盘个数
Teradata 的推荐配置
Balanced Price/Performance Configuration
• 推荐配置需要找到节点CPU和内存、磁盘阵列的I/O(磁盘的多少 )之间一种平衡
• 目标就是为系统提供一种性价比合理的配置
CPU Utilization
100%
I/O
Constrained
80%
60%
Balanced System
Super Saturated
40%
20%
Increase in number of drives
I/O = Number Disk Drives and Controllers
F
SOLARIS
ORACLE DBMS
8
10
15
13
10
8
17
14
11.9
4
5 IBM BLADECENTER
B
AIX
DB2
11
9
11
12
10
9
17
14
11.6
5
6 IBM SYSTEM z9
F
ZOS
DB2
11
14
10
8
10
9
17
14
11.5
6
7 HP BLADESYSTEM
B
HP-UX
ORACLE DBMS
数据仓库系统不是简单的 主机、存储、数据库的堆积
• 数据仓库系统不是简单的主机、存储、数据库的堆积
> 数据仓库是:处理器/内存、存储、I/O性能的平衡优化
• 数据仓库要看整体性能,尤其是:
> I/O性能 > 系统可扩展性 > 并行处理能力 > 数据库性能 > 混合负载管理能力
• 一船沙丁鱼 ≠ 一条鲸鱼
> 强调并行处理能力,能够把一个请 求切分为若干子任务,并将各个子任 务分担到所有的硬件上来并行执行。
> 请求非常多,每次预定都需要访问
> 每个请求非常短小,只访问几条或者几十 条记录
> 能够将数以百万级的请求均衡的分担到 所有的硬件上
> 强调并发能力,能够把尽量多的请求 分散到不同的硬件上来完成。
11
9
12
12
10
7
17
15
11.5
7
8 IBM SYSTEM x
R
WINDOWS
DB2
11
8
11
12
9
6
17
14
10.9
8
9 HP PROLIANT
R
WINDOWS
SQL/SERVE R
11
8
11
13
8
5
17
15
10.9
9
10 HP 9000
R
HP-UX
ORACLE DBMS
6
7
13
12
10
7
17
主动触发
Teradata是目前全球唯一能全面实数施据5复个杂阶度段的数据仓库厂家
综合衡量数据仓库整体性能的十六个维度:
多温度数据管理 多代共存
可扩展性
易用易管理
Monitor & Mgmt
Portal
智能扫描
Set & Go Optimization
Basic
Auto
数据模型灵活度 查询自由度
高可用性
FORM FACTOR PLATFORM & RELATED TOOLS PLATFORM SERVICES WINDOWS
LINUX UNIX MAINFRAME/LEGACY OS & TOOLS BEST RESULT WINDOWS LINUX UNIX MAINFRAME/LEGACY OS SERVICES BEST RESULT DB2 ORACLE SQL/SERVER TERADATA OTHER DBMS BEST RESULT CORPORATE/ SALES & MARKETING LOCAL/ GO-TO-MARKET AVERAGE SCORE RANK BEST OPTION RANK
> 并行磁盘访问 > 高速互联网络 > 采用Shared-nothing MPP
平台架构 > 专用配置:Appliance
扩展能力是数据仓库系统的重要衡量指标: 数据仓库平台的两种设计方式SMP和MPP
数据仓库的5个发展阶段
数据仓库5阶段演进模型
第五阶段 第四阶段
• 查询复杂度增加 • 负载混合度增加 • 数据量规模增加 • 数据模型复杂度增加 • 数据历史深度增加 • 用户数量增加 • 系统期望值增加
10 50 50
30 10
6 40 20
15 6
9 40 20
18 8
9 45 40
18 8
10 45 40
18 8
8 50 40
24 8
8 30 10
12 5
8 40 10
18 7
9 40 20
24 9
W orkload Management OS Partitioning Manageability
• 要充分考虑实施风险
> 已经充分经过验证的成功案例,尤其是同行业企业级的成功案例
• 可扩展性非常重要
> 要充分考虑未来业务的发展,不仅需要满足当前的处理要求,还能够线性扩 展至未来分析处理的需要,充分保护投资
议程
•如何衡量数据仓库性能 •Teradata产品特点 •Teradata产品家族介绍 •Teradata优势总结
工作负载复杂度
第三阶段 第二阶段
报表
发生了什么 情况?
分析
为何发生了 这种情况?
主动事件
我希望发生什么情况!
一线运营支撑
正在发生什么情况?
预测
将要发生什么 情况?
基于事件的 触发
分析建模
连续更新和流 程互动
第一阶段
主要是批处理和 预定义的查询
即席查询和并发 查询
批处理 即席查询
分析 持续的更新/简短的战术性查询
BEST RESULT OS SERVICES BEST RESULT
Stack Technology Best Result Stack Delivery Best Result CORPORATE
SALES & MARKETING LOCAL GO-TO-
MARKET AVERAGE
SCORE RANK
10 3
50
16 7
35
12 6
45
16 6
40
Availability of Skills
2
7
7
8
4
9
6
4
2
Application Choice
8
32
32
40
16
40
32
32
12
LOCAL CATEGORIES
User Definable User Definable User Definable
5 全表扫描 5%
0%
5%
10%
15%
20%
25
权重
30%
35%
数据仓库与一般业务系统的区别
面向用户
数据仓库 > 面向管理人员,用户数少
OLTP > 面向业务人员,用户数多
请求个数
> 请求相对较少
每个请求所 需资源
技术要求
对平台的要 求
> 每个请求巨大,往往需要扫描百万 或千万条的记录
> 能够调集所有的资源完成一个访问 请求
1999 年
2000 年
2003 年
2004年
2007年
GENERIC VIEW DW DBMS SERVER
RELEASE 3
Server SEM (Scorecard Evaluation Model) Lite
Top Ten DW DBMS SERVER by average score
1 NCR TERADATA
2
6
6
6
4
3
9
7
4
Gartner Client "RADAR" Delivers On Promises
10 15
40 9
30 15
45 18
15 12
45 18
50 18
40 18
20 24
BUSINESS PRACTICE
Ease of Doing Business Support
4 50
6 30
15
10.9
10
2001年
Data Warehousing Comparisons
* WEIGHTED SCORES * WEIGHTED SCORES * WEIGHTED
SCORES * WEIGHTED SCORES *
IBM
Sun
HP
IBM
Comp
NCR
SHV 8- Unisys IBM
aq
F
MP/RAS TERADATA
11
10
13
14
14
13