Data Domain技术白皮书

合集下载

数据中心白皮书

数据中心白皮书

数据中心白皮书摘要:本白皮书旨在探讨数据中心的重要性、现状和未来发展趋势。

数据中心作为现代社会信息技术的核心基础设施,承载着海量数据的存储、处理和传输任务。

本文将从数据中心的定义、功能、技术要求和可持续发展等方面进行分析和讨论,旨在为相关行业提供参考和指导。

1. 引言数据中心是指用于集中存储、管理和处理大规模数据的设施,它是信息社会的重要基础设施之一。

随着云计算、大数据、人工智能等技术的快速发展,数据中心的需求和重要性日益突出。

2. 数据中心的功能数据中心的主要功能包括数据存储、数据处理和数据传输。

数据存储是指将大量的数据存储在数据中心的服务器和存储设备中,以实现数据的长期保存和备份。

数据处理是指对存储在数据中心的数据进行计算、分析和挖掘,提取有用的信息和知识。

数据传输是指将数据中心中的数据通过网络传输给用户或其他系统。

3. 数据中心的技术要求数据中心的技术要求主要包括可靠性、安全性、可扩展性和高效性。

可靠性是指数据中心的硬件设备和软件系统具有高可靠性和可用性,能够保证数据的连续性和可访问性。

安全性是指数据中心的数据和系统受到有效的保护,防止未经授权的访问和数据泄露。

可扩展性是指数据中心能够根据需求进行灵活的扩展和升级,以适应不断增长的数据量和计算需求。

高效性是指数据中心的能源利用效率高,运行成本低,同时能够提供高性能和低延迟的服务。

4. 数据中心的现状当前,全球范围内的数据中心规模不断扩大,技术水平不断提高。

数据中心的数量和规模呈现出快速增长的趋势,大型互联网企业和云服务提供商是数据中心建设的主要推动力量。

同时,数据中心的能源消耗和碳排放也成为了一个全球性的问题,可持续发展成为了数据中心建设和运营的重要目标。

5. 数据中心的未来发展趋势未来数据中心的发展趋势主要包括模块化设计、软件定义、绿色能源和边缘计算。

模块化设计可以提高数据中心的灵活性和可扩展性,降低建设和运营成本。

软件定义可以实现数据中心的虚拟化和自动化,提高资源利用率和运维效率。

大数据标准化白皮书

大数据标准化白皮书
3.大数据发展现状和趋势................................................................................................................ 89 3.1 国外大数据发展 ..........................................................................................................................89 3.1.1 政府出台计划.....................................................................................................................910 3.1.2 工业界大数据研究..........................................................................................................1213 3.2 国内的大数据现状 ..................................................................................................................1415 3.2.1 国内大数据关注焦点.......................................................................................................1415 3.2.2 地方政府探索大数据应用...............................................................................................1617 3.3 大数据产品的发展趋势 ..........................................................................................................2021 3.3.1 大数据由网络数据处理走向企业级应用 ......................................................................2021 3.3.2 移动终端数据应用将成为下一轮创新的中心 ..............................................................2122 3.3.3 “数据租售”成为最直接的盈利模式 ..........................................................................2122

(完整word版)H3C大数据产品技术白皮书

(完整word版)H3C大数据产品技术白皮书

H3C大数据产品技术白皮书杭州华三通信技术有限公司2020年4月1 H3C大数据产品介绍 (1)1.1 产品简介 (1)1.2 产品架构 (1)1.2.1 数据处理 (2)1.2.2 数据分层 (3)1.3 产品技术特点 (4)先进的混合计算架构 (4)高性价比的分布式集群 (4)云化ETL (4)数据分层和分级存储 (5)数据分析挖掘 (5)数据服务接口 (5)可视化运维管理 (5)1.4 产品功能简介 (6)管理平面功能: (7)业务平面功能: (8)2 DataEngine HDP 核心技术 (9)3 DataEngine MPP Cluster 核心技术 (9)3.1 MPP + SharedNothing 架构 (9)3.2 核心组件 (10)3.3 高可用 (11)3.4 高性能扩展能力 (11)3.5 高性能数据加载 (12)3.6 OLAP 函数 (13)3.7 行列混合存储 (13)1 H3C大数据产品介绍1.1 产品简介H3C大数据平台采用开源社区Apache Hadoop2.0和MPP分布式数据库混合计算框架为用户提供一套完整的大数据平台解决方案,具备高性能、高可用、高扩展特性,可以为超大规模数据管理提供高性价比的通用计算存储能力。

H3C大数据平台提供数据采集转换、计算存储、分析挖掘、共享交换以及可视化等全系列功能,并广泛地用于支撑各类数据仓库系统、BI系统和决策支持系统帮助用户构建海量数据处理系统,发现数据的内在价值。

1.2 产品架构第一部分是运维管理,包括:安装部署、配置管理、主机管理、用户管HSCZEFKfl上連平frKB笹堆芒12i』」Rt巽^jpRctiuce Spjrk siremCRM SGM生产记〒曲.M-噸Hadaap2.0■1 j jET辛SEmifiKettleH3C大数据平台包含4个部分:理、服务管理、监控告警和安全管理等。

第二部分是数据ETL,即获取、转换、加载,包括:关系数据库连接Sqoop、日志采集Flume、ETL工具Kettle 。

数据库加密系统技术白皮书

数据库加密系统技术白皮书

数据库加密存取及强权限控制系统技术白皮书Oracle版目录1.产品背景 (1)2.解决的问题 (3)3.系统结构 (6)4.部署方案 (7)5.功能与特点 (9)6.支持特性 (10)7.性能测试数据 (11)1.产品背景随着计算机技术的飞速发展,数据库的应用十分广泛,深入到各个领域。

数据库系统作为信息的聚集体,是计算机信息系统的核心部件,其安全性至关重要。

小则关系到企业兴衰、大则关系到国家安全。

在重要单位或者大型企业中,涉及大量的敏感信息。

比如行政涉密文件,领导批示、公文、视频和图片,或者企业的商业机密、设计图纸等。

为了保障这些敏感电子文件的安全,各单位广泛的实施了安全防护措施,包括:机房安全、物理隔离、防火墙、入侵检测、加密传输、身份认证等等。

但是数据库的安全问题却一直让管理员束手无策。

原因是目前市场上缺乏有效的数据库安全增强产品。

数据库及其应用系统普遍存在一些安全隐患。

其中比较严峻的几个方面表现在:(1)由于国外对高技术出口和安全产品出口的法律限制,国内市场上只能购买到C2安全级别的数据库安全系统。

该类系统只有最基本的安全防护能力。

并且采用自主访问控制(DAC)模式,DBA角色能拥有至高的权限,权限可以不受限制的传播。

这就使得获取DBA角色的权限成为攻击者的目标。

而一旦攻击者获得DBA角色的权限,数据库将对其彻底暴露,毫无任何安全性可言。

(2)由于DBA拥有至高无上的权利,其可以在不被人察觉的情况下查看和修改任何数据(包括敏感数据)。

因此DBA掌控着数据库中数据安全命脉,DBA的任何操作、行为无法在技术上实施监管。

而DBA往往只是数据的技术上的维护者,甚至可能是数据库厂商的服务人员,并没有对敏感数据的查看和控制权。

现阶段并没有很好的技术手段来约束DBA 对数据的访问权限,因此存在巨大安全隐患,特别是在DBA权限被非法获取的情况下,更是无法保证数据的安全。

(3)由于C2级的商业数据库对用户的访问权限的限制是在表级别的。

数据白皮书发布制度

数据白皮书发布制度

数据白皮书发布制度数据白皮书发布制度是针对组织、机构在数据处理活动过程中,为应对数据安全威胁与监管合规要求,而建立的一套规范和指南。

该制度旨在促进数据资产的开发利用、价值实现与安全保护之间的平衡,并确保组织、机构在数据处理活动中能够履行合规义务。

在数据白皮书的发布过程中,需要明确以下几点:1. 发布的目的和背景:组织、机构需要明确数据白皮书发布的目的和背景,以便读者能够更好地理解白皮书的内容和意义。

2. 发布的内容:数据白皮书应包括组织、机构在数据处理活动中的战略规划、组织架构、流程规范、风险管理等方面的内容。

此外,还应对数据的收集、存储、使用、加工、传输、提供、公开等环节进行详细阐述,并提供相应的解决方案和最佳实践。

3. 发布的范围和受众:组织、机构需要明确数据白皮书的发布范围和受众群体,以便更好地确定发布方式和渠道。

一般来说,数据白皮书适用于组织内部员工、合作伙伴及监管机构等。

4. 发布的时间和频率:组织、机构需要根据实际情况确定数据白皮书的发布时间和频率。

通常来说,数据白皮书应定期发布,以便及时更新数据处理活动的战略规划、组织架构、流程规范等方面的内容。

5. 发布的审批程序:为确保数据白皮书的质量和合规性,组织、机构需要建立相应的审批程序。

审批程序应包括撰写、审核、修改、定稿等环节,并需经过相关部门或专业人士的审核和批准。

6. 发布后的跟踪与评估:数据白皮书发布后,组织、机构需要对其实施情况进行跟踪和评估。

通过收集反馈意见和建议,及时发现和处理问题,不断完善和优化数据处理活动的过程和规范。

7. 宣传和培训:针对新发布的数据白皮书,组织、机构应进行适当的宣传和培训,以确保员工和合作伙伴能够充分了解和遵守其中的规定和要求。

可以通过内部通讯、培训课程、专题讲座等方式进行宣传和培训。

8. 定期更新和维护:数据处理活动是一个动态的过程,因此数据白皮书也需要定期进行更新和维护。

组织、机构应定期审查和修订数据白皮书,以反映数据处理活动的变化和更新。

数据库加密系统技术白皮书

数据库加密系统技术白皮书

数据库加密系统技术白皮书一、引言在当今数字化时代,数据成为了企业和组织最宝贵的资产之一。

数据库中存储着大量敏感信息,如客户数据、财务数据、知识产权等。

为了保护这些敏感数据的机密性、完整性和可用性,数据库加密技术应运而生。

本白皮书将详细介绍数据库加密系统的相关技术,包括其原理、特点、应用场景以及选择和实施的要点。

二、数据库加密系统的原理数据库加密系统的基本原理是对数据库中的敏感数据进行加密处理,使得未经授权的用户无法直接读取明文数据。

加密过程通常使用对称加密算法(如 AES)或非对称加密算法(如 RSA),将明文数据转换为密文数据。

在数据存储和传输过程中,只有拥有正确密钥的授权用户能够对密文进行解密,获取明文数据。

三、数据库加密系统的特点1、数据保密性通过加密敏感数据,即使数据库被非法访问或窃取,攻击者也难以获取有价值的信息。

2、完整性保护加密可以确保数据在传输和存储过程中不被篡改,从而保证数据的完整性。

3、灵活性可以根据不同的业务需求和安全级别,对特定的表、字段或数据行进行加密。

4、透明性对于应用程序来说,加密和解密过程应该是透明的,尽量减少对现有业务系统的修改和影响。

四、数据库加密系统的应用场景1、金融行业保护客户的账户信息、交易记录等敏感数据。

2、医疗行业存储患者的病历、诊断结果等隐私信息。

3、电商行业处理用户的个人信息、支付数据等。

4、政府部门涉及国家安全、公共服务等领域的敏感数据。

五、数据库加密系统的关键技术1、加密算法选择根据性能、安全性和密钥管理的要求,选择合适的加密算法。

2、密钥管理包括密钥的生成、存储、分发、更新和销毁等环节,确保密钥的安全性和可用性。

3、加密引擎高效的加密引擎能够在不影响数据库性能的前提下完成加密和解密操作。

4、访问控制结合数据库的访问控制机制,确保只有授权用户能够获取密钥并进行解密操作。

六、数据库加密系统的性能影响及优化加密和解密操作不可避免地会对数据库的性能产生一定影响。

华为下一代数据中心白皮书说明书

华为下一代数据中心白皮书说明书

下一代数据中心白皮书01下一代数据中心白皮书前言前言人类社会正在加速迈向智能化,比如智能手机、智能家居、智能制造、自动驾驶等正在重塑人们的工作和生活。

作为智能世界和数字经济的坚实底座,数据中心迎来了蓬勃发展。

同时,碳中和已经成为全球的共识和使命,绿色低碳变成世界新的主题,也是数据中心建设、运营必须考虑的重要因素。

面对ICT技术快速演进、建设需求激增以及绿色低碳要求,数据中心产业正在发生深刻变革,将进入新的时代。

什么是符合新时代需求的“下一代数据中心”?华为携手全球数据中心行业领袖和技术专家,举办了系列“松湖论道”下一代数据中心研讨会,深入探讨了行业和技术发展趋势,并就下一代数据中心定义达成重要共识。

未来已来,相信集业界专家智慧共同定义的下一代数据中心,将为产业可持续发展发挥重要作用!目录前言 01智能化与低碳化推动数据中心快速、高质量发展 031.1 数字经济促进数据中心快速增长 04 1.2 碳中和对数据中心可持续发展提出新的要求 04下一代数据中心052.1 低碳共生 062.1.1 全绿色:源头绿色化,与自然共生 062.1.2 全高效:PUE→xUE,评价体系从单指标到多指标 072.1.3 全回收:全生命周期,资源回收利用最大化 082.2 融合极简 092.2.1 架构极简,孕育建筑与机房新形态 092.2.2 供电极简,部件重定义,链路重塑 112.2.3 温控极简,冷热交换效率最大化 122.3 自动驾驶 132.3.1 运维自动,实现无人值守 142.3.2 能效自优,从制冷到“智”冷 142.3.3 运营自治,资源价值最大化 152.4 安全可靠 162.4.1 主动安全,事后到事前,故障快速闭环 172.4.2 架构安全,从器件到DC,全方位构筑安全防线 17总结语1804下一代数据中心白皮书智能化与低碳化推动数据中心快速、高质量发展当前,世界正在经历以人工智能、云计算、大数据、物联网、5G等为代表的数字技术变革,在加速创新的数字技术驱动下,数字经济已成为全球GDP增长的主引擎。

数据库访问控制安全中间件白皮书模板

数据库访问控制安全中间件白皮书模板

数据库安全访问中间件技术白皮书目录1.产品简介 (1)2.产品安全特性 (2)3.性能与易用性 (6)4.产品体系结构 (7)5.部署方案 (9)6.支持平台 (12)7.性能测试数据 (13)1.产品简介随着计算机技术的飞速发展,数据库的应用十分广泛,深入到各个领域。

但随之而来产生了数据的安全问题。

数据库系统作为信息的聚集体,是计算机信息系统的核心部件,其安全性至关重要。

小则关系到企业兴衰、大则关系到国家安全。

在涉密单位或者大型企业中,广泛的实施了安全防护措施,包括机房安全、物理隔离、防火墙、入侵检测、加密传输身份认证系统等等。

但是数据库的安全问题却一直得不到应有的重视。

同时,之前的市场上也缺乏有效的数据库安全增强产品。

这就致使数据库及其应用系统在安全方面普遍存在一些安全隐患。

其中比较严峻的几个方面表现在:(1)由于国内只能购买到C2安全级别的数据库安全系统,该类系统采用自主访问控制(DAC)模式,DBA角色能拥有至高的权限,权限可以不受限制的传播。

这就使得获取DBA角色的权限成为攻击者的目标。

一旦攻击者获得DBA角色的权限,数据库将对其彻底暴露,毫无任何安全性可言。

(2)数据库系统是一个复杂的系统,根据已经公布的资料,数据库存在许多漏洞,其中不少是致命的缺陷和漏洞。

举例来说,号称拥有全球最安全的数据库产品的Oracle 公司在2006 年1 月发布了其季度安全补丁包,该补丁包修补了多个产品中的80多个漏洞。

其中不少漏洞可以非常容易地被黑客利用,一旦遭到攻击将给用户造成严重影响。

(3)数据库及其应用系统每天都可能受到包括SQL注入攻击在内的广泛的攻击。

攻击者利用应用程序设计中的漏洞,对数据库系统发起攻击,获得不应该具有的权限,甚至下载整个数据库文件,给数据库的安全造成严重威胁。

(4)C2级数据库采用基于口令的认证方式。

本身缺乏有效的登录口令管理机制,口令更换周期长,使用复杂口令很困难,口令泄露的风险大。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Data Domain 技术白皮书1.1.1综述Data Domain DD600/800 Restorer产品是基于硬盘的备份存储器件(appliance)。

尽管DD600/800是建立在串行A TA硬盘技术基础之上的,但并不是又一种廉价RAID磁盘阵列。

具备容量优化技术(Capacity Optimized Storage)和数据防损架构(Data Invulnerability Architecture)的DD OS 操作系统,在为数据提供空前的保护的同时,其每GB费用成本已远远低于所谓的廉价磁盘,而是接近于自动化磁带解决方案的费用成本,某些情况下甚至接近于磁带机的成本。

DD600/800s系列产品是为满足备份和恢复存储设备的特殊需求而设计的。

●备份和恢复兼顾的高性能单个DD600控制器的吞吐量最高可达5400GB/小时,这种性能可与LTO-4磁带机以及许多主存储系统的性能相媲美。

而且DD600/800并不像磁带机那样需要持续的数据流来保证备份的性能。

DD600/800同时可以接受多个不同速度的数据流。

此外DD600/800可以利用磁盘所具备的随机访问特性的优势快速恢复单个文件。

如果需要更高的性能,可以通过配备多个DD600/800产品来增加吞吐量。

●经济性DD OS操作系统通过只保存唯一一份备份镜像冗余部分中的数据样本,从而大大减少需要的存储容量。

这使得DD600/800不但可以发现并消除同样文件重复存储,而且发现和消除在文件内和文件间重复的数据样本。

通过其独特的全局压缩(Global Compression)技术,在使用一段时间后,DD OS操作系统提供的压缩率可以达到20:1。

所以说DD600/800与以备份存储为使用目的的廉价磁盘阵列相比,小得多、简单得多、使用和管理得更方便。

●数据防损DD600/800设计之初,为了保证数据的完整性和可恢复性,就充分考虑到了要防止和及时发现硬件或软件的故障,并能够在出现故障后自动恢复过来。

DD OS 的文件系统和RAID设计从根本上保证了复制、发现和纠正软件和硬件故障,同时与通用的文件系统和磁盘存储相比其保护程度更为严格。

●易于在已有的备份软件环境中使用和集成DD600/800所采用的工业标准NFS或CIFS接口,对于UNIX、Linux或Windows存储管理员来说非常熟悉。

DD600/800可以很容易地接入到现有备份软件环境中,并且支持诸如VERITAS、EMC/Legato和CommVault等业界领先的企业级备份软件。

DD OS还激活了备份产品中许多常被忽视的功能,比如用户发起的文件恢复。

●高性能的备份、恢复和磁带拷贝DD600/800系列产品在设计之初就从三个方面考虑到性能上的需求:✓满足日益缩小的备份窗口所需的更快速备份✓满足日益缩短的可容忍停机时间所需的更快速、更简便的恢复✓更快速、更简便地复制到异地存储1.1.2备份性能在备份和恢复应用方面,DD600/800在性能上可以和高端的串行ATA RAID 系统媲美。

与磁带驱动器不同,DD600/800不需要备份服务器为保证最佳的性能而发送持续的数据流。

在使用磁带时,为补偿慢速的客户端和网络以及诸如增量备份等短时备份的影响,常会使用复用技术。

而在使用DD600/800时,可以将多个并发的、不同速度的数据流发给一个DD600/800。

如果需要增加吞吐量和容量,只要增加DD600/800的数量就可以满足在可用的备份窗口传输任意量数据的需要。

1.1.3恢复性能恢复性能是DD600/800产品最具有优势的地方。

我们以一个典型的备份策略为例:每星期六的全备份加每天的增量备份。

这种策略下如果采用磁带备份,那么如果在星期五早上做完全恢复,就需要顺序读取所有的磁带,还要反复的加载和卸载磁带。

如果在磁带库中没有所需要的磁带,那为了找到必须的磁带可能花费几个小时,甚至几天的时间。

复用技术的采用会恶化性能,因为需要一边读磁带、一边要跳过其他客户端的数据。

与其相反,不管所需的恢复影像数据分布得多散,DD600/800在响应备份软件的请求时可以提供持久的高性能。

我们在来看另一个更常见的情况:在星期五早上的部分恢复——即只有几个文件需要恢复。

采用磁带备份,尽管这只是部分恢复,但仍需要多盘磁带;当然如果一盘磁带找不到就会耽误时间。

就算按照平均的文件访问和介质加载时间计算,开始读取数据前所需的时间是按分钟计的;而采用DD600/800,这种时间是按毫秒计的。

DD600/800由于采用磁盘随机访问的特性,其性能比磁带高出许多。

1.1.4DD600/800的在线保存技术和中转平台技术的比较由于DD600/800可高效地保存数月的备份数据,所以从DD600/800上实现的恢复就算不是全部,也是绝大部分。

这与以磁盘为中转设备的以磁带介质为主的恢复不同。

在某些备份系统中,磁盘是作为磁带的缓存使用的。

在缓存的方案中,备份数据首先会被导向或中转到磁盘上。

在备份数据复制到磁带上后,为了下一次的备份腾出空间,磁盘上缓存的数据就会被删除。

这种备份方式可以利用到磁盘的速度优势以提高备份性能。

不过在恢复时还是需要磁带来完成,所以影响性能的定位、加载和一序列磁带的顺序访问等问题依然存在。

1.1.5DD600/800用于灾难恢复的异地复制DD600/800让异地复制或网络仓库(network vaulting)方案更加简单、快速、成本更低。

可选的Data Domain Replicator软件利用DD OS特有的优势特性,将在两个DD600/800之间通过网络的异步备份数据复制构建得更为简单和高效。

通过采用Replicator,数据首先经标准的备份软件备份到本地的DD600/800上;随后本地的DD600/800会作为“发起端”通过TCP/IP或广域网WAN将数据复制到远端的复制用DD600/800上。

由于容量优化(Capacity Optimization)技术的原因,与其他基于磁盘的备份系统相比,其通过广域网传输的数据量减少了95%以上。

如果必要的话,数据可以通过网络以同样的效率从异地的复制端恢复,或者将异地的数据直接在异地恢复。

异地的复制用DD600/800也可以把数据导入到磁带上以便存档。

所以说一对Restorer的复制性能远远高于实际物理链接所能够提供的性能。

在ESG实验室所演示的性能高达450MB/s,这是因为对于整个要传输的镜像来说只会传那些唯一的数据段。

所有的备份都被定向到Site A的磁盘设备;所有的备份数据都被异步复制到Site B;既可以在Site A也可以在Site B恢复文件;磁带被转用于长期归档应用;1.1.6DD600/800到磁带的拷贝当为了长期存档的目的而需要将数据拷贝到磁带上时,单个DD600/800就足以提供足够的数据流以便让一台高端的磁带机发挥最佳的性能。

而在做往磁带上拷贝数据的同时,DD600/800还可以执行备份和恢复操作。

与使用磁带相反,在做磁带归档操作时,如果需要从DD600/800上恢复数据是不需要停止归档操作的。

DD600/800将高吞吐量,可以保存许多星期备份数据的存储容量,随机访问特性,以及通过网络的高速复制这些优势结合在一起,从而大大改善了整个备份和恢复过程。

1.1.7为高效益恢复存储而设计的容量优化技术备份数据中会包含太多的冗余部分,而当我们将某一周的全备份镜像和其随后的各个周的全备份镜像相比尤其如此。

尽管增量备份只是取那些变化的文件,但增量备份中通常会包含冗余的数据块。

DD OS 容量优化(Capacity Optimization)技术是通过只保存唯一一份备份镜像冗余部分中的数据段来实现的。

当数据写入到DD600/800时,数据会被分成可变长度的数据段,也可以说一序列的字节。

DD OS会实时将该数据段与已经存储的各数据段做比较。

这种方式保证每个唯一独特的数据段只保留一份。

所以DD OS可以在文件内或文件间,甚至是数据块内发现重复的文件和数据段。

实际所需的存储空间也就相对于所保存的数据量低一个数据量级。

要使得容量优化有效率的关键是要不依赖于数据格式。

DD OS的实现方式——全局压缩(Global Compression)——是基于对数据内容和重复模式的研究分析而定的。

Global Compression技术可以应用到任意类型的重复数据——结构化数据(比如数据库)或者非结构化数据(比如文本文件,存储在文件系统或原始卷(raw volume)上的数据)。

DD OS通过采用Global Compression技术,不管什么样的数据格式,都可以实现高效率的备份。

其实容量优化技术所依据的原理并不是新出现的,而是在学术圈里已经存在数十年了(参见本文档的参考文献)。

Data Domain的实现方式和知识产权在优化算法中属于性能卓越的,这使得大量数据空间节省的优势对于备份和恢复过程来说是完全透明的。

1.1.8容量优化技术原理Global Compression算法会对所有要存放在DD600/800上数据做分析,而不管数据的格式和排列方式如何。

优化的好处随着时间的推移会越来越明显。

对于压缩效果最大的一个影响是备份策略。

全备份相对于增量备份的重复度更高;越多的全备份越能够加剧压缩效率。

但就算使用增量备份,Global Compression算法依然可以减少80%到90%的数据量。

假设是每周全备结合每天的增量备份的话,经过四个星期,预计压缩率可以达到10:1。

八个星期后,预计压缩率为14倍。

在18个星期后可以达到20倍的压缩率。

而对于Oracle和Exchange所推荐的每天全备份策略来说,压缩效果更快的显现出来,一般预计会在1个星期后达到10倍的压缩率;2个星期后就可以达到20倍的压缩率。

Global Compression技术被应用于各种各样类型的数据,比如Oracle和其他SQL型数据库、SAP数据、文本文件、home目录、工程文件(如软件开发和半导体设计)、UNIX二进制文件、PC应用软件、Microsoft™ Exchange,和Microsoft Office文档。

影响压缩效果的另一个因素是数据本身。

一份包含多份副本文件或相似文件(一个文件被拷贝很多次,各个版本间的变化很小)的备份镜像,显然容量优化利于应用于这种数据。

某些数据并不重复,容量优化技术也不是很有利于应用在其上,这些数据包括含有静态二进制图像的地震映射数据或卫星遥感数据等。

如果数据无冗余可资利用,DD OS的算法依然比其他常用的压缩算法或重复文件消除算法更能够保证数据的压缩效率。

第一份全备份减少的3-4倍的数据量;文件级增量备份的效果是6-7倍,而随后的全备份可以达到50-60倍压缩比;每星期全备和每天增量备份结合的效果是20倍1.1.9全局压缩和快照或块级增量备份的比较全局压缩(Global Compression)存储备份数据非常高。

相关文档
最新文档