云存储基础架构剖析
云计算基础架构介绍

云计算基础架构介绍引言随着互联网技术的发展和普及,云计算作为一种新兴的技术架构,正在逐渐改变着我们的生活方式和工作方式。
云计算基础架构作为云计算的核心组成部分,对于云计算的高效、稳定和安全运行至关重要。
本文将详细介绍云计算基础架构的定义、组成部分、类型以及优势,以便读者更好地了解和掌握这一技术。
概述云计算基础架构是指为云计算提供基础支持的一套技术架构,包括硬件、软件和网络等方面。
它为上层云计算服务提供了稳定、高效和安全的基础设施,使得各种云计算服务能够更好地满足用户的需求。
云计算基础架构通常包括计算、存储、网络、安全和管理等方面,其中每个方面都有其特定的技术和工具。
云计算基础架构的类型根据不同的分类标准,可以将云计算基础架构分为以下几种类型:1、云平台:云平台是一种提供基础设施即服务(IaaS)的云计算基础架构。
它为用户提供虚拟的计算资源、存储资源和网络资源,用户可以在这些资源上构建自己的云计算环境。
常见的云平台包括亚马逊AWS、微软Azure和阿里云等。
2、云服务:云服务是一种提供软件即服务(SaaS)的云计算基础架构。
它为用户提供基于云端的软件服务,用户可以通过互联网访问和使用这些服务。
常见的云服务包括云邮箱、云存储和云桌面等。
3、云应用:云应用是一种将云计算技术和传统应用软件相结合的云计算基础架构。
它为用户提供基于云端的、定制化的应用软件服务,用户可以在各种终端设备上使用这些服务。
常见的云应用包括在线办公系统、在线CRM系统和在线HR系统等。
云计算基础架构的优势云计算基础架构具有以下优势:1、成本:云计算基础架构使得企业无需购买和维护昂贵的硬件设备,降低了IT成本。
同时,按需付费的方式也使得企业能够更好地控制成本。
2、运维:云计算基础架构的自动化管理和维护减少了IT人员的运维工作量,提高了运维效率和质量。
3、安全:云计算基础架构提供了完善的安全措施,如数据加密、多层次防火墙等,保障了用户数据的安全性。
云存储基础架构剖析

云存储基础架构剖析云存储基础架构剖析
云存储基础架构剖析
模型,功能和内部机制
以目前数据增长的速度来看,云存储越来越流行不足为奇。增长速度最快的数据
是归档数据,鉴于很多因素它是云存储的理想之选,这些因素包括成本、访问频
率、保护和可用性。但是并非所有云存储都是相同的。一家提供商可能主要关注
有一些有趣而新颖的方案可用于解决可用性,比如信息传播。一家提供私有云存
储的公司 Cleversafe(稍后介绍)使用 Information Dispersal Algorithm (IDA)
来在发生物理故障和网络中断的情况下实现更高的可用性。IDA 是由 Michael
Rabin 最初为电信系统而创建的一种算法,它支持使用 Reed-Solomon 代码对数
于成本,而另一家提供商关注于可用性或性能。没有一个架构具有单一侧重点,
但是一个架构实现给定特征的程度定义了其市场和适当的使用模型。 常用缩略词
常用缩略常用缩略词
常用缩略词 ? API:应用程序编程接口 ? FTP:文件传输协议 ? HTTP:超文本传输协议 ? HTTPS: 通过安全套接字层的 HTTP ? JFS: 日志文件系统 ? NFS:网络文件系统 ? NIC:网络接口卡 ? RAID:独立磁盘冗余阵列 ? REST:具象状态传输 ? SAN:存储区域网络 ? SCSI:小型计算机系统接口 ? SLA:服务级别协议 ? TCP:传输控制协议 ? UDP:用户数据报协议 ? WAN:广域网 不从效用角度谈论架构是很难的。我的意思是,通过各种特征度量一个架构,包
云存储的可扩展性
在内部,一个云存储架构必须能够扩展。服务器和存储必须能够在不影响用户的
云计算的架构和设计

云计算的架构和设计随着信息时代的到来,人们对于数据的需求越来越高,同时云计算技术的出现让数据存储和处理变得更加便捷。
那么云计算的架构和设计是什么呢?一、云计算的架构云计算的架构分为三层,分别是应用服务层、平台服务层和基础设施层。
1.应用服务层:这一层包含了云计算的各种应用服务,例如云存储,云数据库,云邮件等。
这一层的服务是为用户提供便捷的数据存储和处理服务。
其中,最为常见的应用服务是云存储服务。
2.平台服务层:这一层包含了云计算的平台服务,例如云计算平台,云开发平台,云数据分析等。
这一层的服务是为用户提供云平台搭建的支持,其目的是为用户提供更专业化的云服务。
3.基础设施层:这一层包含了云计算的基础设施,例如云计算机,云存储控制器等。
这一层是云计算平台最底层的基本构成部分,相当于支撑云计算整个系统的基石。
以上三层构成了云计算的基础架构。
二、云计算的设计云计算的设计涉及到以下几个方面:1.资源池的实现云计算的成本主要集中在数据中心的建设和维护上。
因此,云计算需要通过资源池的方式,对数据中心的资源进行有效的利用。
资源池的实现需要考虑到内部的资源利用率和外部的资源分享率。
2.虚拟化技术的应用虚拟化技术可以实现多个物理资源的虚拟化,构建出多个虚拟计算机。
虚拟计算机可以对资源进行隔离,实现高效的资源使用。
虚拟化技术在云计算中得到了广泛的应用。
3.网络架构的设计网络架构设计是云计算的关键。
它涉及到数据中心内部网络的设计和数据中心与用户之间的连接。
对于数据中心内部网络的设计,应该采取一定的层次结构,将网络分为不同的区域,以便对不同的用户提供不同的服务。
对于数据中心与用户之间的连接,应该采用多种方式,例如 VPN 连接、数据隧道等,以保证数据的安全传输。
4.自动化管理的实现云计算系统中的管理需要实现自动化的管理。
比如,自动化的配置,自动化的监控和自动化的调度。
这些自动化管理的功能,可以很好的提高数据中心管理的效率,降低运维成本。
云存储的基本架构

云存储的基本架构
云存储的基本架构通常包括四个主要层次:存储层、基础管理层、应用接口层和访问层。
以下是对这四个层次的详细解释:
1. 存储层:这是云存储最基础的部分,由各种存储设备组成。
这些设备可以是光纤通道存储设备、IP存储设备(如NAS和iSCSI)或DAS存储设备(如SCSI或SAS)等。
这些存储设备通过广域网、互联网或FC光纤通道网络连接在一起,形成一个庞大的存储网络。
在存储层之上,通常会有一个统一存储设备管理系统,该系统可以实现存储设备的逻辑虚拟化管理、多链路冗余管理,以及硬件设备的状态监控和故障维护。
2. 基础管理层:这是云存储最核心的部分,也是最难以实现的部分。
基础管理层通过集群、分布式文件系统和网格计算等技术,实现云存储中多个存储设备之间的协同工作,使多个的存储设备可以对外提供同一种服务,并提供更大更强更好的数据访问性能。
3. 应用接口层:这是云存储最灵活多变的部分。
它可以根据实际需求提供各种应用接口,例如视频监控应用平台、IPTV和视频点播应用平台、网络硬盘引用平台,远程数据备份应用平台等。
4. 访问层:任何一个授权用户都可以通过标准的公用应用接口来登录云存储系统,享受云存储服务。
云存储运营单位不同,云存储提供的访问类型和访问手段也不同。
云计算基础架构方案

云计算基础架构方案云计算是近年来蓬勃发展的一种计算模式,通过虚拟化技术和分布式计算,将计算资源以服务的形式提供给用户。
为了有效地支持云计算环境下的各种应用和服务,构建一个稳定、高效的云计算基础架构是至关重要的。
本文将提出一个可行的云计算基础架构方案。
一、物理基础架构在云计算基础架构中,服务器是关键的组成部分。
首先,我们需要建立一个可靠的物理服务器集群,以确保云计算环境的稳定运行。
服务器集群应该具备高性能、高可用性和扩展性。
此外,为了保障数据的安全性,我们应该将服务器集群部署在安全可靠的机房中,配备备用电源和灾备设施,以应对突发情况。
二、虚拟化技术虚拟化技术是云计算的基石之一,它将物理服务器划分为多个虚拟机,使得一台物理服务器可以同时运行多个独立的操作系统和应用程序。
在云计算基础架构中,我们可以采用主流的虚拟化技术,如VMware、KVM或Hyper-V来实现虚拟机管理。
通过合理分配资源,我们可以充分利用服务器资源,提高计算效率,提供稳定可靠的服务。
三、存储方案在云计算环境下,大量的数据需要进行存储和管理。
我们需要建立一个高性能、可扩展的存储系统,以满足大规模数据存储和访问的需求。
可以考虑采用分布式存储技术,如Ceph或GlusterFS,将数据分布在多个物理节点上,提高存储的可靠性和可用性。
此外,为了提供高速的数据访问,可以采用SSD或NVMe等高性能存储设备,加速数据的读写速度。
四、网络架构在云计算基础架构中,网络是实现用户与云平台之间通信的基础设施。
我们需要建立一个高性能、可靠的网络架构,以确保数据在云环境中的快速传输和可靠交换。
可以采用SDN(软件定义网络)技术来实现网络的虚拟化和管理,提高网络的灵活性和可控性。
同时,为了保证网络的稳定性和安全性,我们应该采取相应的网络安全措施,如防火墙、入侵检测系统等。
五、监控与管理在云计算基础架构中,监控和管理是非常重要的环节。
我们需要建立一个全面的监控系统,实时监测服务器、存储、网络等各个组件的状态和性能指标。
云计算基础架构

云计算基础架构在当今数字化的时代,云计算已经成为了企业和个人不可或缺的技术手段。
云计算基础架构作为云计算的基石,其重要性不言而喻。
那么,究竟什么是云计算基础架构呢?简单来说,它是支撑云计算服务运行的一系列硬件、软件和网络组件的集合。
就好像是一座大厦的框架,为各种功能和服务提供了坚实的基础。
云计算基础架构主要包括三个关键部分:计算资源、存储资源和网络资源。
计算资源是云计算的“大脑”。
它包括服务器,这些服务器可以是物理服务器,也可以是虚拟服务器。
虚拟服务器的出现极大地提高了资源的利用率。
想象一下,以前一台服务器只能为一个应用程序服务,现在通过虚拟化技术,可以在一台服务器上同时运行多个虚拟机,每个虚拟机都可以运行不同的应用程序,大大节省了硬件成本和空间。
而且,云计算提供商还能够根据用户的需求动态地分配计算资源,实现弹性扩展。
比如在双十一期间,电商网站的访问量会暴增,这时候云计算就可以迅速为其增加计算资源,保证网站的稳定运行,而在访问量恢复正常后,又可以把多余的资源释放出来,避免浪费。
存储资源则是云计算的“仓库”。
它负责存储各种数据,包括用户的文件、数据库、图片、视频等等。
云计算中的存储通常分为块存储、文件存储和对象存储。
块存储就像是电脑里的硬盘,直接将数据以块的形式存储和读取,适合对性能要求高的应用,比如数据库。
文件存储则类似于我们常见的文件系统,可以通过目录和文件名来访问和管理文件,适合共享文件的场景。
对象存储则是将数据作为对象进行存储,每个对象都有唯一的标识符,适合存储大量的非结构化数据,比如图片和视频。
而且,云计算的存储资源通常具有高可靠性和可扩展性,数据会被自动备份到多个地方,以防止丢失。
网络资源是云计算的“血管”。
它确保了数据能够在计算资源和存储资源之间快速、稳定地传输。
云计算中的网络包括内部网络和外部网络。
内部网络用于连接云计算平台中的各个组件,保证它们之间的通信顺畅。
外部网络则用于连接用户和云计算平台,让用户能够随时随地访问云服务。
云计算基础架构

云计算基础架构云计算作为当今信息技术领域的重要创新,已经深入影响并改变了人们的生活和工作方式。
云计算的基础架构是支撑云计算系统及服务运行的核心,它的设计和实施对于云计算的可靠性、可扩展性和安全性起着决定性的作用。
本文将探讨云计算基础架构的构成要素及其特点,并分析其对云计算发展的影响。
一、云计算基础架构的构成要素1. 虚拟化技术:虚拟化技术是云计算基础架构的重要组成部分。
通过虚拟化技术,可以将物理服务器分割为多个虚拟机实例,并能够在不同的物理机上进行迁移和管理。
虚拟化技术的运用大大提高了服务器资源的利用率,降低了硬件成本,并增强了系统的可靠性和灵活性。
2. 分布式存储系统:分布式存储系统是云计算基础架构的重要支撑。
通过将数据分散存储在多个存储节点上,可以实现数据的高可用性和水平扩展性。
分布式存储系统采用副本技术来保证数据的冗余备份,以应对硬件故障和数据丢失的风险。
3. 虚拟网络技术:虚拟网络技术是云计算基础架构中的关键技术之一。
通过虚拟网络技术,可以将物理网络资源划分为多个虚拟网络实例,并实现虚拟网络之间的隔离和互联。
虚拟网络技术使得云计算系统能够提供灵活的网络服务,满足不同用户的需求。
4. 资源调度与管理技术:资源调度与管理技术是云计算基础架构中的关键环节。
通过资源调度与管理技术,可以根据用户需求自动分配和调度云计算资源,提高资源利用率和系统性能。
资源调度与管理技术还能够根据系统的负载情况和用户的需求进行动态调整,以保证系统的稳定性和可靠性。
二、云计算基础架构的特点1. 可扩展性:云计算基础架构具备良好的水平扩展能力,能够根据业务需求快速增加或减少计算、存储和网络资源,以适应不同规模的业务需求。
2. 高可用性:云计算基础架构通过多副本备份和容错机制来实现高可用性,能够提供持续的服务可用性和数据可靠性,防止系统单点故障和数据丢失。
3. 弹性计算:云计算基础架构具备良好的弹性计算能力,能够根据用户需求自动调整计算资源的分配和释放,以提高系统性能和效率。
华为云的基本架构和服务

华为云的基本架构和服务随着云计算的兴起,越来越多的企业开始将自己的业务、数据甚至整个 IT 基础设施迁移到云上。
作为国内领先的云计算服务提供商,华为云以其强大的技术基础、丰富的产品线和优质的服务赢得了越来越多企业和用户的青睐。
那么,华为云的基本架构和服务是怎样的呢?一、基本架构华为云基于全球自有化的基础设施,在全球范围内布局数据中心和 CDN 边缘节点,构建了全球覆盖的云平台。
这个平台采用了华为 HiCloud 虚拟化平台,以 OpenStack 为基础,通过自主研发支持多租户的云管理平台 FusionAccess 等组成了一个高度可靠、高性能的云计算基础架构。
华为云在基础设施方面采用了多种技术手段,如虚拟化、容器化、分布式系统等,从而提高了云计算平台的可靠性、弹性、灵活性和可扩展性。
同时,华为云积极与其他厂商、组织合作,建立了丰富的开放生态系统,以满足应用开发、数据集成和部署等方面的需求。
二、服务华为云提供的服务包括计算、存储、网络、安全、数据库、分析、人工智能等多个领域,具有很强的综合性和可定制性。
下面我们就来看一下华为云的主要服务。
1.计算服务华为云的计算服务主要有弹性云服务器、容器引擎、函数计算等。
其中,弹性云服务器是一种基于虚拟机实现的计算资源,可以用来运行各种应用程序。
容器引擎则是一个轻量级的应用运行时环境,可以更快、更便捷地部署、运行和管理应用程序。
函数计算则是一种无服务器化的计算模型,提供事件驱动的计算能力,可以大大降低运维成本和资源浪费。
2.存储服务华为云的存储服务主要有对象存储、文件存储、块存储等。
对象存储是一种高可靠、高扩展性的云存储服务,适合存储大量非结构化数据。
文件存储则是一种高性能、高可扩展性的云存储服务,适合存储半结构化数据。
块存储则是一种基于网络协议的云存储服务,适合存储结构化数据和虚拟机磁盘等。
3.网络服务华为云的网络服务主要有弹性公网IP、负载均衡、云网络等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
云存储基础架构剖析模型,功能和内部机制M. Tim Jones, 资深软件工程师简介:云存储(或数据存储即服务)是对接口后的存储的抽象,可在该接口内按需管理存储。
此外,接口抽象化存储的位置,这样一来,不管存储是在本地还是远程(或混合)都无关紧要。
云存储基础架构引入新的架构,能够支持为大量潜在用户提供不同水平的服务,以及地理上分散的存储容量。
了解云存储架构的关键架构属性—从数据保护和完整性到存储优化。
本文的标签:cloud, cloud-storage, computing, 云存储基础架构, 云计算, 存储, 应用开发, 硬件平台, 管理, 资产管理常用缩略词∙API:应用程序编程接口∙FTP:文件传输协议∙HTTP:超文本传输协议∙HTTPS: 通过安全套接字层的 HTTP∙JFS: 日志文件系统∙NFS:网络文件系统∙NIC:网络接口卡∙RAID:独立磁盘冗余阵列∙REST:具象状态传输∙SAN:存储区域网络∙SCSI:小型计算机系统接口∙SLA:服务级别协议∙TCP:传输控制协议∙UDP:用户数据报协议∙WAN:广域网以目前数据增长的速度来看,云存储越来越流行不足为奇。
增长速度最快的数据是归档数据,鉴于很多因素它是云存储的理想之选,这些因素包括成本、访问频率、保护和可用性。
但是并非所有云存储都是相同的。
一家提供商可能主要关注于成本,而另一家提供商关注于可用性或性能。
没有一个架构具有单一侧重点,但是一个架构实现给定特征的程度定义了其市场和适当的使用模型。
不从效用角度谈论架构是很难的。
我的意思是,通过各种特征度量一个架构,包括成本、性能、远程访问,等等。
因此,我首先定义一组可度量云存储模型的标准,然后探究云存储架构内的一些有趣的实现。
首先,我们讨论一个通用的云存储架构,设置上下文以供后面探究独特的架构特性。
通用架构云存储架构主要关乎以一个高度可扩展和多租户的方式按需交付存储。
通用(参见图 1)的云存储架构包含一个导出 API 以访问存储的前端。
在传统的存储系统中,这个 API 是 SCSI 协议;但是在云环境中,这些协议在演化。
在那里您可以找到 Web 服务前端、基于文件的前端,甚至更多传统前端(比如 Internet SCSI 或 iSCSI)。
在前端后面是一个中间件层,我将它称作存储逻辑。
该层通过传统的数据放置算法(考虑地理布局)实现各种功能,比如复制和数据简缩。
最后,后端实现对数据的物理存储。
这可能是一个实现特定功能的内部协议或物理磁盘的一个传统后端。
图 1. 通用的云存储架构从图 1 中,您可以看到当前云存储架构的一些特征。
注意,没有特征在特定层中是独有的,而是充当本文探讨的特定主题的指导。
这些特征的定义见表 1。
表 1. 云存储特征特征说明可管理性以最少的资源管理系统的能力访问方法公开云存储所用的协议性能根据宽带和延迟衡量的性能多租户支持多个用户(或承租者)可扩展性通过扩展满足更高要求或以得体的方式加载的能力数据可用性对一个系统的正常运行时间的衡量控制控制系统的能力—特别是为成本、性能或其他特征进行配置存储效率度量如何高效使用原始存储成本度量存储成本(通常以美元每 GB 为单位)可管理性云存储的一个重点是成本。
如果客户可以购买并在本地管理存储,而不是在云中租赁它,那么云存储市场就会消失。
但是成本可划分为两个高级类别:物理存储生态系统本身的成本和管理它的成本。
管理成本是隐式的,但却是总体成本的一个长期组成部分。
为此,云存储必须能在很大程度上进行自我管理。
引入新存储(其中系统通过自动自我配置来容纳它)的能力和在出现错误时查找和自我修复的能力很重要。
在未来,诸如自主计算这样的概念将在云存储架构中起到关键的作用。
访问方法云存储与传统存储之间最显著的差异之一是其访问方法(参见图 2)。
大部分提供商实现多个访问方法,但是 Web 服务 APIs 是常见的。
许多 APIs 是基于REST 原则实现的,即在 HTTP 之上开发(使用 HTTP 进行传输)的一种基于对象的方案。
REST APIs 是无状态的,因此可以简单而有效地予以提供。
许多云存储提供商实现 REST APIs,包括 Amazon Simple Storage Service (Amazon S3)、Windows Azure™ 和 Mezeo Cloud Storage Platform。
Web 服务 APIs 的一个问题是,它们需要与应用程序集成,以利用云存储。
因此,对云存储也使用常见的访问方法来提供即时集成。
例如,NFS/Common Internet File System (CIFS) 或 FTP 等基于文件的协议,iSCSI 等基于块的协议。
Nirvanix、Zetta 和 Cleversafe 等云存储提供商提供这些访问方法。
尽管上面提到的协议是最常用的,但也有适合云存储的其他协议。
最有趣的其中一个是基于 Web 的分布式创作与版本控制(WebDAV)。
WebDAV 也基于 HTTP,且将 Web 作为一种可读写的资源加以启用。
WebDAV 的提供商包括 Zetta 和Cleversafe 等。
图 2. 云存储访问方法您还可以寻找支持多协议访问的解决方案。
例如,IBM® Smart Business Storage Cloud 从同一存储虚拟化架构同时启用基于文件(NFS 和 CIFS)的协议和基于SAN 的协议。
性能性能表现为很多方面,但是在用户与远程云存储提供商之间移动数据的能力是云存储最大的挑战。
问题就是 TCP,它同时也是互联网的主力。
TCP 基于数据包确认从对等端点控制数据流。
数据包丢失或延迟到达情况下将启用阻塞控制,进一步限制性能以避免更多全局网络问题。
TCP 适用于通过全局 Internet 启用小量数据,但不适用于会增加往返时间(RTT)的大型数据移动。
通过 Aspera Software,Amazon 解决了这个问题,方法就是从程式中删除 TCP。
且开发了一个称为Fast and Secure Protocol(FASP™) 的新协议,以在大型 RTT 和严重数据包丢失情况下加速批量数据移动。
关键是 UDP 的使用,它是 TCP 的缔约方传输协议。
UDP 允许主机管理阻塞,将这个方面推进到 FASP 的应用层协议中(参见图 3)。
图 3. Aspera Software 上的 Fast and Secure Protocol通过标准(非加速)NICs、FASP 有效使用应用程序可用带宽,并移除传统的批量数据传输模式的基本瓶颈。
参考资料部分提供在传统 WAN、洲际传输和有损卫星链接中 FASP 性能相关的一些有趣统计信息。
多租户云存储架构的一个关键特征称为多租户。
这只是表示存储由多个用户(或多个“承租者”)使用。
多租户应用于云存储堆栈的多个层,从应用层(其中存储名称空间在用户之间是隔离的)到存储层(其中可以为特定用户或用户类隔离物理存储)。
多租户甚至适用于连接用户与存储的网络基础架构,向特定用户保证服务质量和优化带宽。
可扩展性您可以从多个方面看待可扩展性,但正是云存储的随需视图使其最具吸引力。
扩展存储需求(向上和向下)可改善用户成本,提高云存储提供商的复杂性。
不仅要为存储本身提供可扩展性(功能扩展),而且必须为存储带宽提供可扩展性(负载扩展)。
云存储的另一个关键特性是数据的地理分布(地理可扩展性),支持经由一组云存储数据中心(通过迁移)使数据最接近于用户。
对于只读数据,也可以进行复制和分布(使用内容传递网络完成)。
这如图 4所示。
图 4. 云存储的可扩展性在内部,一个云存储架构必须能够扩展。
服务器和存储必须能够在不影响用户的情况下重新调整大小。
正如在可管理性部分所讨论的,自主计算是云存储架构所必需的。
可用性如果一个云存储供应商有用户的数据,它必须能够应求将该数据提供给用户。
鉴于网络中断、用户错误和其他情况,这很难以一种可靠而确定的方式予以提供。
有一些有趣而新颖的方案可用于解决可用性,比如信息传播。
一家提供私有云存储的公司 Cleversafe(稍后介绍)使用 Information Dispersal Algorithm (IDA) 来在发生物理故障和网络中断的情况下实现更高的可用性。
IDA 是由 Michael Rabin 最初为电信系统而创建的一种算法,它支持使用 Reed-Solomon 代码对数据进行切片处理,以便在数据丢失的情况下实现数据重建。
此外,IDA 允许您配置数据切片的数量,这样一来,可以为一个可接纳故障将数据对象分割成 4 个切片,对 8 个可接纳故障分割成 20 个切片。
与 RAID 类似,IDA 支持通过原始数据的子集重建数据,含有一定数量的代码错误开销(依赖于可接纳故障的数量)。
这如图 5所示。
图 5. Cleversafe 用于最大化数据可用性的方法有了为数据切片的能力以及 cauchy Reed-Solomon 纠错码,就可以将切片分发到地理上分散的站点进行存储。
对于大量切片(p)和大量可接纳故障(m),最终开销是p/(p-m)。
因此在图 5中,p = 4 且m = 1 的存储系统的开销是is 33%。
IDA 的缺点在于,它是处理密集型的,无硬件加速。
复制是另一个有用的技术,且由各个云存储提供商实现。
尽管复制技术引入了大量开销(100%),但可以简单而高效地提供它。
控制一名客户控制和管理其数据存储方式及其相关成本的能力很重要。
许多云存储提供商实施控制,使用户对其成本有更大的控制权。
Amazon 实现 Reduced Redundancy Storage (RRS),为用户提供最小化总存储成本的一种方式。
数据是在 Amazon S3 基础架构内复制的,但使用 RRS,数据复制次数较少,且存在丢失数据的可能性。
这适用于可重新创建的或在其他地方有副本的数据。
Nirvanix 还提供基于策略的复制来对如何以及在何处存储数据提供更细粒度的控制。
效率存储效率是云存储基础架构的一个重要特征,特别是将重点放在总成本上。
下一部分专门介绍成本,但是该特征更多地是关于对可用资源的高效使用,而非成本。
要使一个存储系统更高效,必须存储更多数据。
一个常见的解决方案就是数据简缩,即通过减少源数据来降低物理空间需求。
实现这一点的两种方法包括压缩—通过使用不同的表示编码数据来缩减数据—和重复数据删除—移除可能存在的相同的数据副本。
虽然两种方法都有用,但压缩方法涉及到处理(重新编码数据进出基础架构),而重复数据删除方法涉及到计算数据签名以搜索副本。
成本云存储最显著的特征之一是通过使用降低成本的能力。
这包括购置存储的成本、驱动存储的成本、修复存储的成本(当驱动器出现故障时)以及管理存储的成本。