云计算及其关键技术

云计算及其关键技术
云计算及其关键技术

收稿日期:2009-03-14;修回日期:2009-05-09。

作者简介:陈全(1986-),男,安徽滁州人,硕士研究生,主要研究方向:云计算、数据密集型可扩展计算; 邓倩妮(1973-),女,广西柳州人,副教授,博士,主要研究方向:对等计算、网格计算、复杂网络拓扑。

文章编号:1001-9081(2009)09-2562-06

云计算及其关键技术

陈 全,邓倩妮

(上海交通大学计算机科学与工程系,上海200240)

(squ i rr3@g m ai.l co m )

摘 要:云计算是一种新兴的计算模型,它是在网格计算的基础上发展而来的。介绍了云计算的发展历史和应用场景,比较了现有的云计算的定义并给出了新的定义,以谷歌的云计算技术为例,总结了云计算的关键技术:数据

存储技术(G oog l e F ile System )、数据管理技术(B igT ab l e)、编程模型和任务调度模型(M ap -R educe)等,分析了云计算和网格计算以及传统超级计算的区别,并指出了云计算的广阔发展前景。

关键词:云计算;数据存储;数据管理;编程模型

中图分类号:T P338.8 文献标志码:A

C loud co m puti ng and its key techniques

C H E N Quan ,DENG Q i a n -n i

(De part m e n t of Compu ter S cience and Eng i neering,Shangha i Jiao Tong Un i v e rsit y,Shanghai 200240,Ch i na )

Abstract :C loud computi ng i s a ne w co m puti ng m ode;l it is deve l oped based on gr i d computi ng.T he aut hors i n troduced the develop m ent history o f cloud com puti ng and its applicati on situati on ;co m pa red ex isti ng defi nitions o f c l oud com puti ng and gav e a new defi n iti on ;took goog l e p s cloud computing techn i ques as an examp l e ,su mm ed up key techn i ques ,such as data storage techno l ogy (G oog le F ile Sy stem ),data m anage m en t techno l ogy (B i gT ab l e ),as we ll as prog ra mm i ng m ode l and task schedu ling m ode l(M ap -R educe ),used i n c l oud co m puti ng ;and ana l yzed the d ifferences among cloud compu ti ng ,g rid co m puti ng and traditi ona l s uper -computi ng ,and fi ngered out t he broad develop m ent prospec ts o f cloud co m puti ng .

K ey words :cloud co m puti ng ;data storag e ;da ta m anagement ;progra mm i ng m odel

0 引言

云计算(C l oud Co m puti ng)是一种新近提出的计算模式。是分布式计算(D istr i buted Computi ng )、并行计算(Para llel Co m puti ng)和网格计算(G rid Co m puti ng)的发展。

目前,亚马逊、微软、谷歌、IB M 、英特尔等公司纷纷提出了/云计划0。例如亚马逊的AW S(Am azon W eb Services)[1]、IB M 和谷歌联合进行的/蓝云0计划等。这对云计算的商业

价值给予了巨大的肯定。同时学术界也纷纷对云计算进行深层次的研究。例如谷歌同华盛顿大学以及清华大学合作,启动云计算学术合作计划(A cade m i c C loud Co m puti ng In iti ative),推动云计算的普及,加紧对云计算的研究。卡内基梅隆大学等对数据密集型的超级计算(D ata Intensi ve Super Co m puti ng ,D ISC )[2]进行研究,本质上也是对云计算相关技术开展研究。

I DC 的调查显示,未来五年云计算服务将急速增长,预期2012年市场规模可达420亿美元。目前企业导入云计算已逐渐普及,并且有逐年成长趋势。估计在2012年,企业投入在云计算服务的支出将占整体IT 成本的25%,甚至在2013年提高至IT 总支出的三分之一。

由此可见,在各大公司以及学术界的共同推动下,云计算技术将会持续发展。

云计算有着广泛的应用前景。如表1所示。云计算在天文学[3]、医学等各个领域有着广泛的应用前景。

趋势科技和瑞星等安全厂商纷纷提出了/安全云0计划。

如今,每天有2万多种新的病毒和木马产生,传统的通过更新

用户病毒库的防毒模式,受到了严峻的挑战,该模式使用户端的病毒库过于庞大。趋势科技和瑞星的/安全云0将病毒资料库放在/云0端,与客户端通过网络相连,当/云0在网络上发现不安全链接时,可以直接形成判断,阻止其进入用户机器,从根本上保护机器的安全。

表1 云计算的应用领域

领域应用场景科研

地震监测海洋信息监控天文信息计算处理医学

DNA 信息分析

海量病例存储分析医疗影像处理

网络安全

病毒库存储垃圾邮件屏蔽图形和图像处理

动画素材存储分析

高仿真动画制作海量图片检索互联网

E-m ail 服务

在线实时翻译网络检索服务

据趋势科技大中华区执行总裁张伟钦介绍,趋势科技已投入了大量资金,在全球数个地方建设了新型数据中心。同时,趋势科技还花费了1000多万美元,租借了34000多台服务器,构建了一个服务遍及全球的/安全云0。目前趋势科技

第29卷第9期

2009年9月

计算机应用

Journa l o f Co m puter App lications

V o.l 29No .9Sep .2009

已将公司中低端的部分产品线放到/云安全0计划中,而高端的大部分产品线,仍在准备过程中。

谷歌提供的Gm a il、G oog le E art h、G oogle A na l ytics等服务都基于其云计算服务器运行[4]。谷歌基于云计算提供的翻译服务具有现今最好的性能[5]。对互联网和美国人生活的一项研究显示,大约70%的在线用户使用以上/云计算0服务。

1云计算的定义

目前,云计算没有统一的定义,当前云计算的定义主要包括如下几种。

1)维基百科给云计算下的定义。云计算将I T相关的能力以服务的方式提供给用户,允许用户在不了解提供服务的技术、没有相关知识以及设备操作能力的情况下,通过Interne t获取需要的服务[6]。

2)中国云计算网将云计算定义为:云计算是分布式计算

(D i str i buted Co m puti ng)、并行计算(Pa ra lle l Com puti ng)和网格计算(G r i d Co m puti ng)的发展,或者说是这些科学概念的商业实现[7]。

3)文献[8]在综合多个云计算的定义之后,给/云0下了如下定义。云是一个包含大量可用虚拟资源(例如硬件、开发平台以及I/O服务)的资源池。这些虚拟资源可以根据不同的负载动态地重新配置,以达到更优化的资源利用率。这种资源池通常由基础设施提供商按照服务等级协议(Serv i ce Leve lA g ree m ent,SLA)采用用时付费(P ay-P er-U se,PPU)的模式开发管理。

对比上述定义,可以发现,文献[6]和文献[8]中给出的定义的相似之处在于它们都提到了云计算提供服务。文献[6]中的定义主要从云计算用户的角度给出定义,即用户在不了解具体实现的情况下通过Interne t获取服务。文献[7]从云计算的发展脉络的角度给出定义,主要说明了云计算的历史。文献[8]给出的定义则是从云计算提供者的角度来给出定义,定义了云计算的后台实现方式,以及管理模式。但是,这些定义都仅从一个方面定义云,并不完善。结合上述定义,可以总结出云计算的一些本质特征,即分布式的计算和存储特性,高扩展性,用户友好性,良好的管理性,用时付费等。云计算技术具有以下特点。

1)云计算系统提供的是服务。服务的实现机制对用户透明,用户无需了解云计算的具体机制,就可以获得需要的服务。

2)用冗余方式提供可靠性。云计算系统由大量商用计算机组成集群向用户提供数据处理服务。随着计算机数量的增加,系统出现错误的概率大大增加。在没有专用的硬件可靠性部件的支持下,采用软件的方式,即数据冗余和分布式存储来保证数据的可靠性。

3)高可用性。通过集成海量存储和高性能的计算能力,云能提供较高的服务质量。云计算系统可以自动检测失效节点,并将失效节点排除,不影响系统的正常运行。

4)高层次的编程模型。云计算系统提供高层次的编程模型。用户通过简单学习,就可以编写自己的云计算程序,在/云0系统上执行,满足自己的需求。现在云计算系统主要采用M ap-R educe模型。

5)经济性。组建一个采用大量的商业机组成的集群相对于同样性能的超级计算机花费的资金要少很多。

6)服务多样性。用户可以支付不同的费用,以获得不同级别的服务等。

为了更好地定义云计算,必须从云计算的服务使用者,服务提供者,组织方式,内部实现机制等方面同时定义。

根据现有定义的不足,本文定义云计算为:/云计算是由网格计算发展而来的,前台采用用时付费的方式通过Interne t 向用户提供服务。云系统后台由大量的集群使用虚拟机的方式,通过高速互联网络互连,组成大型的虚拟资源池。这些虚拟资源可自主管理和配置。用数据冗余的方式保证虚拟资源的高可用性。并具有分布式存储和计算、高扩展性、高可用性、用户友好性等特征。0

2云计算的关键技术

云计算是一种新型的超级计算方式,以数据为中心,是一种数据密集型的超级计算。在数据存储、数据管理、编程模式等多方面具有自身独特的技术。同时涉及了众多其他技术,如表2所示。本章主要介绍云计算特有的技术,包括数据存储技术,数据管理技术,编程模式等。其他相关技术请阅读给出的参考文献。

表2云计算涉及的关键技术

技术类型具体技术参考文献

设备架设

数据中心节能文献[4,9]

节点互联技术文献[10]改善服务技术

可用性技术文献[11-12]

容错性技术文献[12-13]资源管理技术

数据存储技术文献[14-16]

数据管理技术文献[11]任务管理技术

数据切分技术文献[17]

任务调度技术文献[12,17]

编程模型文献[12,15-17]其他相关技术

负载均衡技术文献[18]

并行计算技术文献[19-20]

虚拟机技术文献[13,21-22]

系统监控技术文献[23]

2.1数据存储技术

为保证高可用、高可靠和经济性,云计算采用分布式存储的方式来存储数据,采用冗余存储的方式来保证存储数据的可靠性,即为同一份数据存储多个副本。

另外,云计算系统需要同时满足大量用户的需求,并行地为大量用户提供服务。因此,云计算的数据存储技术必须具有高吞吐率和高传输率的特点。

云计算的数据存储技术主要有谷歌的非开源的G FS (G oog l e F il e Sy stem)[14]和H adoop开发团队开发的G FS的开源实现HDFS(H adoop D istri buted F il e Syste m)[15-16]。大部分I T厂商,包括雅虎、英特尔的/云0计划采用的都是HDFS的数据存储技术。

云计算的数据存储技术未来的发展将集中在超大规模的数据存储、数据加密和安全性保证以及继续提高I/O速率等方面。

以G FS为例。GFS是一个管理大型分布式数据密集型计算的可扩展的分布式文件系统。它使用廉价的商用硬件搭建系统并向大量用户提供容错的高性能的服务。

GFS和普通的分布式文件系统有以下区别,如表3所示。

2563

第9期陈全等:云计算及其关键技术

表3 GFS 与传统分布式文件系统的区别

文件系统组件失败管理文件大小数据写方式数据流和控制流GFS 不作为异常处理少量大文件在文件末尾附加数据数据流和控制流分开传统分布式文件系统

作为异常处理

大量小文件

修改现存数据

数据流和控制流结合

G FS 系统由一个M aster 和大量块服务器构成。M aster 存放文件系统的所有元数据,包括名字空间、存取控制、文件分块信息、文件块的位置信息等。GFS 中的文件切分为64M B 的块进行存储。

在GFS 文件系统中,采用冗余存储的方式来保证数据的可靠性。每份数据在系统中保存3个以上的备份。为了保证数据的一致性,对于数据的所有修改需要在所有的备份上进行,并用版本号的方式来确保所有备份处于一致的状态。

客户端不通过M aster 读取数据,避免了大量读操作使M aster 成为系统瓶颈。客户端从M aste r 获取目标数据块的位置信息后,直接和块服务器交互进行读操作。

G FS 的写操作将写操作控制信号和数据流分开,如图1[17]

所示。

图1 写控制信号和写数据流

即客户端在获取M aster 的写授权后,将数据传输给所有的数据副本,在所有的数据副本都收到修改的数据后,客户端才发出写请求控制信号。在所有的数据副本更新完数据后,由主副本向客户端发出写操作完成控制信号。具体请见文献[17]。

当然,云计算的数据存储技术并不仅仅只是G FS ,其他I T 厂商,包括微软、H adoop 开发团队也在开发相应的数据管理工具。本质上是一种分布式的数据存储技术,以及与之相关的虚拟化技术,对上层屏蔽具体的物理存储器的位置、信息等。快速的数据定位、数据安全性、数据可靠性以及底层设备内存储数据量的均衡等方面都需要继续研究完善。

2.2 数据管理技术

云计算系统对大数据集进行处理、分析向用户提供高效的服务。因此,数据管理技术必须能够高效地管理大数据集。其次,如何在规模巨大的数据中找到特定的数据,也是云计算数据管理技术所必须解决的问题。

云计算的特点是对海量的数据存储、读取后进行大量的分析,数据的读操作频率远大于数据的更新频率,云中的数据管理是一种读优化的数据管理。因此,云系统的数据管理往往采用数据库领域中列存储的数据管理模式。将表按列划分后存储。

云计算的数据管理技术中最著名的是谷歌在文献[11]提出的B i gT able 数据管理技术。

由于采用列存储的方式管理数据,如何提高数据的更新速率以及进一步提高随机读速率是未来的数据管理技术必须

解决的问题。

以B i gT able 为例。B i gT ab le 数据管理方式设计者)))

G oogle 给出了如下定义[11]:/B i gT able 是一种为了管理结构化数据而设计的分布式存储系统,这些数据可以扩展到非常大的规模,例如在数千台商用服务器上的达到PB (P etaby tes)规模的数据。0

B igT ab l e 对数据读操作进行优化,采用列存储的方式,提高数据读取效率。B i gT ab le 管理的数据的存储结构为:->str i ng 。B i gT able 的基本元素是:行,列,记录板和时间戳。其中,记录板是一段行的集合体。如图2所示。

图2 B i gTab le 的逻辑结构

B igT ab l e 中的数据项按照行关键字的字典序排列,每行动态地划分到记录板中。每个节点管理大约100个记录板。时间戳是一个64位的整数,表示数据的不同版本。列族是若干列的集合,B i gT able 中的存取权限控制在列族的粒度进行。B igT ab l e 在执行时需要三个主要的组件:链接到每个客户端的库,一个主服务器,多个记录板服务器。主服务器用于分配记录板到记录板服务器以及负载平衡,垃圾回收等。记录板服务器用于直接管理一组记录板,处理读写请求等。

为保证数据结构的高可扩展性,B igT ab l e 采用三级的层次化的方式来存储位置信息,如图3所示[11]。

其中第一级的Chubby fil e 中包含R oo t T ablet 的位置,R oot T ablet 有且仅有一个,包含所有M ETADATA tablets 的位置信息,每个M ETADATA tab lets 包含许多U ser T ab l e 的位置信息。

图3 B i gTab le 中存储记录板位置信息的结构

当客户端读取数据时,首先从Chubby fil e 中获取R oo t T ablet 的位置,并从中读取相应M ETADATA tab let 的位置信息。接着从该M ETADATA tablet 中读取包含目标数据位置信息的U ser T able 的位置,然后从该U ser T ab l e 中读取目标数据的位置信息项。据此信息到服务器中特定位置读取数据。具体见文献[11]。

这种数据管理技术虽然已经投入使用,但是仍然具有部分缺点。例如,对类似数据库中的Jo i n 操作效率太低,表内数据如何切分存储,数据类型限定为stri ng 类型过于简单等。而微软的D ryadL I NQ 系统[20]则将操作的对象封装为.N ET 类,这样有利于对数据进行各种操作,同时对Jo in 进行了优化,得到了比B i gT able +M ap R educe 更快的Jo i n 速率和更易用的数据操作方式。

2564

计算机应用第29卷

2.3 编程模型

为了使用户能更轻松地享受云计算带来的服务,让用户能利用该编程模型编写简单的程序来实现特定的目的,云计算上的编程模型必须十分简单。必须保证后台复杂的并行执行和任务调度向用户和编程人员透明。

云计算大部分采用M ap -R educe [12]的编程模式。现在大部分IT 厂商提出的/云0计划中采用的编程模型,都是基于M ap -R educe 的思想开发的编程工具。

M ap -R educe 不仅仅是一种编程模型,同时也是一种高效的任务调度模型。M ap -R educe 这种编程模型并不仅适用于云计算,在多核和多处理器、ce ll processor 以及异构机群上同样有良好的性能[24-27]。

该编程模式仅适用于编写任务内部松耦合、能够高度并行化的程序。如何改进该编程模式,使程序员得能够轻松地编写紧耦合的程序,运行时能高效地调度和执行任务,是M ap -R educe 编程模型未来的发展方向。

M ap -R educe 是一种处理和产生大规模数据集的编程模型,程序员在M ap 函数中指定对各分块数据的处理过程,在R educe 函数中指定如何对分块数据处理的中间结果进行归约。用户只需要指定m ap 和reduce 函数来编写分布式的并行程序。当在集群上运行M ap -R educe 程序时,程序员不需要关心如何将输入的数据分块、分配和调度,同时系统还将处理集群内节点失败以及节点间通信的管理等。图4[15]给出了一个M ap -R educe

程序的具体执行过程。

图4 M ap -Redu ce 程序的具体执行过程

从图4可以看出,执行一个M ap -R educe 程序需要五个步

骤:输入文件、将文件分配给多个wo rker 并行地执行、写中间文件(本地写)、多个R educe wo rkers 同时运行、输出最终结果。本地写中间文件在减少了对网络带宽的压力同时减少了写中间文件的时间耗费。执行R educe 时,根据从M aster 获得的中间文件位置信息,R educe 使用远程过程调用,从中间文件所在节点读取所需的数据。

M ap -R educe 模型具有很强的容错性,当wo rker 节点出现错误时,只需要将该wo rker 节点屏蔽在系统外等待修复,并将该w orker 上执行的程序迁移到其他wo rker 上重新执行,同时将该迁移信息通过M aster 发送给需要该节点处理结果的节点。M ap -R educe 使用检查点的方式来处理M aster 出错失败的问题,当M aster 出现错误时,可以根据最近的一个检查点重新选择一个节点作为M aster 并由此检查点位置继续运

行。具体请见文献[12]。

M ap -R educe 仅为编程模式的一种,微软提出的D ryadL I NQ [17]是另外一种并行编程模式。但它局限于.N ET 的L I NQ 系统同时并不开源,限制了它的发展前景。M ap -R educe 作为一种较为流行的云计算编程模型,在云计算系统中应用广阔。但是基于它的开发工具H adoop 并不完善。特别是其调度算法过于简单,判断需要进行推测执行的任务的算法造成过多任务需要推测执行,降低了整个系统的性能。改进M ap -R educe 的开发工具,包括任务调度器、底层数据存储系统、输入数据切分、监控/云0系统等方面是将来一段时间的主要发展方向。另外,将M ap -R educe 的思想运用在云计算以外的其他方面也是一个流行的研究方向。

3 云计算和其他超级计算的区别

3.1 云计算与网格计算的区别

Ian Foster 将网格定义为:支持在动态变化的分布式虚拟组织(V irtual O rganiza ti ons)间共享资源,协同解决问题的系统[28]。所谓虚拟组织就是一些个人、组织或资源的动态组合。

图5和图6分别为云及网格的结构示意图。图5显示,云计算是一种生产者)消费者模型,云计算系统采用以太网等快速网络将若干集群连接在一起,用户通过因特网获取云计算系统提供的各种数据处理服务。图6显示,网格系统是一种资源共享模型,资源提供者亦可以成为资源消费者,网格侧重研究的是如何将分散的资源组合成动态虚拟组织。主要区别如表4所示。

云计算和网格计算[29]的一个重要区别在于资源调度模式。云计算采用集群来存储和管理数据资源,运行的任务以数据为中心。即调度计算任务到数据存储节点运行。而网格计算,则以计算为中心。计算资源和存储资源分布在因特网的各个角落,不强调任务所需的计算和存储资源同处一地。由于网络带宽的限制,网格计算中的数据传输时间占总运行时间的很大一部分。

网格将数据和计算资源虚拟化,而云计算则进一步将硬

2565第9期陈全等:云计算及其关键技术

件资源虚拟化,活用虚拟机技术,对失败任务重新执行,而不必重启任务。同时,网格内各节点采用统一的操作系统(大部分为UN I X),而云计算放宽了条件,在各种操作系统的虚拟机上提供各种服务。和网格的复杂管理方式不同,云计算提供一种简单易用的管理环境。另外,网格和云在付费方式上有着显著的不同。网格按照固定的资费标准收费或者若干组织之间共享空闲资源。而云则采用用时付费以及服务等级协议的模式收费。其他区别不再赘述。

表4网格计算和云计算的主要区别

区别点网格计算云计算

发起者学术界工业界

标准化是(OGSA)否

开源是部分开源互联网络因特网,高延时低带宽高速网络,低延时高带宽关注点计算密集型数据密集型

节点分散的PC或服务器集群

获取的对象共享的资源提供的服务

安全保证公私钥技术,

账户技术

每个任务一个虚拟机,

保证隔离性

节点操作系统相同的系统(UN I X)多种操作系统上的虚拟机虚拟化虚拟数据和计算资源虚拟软硬件平台

节点管理方式分散式管理集中式管理易用性难以管理,使用用户友好

付费方式/用时付费

失败管理失败的任务重启虚拟机迁移到其他节点继续执行

对第三方插件的兼容性难以兼容

易于兼容,通过提供

不同的服务来兼容

自我管理方式重新配置重新配置,自我修复

3.2云计算系统与传统超级计算机的区别

超级计算机拥有强大的处理能力,特别是计算能力。2008年11月17日,最新一期的T op500[30]榜单发布。冠军/Ro adRunner0是I B M为美国L os A la m os国家实验室建造的计算机系统。它的运算速度达到了1.026PFLOTP。R oad R uner超级计算机包含12960个IB M Pow er X ce ll8i处理器以及6948个分布于刀片服务器上的AM D O pteron芯片。刀片服务器安装在288个IB M B ladCener机架上。Road R uner 拥有80TB的内存,外存使用1.5PB容量的P anasas存储,外存通过10GbTP的以太网进行连接。耗资超过1亿美元。

从TOP500对超级计算机的排名方式可以看出,传统的超级计算机注重运算速度和任务的吞吐率。以运算速度为核心进行计算机的研究和开发。而云计算则以数据为中心,同时兼顾系统的运算速度。传统的超级计算机耗资巨大,远超云计算系统。例如,趋势科技花费1000多万美元租用34000多台服务器,构建自身的/安全云0系统。

4结语

云计算具有广阔的发展前景,相关的各项关键技术也在迅速发展。

首先,当前的云计算系统的能耗过大,因此,减少能耗,提高能源的使用效率,建造高效的冷却系统是当前面临的一个主要问题。例如,谷歌的数据中心的能耗相当于一个小型城市的总能耗[31]。因为,过大的能耗使得数据中心内发热量剧增,要保证云计算系统的正常运行,必须使用高效的冷却系统来保持数据中心在可接受的温度范围内。

其次,云计算对面向市场的资源管理方式的支持有限。可以加强相应的服务等级协议,使用户和服务提供者能更好的协商提供的服务质量。

另外,需要对云计算的接口进行标准化并且制定交互协议。这样可以支持不同云计算服务提供者之间进行交互,相互合作提供更加强大和更好的服务。

再者,需要开发出更易用的编程环境和编程工具,这样可以更加方便地创建云计算应用,拓展云计算的应用领域。

最后,虽然云计算还有很多问题需要解决,但是云计算必将得到更大的发展。

参考文献:

[1]VAR I A J.C l oud arch i tectures-Am azon W eb services[EB/OL].

[2009-03-01].htt p://ac mb https://www.360docs.net/doc/bf15149429.html,/even ts/m on t h l y-tal k/ m ay-2008--cl oud-arch itect u res---a m az on-w eb-s ervices.h t m.l

[2]BR YANT R E.D ata-i n tensive superco m puti ng:The case f or D I SC,

CMU-CS-07-128[R].P itts burgh,P A,USA:Carneg i eM ellon Un-i

vers i ty,D epart m en t of C o mpu ter Science,2007.

[3]SZAL AY A S,KUNSZT P,T HAKAR A,e ta l.Des i gn i ng and m i n-

i ng m u lt-i t erabyte as trono m y arch i ves:The sloan d i gital s ky s u rvey

[C]//Proceed i ngs of the2000ACM S I G M OD In ternati onal Con fer-

ence onM anage m en t ofData.N e w York:ACM Press,2000:451-

462.

[4]BARROSO L A,DEAN J,H;LZLE U.W eb search for a p lanet:

The Google cl uster arch itect u re[J].I EEE M icro,2003,23(2):22

-28.

[5]GILES J.Googl e t oTP trans l ation rank i ng[EB/OL].(2006-11-

06)[2009-03-06].http://www.n ature.co m/ne w s/2006/

061106/fu ll/new s061106-6.h t m.l

[6]维基百科.C l oud co m pu ti ng[EB/OL].[2009-03-10].h tt p://

en.w i k i ped i https://www.360docs.net/doc/bf15149429.html,/w i k i/C l oud_co m puti ng.

[7]中国云计算网.什么是云计算?[EB/OL].(2008-05-14)

[2009-02-27].http://www.cl oud co m pu ting-ch i https://www.360docs.net/doc/bf15149429.html,/A rticl e/

Sho wA rti cle.as p?A rticl eI D=1.

[8]VAQUERO L M,RODERO-M ER I NO L,CACERE S J,e t al.A

b reak i n t h e cl oud s:Towards a cloud d efi n iti on[J].AC M SI G-

COMM C o m pu ter Co mmun ication Revie w,2009,39(1):50-55.

[9]W E I SS A.Co m pu ti ng i n t h e clouds[J].AC M N et w orker,2007,

11(4):16-25.

[10]GRIFFIT H S A,M ETHERALL G.C l u ster i nterconn ection net w ork s

[EB/OL].(2000-09-01)[2009-03-03].http://www.gri d-

bu https://www.360docs.net/doc/bf15149429.html,/~ra j/csc433/C l u ster N ets.pd.f

[11]CHANG F,DEAN J,GHEMAWAT S,e ta l.B i gTab le:A d i stri b-

u ted storage s yste m for stru ctured dat a[J].ACM Transactions on

Co m pu t er Sys t e m s,2008,26(2):1-26.

[12]DEAN J,GHEM A W AT S.M apR edu ce:S i m p li ed data p rocess i ng

on large clusters[C]//OSDI p04:Proceed i ngs of t h e6th Sy m pos-i

um on Op erati ng Syste m Des i gn and I mp le m entation.N e w York:

ACM Press,2004:137-150.

[13]NAGARA J AN A B,MUELLER F,ENGEL M ANN C,e ta l.Proac-

ti ve fau lt toleran ce forHPC w it h Xen virtualizati on[C]//Proceed-

ings of t he21st Annual International Conference on Sup erco mpu-t

ing.Ne w York:ACM Press,2007:23-32.

[14]G HEM A W AT S,GOBI OFF H,LEUNG P T.The Google fil e s ys-

te m[C]//Proceed i ngs of t he19t h ACM Sy m pos i um on Op erati ng

Syste m s Pri n ci ples.Ne w York:ACM Press,2003:29-43. [15]Apache H adoop.H adoop[EB/OL].[2009-03-06].h tt p://

hadoop.ap https://www.360docs.net/doc/bf15149429.html,/.

[16]Yahoo.Yahoo!H adoop t u t ori al[EB/OL].[2009-02-27].h tt p://

2566计算机应用第29卷

pub li c .yahoo .co m /gogate/hadoop -t u t ori al/st ar-t tut ori a.l ht m.l

[17] YU Y,ISARDM,FETTERLY D ,et al .DryadL I NQ :A syst e m for

gen era-l pu rpos e d istri buted data -parallel co m puti ng us i ng a h igh -l evel l anguage [C ]//Proceed i ngs of the 8th USENIX Sy m pos i um on Operati ng Syste m s D es i gn and I m p l e m en tati on.N e w York :ACM Press ,2008:1-14.

[18] P I NAR A ,HENDR I CKSON B.Exp l oiti ng fl ex i b l y assi gnab l e w ork

to i m prove load balance [C ]//Proceed i ngs of the 14t h Annual ACM Symposiu m on Para ll el A lgorit hm s and Arc h itectures .N e w York :ACM Press ,2002:155-163.

[19] GRA M A A,KARYPIS G,KUMAR V,et a l .Introdu cti on to par -all el co m puti ng [M ].2nd ed .London :Pearson E du cati on ,2003.

[20] YAN B Q ,R HODES P J .To w ard auto m atic parall elizati on of s pa -ti al co m pu tati on for co m pu ting cl usters [C ]//Proceed i ngs of t he 17th In ternati onal S y mpos i u m on H i gh Perfor mance Distri bu t ed C o mpu ti ng .Ne w York :ACM Press ,2008:45-54.

[21] KRSUL I ,GANQUL Y A ,Z HANG P J ,et al .V M Plants :Prov-i

d i ng and m anaging virtualm ach i n

e execu ti on environm ents for grid compu ti ng [C]//P roceed i ngs o

f the 2004ACM /I EEE Con ference on Superco m puti n

g .New York :ACM Press ,2004:7-7.

[22] BAR HAM P ,DRAGOV I C B ,FRASER K,et al .Xen and t h e art

of virtualizati on [J ].ACM S I GOTP Operating Syste m s Revie w,2003,32(5):164-177.

[23] SAAB C B,A I RE X B,FOLL I OT B.Ph oen i x :A s elf adaptab l e

mon i tori ng p l atfor m for cl uster m anage m en t [J].C l u ster Co m pu -ti ng ,2002,5(1):75-85.

[24] RANGER C,RAGHURAMAN R,PEN M ETSA A .Eval uati ng M a -pReduce for m u l t-i core and mu ltiprocess or s yste m s [C]//Proceed -

i ngs of t he 2007I EEE 13t h I n ternati onal S y mpos i um on H i gh Per -for m an ce C o mpu ter Arch i tecture .W as h i ngton ,DC:I EEE C o mpu -t er Soci et y ,2007:13-24.

[25] KRUIJ F M D,SANKARAL I NGA M K .M apRedu ce for the cell B.

E.arch itect u re ,CS-TR -2007-1625[R].M ad is on,M I ,USA:U-n i vers i ty ofW iscons i n -M ad i son,2007.

[26] HE B S ,FANGW B,LUO Q ,et a l .M ars :A M apReduce fra m e -w ork on graph i cs p rocessors [C ]//Proceed i ngs of the 17t h In t erna -ti onal Con ference on Parall el Arch i tectures and Co m p il ati on Tech-n iques .N e w Y ork:AC M P ress ,2008:260-269.

[27] ZAHARI A M,KONW I NSKI A ,J OSEP H A D .I mp rovingM apRe -du ce perf or m ance i n het erogeneous en vi ronm ents [C ]//Proceed-i ngs of t he 8th USEN I X Symposi um on Op erati ng S yste m s Des i gn and I m ple m entation .Ne w York :ACM Press ,2008:29-42.

[28] FOSTER I ,KE SSEL M AN C ,T UECKE S.The anato m y of t h e gri d

enab li ng scalab l e virt ual organ iz ati ons [J].Internati onal Jou rnal of H i gh Perfor m an ce Co m puti ng A pp lications ,2001,15(3):200-222.

[29] BER M AN F ,FOX G,HEY T.Th e gri d :Past ,present ,and f u-t u re [M ]//G ri d co m puti ng :M ak i ng t he global i n fras tr u cture a re -alit y .England :J ohn W iley and Sons ,2003:9-50.

[30] Top 500s up erco mpu ti ng sites .Top500list -N ove mber 2008(1-100)[EB /OL].

(2008-11-17)[2009-03-05].h tt p://

https://www.360docs.net/doc/bf15149429.html, /li st/2008/11/100.

[31] BUYYA R ,YEO C S,VENUGOP AL S ,et a l .C l oud co m puti ng

and e m erg i ng I T p l atfor m s :V ision ,hype ,and reality for deliveri ng co m pu ting as the 5t h utilit y [J].Fu t u re Gen erati on C o m pu ter Sys -te m s ,2008,25(6):599-616.

(上接第2547页

)

图2 改进M US I C 算法的空间谱

两种算法性能的比较如表1所示。如果选择5为门限,邻域宽度0.2时,谱峰宽度$=0.09,根据式(13)一次搜索出三

个信号的概率是:

Z 1=(0.09/0.2)3=9.1%(21)此时,加法运算量只有传统算法40%,乘法运算量只有传统算法40%。两次搜索出三个信号的概率是Z 2=72.9%,此时加法运算量只有传统算法50%,乘法运算量只有传统算法50%。

表1 算法性能比较

搜索方式加法次数乘法次数概率/%传统搜索3000057400100.0一次搜索12000229609.1两次搜索

15000

28700

72.9

5 结语

通过大步进和小步进联合搜索,可以有效减少MU SIC 法

运算量,同时保持对信号DOA 的估计精度。新算法对于解决M US I C 算法工程应用中面临的大运算量问题,具有重要意义。

参考文献:

[1] P USKA H,SAAR N IS AAR IH,II N ATTI J .Seri al s earch code acquis-i

tion us i ng s m art antennas w it h si ngle correlator or m atched filt er [J ].

I EEE T ransacti ons on C o mmun i cati ons ,2008,56(2):299-307.[2] H IR OTA A ,ARAI H,NAKANO M.Directi on -o-f arri val estm i ati on

s yste m f or mu lti pat h p ropagati on i n c ode -d i visi on m ulti ple -acces s s ys -te ms w it h s yn t hesi zed vi rt ual planar array usi ng p il ot s i gnal s [J].I EEE Transacti on s on Ve h ic u l ar Technol ogy ,2008,57(4):2153-2161.

[3] ZHANG T T,LU Y L,HU IH T.C o m pensati on f or t h em utual cou-pli ng effect i n un if or m circu lar arrays f or 2D DOA esti m ations e m p l o -yi ng t h em ax i m u m li k eli hood techn i qu e [J].I EEE Transactions on Aeros pace and E l ectron i c Syste m s ,2008,44(3):1215-1221.[4] SCHM I DT R O .M u ltiple e m itt er l ocation and si gnal para m et er est-i

m ation [J ].IEEE Transactions on An tennas and Propagati on,1986,34(3):276-280.[5] YE Z F ,L I U C.On t he res iliency ofM USIC directi on fi nd i ng a -gai n st an tenna sensor coup li ng [J].I EEE Transactions on Antennas and Propagati on,2008,56(2):371-380.

[6] LI B ,PENG C Y,B I SWAS S .Associati on of DOA esti m ati on f ro m

t w oULA s [J].IEEE T ran s acti ons on Instrum en t ati on and M eas u re -m en t ,2008,57(6):1094-1101.[7] van TREES H L.Op ti m um array p rocess i ng [M ].Ne w York :J ohn

W iley ,2002.

2567第9期陈全等:云计算及其关键技术

云计算的关键技术及发展现状(1)

云计算的关键技术及发展现状 周小华 摘要:本文主要对云计算技术的应用特点、发展现状、利处与弊端以及对云计算的应用存在的主要问题进行了探讨分析,最后是关于云计算的挑战及其展望。 关键词:云计算;数据存储;编程模型 1.云计算定义 云计算是由分布式计算、并行处理、网格计算发展而来的,是一种新兴的商业计算模型。目前,对于云计算的认识在不断地发展变化,云计算仍没有普遍一致的定义。计算机的应用模式大体经历了以大型机为主体的集中式架构、以pc机为主体的c/s分布式计算的架构、以虚拟化技术为核心面向服务的体系结构(soa)以及基于web2.0应用特征的新型的架构。云计算发展的时代背景是计算机的应用模式、技术架构及实现特征的演变。“云计算”概念由google提出,一如其名,这是一个美妙的网络应用模式。在云计算时代,人们可以抛弃u盘等移动设备,只要进入google docs页面,新建一个文档,编辑其内容,然后直接把文档的url分享给朋友或上司,他们就可以直接打开浏览器访问url。我们再也不用担心因pc硬盘的损坏而发生资料丢失事件。 IBM公司于2007年底宣布了云计算计划,云计算的概念出现在大众面前。在IBM的技术白皮书“Cloud Computing”中的云计算定义:“云计算一词用来同时描述一个系统平台或者一种类型的应用程序。一个云计算的平台按需进行动态地部署(provision)、配置

(configuration)、重新配置(reconfigure)以及取消服务(deprovision)等。在云计算平台中的服务器可以是物理的服务器或者虚拟的服务器。高级的计算云通常包含一些其他的计算资源,例如存储区域网络(SANs)。网络设备,防火墙以及其他安全设备等。云计算在描述应用方面,它描述了一种可以通过互联网Intemet进行访问的可扩展的应用程序。“云应用”使用大规模的数据中心以及功能强劲的服务器来运行网络应用程序与网络服务。任何一个用户可以通过合适的互联嘲接入设备以及一个标准的浏览器就能够访问一个云计 算应用程序。” 云计算是基于互联网的超级计算模式,包含互联网上的应用服务及在数据中心提供这些服务的软硬件设施,进行统一的管理和协同合作。云计算将IT 相关的能力以服务的方式提供给用户,允许用户在不了解提供服务的技术、没有相关知识以及设备操作能力的情况下,通过Internet 获取需要的服务。 通过对云计算的描述,可以看出云计算具有高可靠性、高扩展性、高可用性、支持虚拟技术、廉价以及服务多样性的特点。现有的云计算实现使用的技术体现了以下3个方面的特征: (1)硬件基础设施架构在大规模的廉价服务器集群之上.与传统的性能强劲但价格昂贵的大型机不同,云计算的基础架构大量使用了廉价的服务器集群,特别是x86架构的服务器.节点之间的巨联网络一般也使用普遍的千兆以太网. (2)应用程序与底层服务协作开发,最大限度地利用资源.传

云计算的关键技术及发展现状

云计算的关键技术及发展现状 居巍杰 摘要:本文给出了云计算的定义,总结了云计算的关键技术,揭示了云计算是多种新技术的综合发展产物,并详细介绍了云计算的发展现状。 关键词:云计算;数据存储;编程模型;云安全 1.前言 云计算(Cloud Computing)是一种新近提出的计算模式。云计算将待处理的数据送到互联网上的超级计算机集群中进行计算和处理,把互联网变成一种全新的计算平台,能够在网络上实现按需购买与按使用付费的业务模式。自从云计算的概念提出来以后,立刻引起业内各方极大的关注,现在已成为信息领域的研究热点之一。云计算到底是什么?为什么需要云计算?云计算的关键技术有哪些?云计算的发展现状如何?本文将就上述问题展开叙述。 2.云计算定义 云计算(Cloud Computing)是由分布式计算(Distributed Computing)、并行处理(Parallel Computing)、网格计算(Grid Computing)发展而来的,是一种新兴的商业计算模型。目前,对于云计算的认识在不断地发展变化,云计算仍没有普遍一致的定义。 IBM公司于2007年底宣布了云计算计划,云计算的概念出现在大众面前。在IBM的技术白皮书“Cloud Computing”[1]中的云计算定义:“云计算一词用来同时描述一个系统平台或者一种类型的应用程序。一个云计算的平台按需进行动态地部署(provision)、配置(configuration)、重新配置(reconfigure)以及取消服务(deprovision)等。在云计算平台中的服务器可以是物理的服务器或者虚拟的服务器。高级的计算云通常包含一些其他的计算资源,例如存储区域网络(SANs)。网络设备,防火墙以及其他安全设备等。云计算在描述应用方面,它描述了一种可以通过互联网Intemet进行访问的可扩展的应用程序。“云应用”使用大规模的数据中心以及功能强劲的服务器来运行网络应用程序与网络服务。任何一个用户可以通过合适的互联嘲接入设备以及一个标准的浏览器就能够访问

云计算技术国内外发展现状

次。联想公司计划推出基于云计算服务的PC及云终端,终端更像一台接收机,它本身没有存储设备,所有的数据都集中在后台。 云计算改变了单个计算机的功能,降低对网络的要求,由于终端不考虑应用的具体实现过程,扩展应用变得更加容易,高可扩展性是云计算的显著特征。应用在服务器端实现和部署,可以轻松实现不同设备间的数据与应用共享,并以统一的方式(例如通过浏览器)在终端实现与用户的交互。 三、国外云计算技术、产业现状及发展趋势 (一)国外云计算技术及产业现状 1、主要国家的最新进展 美国将云计算技术和产业定位为维持国家核心竞争力的重要手段之一,在制定的一系列云计算政策中,明确指出加大政府采购,积极培育市场。通过强制政府采购和指定技术架构来推进云计算技术进步和产业落地发展。例如,美国军队(空军、海军)、司法部、农业部、教育部等部门都已应用了云计算服务。美国历届联邦政府都将推动IT技术创新与产业发展作为国家的基本政策,在2011年出台的《联邦云计算战略》中明确提出鼓励创新,积极培育市场,构建云计算生态系统,推动产业链协调发展。 欧盟欧盟委员会在2012年9月启动“释放欧洲云计算潜力”的战略计划,包括筛选和精简众多技术标准、为云计算服务制定安全和公平的标准规范等,同时明确市场政策,确立欧洲云计算市场,促使欧洲云服务提供商扩大业务范围并提供性价比高的在线管理服务。 英国政府在2013年为13个研发项目拨款500万英镑,以应对阻碍云计算应用的商业和技术挑战。这13个项目的研究重点在于开发相关的系统、服务和软件,帮助解决云服务缺乏互操作性、数据恢复能力和身份验证这三项挑战,提高云服务的安全性。 澳大利亚澳大利亚政府信息管理办公室(AGIMO) 在2011年发布《澳大利亚政府云计算政策:最大化云计算的价值》的文件,并在2013年5月更新和发布了该文件的2.0版,该文件对政府部门使用云计算服务提供了指导,包括云计算相关法律、财政支持、安全规范等。2013年,AGIMO发布《公共服务大数据战略》,该战略以六条“大数据原则”为支撑,旨在推动公共行业利用大数据分析进行服务改革,并制定更好的公共政策。澳大利亚新南威尔士州出台与云服务相关的政策,以利用更加灵活可靠的技术来改善政府的运作和服务,节约运营成本。 韩国在2011年制定了《云计算全面振兴计划》,其核心是政府率先引进并提供云计算服务,为云计算开发国内需求。韩国通信委员会的报告指出,2010年至2012年,韩国政府投入4158亿韩元预算来构建通用云计算基础设施,将利用率低下的电子政务服务器虚拟化,逐步置换成高性能服务器,并根据系统服务器资源使用量实现服务器资源的动态分配。 日本日本经济产业省2010年8月发布《云计算与日本竞争力研究》报告,鼓励和支持包括数据中心和IT厂商在内的云服务提供商利用日本的IT技术等优势,通过分析云计算的全球发展趋势,解决云计算发展过程中的挑战性和关键性问题。

云计算的发展热点与未来趋势

班级:仪器11402 姓名:李学智学号:201406277 当前云计算的发展热点与未来趋势 目前,云计算被认为是未来的IT发展趋势。云计算的应用形式各种各样,但是,有关于云计算的应用却并不是很容易被用户接受的,虽然很多企业组织正在积极的探寻关于云计算的发展战略,可预测未来云计算的发展趋势,将其作为是未来云计算的突破口参考。 一、目前云计算的发展现状 云计算的发展趋势在行业中已经取得共识。它的影响已经逐渐渗透到整个产业以及用户的应用中。云计算将赋予互联网更大的内涵,在某种程度上,它改变互联网企业的运营模式,通过云计算,更多的应用能够以互联网服务的方式交付与运行。云计算将扩大IT软,硬件产品应用的外延,并且改变了软硬件产品的应用模式。IT产品的开发方向也会发生改变来适应上述云计算带来的变化。很多业界领先代表,微软,谷歌,亚马逊等等业界领先代表都推出了自己的云计算产品和方案。如:谷歌推出GDrive服务;AOL的Xdrive服务;亚马逊云计算;HDS,EMC,NetApp先后将云计算和云存储的落地作为今后整体渠道策略调整的关键点;EMC宣布发展目标直指虚拟化和私有云建设;NetApp致力于拓展系统集成商和云存储业务。除此之外,HDS、EMC、NetApp在云存储等方面也取得较好效果。 二、未来云计算的发展趋势 云计算作为一种应用模式,它的出现和应用范围的日益扩大,必将对产业链的上下游产生重要影响,它在不断的适应着企业的需求。未来根据需求进行着不断增多,云计算将要如何发展?经过调查分析有以下几个方向: (一)混合云的发展方向 虽然现在很多企业都已经采用了云服务,但是对于大部分的企业来说,基本上采用的都是多个云服务供应商,包括公共云与私有云,以满足不同的需求。公有云与私有云的组合被大家称之混合云,混合云的优势是能够适应不同的平台需求,它既能提供私有云的安全性,也可以提供公有云的开放性。所以在未来混合云的发展是云服务的主流模式。 (二)大数据分析 大数据如是高科技的热门话题,大数据分析使云计算和大数据能够很好结合。云计算是可以扩展,可以覆盖到大数据领域的,这些云服务能够为云计算提供平台,开源的云平台为大数据提供更好的开发与分析。 (三)SMB应用程序保护 现在,大多数的中小企业还是无法承受整个应用程序的测试层序与昂贵的工具进行内部检查安全和数据保护等应用的,期待新的云计算技能够帮助企业利用Web应用程序来进行源代码的扫描,协助企业及时发现潜在的一些网络攻击,从而来按需求提供帮助,降低企业的费用。 (四)强调性能

浅析云计算的五大关键技术

浅析云计算的五大关键技术 据中国报告大厅发布的《2014-2020年中国云计算行业深度调研及发展趋势分析报告》,国科数据中心做出如下解读: 1 虚拟化技术 虚拟化技术是指计算元件在虚拟的基础上而不是真实 的基础上运行,它可以扩大硬件的容量,简化软件的重新配置过程,减少软件虚拟机相关开销和支持更广泛的操作系统方面。通过虚拟化技术可实现软件应用与底层硬件相隔离,它包括将单个资源划分成多个虚拟资源的裂分模式,也包括将多个资源整合成一个虚拟资源的聚合模式。虚拟化技术根

据对象可分成存储虚拟化、计算虚拟化、网络虚拟化等,计算虚拟化又分为系统级虚拟化、应用级虚拟化和桌面虚拟化目。在云计算实现中。计算系统虚拟化是一切建立在“云”上的服务与应用的基础。虚拟化技术目前主要应用在CPU、操作系统、服务器等多个方面,是提高服务效率的最佳解决方案。 2 分布式海量数据存储 云计算系统由大量服务器组成,同时为大量用户服务,因此云计算系统采用分布式存储的方式存储数据,用冗余存储的方式(集群计算、数据冗余和分布式存储)保证数据的可靠性。冗余的方式通过任务分解和集群,用低配机器替代超级计算机的性能来保证低成本,这种方式保证分布式数据的高可用、高可靠和经济性,即为同一份数据存储多个副本。云计算系统中广泛使用的数据存储系统是Google的GFS和Hadoop团队开发的GFS的开源实现HDFS. 3 海量数据管理技术 云计算需要对分布的、海量的数据进行处理、分析,因此,数据管理技术必需能够高效的管理大量的数据。云计算

系统中的数据管理技术主要是Google的BT sT~lO数据管理技术和Hadoop团队开发的开源数据管理模块HBase.由于云数据存储管理形式不同于传统的RDBMS数据管理方式,如何在规模巨大的分布式数据中找到特定的数据,也是云计算数据管理技术所必须解决的问题[61.同时,由于管理形式的不同造成传统的SQL数据库接口无法直接移植到云管理系统中来,目前一些研究在关注为云数据管理提供RDBMS和SQL 的接口,如基于Hadoap子项目HBase和Hive等。另外,在云数据管理方面,如何保证数据安全性和数据访问高效性也是研究关注的重点问题之一。 4 编程方式 云计算提供了分布式的计算模式,客观上要求必须有分布式的编程模式。云计算采用了一种思想简洁的分布式并行编程模型Map—Reduce.Map—Reduce是一种编程模型和任务调度模型。主要用于数据集的并行运算和并行任务的调度处理。在该模式下,用户只需要自行编写Map函数和Reduce函数即可进行并行计算。其中,Map 函数中定义各节点上的分块数据的处理方法,而Reduce函数中定义中间结果的保存方法以及最终结果的归纳方法。

云计算关键技术及其发展的分析

云计算关键技术及其发展的分析 近几年,云计算以网格计算为基础,成为一种新兴的计算模型。本文将对云计算的基本概念及其关键技术进行介绍,并以此为根据对云计算的发展和应用领域加以阐述。 标签:云计算;关键技术;发展 1 云计算的概念 云计算就是把传统计算机技术和网络技术的分布式处理和并行处理,以及网格计算和效用计算,还有网络存储等等功能,进行充分的发展融合形成的产物。借助于网络这个先进的工具,联系和整个若干个具有较低陈本的计算实体,通过进一步的整合,形成具有强大功能的系统,具有超强的计算能力和完美的功能。为终端用户提供多种服务形式的超强大的计算能力。 通过把“云”的处理能力不断的提高,从而使用户终端的处理负担被减轻,最终实现用户终端被简化成一个单纯的输入输出设备,同时用户终端对“云”的强大计算处理能力能够根据自己的需求进行享受,这就是云计算的核心理念。 强大的计算能力和安全可靠,以及无限量的存储空间和使用方便便捷,还有数据共享是云计算的特点。这种模型的运用,无论是个人还是企业,都必须花费大量的投资,对昂贵的硬件进行购置,就可以通过互联网来实现租赁和计算能力。 2 云计算关键技术 2.1 虚拟化技术 云计算最核心的特征就是虚拟化,同时这一特征也是云计算得以实现的基础。虚拟化技术将物理资源的逻辑与统一表示出来。虚拟化指的是以虚拟软件为基础进行的计算,而不是在真实硬件上运行的。虚拟化技术的运用,实现了资源的高效利用,而且能够以用户的实际需要作为出发点,及时调节资源的分配,平衡了动态负载,另外与硬件无关的特性所提供的系统自愈功能,使得系统的可靠性得以显著提升。虚拟化技术涵盖了计算机技术的方方面面。 2.2 分布式技术分布 最早将分布式技术大规模应用于向全球用户提供搜索服务的是Google搜索引擎,其分布式的架构能够使得数百万台计算机协同作业。分布式文件系统的最主要特征就是能够将大量的数据以分布式进行储存,从而完成大型任务的分解,以及多台计算机的并行计算。作为分布式技术中最关键的组成部分,无论是Google的GFS,还是Hadoop中的HDFS,这些分布式文件系统的设计都是为了实现海量文件的存储,这种方式能提高数据存储访问的可靠性和高效性。

云计算的关键技术

云计算的关键技术 云计算(cloudcomputing,分布式计算技术的一种,其最基本的概念,是透过网络将庞大的计算处理程序自动分拆成无数个较小的子程序,再交由多部服务器所组成的庞大系统经搜寻、计算分析之后将处理结果回传给用户。稍早之前的大规模分布式计算技术即为“云计 算”的概念起源。 云计算系统运用了许多技术,其中以编程模型、数据管理技术、数据存储技术、虚拟化 技术、云计算平台管理技术最为关键。 云计算的核心技术 (1)编程模型 MapReduce是Google开发的java、Python、C++编程模型,它是一种简化的分布式编程模型和高效的任务调度模型,用于大规模数据集(大于1TB)的并行运算。严格的编程模型使云计算环境下的编程十分简单。MapReduce模式的思想是将要执行的问题分解成

Map(映射)和Reduce(化简)的方式,先通过Map程序将数据切割成不相关的区块,分配(调度)给大量计算机处理,达到分布式运算的效果,再通过Reduce程序将结果汇整输出。 (2)海量数据分布存储技术 云计算系统由大量服务器组成,同时为大量用户服务,因此云计算系统采用分布式存储的方式存储数据,用冗余存储的方式保证数据的可靠性。云计算系统中广泛使用的数据存储系统是Google的GFS和Hadoop团队开发的GFS的开源实现HDFS。 GFS即Google文件系统(GoogleFileSystem),是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。GFS的设计思想不同于传统的文件系统,是针对大规模数据处理和Google应用特性而设计的。它运行于廉价的普通硬件上,但可以提供容错功能。它可以给大量的用户提供总体性能较高的服务。 一个GFS集群由一个主服务器(master)和大量的块服务器(chunkserver)构成,并被许多客户(Client)访问。主服务器存储文件系统所以的元数据,包括名字空间、访问控制信息、从文件到块的映射以及块的当前位置。它也控制系统范围的活动,如块租约(lease)管理,孤儿块的垃圾收集,块服务器间的块迁移。主服务器定期通过HeartBeat消息与每一个块服务器通信,给块服务器传递指令并收集它的状态。GFS中的文件被切分为64MB的块并以冗余存储,每份数据在系统中保存3个以上备份。 客户与主服务器的交换只限于对元数据的操作,所有数据方面的通信都直接和块服务器联系,这大大提高了系统的效率,防止主服务器负载过重。 (3)海量数据管理技术 云计算需要对分布的、海量的数据进行处理、分析,因此,数据管理技术必需能够高效的管理大量的数据。云计算系统中的数据管理技术主要是Google的BT(BigTable)数据管理技术和Hadoop团队开发的开源数据管理模块HBase。 BT是建立在GFS,Scheduler,LockService和MapReduce之上的一个大型的分布式数据库,与传统的关系数据库不同,它把所有数据都作为对象来处理,形成一个巨大的表格,用来分布存储大规模结构化数据。 Google的很多项目使用BT来存储数据,包括网页查询,Googleearth和Google金融。这些应用程序对BT的要求各不相同:数据大小(从URL到网页到卫星图象)不同,反应速度不同(从后端的大批处理到实时数据服务)。对于不同的要求,BT都成功的提供了灵活高效的服务。 (4)虚拟化技术 通过虚拟化技术可实现软件应用与底层硬件相隔离,它包括将单个资源划分成多个虚拟资源的裂分模式,也包括将多个资源整合成一个虚拟资源的聚合模式。虚拟化技术根据对象可分成存储虚拟化、计算虚拟化、网络虚拟化等,计算虚拟化又分为系统级虚拟化、应用级虚拟化和桌面虚拟化。 (5)云计算平台管理技术 云计算资源规模庞大,服务器数量众多并分布在不同的地点,同时运行着数百种应用,如何有效的管理这些服务器,保证整个系统提供不间断的服务是巨大的挑战。 云计算系统的平台管理技术能够使大量的服务器协同工作,方便的进行业务部署和开通,快速发现和恢复系统故障,通过自动化、智能化的手段实现大规模系统的可靠运营。 在vForum2011大会的媒体见面会上,VMware公司亚太区兼日本区总经理AndrewDutton接受了记者采访,就Vmware在亚太区及中国的云计算战略发表了自己的看法。

Google云计算的关键技术(一)

Google云计算的关键技术(一) Google云计算的关键技术主要包括:Google文件系统GFS、分布式计算编程模型MapReduce、分布式锁服务Chubby和分布式结构化数据存储系统BigTable等。其中: 1)GFS提供了海量数据存储和访问的能力; 2)MapReduce使得海量信息的并行处理变得简单易行; 3)Chubby保证了分布式环境下并发操作的同步问题; 4)BigTable使得海量数据的管理和组织十分方便。 ●GFS GFS是一个面向海量数据密集型应用的、可伸缩的分布式文件系统,它为Google云计算提供了海量存储的能力,处于整个Google云计算技术体系的最底层。 GFS使用廉价的商用机器构建分布式文件系统,将容错的任务交由文件系统来完成,利用软件的方法解决系统可靠性的问题,不但使得存储的成本成倍下降,更是很好地在频繁的故障中确保了数据存储的安全和数据存储服务的连续性,从整体上确保了整个系统的可靠性,进而可以为大量客户机提供高性能的服务。 一、架构 一个GFS集群包含一个单独的Master逻辑节点、多台Chunk服务器,并且同时被多个客户端访问,如下图所示。

GFS存储的文件都被分割成固定大小的Chunk。在Chunk创建的时候,Master服务器会给每个Chunk分配一个不变的、全球唯一的64位的Chunk标识。Chunk服务器把Chunk以linux文件的形式保存在本地硬盘上,并且根据指定的Chunk标识和字节范围来读写块数据。出于可靠性的考虑,每个块都会复制到多个块服务器上。缺省情况下,我们使用3个存储复制节点,不过用户可以为不同的文件命名空间设定不同的复制级别。 Master节点管理所有的文件系统元数据,在逻辑上只有一个。这些元数据包括名字空间、访问控制信息、文件和Chunk的映射信息、以及当前Chunk的位置信息;Master节点还管理着系统范围内的活动,比如Chunk在Chunk服务器之间的迁移等。Master节点使用心跳信息周期地和每个Chunk服务器通讯,发送指令到各个Chunk服务器并接收Chunk服务器的状态信息。 GFS客户端代码以库的形式被链接到客户程序里。客户端代码实现了GFS文件系统的API 接口函数、应用程序与Master节点和Chunk服务器通讯、以及对数据进行读写操作。客户端和Master节点的通信只获取元数据,所有的数据操作都是由客户端直接和Chunk服务器进行交互的。 无论是客户端还是Chunk服务器都不需要缓存文件数据(客户端会缓存元数据)。客户端缓存数据几乎没有什么用处,因为大部分程序要么以流的方式读取一个巨大文件,要么工作集太大根本无法被缓存。Chunk服务器不需要缓存文件数据的原因是:Chunk以本地文件的方式保存,Linux操作系统的文件系统缓存会把经常访问的数据缓存在内存中。 设计思路:集中+分布。单一的Master节点便于通过全局的信息精确定位Chunk的位置以及进行复制决策。同时,为了避免Master节点成为系统的瓶颈,必须减少对Master节点的读写:客户端并不通过Master节点读写文件数据,只是通过其询问应该联系的Chunk服务器,后续的操作将直接和Chunk服务器进行数据读写操作。 二、客户端访问GFS流程 首先,客户端把文件名和程序指定的字节偏移,根据固定的Chunk大小,转换成文件的Chunk 索引。然后,它把文件名和Chunk索引发送给Master节点。Master节点将相应的Chunk 标识和副本的位置信息发还给客户端。客户端用文件名和Chunk索引作为key缓存这些信息。 之后客户端发送请求到其中的一个副本处,一般会选择最近的。请求信息包含了Chunk的标识和字节范围。在对这个Chunk的后续读取操作中,客户端不必再和Master节点通讯了,除非缓存的元数据信息过期或者文件被重新打开。 三、Chunk尺寸的设定 Chunk的大小是关键的设计参数之一。选择64MB这个较大尺寸有几个重要的优点。首先,它减少了客户端和Master节点通讯的需求,因为只需要一次和Mater节点的通信就可以获

云计算发展现状分析

1.云计算概述 云计算是2007年底正式提出的一个新的概念,至今为止,几乎所有的IT行业巨头都将云计算作为未来发展的主要战略之一,相关商业媒体也将云计算视为计算机未来发展的主要趋势,其商业前景和应用需求已勿庸置疑。 云计算是一种全新的商业模式,其核心部分依然是云后端的数据中心,它使用的硬件设备主要是成千上万的工业标准服务器,它们由英特尔或AMD生产的处理器以及其他硬件厂商的产品组成。企业和 个人用户通过高速互联网得到计算能力,从而避免了大量的硬件投资。 云计算的基本原理是,通过将计算分布在大量的分布式计算机上,使企业数据中心的运行更加类似于使用互联网。从而使企业能够将随时资源切换到需要的应用上,根据需求访问计算机和存储系统。 狭义的云计算指的是厂商通过分布式计算和虚拟化技术搭建数 据中心或超级计算机,以免费或按需租用方式向技术开发者或者企业客户提供数据存储、分析以及科学计算等服务,比如亚马逊数据仓库出租生意。广义的云计算指厂商通过建立网络服务器集群,向各种不同类型客户提供在线软件服务、硬件租借、数据存储、计算分析等不同类型的服务。广义的云计算包括了更多的厂商和服务类型,例如国内用友、金蝶等管理软件厂商推出的在线财务软件,谷歌发布的Google应用程序套装等。 2.云计算发展国内外现状 IBM于2007年8月高调推出“蓝云(Blue Cloud)一计划。IBM的Willy

Chiu透露,“云计算将是IBM接下来的一个重点业务。"这也是IBM扩张自身领地的绝佳机会,IBM具有发展云计算业务的一切有利因素:应用服务器、存储、管理软件、中间件等等,IBM抓住了这样一个良好的机会,提出了“蓝云”计划。2008年8月,IBM斥资3.6亿美元在美国北卡罗来纳州开始建立云计算数据中心,并将该数据中心称为史上最复杂的数据中心,投入了大量人力物力。IBM还在东京建立了一所新的研究机构,建立帮助用户使用云计算基础设施。该数据中心占地6万平方英尺,预计将于2009年下半年投入运营。IBM表示:“使用该数据中心的用户能够获得空前的互联网计算能力,并获得业内领先的环保优势和成本”。IBM在东京的专家将为大企业、大学和政府提供云计算咨询,帮助他们利用云计算设施,设计云计算应用,以及向他们的用户提供基于云计算的服务。在2009年的计划中,IBM计划于推出数种云计算服务产品。 Google于2007年10月在全球宣布了云计划,同时与IBM合作,把全球很多大学纳入搿云计算”计划当中。当月,Google与IBM开始在美国大学校园,包括卡耐基梅隆大学、麻省理工学院、斯坦福大学、加州大学伯克利分校及马里兰大学等,推广云计算的计划。希望从而降低分布式计算技术在学术研究方面的成本,并为这些大学提供相关的软硬件设备及技术支援(包括数百台个人计算机及Blade Center与System X服务器,以及Linux、Xen、Hadoop等开源平台)。而这些学校的学生则可以通过网络开发各项以大规模计算为基础的研究计划。2008年1月30日,Google宣布在台湾启动“云计算学术计划".与台湾

云计算关键技术及发展现状研究

云计算关键技术及发展现状研究 摘要:云计算是在网格计算基础上新兴的计算模式,可以将共享的软硬件资源和信息按需提供给计算机和其他 设备。本文在解释云计算概念的基础上,通过探讨云计算的关键技术,揭示了云计算是多种新技术的综合发展产物,并详细介绍了云计算的发展现状。 关键词:云计算;关键技术;发展现状 1 前言 互联网技术的飞速发展,信息量与数据量快速增长,导致计算机的计算能力和数据的存储能力满足不了人们的需求,大大提高了成本费用。在这种情况下,云计算应运而生。云计算将待处理的数据送到互联网上的超级计算机集群中 进行计算和处理,把互联网变成一种全新的计算平台,能够在网络上实现按需购买与按使用付费的业务模式。自从云计算的概念提出来以后,立刻引起业内各方极大的关注,现在已成为信息领域的研究热点之一。 2 云计算定义

云计算(Cloud Computing)是由分布式计算(Distributed Computing)、并行处理(Parallel Computing)、网格计算(Grid Computing)发展而来的,是一种新兴的商业计算模型。目前,对于云计算的认识在不断地发展变化,云计算仍没有普遍一致的定义。 云计算是基于互联网的超级计算模式,包含互联网上的应用服务及在数据中心提供这些服务的软硬件设施,进行统一的管理和协同合作。云计算将IT相关的能力以服务的方式提供给用户,允许用户在不了解提供服务的技术、没有相关知识以及设备操作能力的情况下,通过Internet获取需要的服务。 通过对云计算的描述,可以看出云计算具有高可靠性、高扩展性、高可用性、支持虚拟技术、廉价以及服务多样性的特点。 3 云计算关键技术 云计算是一种新兴的计算模式,其发展离不开自身独特的技术和所涉及的一系列其他传统技术的支持,并借助SaaS/PaaS/IaaS等先进的商业模式把这强大的计算能力分布到终端用户手中。 (1) 虚拟化技术

云计算的关键技术

云计算的关键技术 摘要:云计算是一种新兴的计算模型,它是在网格计算的基础上发展而来的,它是指通过网络以按需、易扩展的方式来获得所需的信息服务,因此,云计算又常常被称为云服务。本文介绍了云计算的发展历史,总结了云计算的关键技术:数据存储技术(Google File system)、数据管理技术(BigTable)、编程模型和任务调度等,分析了云计算和网格计算以及传统超级计算的区别,并指出了云计算的广阔发展前景。 关键词:云计算;编程模型;数据存储;数据管理;任务调度 正文: 云计算(cloud computing)是一种新近提出的计算模式。是分布式计算(Dist uted computing)、并行计算(Parallelcomputing)和网格计算(Grid computing)的发展。目前,亚马逊、微软、谷歌、IBM、英特尔等公司纷纷提出了“云计划”。例如亚马逊的Aws(Amazon web services)?,IBM和谷歌联合进行的“蓝云”计划等。这对云计算的商业价值给予了巨大的肯定。同时学术界也纷纷对云计算进行深层次的研究。例如谷歌同华盛顿大学以及清华大学合作,启动云计算学术合作计划(Academic cloud ComputingInitiative),推动云计算的普及,加紧对云计算的研究。卡内基梅隆大学等对数据密集型的超级计算(Data Intensive supercomputing,DIsc) 进行研究,本质上也是对云计算相关技术开展研究。云计算有着广泛的应用前景。如表1所示。云计算在天 文学、医学等各个领域有着广泛的应用前景。趋势科技和瑞星等安全厂商纷纷提出了“安全云”计划。 在云计算关键技术研究过程中,主要对依赖于以下的技术支持,他们分别是数据存储技术(Google File system)、数据管理技术(BigTable)、编程模型和任务调度模型等,我们逐一进行介绍。 一.数据存储技术: 为保证高可用、高可靠和经济性,云计算采用分布式存储的方式来存储数据,同时利用冗余存储的方式来保证存储数据的可靠性,即为同一份数据存储多个副本,这样避免当前的数据系统崩溃还有备用的数据可以马上回复工作。另外,云计算系统需要同时满足大量用户的需求,并行地为大量用户提供服务。因此,云计算的数据存储技术必须具有高吞吐率和高传输率的特点。云计算的数据存储技术主要有谷歌的非开源的GFs(Google File System) 和Hadoop开发团队开发的GFS的开源实现HDFs(Hadoop Dist uted nle system) 。大部分IT厂商,包括雅虎、英特尔的“云”计划采用的都是HDFS的数据存储技术。云计算的数据存储技术未来的发展将集中在超大规模的数据存储、数据加密和安全性保证以及继续提高L/O速率等方面。以GFs为例。GFs是一个管理大型分布式数据密集型计算的可扩展的分布式文件系统。它使用廉价的商用硬件搭建系统并向大量用户提供容错的高性能的服务。GFS系统由一个Master和大量块服务器构成。Master存放文件系统的所有元数据,包括名字空间、存取控制、文件分块信息、文件块的位置信息等。GFs中的文件切分为64 MB的块进行存储。在GFs文件系统中,采用冗余存储的方式来保证数据的可靠性。每份数据在系统中保存3个以上的备份。为了保证数据的一致性,对于数据的所有修改需要在所有的备份上进行,并用版本号的方式来确保所有备份处于一致的状态。客户端不通过Master读取数据,避免了大量读操作使Master成为系统瓶颈。客户端从Master获取目标数据块的位置信息后,直接和块服务器交互进行读操作。GFs的写操作将写操作控制信号和数据流分开,如图所示:

“云计算与大数据关键技术研发及应

“云计算与大数据关键技术研发及应 用” 巨大主题专项申报指南 云计算与大数据是支撑智能化发展的严重技术领域,结合《国家中长期科学和技术发展规划纲要(2006-2020年)》、国务院《关于促进云计算创新发展,培育信息产业新业态的意见》和《关于印发促进大数据发展行动纲要的通知》以及《重庆市以大数据智能化为引领的创新驱动发展战略行动计划(2018-2020)》等文件要求,根据我市相关产业创新发展的实际需求和云基础设施条件,现启动实施“云计算与大数据关键技术研发及应用”巨大主题专项,布局一批重点研发项目,突破一批关键核心技术,在智慧城市、智能制造、智慧服务等严重领域实现智能化引领,逐步提升资源汇聚、数据收集、存储管理、分析挖掘、安全保障、按需服务等能力,促进我市云计算与大数据技术的研发及应用达到国内乃至国际优秀水平。 1.面向智能终端的大数据云服务平台研发及应用研究内容:研发面向海量智能终端的大数据管理和开放服务云平台,为典型行业智慧应用提供支撑。研究海量智能终端的数据并发接入、异构协议自动转换技术;研究海量大数据的管理和可视化技术;研究海量图片和大视频文件高效存储技术,物联网图片、视频分析技术;研究基于地理位置信息的物联网数据融合技术;研究优秀的多源异构信息融合和大数据分析技术;研究大数据分析模型的云端实现,构建云计算模型库;研究智能边缘计算交互技术、用户可自定义的数据抽取技术、时序数据的模型训练、推断及分析;研究基于微服务架构体系的基于组件的设备管控和数据分析服务;实现若干典型行业的应用验证。 考核指标:云服务平台:支持主流通信协议接入,包括但不限于WIFI、ZigBee、BLE、3G、4G、NB-IoT;支持设备接入协议解析,包括但不限于HTTP、MQTT、Modbus、LWM2M;设备寻址和控制响应时间≤3s;单前置机并发:≥1万;智能终端设备接入量≥1亿;数据存储量≥100亿条;图片文件存储量≥10亿个;图片、视频分析能力≥1000帧/秒。

云计算体系架构与关键技术

云计算:体系架构与关键技术 罗军舟金嘉晖宋爱波东方 东南大学计算机科学与工程学院,江苏南京211189 摘要:系统地分析和总结云计算的研究现状,划分云计算体系架构为核心服务、服务管理、用户访问接口等3 个层次。围绕低成本、高可靠、高可用、规模可伸缩等研究目标,深入全面地介绍了云计算的关键技术及最新研 究进展。在云计算基础设施方面,介绍了云计算数据中心设计与管理及资源虚拟化技术;在大规模数据处理方面, 分析了海量数据处理平台及其资源管理与调度技术;在云计算服务保障方面,讨论了服务质量保证和安全与隐私 保护技术。针对新型的云计算应用和云计算存在的局限性,又探讨并展望了今后的研究方向。最后,介绍了东南 大学云计算平台以及云计算研究与应用方面的相关成果。 云计算;虚拟化;数据中心;海量数据处理;服务质量;安全与隐私 TP393A1000-436X(2011)07-0003-19 Cloud computing: architecture and key technologies  LUO Jun-zhouJIN Jia-huiSONG Ai-boDONG Fang 2011-05-202011-06-30 基金项目:国家自然科学基金资助项目(61070161, 61070158,61003257,60773103,90912002);国家重点基础研究发展计划(“973”计划)基金资助项目(2010CB328104);国家科技支撑计划课题基金资助项目(2010BAI88B03);教育部博士点基金课题基金资助项目(200802860031);江苏省自然科学基金资助项目(BK2008030);国家科技重大专项课题基金资助项目(2009ZX03004-004-04):江苏省“网络与信息安全”重点实验室基金资助项目(BM2003201);“计算机网络与信息集成” 教育部重点实验室项目(93K-9) 万方数据

云计算及其关键技术

收稿日期:2009-03-14;修回日期:2009-05-09。 作者简介:陈全(1986-),男,安徽滁州人,硕士研究生,主要研究方向:云计算、数据密集型可扩展计算; 邓倩妮(1973-),女,广西柳州人,副教授,博士,主要研究方向:对等计算、网格计算、复杂网络拓扑。 文章编号:1001-9081(2009)09-2562-06 云计算及其关键技术 陈 全,邓倩妮 (上海交通大学计算机科学与工程系,上海200240) (squ i rr3@g m ai.l co m ) 摘 要:云计算是一种新兴的计算模型,它是在网格计算的基础上发展而来的。介绍了云计算的发展历史和应用场景,比较了现有的云计算的定义并给出了新的定义,以谷歌的云计算技术为例,总结了云计算的关键技术:数据 存储技术(G oog l e F ile System )、数据管理技术(B igT ab l e)、编程模型和任务调度模型(M ap -R educe)等,分析了云计算和网格计算以及传统超级计算的区别,并指出了云计算的广阔发展前景。 关键词:云计算;数据存储;数据管理;编程模型 中图分类号:T P338.8 文献标志码:A C loud co m puti ng and its key techniques C H E N Quan ,DENG Q i a n -n i (De part m e n t of Compu ter S cience and Eng i neering,Shangha i Jiao Tong Un i v e rsit y,Shanghai 200240,Ch i na ) Abstract :C loud computi ng i s a ne w co m puti ng m ode;l it is deve l oped based on gr i d computi ng.T he aut hors i n troduced the develop m ent history o f cloud com puti ng and its applicati on situati on ;co m pa red ex isti ng defi nitions o f c l oud com puti ng and gav e a new defi n iti on ;took goog l e p s cloud computing techn i ques as an examp l e ,su mm ed up key techn i ques ,such as data storage techno l ogy (G oog le F ile Sy stem ),data m anage m en t techno l ogy (B i gT ab l e ),as we ll as prog ra mm i ng m ode l and task schedu ling m ode l(M ap -R educe ),used i n c l oud co m puti ng ;and ana l yzed the d ifferences among cloud compu ti ng ,g rid co m puti ng and traditi ona l s uper -computi ng ,and fi ngered out t he broad develop m ent prospec ts o f cloud co m puti ng . K ey words :cloud co m puti ng ;data storag e ;da ta m anagement ;progra mm i ng m odel 0 引言 云计算(C l oud Co m puti ng)是一种新近提出的计算模式。是分布式计算(D istr i buted Computi ng )、并行计算(Para llel Co m puti ng)和网格计算(G rid Co m puti ng)的发展。 目前,亚马逊、微软、谷歌、IB M 、英特尔等公司纷纷提出了/云计划0。例如亚马逊的AW S(Am azon W eb Services)[1]、IB M 和谷歌联合进行的/蓝云0计划等。这对云计算的商业 价值给予了巨大的肯定。同时学术界也纷纷对云计算进行深层次的研究。例如谷歌同华盛顿大学以及清华大学合作,启动云计算学术合作计划(A cade m i c C loud Co m puti ng In iti ative),推动云计算的普及,加紧对云计算的研究。卡内基梅隆大学等对数据密集型的超级计算(D ata Intensi ve Super Co m puti ng ,D ISC )[2]进行研究,本质上也是对云计算相关技术开展研究。 I DC 的调查显示,未来五年云计算服务将急速增长,预期2012年市场规模可达420亿美元。目前企业导入云计算已逐渐普及,并且有逐年成长趋势。估计在2012年,企业投入在云计算服务的支出将占整体IT 成本的25%,甚至在2013年提高至IT 总支出的三分之一。 由此可见,在各大公司以及学术界的共同推动下,云计算技术将会持续发展。 云计算有着广泛的应用前景。如表1所示。云计算在天文学[3]、医学等各个领域有着广泛的应用前景。 趋势科技和瑞星等安全厂商纷纷提出了/安全云0计划。 如今,每天有2万多种新的病毒和木马产生,传统的通过更新 用户病毒库的防毒模式,受到了严峻的挑战,该模式使用户端的病毒库过于庞大。趋势科技和瑞星的/安全云0将病毒资料库放在/云0端,与客户端通过网络相连,当/云0在网络上发现不安全链接时,可以直接形成判断,阻止其进入用户机器,从根本上保护机器的安全。 表1 云计算的应用领域 领域应用场景科研 地震监测海洋信息监控天文信息计算处理医学 DNA 信息分析 海量病例存储分析医疗影像处理 网络安全 病毒库存储垃圾邮件屏蔽图形和图像处理 动画素材存储分析 高仿真动画制作海量图片检索互联网 E-m ail 服务 在线实时翻译网络检索服务 据趋势科技大中华区执行总裁张伟钦介绍,趋势科技已投入了大量资金,在全球数个地方建设了新型数据中心。同时,趋势科技还花费了1000多万美元,租借了34000多台服务器,构建了一个服务遍及全球的/安全云0。目前趋势科技 第29卷第9期 2009年9月 计算机应用 Journa l o f Co m puter App lications V o.l 29No .9Sep .2009

相关文档
最新文档