云计算与数据挖掘

合集下载

基于云计算的数据挖掘技术分析

１ｄｕｃｅ模式收集数据，但不足的是开发工具还不
今后结合分形维数和其他技术的方法是新的发展方向。数据挖掘也称数据库中的知识发现过程，是指在大量不完完善。结合网络聚类和分形维数的思想产生的基于网络和分形全的、随机的、模糊的、有噪声的数据中发现具有潜在实用价例如：
是无形的、动态的，实际用户不会关心应用运行的具体位置。
算调度任务和计算分配等问题。（三）云计算提高了大规模数据
（二）价格便宜，速度快。“ 云 ”的构成节点极其廉价，所以降处理速度和能力。（四）数据处理成本降低了，也不再需要高性
低了数据中心管理需要的成本消耗。“ 云 ”不仅成本低廉，资能机器。
关键词：数据挖掘；云计算
１概述
果模式评价，这与传统数据挖掘过程一样。但是在数据的处理
这是因为云计算中的数据格式与传统的随着物联网、移动互联网的迅猛发展，数据呈指数形式增和存储方式上会不同，它们大多来自于点击流。加，当今时代已处于信息数据过载的海量数据时代，这对数据不一致，
２．２数据存储
云计算系统运用最广泛的数据存储方式是分布式存储策
１．２云计算
同一个数据存储为多个副本，这保证了数据的可靠性。这不狭义上讲，云计算指的是通过网络以便于扩展、按照需求略，同时系统还要有错误隔离、心跳检测等措施。的方式获得资源（硬件、软件、平台），是一种ＩＴ基础设施的交是冗余复制。付和使用模式，云就是网络中的软、硬件资源。广义上讲，云计３基于云计算的数据挖掘技术优势算是指服务提供者根据用户需求、以便于扩展的方式提供服

云计算及其在数据挖掘上的应用研究

的，即服务对用户透明。
２云计算采用冗余方式提高可靠性。云计算系统提供数据处理服务给用户，）大量商用计算机集群组成云计算系统。果Ｐ如Ｃ数量不断地增加，系统出现错误甚至崩溃的概率就会会不断增大。在没有专用的可靠性硬件支持的情况下，用软件的方式保证数据采
ＣｍｐｔｎｗｅｇｎｅｈｏｇｏｕｅＫｏｌｅａｄＴｃｎｌｙ电脑知识与技术ｒｄｏ
Ｖｏ．Ｎｏ２，ｇｓ００，Ｐ６７ — ２４１６，．２Ａｕｕｔ２１Ｐ．２２６７
云计算及其在数据挖掘上的应用研究
云计算技术的出现是并行计算技术、件技术、软网络技术发展的必然结果。云计算在商业和科研领域的应用价值得到了包括ＩＭ、ｏｇｅ等公司的重视，未来将像工业革命一样引领着社会的发展。目前，ＢＧｏｌ其云计算的研究与应用尚处于初级阶段，计算实现云商业价值指日可待，云计算的特点是使数据存储及应用商业化，ｂ数据挖掘是一个应用价值大理论性很强的研究领域，文基于Ｗｅ本云计算框架下对Ｗｅｂ数据挖掘算法进行了讨论和研究。
储和网络计算服务。种计算由统一的计算机群完成，比网格计算效率更高，态处理能力更强。云计算应用到数据挖掘中，该相动将可

数据挖掘与云计算——专访中国科学院计算技术研究所何清博士

目
ＤＯ：０３６／．ｓｎ１０ —８４２１．３０２Ｉ１．９９ｊｉ．０１２．０１０．０ｓ３
数据挖掘与云计算
专访中国科学院计算技术研究所何清博士
《字通信》数记者：张诚，郭毅
与的计算模式，计算资源（算能力、储能力、其计存交互能力）动态、是可伸缩、被虚拟化的，且以且而服务的方式提供。云计算给软件带来的变革主要表现在Ｓａ（ａｓ软件即服务）。软件的单机安装将逐渐被云计算平台部署所代替，用户只需通过网络浏览器便可享受快速高质的云服务，中小企业既可以在公共云计算平台上使用云服务软件，可以在硬件开支不大的情也
Ｃｕｅａ在ＮＰ２０ｈｔｌＩＳ０６上发表了一篇文章，他们采用Ｍａ／ｅｕｅ编程完成了很多机器学习方法，ｐｒｄｃ这是一项有非常重要意义的工作，过他们的运算环不境是基于多核系统的。目前，基于Ｈｄｏａｏｐ的数据挖掘开源项目有Ｍａｏｔ这个项目致力于数据挖掘并ｈｕ，行化，以云计算方式来做数据挖掘的开源项目。是通过云计算的海量数据存储和分布计算，云为计算环境下的海量数据挖掘提供了新方法和手段，
况下部署自己的云计算平台，而实现高性能、从低
成本的计算。随着云计算的发展，多公共需求的很服务将会日益满足大众需求，惠各个行业。普数据挖掘远比信息搜索要复杂。过去对海量数据的处理主要是通过高性能机或者更大规模的

大数据中的名词解释

大数据中的名词解释大数据是当今数字时代的热门话题，随着科技的迅猛发展和互联网的普及，数据量爆炸式地增长，这促使人们开始关注如何利用这些海量数据来发现规律、做出决策。

然而，对于大数据的定义和相关术语的解释，并不是每个人都能轻松理解。

在本文中，将对一些常见的大数据名词进行解释，以便读者更好地理解大数据的含义和应用。

1. 数据挖掘数据挖掘是指通过分析大量数据，从中提取出隐藏在其中的有价值的信息和模式。

这个过程可以帮助人们发现数据中的关联关系、趋势以及未来可能发生的事件。

数据挖掘通过应用统计学和机器学习算法，帮助人们预测未来的趋势，并为企业决策提供有力支持。

2. 数据可视化数据可视化是将大数据以图表、图像或其他视觉化方式展示出来，以便人们更容易理解和分析。

通过数据可视化，人们可以将抽象的数据转化为可感知的信息，从而更好地发现数据中的规律和趋势。

数据可视化不仅可以帮助人们对大数据进行直观的理解，还能够帮助决策者做出更明智的决策。

3. 人工智能人工智能（AI）是指计算机系统通过学习和仿效人类智能，能够自动完成复杂的任务和决策。

大数据为人工智能提供了充足的输入数据，使得人工智能系统能够更好地理解和模仿人类行为。

在大数据的支持下，人工智能技术可应用于自然语言处理、图像识别、智能推荐等领域，为人们提供更高效、智能的服务。

4. 云计算云计算是一种将计算、储存和处理等资源通过互联网进行共享和交付的方式。

大数据分析通常需要大量的计算和存储资源，而云计算提供了高效、灵活的基础设施，使得大数据处理更加便捷和经济。

通过云计算，用户可以根据实际需求按需获取所需的计算资源，而不需要自行购买和维护昂贵的硬件设备。

5. 数据隐私数据隐私是指个人或组织拥有的关于自身个人信息的保护权。

随着大数据的广泛应用和数据泄露事件的频发，数据隐私问题日益受到关注。

合理地处理数据隐私问题既能保护个人权益，又能实现大数据应用的可持续发展。

为此，政府和企业需要制定相关的隐私规范和技术手段，确保数据的合法获取和使用，以及个人隐私的保护。

云计算中的数据分析和挖掘方法

云计算中的数据分析和挖掘方法随着现代科技的不断进步，数据的规模和复杂性不断增加。

这些数据储存在云计算的大数据平台上，如何从海量数据中提取出有价值的信息和知识成为了当前云计算领域研究的热点之一。

数据分析和挖掘方法在这个过程中扮演着至关重要的角色。

一、数据分析方法数据分析是一种从大量数据中提取出有价值的信息，用来支持决策和预测的过程。

它可以基于数据的模式、统计规律、自然语言处理等方面来进行分析，从而为商业和行政决策提供数据支持。

在云计算中，数据分析的方法主要包括以下几种：1. 数据挖掘数据挖掘是一种从大量数据中自动寻找有用的模式和规律，以实现分类、聚类、预测、关联分析等目标的技术。

其过程包括数据预处理、特征选择、模型构建和模型评估等步骤。

数据挖掘方法可以应用于电子商务、智能交通、医学等多个领域中，为数据分析提供了有力的支持。

2. 统计分析统计分析是一种在已知数据分布的前提下，对数据进行概率分析的方法。

它可以通过概率统计、假设检验、回归分析等方法，对数据的分布情况进行描述和分析，从而得出结论。

在云计算中，统计分析方法通常用于预测和决策分析。

3. 自然语言处理自然语言处理是一种将自然语言转化为计算机可处理形式的技术。

它可以通过文本分析、语义分析、信息检索等方法，从文本中抽取出有用的信息。

在云计算中，自然语言处理主要应用于文本分析和情感分析等方面。

二、数据挖掘方法数据挖掘是一种从海量数据中挖掘出有价值的信息和知识的技术。

在云计算中，数据挖掘方法主要包括以下几种：1. 关联规则挖掘关联规则挖掘是一种从数据中挖掘出同时出现的频繁项集及其相互间的关系的技术。

它可以用来发现数据之间的关联规律，从而为商业决策提供支持。

2. 分类算法分类算法是一种从已知数据中构建分类模型，然后利用该模型对新数据进行分类的技术。

它可以将数据划分为不同的类别，用于预测和决策分析。

3. 聚类算法聚类算法是一种将数据集中相似的数据划分到同一组别中的技术。

浅谈基于云计算的数据挖掘技术

摘要：着云计算时代的到来，于云计算进行海量数据挖掘成为一种解决传统集中式数据挖掘不适应海量数据不断增长的高效、随基
可信方法．介绍了云计算的含义、点以及发展现状，析了运用云计算技术实现数据挖掘的优势，查并总结了目前基于云计算．特分调数据挖掘技术的研究状况以及所面临的问题和挑战，并提出一些解决方法和措施．．
Ａｂｓｒｔｔａｃ：Ｗｉｈｔｌｕｄｃｍｐｕｉｇｒｏｉ，ｂａｅｌｕｄｃｍｐｉｇｆａｓｖｅｄａａｍｉｉｇａｏｕｉＯｔｅｔａｉｉａｅ — ｔｈｅｃｏｏｔｎｅａｃｍｎｇｓｄｏｎｃｏｏｕｔｎｏｒｍｓｉｔｎｎｓａｓｌｔｏｎｔｈｒｄｔｏｎｌｃｎｔａｉｅａａｍｉｉａｓｖｄｔｎｕｔｄｔｇｏｉｇｈｉｈ—ｐｅｏｒａｅｅｉｂｌｍｅｈｏｒｌｄｄｔｎｎｇｍｓｉｅａａｏｔｓｉｅＯｒｗｎｇｚｆｒｍｎｃ，ｒｌａｅｔｄ．Ｄｅｃｉｓｔｅｅｎｉｆｃｏｕｄｃｍｐｉｇ，ｓｒｂｅｈｍａｎｇｏｌｏｕｔｎｃａａｔｒｓｉｓａｄｄｖｅｏｈｒｃｅｔｃｎｅｌｐｍｅｔｓａｎ，ａｌｓｓｏｆｔｅｕｓｆｃｏｏｍｐｉｇｔｃｎｏｏＯａｈｅｈｅａｖｎａｓｏａａｍｉｎｉｎｔｔｓｎａｙｉｈｅｏｌｕｄｃｕｔｎｅｈｌｇｔｃｉｖｅｔｄａｔｇｅｆｄｔｎｉｇ，ｉｅｔｙｎｖｓｉ－ｇｔｎｄｕｍｍａｉｅｈｅｃｒｅａａｉｎｎｓｄｎｌｕｄｃｍｐｕｉｅｅｒｈｉｕａｉｎｄｔｅｐｏｂｅｓａｈｌｎｇｓｆｃｄｂｙ，ａｄａｅａｓｒｚｔｕｒｎｔｄｔｍｉｇｂａｅｏｃｏｏｔｎｇｒｓａｃｓｔｏｎａｈｒｌｍｎｄｃａｌｅａｅｔｅｎ

大数据技术的基础理论和应用

大数据技术的基础理论和应用近年来，随着互联网技术的不断发展，大数据技术逐渐走进人们的视野。

大数据技术是指通过收集、存储、处理和分析大量的数据，从而发现其中的规律和关联性，进而为企业和政府决策提供支持。

本文将从大数据技术的基础理论和应用方面进行论述。

一、大数据技术的基础理论1、数据挖掘技术数据挖掘技术是大数据技术的重要组成部分。

它通过构建模型、应用统计学和机器学习算法等方式，从大量的数据中提炼有用的信息，实现知识发现和预测。

数据挖掘技术主要包括分类、聚类、关联规则和异常检测等基本方法，可以帮助企业和政府发现新的商业机会和决策洞见。

2、云计算技术云计算技术是大数据技术的支撑基础之一。

它通过虚拟化技术，将计算资源和数据存储在互联网上的数据中心中，实现计算能力的共享和弹性伸缩。

云计算技术能够提高计算效率和降低成本，为大数据分析提供强大的计算支持。

3、分布式计算技术分布式计算技术是大数据技术的另一个关键技术。

它将计算任务分散到多个计算节点中，使得每个节点只需处理部分数据和任务，从而提高计算效率和可靠性。

分布式计算技术主要包括MapReduce框架和分布式数据库等技术，能够满足大数据处理的高效性和可扩展性要求。

二、大数据技术的应用领域1、金融领域大数据技术在金融领域的应用非常广泛。

通过对大量的金融数据进行挖掘，可以提高金融风险预测和交易决策的准确性，降低金融机构的风险和成本。

例如，利用大数据技术进行风险模型构建和风险评估，可以帮助银行和保险公司发现潜在的风险和机会，从而制定更加有效的风险管理策略。

2、医疗领域大数据技术在医疗领域的应用也逐渐变得重要。

通过对医疗数据进行分析和挖掘，可以实现疾病预防和诊断的准确性、个性化治疗的优化和临床决策的智能化。

例如，利用大数据技术进行基因测序和疾病模型构建，可以精确地诊断疾病和确定个性化治疗方案。

3、智能制造领域大数据技术在智能制造领域的应用也非常广泛。

通过对制造过程和产品数据的收集和分析，可以实现制造过程的优化和产品质量的提高，从而提高制造效率和降低生产成本。

在云计算环境下基于MapReduce的数据挖掘算法研究

在云计算环境下基于MapReduce的数据挖掘算法研究随着数据的不断增长和社会的不断发展，数据的应用价值不断提升。

而大数据背景下的数据挖掘算法，成为了人们不可或缺的研究领域。

云计算技术，作为当前新的计算模式，给数据挖掘算法带来了革命性的变化。

本文将探讨在云计算环境下基于MapReduce的数据挖掘算法研究。

一. 云计算环境下的数据挖掘算法云计算技术，将计算资源和数据存储提供给大众化和广泛的应用，使得研究者们可以在更高效的计算资源下，加速数据挖掘算法的研究和应用。

同时，云计算技术还提供了可扩展性和动态性，可以根据需求自动扩展计算资源。

数据挖掘算法通过挖掘数据价值提供决策支持，而云计算技术可以大大减少计算资源的需求量和节约硬件装置和能源成本，从而可以加速算法的研究，提高算法的效果和运行速度。

二. 基于MapReduce的数据挖掘算法基于MapReduce的数据挖掘算法，是针对MapReduce分布式计算模型特点而开发的一类算法，它包含两个主要的计算步骤：映射（Map）和归约（Reduce）。

在Map阶段，对于每个键值对，解析处理成若干个映射的键值对并将这些键值对传给Reduce阶段。

在Reduce阶段，对于每个映射键，集合过来所有映射值，使用Reduce预定义的操作并输出一个或者多个最终结果。

MapReduce算法相对于传统算法，为用户提供了处理海量数据的功能，同时也大大节省了硬件和能源成本。

三. 基于MapReduce的数据挖掘算法的优点在MapReduce算法中，各个分布式节点独立运算，并行处理数据，大大加快了算法的运算速度。

基于MapReduce的数据挖掘算法，具有高效性、可扩展性和可重用性。

分布式算法的数据的存储是以分布式存储的方式进行的，因此可以大大提高数据的访问速度，简化了数据的过滤操作，加快了计算速度。

对于数据挖掘算法的应用，基于MapReduce的优势可以最大程度的发挥，提高了算法的变量性和可回访性。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

摩尔定律
◦ 集成电路芯片上所集成的电路的数目，每隔18个月就翻一番，同时性能也提升一倍
Gordon Moore

“免费的性能大餐”？
◦ Andy given, and Bill taken away ◦ 软件算法、数据结构似乎不再重要，因为处理器性能不断提升
免费的午餐已经结束！！ Intel Microsoft
不同的工作负载，不同的设计优先级（廉价、不可靠的硬件）
◦ 需要设计与Google应用和负载相符的文件系统
14

硬件出错是正常而非异常
◦ 系统应当由大量廉价、易损的硬件组成 ◦ 必须保持文件系统整体的可靠性

主பைடு நூலகம்负载是流数据读写
◦ 主要用于程序处理批量数据，而非与用户的交互或随机读写 ◦ 数据写主要是“追加写”，“插入写”非常少
刘鹏
gloud@
中国云计算：
中国网格：

内容提纲
云计算概念与现状 Google文件系统
Google MapReduce
Google Bigtable 大云数据挖掘系统
云计算的起源
云计算发展的驱动因素

摩尔定律正在走向终结…
◦ 单芯片容纳晶体管的增加，对制造工艺提出要求 ◦ CPU制造18nm技术，电子泄漏问题 ◦ CPU主频已达3GHz时代，难以继续提高
散热问题（发热太大，且难以驱散）功耗太高
未来的发展：多核

在多核时代生存，必须考虑并发问题不存在解决多核编程问题的银弹，不存在可以简单地将并发编程问题化解掉的工具，开发高性能的并行程序必须要求开发者从根本上改变其编程方法从某种意义上来说，这不仅仅是要改变50年来顺序程序设计的工艺传统， Herb Sutter 而且是要改变数百万年来人类顺序化思考问题的习惯
微软的节能措施
分布式文件系统GFS Google File System
12

Google需要一个支持海量存储的文件系统
◦ 购置昂贵的分布式文件系统与硬件？
是否可以在一堆廉价且不可靠的硬件上构建可靠的分布式文件系统？
13

为什么不使用当时现存的文件系统？
◦ Google所面临的问题与众不同

陈旧数据块删除
◦ 探测陈旧的数据块，并删除
22

采用中心服务器模式
◦ 可以方便地增加Chunk Server ◦ Master掌握系统内所有Chunk Server的情况，方便进行负载均衡 ◦ 不存在元数据的一致性问题
23

不缓存数据
◦ GFS的文件操作大部分是流式读写，不存在大量的重复读写，使用Cache对性能提高不大 ◦ Chunk Server上的数据存取使用本地文件系统，如果某个Chunk读取频繁，文件系统具有Cache ◦ 从可行性看，Cache与实际数据的一致性维护也极其复杂

案例：单词记数问题(Word Count)
◦ 给定一个巨大的文本（如1TB），如何计算单词出现的数目？

使用MapReduce求解该问题
◦ 定义Map和Reduce函数

使用MapReduce求解该问题
◦ Step 1: 自动对文本进行分割，形成初始的<key,value> 对

使用MapReduce求解该问题
◦ Master 调度策略:
向GFS询问获得输入文件blocks副本的位置信息 Map tasks 的输入数据通常按 64MB来划分 (GFS block 大小) 按照blocks所在的机器或机器所在机架的范围进行调度
◦ 效果
绝大部分机器从本地读取文件作为输入，节省大量带宽

跳过有问题的记录
简单的问题，计算并不简单！
Jeffery Dean设计一个新的抽象模型，使我们只要执行的简单计算，而将并行化、容错、数据分布、负载均衡的等杂乱细节放在一个库里，使并行编程时不必关心它们这就是MapReduce
Google MapReduce 架构设计师 Jeffrey Dean

什么样的问题适合并行计算？
◦ 斐波那契序列(Fibonacci)的计算？

什么样的问题适合并行计算？
◦ 如果有大量结构一致的数据要处理，且数据可以分解成相同大小的部分，那我们就可以设法使这道处理变成并
行

计算问题简单，但求解困难
◦ 待处理数据量巨大（PB级），只有分布在成百上千个节点上并行计算才能在可接受的时间内完成 ◦ 如何进行并行分布式计算？ ◦ 如何分发待处理数据？ ◦ 如何处理分布式计算中的错误？

实践证明，MapReduce是出色的分布式计算模型
◦ Google宣布，其对分布于1000台计算机上的1TB数据进行排序仅仅需要68s ◦ 对4000台计算机上的1PB数据进行排序处理仅需要6小时 2分钟（每次测试至少会损坏1块硬盘） ◦ 在08年1月份，Google MapReduce平均每天的数据处理量是20PB，相当于美国国会图书馆当年5月份存档网络数据的240倍

串行编程
◦ 早期的计算里，程序一般是被串行执行的 ◦ 程序是指令的序列，在单处理器的机器里，程序从开始到结束，这些指令一条接一条的执行

并行编程
◦ 一道处理可以被划分为几部分,然后它们可以并发地执行 ◦ 各部分的指令分别在不同的CPU上同时运行，这些CPU 可以存在于单台机器中,也可以存在于多台机器上,它们通过连接起来共同运作
◦ 一些特定的输入数据常导致Map/Reduce无法运行 ◦ 最好的解决方法是调试或者修改
不一定可行~ 可能需要第三方库或源码
◦ 在每个worker里运行一个信号处理程序，捕获map或 reduce任务崩溃时发出的信号，一旦捕获，就会向master 报告，同时报告输入记录的编号信息。如果master看到一条记录有两次崩溃信息，那么就会对该记录进行标记，下次运行的时候，跳过该记录

需要存储大尺寸的文件
◦ 存储的文件尺寸可能是GB或TB量级，而且应当能支持存储成千上万的大尺寸文件
15

将文件划分为若干块（Chunk）存储
◦ 每个块固定大小（64M）

通过冗余来提高可靠性
◦ 每个数据块至少在3个数据块服务器上冗余 ◦ 数据块损坏概率？

通过单个master来协调数据访问、元数据存储
◦ Step 2:在分割之后的每一对<key,value>进行用户定义的Map进行处理，再生成新的<key,value>对

使用MapReduce求解该问题
◦ Step 3:对输出的结果集归拢、排序(系统自动完成）

使用MapReduce求解该问题
◦ Step 4:通过Reduce操作生成最后结果
云计算的定义
云计算是一种商业计算模型。它将计算任务分布在大量计算机构成的资源池上，使各种应用系统能够根据需要获取计算力、存储空间和信息服务。
云计算技术体系结构
SOA构建层
服务接口服务注册服务查找服务访问服务工作流
管理中间件
用户管理帐号管理用户环境配置用户交互管理使用计费安全管理身份认证访问授权综合防护安全审计

源文件：GFS Map处理结果：本地存储 Reduce处理结果：GFS 日志：GFS
Google MapReduce计算架构有什么问题？

Worker故障
◦ Master 周期性的ping每个worker。如果master在一个确定的时间段内没有收到worker返回的信息，那么它将把这个worker标记成失效 WHY？ ◦ 重新执行该节点上已经执行或尚未执行的Map任务 ◦ 重新执行该节点上未完成的Reduce任务，已完成的不再执行
?
24

在用户态下实现
◦ 直接利用Chunk Server的文件系统存取Chunk，实现简单 ◦ 用户态应用调试较为简单，利于开发 ◦ 用户态的GFS不会影响Chunk Server的稳定性

提供专用的访问接口
◦ 未提供标准的POSIX访问接口 ◦ 降低GFS的实现复杂度
25

GFS的容错机制
19

GFS的解决办法
◦ 性能瓶颈问题
尽可能减少数据存取中Master的参与程度不使用Master读取数据，仅用于保存元数据
客户端缓存元数据
Simple, and good enough!
采用大尺寸的数据块（64M）数据修改顺序交由Primary Chunk Server完成
20

存储元数据文件系统目录管理与加锁与ChunkServer进行周期性通信
◦ 发送指令，搜集状态，跟踪数据块的完好性

数据块创建、复制及负载均衡
◦ 对ChunkServer的空间使用和访问速度进行负载均衡，平滑数据存储和访问请求的负载 ◦ 对数据块进行复制、分散到ChunkServer上 ◦ 一旦数据块冗余数小于最低数，就发起复制操作
21

垃圾回收
◦ 在日志中记录删除操作，并将文件改名隐藏 ◦ 缓慢地回收隐藏文件 ◦ 与传统文件删除相比更简单、更安全
任务管理
映像部署和管理
任务调度
任务执行
生命期管理
资源管理
负载均衡
故障检测
故障恢复
监视统计
资源池
计算资源池
存储资源池
网络资源池
数据资源池
软件资源池
物理资源
计算机
存储器
网络设施
数据库
软件
Google云计算关键技术