南京 邮电 大学 云计算与大数据 课后作业节选(附题干)
云计算习题参考答案

第6章云计算习题参考答案6-1简述云和云计算的基本概念。
答:云也叫做资源池,是一些可以自我维护和管理的虚拟计算资源,通常是一些大型服务器集群,包括计算服务器、存储服务器和宽带资源等。
云计算是一种基于互联网的、大众参与的计算模式,其计算资源(计算能力、存储能力、交互能力)是动态、可伸缩、且被虚拟化的,以服务的方式提供。
6-2简述私有云、公用云和混合云的基本概念。
答:私有云也叫做专用云,是由单个客户所拥有的按需提供基础设施,该客户控制哪些应用程序在哪里运行,拥有服务器、网络和磁盘,并且可以决定允许哪些用户使用基础设施。
公用云是由第三方运行的云,第三方可以把来自许多不同客户的作业在云内的服务器、存储系统和其他基础设施上混合在一起。
最终用户不知道运行其作业的同一台服务器、网络或磁盘上还有哪些用户。
混合云把公用云模式与私有云模式结合在一起。
客户通过一种可控的方式对云部分拥有,部分与他人共享。
6-3简述云计算的四个本质特征。
答:云计算的本质包括:(1)虚拟化,即把软件、硬件等IT资源进行虚拟化,抽象成标准化的虚拟资源,放在云计算平台中统一管理,保证资源的无缝扩展;(2)多粒度和多尺度,即灵活的面对需求,提供不同的服务;(3)不确定性,因为云计算是一个人参与的计算,是群体智能的体现,表现出自然界不确定性特征;(4)软计算,即如何让网络明白一些定量、定性的转换,如一些大约的量词等。
6-4简述云计算与并行计算的关系。
答:并行计算式云计算的萌芽阶段。
在并行计算中,为了获得高速的计算能力,人们不惜采用昂贵的服务器和购买更多的服务器。
因此,强大的并行计算能力需要巨额的投资。
并且,传统的并行计算机的使用是一个相当专业的工作,需要使用者具有较高的专业素质。
而云计算将服务器等设施集中起来,最大程度地做到资源共享,能够动态地为用户提供计算能力和存储能力,随时满足用户的需求。
6-5简述分布式计算的基本原理,并指出云计算与分布式计算的关系。
云计算与大数据技术-课后习题答案docx (6)[1页]
![云计算与大数据技术-课后习题答案docx (6)[1页]](https://img.taocdn.com/s3/m/02edc3eb6394dd88d0d233d4b14e852458fb396f.png)
6.11 习题答案
1.启动Hadoop集群可以使用一条命令,也可以使用两条命令,它们分别是什么?
答:使用一条命令:start-all.sh;使用两条命令:start-dfs.sh和start-yarn.sh。
2.Hadoop启动成功之后,使用jps命令,分别回答在master和slave端,至少需要看到那几个服务进程已经启动才表示Hadoop启动正确?
答:master机器上:NameNode、SecondaryNameNode、ResourceManager服务进程;slave机器上:NodeManager、DataNode服务进程。
3.试述ZooKeeper正确启动之后,可以看见的它的守护进程是什么?
答:QuorumPeerMain进程。
4.HBase启动成功之后,分别在master和slave端可见的它的守护进程是什么?
答:在hbase的主节点master机器可见HMaster、HRegionServer进程,在从节点slave上可见HRegionServer进程。
5.试叙述如果需要Hbase正常工作的话,Hbase、ZooKeeper、Hadoop三者的启动先后顺序。
答:先启动Hadoop,再启动ZooKeeper,最后启动ZooKeeper。
在前一个正确的基础上,后一个才可以正确运行。
6.试述在安装Hive之前,必须在Linux服务上事先安装什么数据库软件?
答:安装mysql数据库软件。
7.试述在安装Kafka之前,需要在Linux环境下,必须事先安装好什么软件或服务?
答:Kafka工作的时候需要jdk和zookeeper服务,所以必须事先安装。
大学《云计算与大数据》试题及答案

云计算大数据试题一、单选题1、我公司大数据对外服务品牌是下面哪一项?(A)A.智慧洞察B.精确营销C.智慧数据D.和数据答案:A2、目前中国移动已经开展的大数据对外服务不包括下面的哪一项?(D)A.旅游景区客源分析B.交通OD系统C.商铺选址D.互联网广告营销答案:D3、大数据金融征信是对外服务一个重要的领域,下面说法错误的是(C)A.要严格保护用户信息安全B.数据结果脱敏加工C.可以输出用户的位置信息D.必须获得用户授权答案:C4、大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行(B)。
A. 数据信息B. 专业化处理C.速度处理D. 内容处理答案:B5、与运营商数据相比,互联网数据有以下几点局限性,除了( D )。
A. 数据局部性B. 数据封闭性C. 数据割裂性D.数据全面性答案:D6、推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、(D ),推测客户将来可能的购买行为。
A.客户的朋友B.客户的个人信息C.客户的兴趣爱好D. 客户过去的购买行为和购买记录答案:D7、社交网络产生了海量用户以及实时和完整的数据,同时社交网络也记录了用户群体的( C ),通过深入挖掘这些数据来了解用户,然后将这些分析后的数据信息推给需要的品牌商家或是微博营销公司。
A.地址B.行为C.情绪D.来源答案:C8、在云生态环境中,用户需求相当于( D ),云数据中心相当于( C ),云服务相当于( B )。
A. 降水B. 水滴C. 水库D. 阳光答案:D\C\B9、云计算按照提供的服务类型进行分类,包括Iaas、Paas、(A)。
A.SaasB.DockerC.XenD.KVM答案:A10、IDC机房等级(五星级机房),等保(三级)答案:B11、(A)是指以服务的形式提供虚拟硬件资源,如虚拟主机/存储/网络等资源。
A.IaasB.SaasC.PaasD.Docker答案:A12、存储虚拟化通过对存储系统或存储服务的内部功能进行抽象、隐藏或隔离,从而实现(B)和存储的独立管理。
《分布式计算、云计算与大大数据》习题参考解答

《分布式计算、云计算与大数据》习题解答参考第1章分布式计算概述一、选择题1,CD 2,ABC 3,ABCD 4,ACD二、简答题1,参考1.1.1和1.1.2节2,参考1.1.2节3,分布式计算的核心技术是进程间通信,参考1.3.2节4,单播和组播5,超时和多线程三、实验题1.进程A在进程B发送receive前发起send操作进程A进程B发出非阻塞send操作,进程A继续运行发出阻塞receive操作,进程B被阻塞进程B在进程A发起send前发出receive操作发出非阻塞send 操作,进程A 继续运行发出阻塞receive 操作,进程B被阻塞收到进程A 发送的数据,进程B 被唤醒2. 进程A 在进程B 发送receive 前发起send 操作进程A 进程B发出阻塞send 操作,进程A 被阻塞发出阻塞receive 操作,进程B 被阻塞进程B 在进程A 发起send 前发出receive 操作发出阻塞send操作,进程A被阻塞发出阻塞receive操作,进程B被阻塞收到进程A发送的数据,进程B被唤醒收到进程B返回的数据,进程A被唤醒3.1).在提供阻塞send操作和阻塞receive操作的通信系统中receiveoperationsendoperationt=1在提供非阻塞send操作和阻塞receive操作的通信系统中t=1receiveoperationsendoperation2).P1,P2,P3进程间通信的顺序状态图m1m1m2m2第2章分布式计算型概述1.消息传递,客户-服务器,P2P,分布式对象,网络服务,移动代理等2.分布式应用最广泛最流行的型是客户-服务器型,参考2.2节3.分布式应用最基本的型是消息传递模型,参考2.1节4.参考2.3节,P2P应用有很多,例如Napster,迅雷,PPS网络电视等5.参考2.4节6.参考2.7节7.略8.消息传递模式是最基本的分布式计算型,适用于大多数应用;客户-服务器型是最流行的分布式计算型,应用最为广泛;P2P型又称为对等结构型,使得网络以最有效率的方式运行,适用于各参与者地位平等的网络;分布式对象型,是抽象化的远程调用,适用于复杂的分布式计算应用等。
云计算与大数据技术应用习题

1. 简述什么是云计算?答:云计算是一种动态扩展的计算模式,通过网络将虚拟化的资源作为服务提供;云计算是一种无处不在的、便捷的通过互联网访问一个可定制的IT资源(IT资源包括网络、服务器、存储、应用软件和服务)共享池,并是一种按使用量付费的模式,它能够通过最少量的管理或与服务供应商的互动实现计算资源的迅速供给和释放;云计算是基于互联网服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。
2. 云计算有什么特点?答:①具有大规模并行计算能力;②资源虚拟化(Virtualization)和弹性调度;③数据量巨大并且增速迅猛;④高可靠性;⑤按需分配,按量计费。
3. 请分别回答什么是IaaS、PaaS、SaaS?答:IaaS:基础设施即服务,Infrastructure as a Service;PaaS:平台即服务,Platform as a Service;SaaS:软件即服务,Software as a Service。
4. 云计算的基础设施有哪些,各自完成什么功能?答:①分布式文件系统,完成数据的存储;②MapReduce编程模式,提供分布式并行编程环境进行数据处理;③大规模分布式数据库BigTable,提供分布式大规模数据库管理系统。
1. 解释说明什么是非结构化和半结构化数据?答:非结构化数据是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据,包括所有格式的办公文档、文本、图片、图像和音频/视频信息等。
半结构化数据是介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据之间的数据,XML、HTML文档属于半结构化数据,它一般是自描述的,数据的结构和内容混在一起,没有明显的区分。
2. 大数据价值链的三大构成是什么?答:数据本身、技能与思维。
3. 大数据的4V特征是什么?答:①多样性(Variety);②规模性大(V olume);③快速性(Velocity);④价值密度低(Value)。
云计算技术_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年

云计算技术_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年1.下列关于云计算的说法错误的是()。
参考答案:主要基于非虚拟化资源池2.副本删除发生的原因主要包括()。
参考答案:副本的生命周期结束3.下列典型虚拟化软件不包括()。
参考答案:Eureka4.下列不属于半虚拟化技术的是()。
参考答案:AMD-V5.相较于Swarm,Kubernetes的优势包括()。
参考答案:以上都是6.用户合法获取云服务的第一道关卡是()。
参考答案:身份认证7.与虚拟机相比,以下关于目前容器的叙述错误的是()。
参考答案:容器的安全性比虚拟机强8.目前决定副本数量的主要方法不包括()。
参考答案:随机复制9.在GFS中,客户端可以并行访问多个(),提高了系统的整体性能。
参考答案:数据块服务器10.同一台物理主机上一个虚拟机的崩溃或故障不会影响其他虚拟机,这主要得益于虚拟化技术的()特征。
参考答案:隔离11.虚拟化技术的研究目的包括()。
参考答案:以上都是12.Docker可以回滚到当前镜像的前一个版本,可以避免因为完成部分组件的升级而导致对整个环境的破坏,这是Docker的()功能。
参考答案:版本控制13.分布式文件系统的性能要求主要包括()。
参考答案:以上都是14.区块链的核心是(),是区块链网络中各个节点达成一致的方法。
参考答案:共识层15.云计算有许多关键技术,其中包含()。
参考答案:以上都是16.证明云计算系统中的活动符合内部或外部要求的合规性机制是()。
参考答案:云计算审计17.云计算的体系架构不包括()。
参考答案:网络调度层18.云计算的产生与发展综合了许多技术,包括()。
参考答案:以上都是19.存储虚拟化的实现方式包括()。
参考答案:以上都是20.以下不属于云计算部署模型的是()。
参考答案:企业云21.云计算的管理中间件层中包含对()的管理功能。
参考答案:以上都是22.基于区块链的数据完整性验证通过()计算哈希值并判断其与根哈希值是否一致。
《分布式计算、云计算与大数据》习题参考解答

《分布式计算、云计算与大数据》习题解答参考第1章分布式计算概述一、选择题1,CD 2,ABC 3,ABCD 4,ACD二、简答题1,参考1.1.1和1.1.2节2,参考1.1.2节3,分布式计算的核心技术是进程间通信,参考1.3.2节4,单播和组播5,超时和多线程三、实验题1.进程A在进程B发送receive前发起send操作进程A进程B发出非阻塞send操作,进程A继续运行发出阻塞receive操作,进程B被阻塞进程B在进程A发起send前发出receive操作发出非阻塞send 操作,进程A 继续运行发出阻塞receive 操作,进程B被阻塞收到进程A 发送的数据,进程B 被唤醒2. 进程A 在进程B 发送receive 前发起send 操作进程A 进程B发出阻塞send 操作,进程A 被阻塞发出阻塞receive 操作,进程B 被阻塞进程B 在进程A 发起send 前发出receive 操作发出阻塞send操作,进程A被阻塞发出阻塞receive操作,进程B被阻塞收到进程A发送的数据,进程B被唤醒收到进程B返回的数据,进程A被唤醒3.1).在提供阻塞send操作和阻塞receive操作的通信系统中receiveoperationsendoperationt=1在提供非阻塞send操作和阻塞receive操作的通信系统中t=1receiveoperationsendoperation2).P1,P2,P3进程间通信的顺序状态图m1m1m2m2第2章分布式计算范型概述1.消息传递,客户-服务器,P2P,分布式对象,网络服务,移动代理等2.分布式应用最广泛最流行的范型是客户-服务器范型,参考2.2节3.分布式应用最基本的范型是消息传递模型,参考2.1节4.参考2.3节,P2P应用有很多,例如Napster,迅雷,PPS网络电视等5.参考2.4节6.参考2.7节7.略8.消息传递模式是最基本的分布式计算范型,适用于大多数应用;客户-服务器范型是最流行的分布式计算范型,应用最为广泛;P2P范型又称为对等结构范型,使得网络以最有效率的方式运行,适用于各参与者地位平等的网络;分布式对象范型,是抽象化的远程调用,适用于复杂的分布式计算应用等。
大数据与云计算综合练习含答案

大数据与云计算综合练习含答案1.下列关于大数据(Big data)特点的叙述,错误的是( ).[单选题] *A:数据体量巨大B:数据类型繁多C:商业价值高D:处理速度慢(正确答案)2.当前大数据技术的基础是由( )首先提出的.[单选题] *A:微软B:百度C:谷歌(正确答案)D:阿里巴巴3.大数据的起源是( ).[单选题] *A:金融B:电信C:互联网(正确答案)D:公共管理4.大数据的最显著特征是( ).[单选题] *A:数据规模大(正确答案)B:数据类型多样C:数据处理速度快D:数据价值密度高5.美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点.这体现了大数据分析理念中的( ).[单选题] *A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析(正确答案)C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据6.当前社会中,最为突出的大数据环境是( ).[单选题] *A:自然资源B:综合国力C:物联网D:互联网(正确答案)7.大数据时代,数据使用的关键是( ).[单选题] *A:数据收集B:数据存储C:数据分析D:数据再利用(正确答案)8.下列论据中,能够支撑"大数据无所不能"的观点的是( ).[单选题] *A:互联网金融打破了传统的观念和行为(正确答案)B:大数据存在泡沫C:大数据具有非常高的成本D:个人隐私泄露与信息安全担忧9.支撑大数据业务的基础是( ).[单选题] *A:数据科学B:数据应用(正确答案)C:数据硬件D:数据人才10.大数据的核心就是( ).[单选题] *A:告知与许可B:预测(正确答案)C:匿名化D:规模化11.大数据不是要教机器像人一样思考.相反,它是( ).[单选题] *A:把数学算法运用到海量的数据上来预测事情发生的可能性(正确答案)B:被视为人工智能的一部分C:被视为一种机器学习D:预测与惩罚12.大数据是指不用随机分析法这样的捷径,而采用( )的方法 .[单选题] *A:所有数据(正确答案)B:绝大部分数据C:适量数据D:少量数据13.相比依赖于小数据和精确性的时代,大数据因为更强调数据的( ),帮助我们进一步接近事实的真相.[单选题] *A:安全性B:完整性C:混杂性D:完整性和混杂性(正确答案)14.大数据的发展,使信息技术变革的重点从关注技术转向关注( ).[单选题] *A:信息(正确答案)B:数字C:文字D:方位15.大数据时代,我们是要让数据自己"发声",没必要知道为什么,只需要知道( ).[单选题] *A:原因B:是什么(正确答案)C:关联物D:预测的关键16.下列关于大数据的分析理念的说法中,错误的是( ).[单选题] *A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据(正确答案)17.下列说法正确的是( ).[单选题] *A:有价值的数据是附属于企业经营核心业务的一部分数据B:数据挖掘它的主要价值后就没有必要再进行分析了C:所有数据都是有价值的(正确答案)D:在大数据时代,收集、存储和分析数据非常简单18.关于数据创新,下列说法正确的是( ).[单选题] *A:多个数据集的总和价值等于单个数据集价值相加B:由于数据的再利用,数据应该永久保存下去C:相同数据多次用于相同或类似用途,其有效性会降低D:数据只有开放价值才能得到真正释放(正确答案)19.关于数据估值,下列说法错误的是( ).[单选题] *A:随着数据价值被重视,公司所持有和使用的数据也渐渐纳入了无形资产的范畴B:无论是向公众开放还是将其锁在公司的保险库中,数据都是有价值的(正确答案) C:数据的价值可以通过授权的第三方使用来实现D:目前可以通过数据估值模型来准确的评估数据的价值评估20.在大数据时代,下列说法正确的是( ).[单选题] *A:收集数据很简单B:数据是最核心的部分(正确答案)C:对数据的分析技术和技能是最重要的D:数据非常重要,一定要很好的保护起来,防止泄露21.在大数据时代,我们需要设立一个不一样的隐私保护模式,这个模式应该更着重于( )为其行为承担责任.[单选题] *A:数据使用者(正确答案)B:数据提供者C:个人许可D:数据分析者22.对大数据使用进行正规评测及正确引导,可以为数据使用者带来什么切实的好处( ).[单选题] *A:他们无须再取得个人的明确同意,就可以对个人数据进行二次利用(正确答案) B:数据使用者不需要为敷衍了事的评测和不达标准的保护措施承担法律责任C:数据使用者的责任不需要强制力规范就能确保履行到位D:所有项目,管理者必须设立规章,规定数据使用者应如何评估风险、如何规避或减轻潜在伤害23.下列论据中,体现"冷眼"看大数据的观点的是( ).[单选题] *A:互联网金融打破了传统的观念和行为B:大数据医疗正在走进平民百姓C:数据资产型企业前景光明D:个人隐私泄露与信息安全担忧(正确答案)24.大数据环境下的隐私担忧,主要表现为( ).[单选题] *A:个人信息的被识别与暴露(正确答案)B:用户画像的生成C:恶意广告的推送D:病毒入侵25.对线下零售而言,做好大数据分析应用的前提是( ).[单选题] *A:增加统计种类B:扩大营业面积C:增加数据来源(正确答案)D:开展优惠促销26.一切皆可连,任何数据之间逻辑上都有可能存在联系,这体现了大数据思维维度中的( ).[单选题] *A:定量思维B:相关思维(正确答案)C:因果思维D:实验思维27.一切皆可试,大数据分析的效果好坏,可以通过模拟仿真或者实际运行来验证,这体现了大数据思维维度中的( ).[单选题] *A:定量思维B:相关思维C:因果思维D:实验思维(正确答案)28.下列企业中,最有可能成为典型的数据资产动营商的是( ).[单选题] *A:物联网企业B:互联网企业C:云计算企业D:电信运营商(正确答案)29.大数据处理中的数据分析根据不同层次大致可分为3类:计算架构、( )以及数据分析和处理.[单选题] *A:支撑技术B:数据解释C:查询与索引(正确答案)D:数据的收集管理30.大数据的4V特点,不包括( ).[单选题] *A:大量(Volume)B:高速(Velocity)C:多样(Variety)D:可视化(Visualization)(正确答案)31.大数据的处理不包含下列( ).[单选题] *A:采集B:导入/预处理C:统计/分析D:查询(正确答案)32.大数据分析相比于传统的( )仓库应用,具有数据量大、查询分析复杂等特点.[单选题] *A:小型B:大型C:数据(正确答案)D:计算33.网上购物过程中,经常会看到"看了此商品的会员通常还看了…"、"买了此商品的会员通常还买了…".这些信息既方便了顾客购物选择,又为商家赢得了更多的利润.这里采用的技术是( ).[单选题] *A:联机分析处理B:智能代理C:智能机器人D:数据挖掘(正确答案)34.基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源.这种新的计算机应用领域称为( ).[单选题] *A:嵌入式技术B:云计算(正确答案)C:虚拟现实技术D:物联网技术35.云计算是对( )技术的发展与运用.[单选题] *A:并行计算B:网格计算C:分布式计算D:三个选项都是(正确答案)36.云计算通过共享( )的方法将巨大的系统池连接在一起.[单选题] *A:CPUB:软件C:基础资源(正确答案)D:处理能力37.云计算中,提供资源的网络被称为( ).[单选题] *A:母体B:导线C:数据池D:云(正确答案)38.通过分布处理和并行处理的方式,将计算资源放置在网络中,供多个终端设备共同来分享使用的技术是( ).[单选题] *A:多媒体技术B:云安全技术C:物联网技术D:云计算技术(正确答案)39.下列关于云计算技术的叙述,错误的是( ).[单选题] *A:可以轻松实现不同设备间的数据和应用共享B:云计算是一种分布式计算C:提供了较为可靠安全的数据存储中心D:对用户端的设备要求较高(正确答案)40.移动云计算是云计算技术在移动网络中的应用,下列不是移动云计算优势的是( ).[单选题] *A:便捷的数据存取B:降低管理成本C:限制资源的访问(正确答案)D:突破终端硬件限制41.云计算将存在于互联网上的( )集群上的硬件资源和软件资源池连接在一起,以服务的方式提供计算资源,形成了一种动态可伸缩、虚拟化的新型计算资源组织、分配和使用模式.[单选题] *A:存储器B:网络设备C:服务器(正确答案)D:无线设备42.云计算的特点有通用性、按需服务、成本低廉、超大规模及( ).[单选题] *A:基于互联网B:高可扩展性(正确答案)C:计算速度快D:存储速度快43.一般认为云计算不包括以下( )层次的服务.[单选题] *A:基础设施即服务(IaaS)B:平台即服务(PaaS)C:软件即服务(SaaS)D:硬件即服务(HaaS)(正确答案)44."云"使用了数据多副本容错、计算节点同构可互换等措施来保障服务的( ),使用云计算比使用本地计算机更加可靠.[单选题] *A:高可靠性(正确答案)B:通用性C:超大规模D:虚拟性45.云计算技术在( )中的应用,体现在搜索引擎、网络信箱、Google的Applications 等.[单选题] *A:虚拟现实B:嵌入式技术C:网络服务(正确答案)D:通信技术46.按照云计算服务类型进行划分,以下不是其分类的是( ).[单选题] *A:基础设施即服务(IaaS)B:平台即服务(PaaS)C:软件即服务(SaaS)D:网络服务(正确答案)47.云计算是一种基于互联网的计算方式,以下不属于云计算特征的是( ).[单选题] * A:多人共享资源池B:随需应变自助服务C:借助自然界的云为载体的计算(正确答案)D:基于虚拟化技术获得服务48.云计算通常通过( )来提供动态易扩展且经常是虚拟化的资源.[单选题] *A:局域网B:互联网(正确答案)C:服务器D:软件49.大数据与云计算的关系( ).[单选题] *A:密不可分(正确答案)B:毫无关系C:不一定D:以上都不对50.云计算服务除了提供计算服务外,还必然提供了( )服务.[单选题] *A:存储(正确答案)B:分布C:打包D:运算。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、在信息产业的发展历程中,计算和数据作为两个重要的内在动力在不同时期起着重要作用。
5、吉姆·格雷(Jim Gray)提出了第四范式,被誉为“大数据之父”。
6、MapReduce的思想来源是Lisp编程语言。
7、按照资源封装层次,云计算可分为基础设施既服务、平台既服务、软件既服务三种类型。
8、与传统的资源提供方式相比,与计算具有什么特点?
云计算技术是资源与用户需求之间是一种弹性化的关系,资源的实用这之需对资源的使用按需付费,从而敏捷地响应客户不断变化的需求,从而降低了资源使用者的成本,提高了走远利用的效率。
10、简述主要的大数据的处理系统。
(1)数据查询分析计算系统:对大规模莫数据进行事时或准时查询
(2)批处理系统:典型代表有MapReduce计算模式的Hadoop与Spark
(3)流式计算系统:具有很强的实时系统,需要对应用源源不断产生的数据实时进行处理,使数据不积压、不丢失,常用于处理电信、电力等行业应用与互联网恒业的访问日志等。
(4)迭代计算系统:iMapReduce、Twister、Spark、Hadoop等。
(5)图计算系统:图数据需要专门的系统进行存储和计算。
常用的计算系统有:Giraph、Pregel、Trinity、GraphX等
(6)内存计算系统:Dremel、HANA、Spark等
11、简述大数据处理的基本流程。
(1)数据抽取与集成:从数据中取出关系与实体,经过关联和聚合等操作,按照统一的格式进行存储。
(2)数据分析:是大数据处理流程的核心步骤,通过数据抽取和集成环节获得原始数据后用户可以根据自己的需求对这些数据进行分析处理。
(3)数据解释:可视化和人机交互是书记解释的主要技术。
第二章
1、简述一致性哈希算法的基本原理。
一致性哈希算法的设计目标是解决节点频发变化时的任务分配问题。
一致性哈希算法将整个哈希空间组织成一个哈希环。
比如将ip作为关键字哈希,确定每个结点在哈希环上的位置,将key用函数映射到哈希空间上的某个值,沿该值向后,将遇到的第一个节点作为处理节点。
节点数不多时可以引入虚拟节点解决负载不均衡的问题。
Key值在哈希环中找到大于它的最小节点作为路由值。
2、科学研究的四个范式是经验、理论、实验、海量数据。
3、物联网的产业链可以分为标识、感知、处理和信息传递4个环节。
4、非关系型数据库可以分为Column-Oriented、Key-Value、Document-Value。
第三章
2、虚拟化技术从计算体系层次结构上可以分为以下5种类型:指令集架构级虚拟化、硬件抽象层虚拟化、操作系统层虚拟化、编程语言层上的虚拟化、库函数层的虚拟化。
4、系统虚拟化具有硬件无关性、隔离性、多实例、特权功能等优点。
5、系统虚拟化可分为一虚多、多虚一、多虚多。
6、服务器虚拟化按照其虚拟化部件可分为CPU虚拟化、内存虚拟化、I/O虚拟
7、什么是广义虚拟化技术?
逻辑简化技术,实现物理层想逻辑层的变化。
8、虚拟化技术有哪些优势与劣势?
优势:提高资源利用率;提供相互隔离的、高效的运行环境;简化资源和资源管理;实现软件和硬件的分离。
劣势:肯呢个回事物理计算机负载过重;升级和维护的安全问题;物理计算机的影响。
第四章
3、传统的集群系统可以分为高可用性集群系统、负载均衡集群系统、高性能集群系统、虚拟化集群系统4类。
4、简述Beowulf系统的主要特点。
用廉价系统实现高性能的能力。
(1)由一个管理节点和多个计算节点构成。
(2)同城由最城建的硬件系统构成。
(3)通常采用廉价且广范传播的软件。
5、Lustre存储系统的组成有元数据服务器、元数据存储节点、对象存储服务器、对象存储节点、客户端。
6、简述面向对象的分布式系统、混合型分布试系统、面向数据的分布式系统的实现机制,分析三种系统的区别。
三种系统的实现机制分别为:计算拆分、数据拆分、数据拆分
区别:混合式系统具有面向计算和面向数据的特征以集中式的存储和数据想计算迁移的方式实现计算和数据位置的一致性。
面向数据的分布式系统往往有对应的文件系统支持,从文件存储实现数据块的划分。
计算和数据协作机制为核心问题。
面向计算的分布试系统具有灵活和功能强大的计算能力能完成大多数问题的计算任务,面向数据的分布试系统能较好地解决海量数据的自动分布式分布式处理问题。
第五章
1、什么是MPI?
MPI是一种消息传递编程模型并成为这种编程模型的代表和事实上的标准。
3、简述MPICH并行环境建立的主要步骤。
(1)配置NFS实现所有节点指定文件夹的共享。
(2)配置好节点间的互信,实现集群内部各节点间的无密码访问。
(3)编译安装配置MPICH。
第六章
2、简述GFS的工作过程。
(1)客户端使用固定大小的块将应用程序指定的文件名和字节偏移转换成文件的一个块索引,向master发送包含文件名和块索引的请求。
(2)Master收到客户端发来的请求后向服务器发出指示,同时时刻监控众多chunkserver的状态。
(3)Master通过和chunkserver的交互向客户端发送chunk-handle和副本位置。
期中文件被分成若干个块。
(4)客户端向其中一个副本发出请求,请求指定了chunk-handle和块内的一个字节区间。
(5)客户端从chunkserver获得数据。
3、简述HDFS的分块策略。
通常HDFS在存储一个文件会将文件切为64M大小的块来进行存储,数据块会被分别存储在不同的Datanode节点上同时数据块被分块存储后在数据读写时能实现对数据的并发读写。
4、简述搭建Hadoop开发环境的流程。
首先安装jdk,下载解压Hadoop,配置Hadoop环境变量,然后修改Hadoop配置文件。
第七章
1、简述HPCC的主要特点。
面向数据的高性能计算平台,平台基于键值进行索引,用来解决海量数据的处理与分析。
4、HPCC从总体物理上可以看作在同一个集群上部署了Thor、Roxie两套集群计算系统。
5、HPCC的系统服务包含ECL服务器、Dail服务器、Sasha服务器、DFU服务器、ESP服务器。
6、简述HPCC平台数据检索任务的执行过程。
(1)加载原始数据(2)切分、分发待处理的数据(3)分发后原始数据的ETL 处理(4)向Roxie集群发布。
第八章
1、Storm三进程包括Nimbus、Supervisor、Zookeeper。
2、在Storm中每实现一个任务,用户需要构造包含Spout、Bolt组件的拓扑。
第九章
1、数据中心的发展经历了巨型机时代、微型计算机/PC时代、互联网时代、云计算、大数据时代四个阶段。
2、数据中心的选址主要考虑地质环境、气候条件、电力供给、网络带宽等因素。
3、数据中心的主要组成部分有基础设施、硬件设施、基础软件、管理支撑软件。
4、PUE的定义为数据中心整体能耗/IT设备能耗。
5、DCIE的定义为IT设备能耗/数据中心整体能耗。
第十章
1、GirdSim和CloudSim的区别有哪些?
GirdSim没有将云计算体系中的SaaS、PaaS、LaaS层抽象出来也没有虚拟化模型和资源管理模型,CloudSim继承了前者的模型弥补了网格计算模拟软件的不足。
2、简述CloudSim仿真的主要步骤。
初始化CloudSim库,创建数据中心,创建代理Broker,创建虚拟机,创建云任务,启动仿真,在仿真结束后统计结果。