华为FusionInsight大数据平台测试报告

合集下载

大数据HCIA考试模拟题及答案

大数据HCIA考试模拟题及答案

大数据HCIA考试模拟题及答案一、单选题(共40题,每题1分,共40分)1、关于Hive建表的基本操作,描述正确的是?A、创建外部表的时需要指定external关键字B、一旦表创建好,不可再修改列名C、一旦表创建好,不可再修改表名D、一旦表创建好,不可再增加新列正确答案:A2、Flink的数据转换操作在以下哪个环节中完成?A、sourceB、sinkC、transformationD、channel正确答案:C3、Kafka集群中,Kafka服务端部署的角色是?A、ProducerB、ConsumerC、ZooKeeperD、Broker正确答案:D4、可以通过以下哪个命令创建节点数据?A、ls/nodeB、get/nodeC、create/nodeD、set/nodedata正确答案:C5、在Zookeeper和YARN的协同工作中,当ActiveResourceManager产生故障时,StandbyResourceManager会从以下哪个项目中获取Application相关信息?A、warehouseB、metastoreC、StorageD、Statestore正确答案:D6、以下关于Kafka的描述错误的有?A、具有消息持久化,高吞吐,实时等特性B、用作活动流和运营数据处理管道的基础C、使用Scala,Java语言实现D、由ApacheHadoop开发,并于2011年开源正确答案:D7、下面关于Zookeeper特性的描述错误的是?()A、Zookeeper节点数必须为奇数个。

B、客户端所发送的更新会按照它们被发送的顺序进行应用。

C、消息更新只能成功或者失败,没有中间状态。

D、一条消息要被超过半数的Server接收,它将可以成功写入磁盘正确答案:A8、Flink中的()接口用于流数据处理,()接口用于批处理?A、BatchAPI,StreamAPIB、DataStreamAPI,DataSetAPIC、StreamAPI,BatchAPID、DataBatchAPI,DataStreamAPI正确答案:B9、Flume支持监控并传输目录下新增的文件,可实现准实时数据传输,以上描述的是哪一类source?A、syslogsourceB、spoolingdirectorysourceC、httpsourceD、execsource正确答案:B10、FusionlnsightHD中Loader实例必须与哪个实例部署在一起?A、DataNodeB、RegionServerC、ResourceManagerD、Nodemanager正确答案:D11、在Zookeeper和YARN的协同工作中,当ActiveResourceManager产生故障时,StandbyResourceManager会从以下哪个目录中获取Application相关信息()A、warchouseB、metastoreC、StatestoreD、Storage正确答案:C12、哪个不是Flume的channel类型A、MemoryChannelB、FileChannelC、JDBCChannelD、HDFSChannel正确答案:D13、FusionInsightHDHBase的管理进程是如何选择主节点的?A、随机选取B、由RegionServer进行裁决C、通过ZooKeeper进行裁决D、HMaster为双主模式,不需要进行裁决正确答案:C14、FuskmlnsightHD集群规划中,管理节点&控制节点&数据节点合一部署方案适合什么样的场景?A、30节点以下B、100节点以上C、100-200节点D、200节点以上正确答案:A15、关于Hive与传统数据仓库的对比,以下描述错误的是?()A、由于Hive的数据存储在HDFS中,所以可以保证数据的高容错、高可靠。

HCNP云计算-第一章 FusionInsight 解决方案

HCNP云计算-第一章 FusionInsight 解决方案
二次登陆组件UI,组件Webapp直接向CAS校验身 份。如果该身份已经登陆,则无需再次身份校验。
用户价值
提供安全、可靠的统一用户身份校验机制。 提供多组件UI间单点登陆功能,操作方便易用。
安全:Hive/HBase细粒度加密
Hive/HBase
敏感数据写 入
敏感数据读 取
非敏感数 据
加密/解密
pp
3 验证
应用场景
Hadoop集群原生组件的WEB UI可以直接登陆,并不需 要用户鉴权,没有任何安全保障能力,需要增加用户 鉴权功能。同时,多个组件UI登陆时,如果不支持单 点登陆,那么每登陆一次组件UI都需要输入一次鉴权 信息,非常麻烦。
解决方案
首次登陆UI,会重定向到CAS进行集中认证。认证 通过后,返回票据;UI使用票据重新请求server端, server端向CAS校验票据。从而完成登陆认证校验 过程。
系统可靠性
业务无单点:OMS,HDFS,HBase,Yarn,Hive,Hue,ZooKeeper采用 主备,负荷分担方式实现服务无单点故障
管理节点HA:OMS节点及所有业务组件中心管理节点实现HA
跨DC容灾/备份:HBase集群通过HLOG准实时复制,HDFS/Hive集群通过 异步复制实现跨数据中心灾备
CAS 2
6 Oozi e MR Zk
5
HDFS
Hive HBase
4
4
5
业务开发用户
运维用户
超级管理员
1 网络安全
2 用户/用户组管理
3 Kerberos认证
4
4 数据分角色存储 5 数据加密
图形化快速升级平滑扩容
平滑在线扩展
快速升级
集群

FusionInsight HD技术白皮书

FusionInsight HD技术白皮书

华为FusionInsight HD 技术白皮书目录1 简介 (1)1.1 FusionInsight概述 (1)1.2 FusionInsight HD组件介绍 (2)2 重点组件介绍 (4)2.1 集群管理Manager (4)2.2 分布式文件系统HDFS (6)2.3 统一资源管理和调度框架YARN (7)2.3.1 Yarn (7)2.3.2 Superior Scheduler (7)2.4 分布式批处理引擎MapReduce (12)2.5 分布式数据库HBase (13)2.6 数据仓库组件Hive (13)2.7 分布式内存计算引擎Spark (14)2.7.1 Spark (14)2.7.2 CarbonData (15)2.8 交互式SQL引擎Elk (16)2.9 全文检索组件Solr (19)2.10 全文检索组件Elasticsearch (21)2.11 批量数据集成Loader (22)2.12 实时数据采集Flume (25)2.13 流式事件处理(Storm) (26)2.13.1 Storm (26)2.13.2 StreamCQL (27)2.14 流处理引擎Flink (28)2.15 分布式高速缓存Redis (30)2.16 分布式消息队列Kafka (30)2.17 作业编排与调度Oozie (31)2.18 数据继承入口Hue (33)2.19 多租户 (34)2.20 安全增强 (36)2.21 可靠性增强 (37)2.22 滚动重启、滚动升级与滚动补丁 (39)1 简介1.1 FusionInsight概述FusionInsight是华为企业级大数据存储、查询、分析的统一平台,能够帮助企业快速构建海量数据信息处理系统,通过对巨量信息数据实时与非实时的分析挖掘,发现全新价值点和企业商机。

FusionInsight解决方案由产品:FusionInsight HD、FusionInsight LibrA、FusionInsightAthena和操作运维系统FusionInsight Manager,数据使能服务:数据集成开发工具、实时决策平台,及私有云服务:HDS大数据服务、ADS数据库服务、RDS数据库服务构成。

附报告华为FusionInsight大数据平台首次入围Gartner分析数据管理解决方案魔力象限

附报告华为FusionInsight大数据平台首次入围Gartner分析数据管理解决方案魔力象限

附报告华为FusionInsight大数据平台首次入围Gartner分析数据管理解决方案魔力象限刚刚不久前,Gartner发布了2017年的《分析数据管理解决方案(DMSA)魔力象限研究报告》,华为的FusionInsight大数据平台成功入围。

加上原有的星环科技,在大数据平台领域,目前已有2家中国公司入选。

在2016年,这份报告的名称叫《Magic Quadrant for Data Warehouse and Data Management Solutions for Analytics》。

那个时候,中国的星环科技是入围的唯一中国厂商,而且星环科技进入了远见者象限,这个对于中国公司来说还是非常了不起的。

因为在运营商领域,中国的华为和中兴都有产品进入领导者象限,但在企业市场,除了华为存储去年进入领导者象限外,几乎没有看到有公司能够跨过远见这个巨大的门槛,进入远见者或者领导者象限。

一年之后,Gartner把这份报告更名为《Magic Quadrant forData Management Solutions for Analytics》,因为Gartner发现,传统的数据仓库已经不太重要,客户关注度也不高。

在这份新的报告里,各厂商有啥变化呢?先来看看中国厂商,,原来的星环科技从远见者变为了利基者。

华为虽然首次入围,但在执行力和远见两方面略领先星环科技。

如果只看厂商的进出,总的变化如下:新增厂商•EnterpriseDB•Google•Huawei•Snowflake Computing出局厂商•Actian:不再从事分析市场数据管理解决方案•Exasol:没有满足入围标准对收入要求•Hitachi:没有展示最少两个不同地理区域的客户•Kognitio:没有满足入围标准对收入要求•Infobright:没有满足入围标准对收入要求其他在位置上升发生比较大的厂商还有AWS成为领导者,MarkLogic成为远见者。

基于华为FusionInsight的《大数据平台建设》课程实验教学探索

基于华为FusionInsight的《大数据平台建设》课程实验教学探索

基于华为FusionInsight的《大数据平台建设》课程实验教学探索作者:关辉许璐蕾来源:《电脑知识与技术》2018年第24期摘要:近年来随着各行业对高层次大数据专业人才的迫切需求,很多高校都陆续开设了大数据专业或课程,对大数据技术专业人才的培养成为高校教学中的一个热点问题。

大数据技术强调实践动手能力,实验教学对培养学生的大数据平台构建、大数据分析处理和应用能力具有非常重要的作用。

文章基于华为FusionInsight探讨了《大数据平台建设》课程的实验教学方案,针对课程内容与特点,从实验分组规划、实验内容流程设计、信息化实验教学等方面对课程的实验教学进行了有益的探索,旨在提升实验教学质量,更有效地培养学生的实战技能。

关键词:实验教学;教学设计;大数据平台;FusionInsight中图分类号:G642 文献标识码:A 文章编号:1009-3044(2018)24-0091-03Abstract: In recent years, with the urgent need of high level big data professionals in many industries, many universities have opened big data specialty or courses. The cultivation of big data technology professionals has become a hot topic in university teaching. Big data technology emphasizes practical ability, and experimental teaching plays a very important role in cultivating students' big data platform construction, big data analysis processing and application ability. Based on HUAWEI FusionInsight, this paper discusses the experimental teaching plan of the construction of big data platform. In view of the content and characteristics of the course, the experiment teaching is explored from the aspects of experimental group planning, experiment content process design, and information experiment teaching. The aim is to improve the quality of experimental teaching and cultivate students' practical skills effectively.Key words:experimental teaching;teaching design;big data platform;FusionInsight1 引言大数据时代已经悄然来临,在商业、金融、教育等诸多领域,决策越来越依赖于数据和分析,而非依赖于经验和直觉。

IT智能运维解决方案部-培训反馈测试-第三周

IT智能运维解决方案部-培训反馈测试-第三周

IT智能运维解决方案部-培训反馈测试-第三周您的姓名: [填空题] *_________________________________华为Fusioninsight大数据产品1. 数据管理范式的下一步创新方向是:() [单选题] *A. Data Lakehouse(正确答案)B. Data LakeC. Data WarehouseD. Data Stream2. 在实时数据流处理中,华为优先推荐哪种流计算引擎() [单选题] *A. Flink(正确答案)B. Spark StreamingC. StormD. Heron3. FusionInsight实时检索引擎包括:() *A. Hbase(正确答案)B. ElasticSearch(正确答案)C. KafkaD. Redis4. 大数据不仅限于Hadoop,是多种主流数据处理技术的合集,成为开放技术的实施标准。

() [单选题] *A.正确(正确答案)B.不正确5. 华为认为,面向未来()是下一步创新方向,技术创新持续涌现。

() [单选题] *A.数据仓库B.数据湖C.湖仓一体(正确答案)6. 下列哪一个选项是深度学习主流框架?() [单选题] *A.HadoopB.HiveC.SparkD.Tensorflow(正确答案)E.Flink7. FusionInsight具备四大能力是(),助力客户解决企业大数据平台建设的关键问题() *A.一站式平台(正确答案)B.永远在线(可靠性99.999%)(正确答案)C.易用低成本(正确答案)D.可持续演进(正确答案)E.标准化产品,开箱即用华为智慧城市IOC&大数据解决方案8. 华为新型智慧城市建设思路是:1+1+N,其中1+1是指什么?() [单选题] *A. 一个数字平台+一个城市IOC(正确答案)B. 一个目标+一套平台C. 一个标准+一种方法D. 一个指挥+一笔资金9. 华为认为新型智慧城市建设应包括几个”一”工程?() [单选题] *A. 6(正确答案)B. 5C. 4D. 310. IOC技术架构的技术基础是什么?() [单选题] *A. 大数据平台(正确答案)B. PaaSC. SaaSD. IaaS11. 无处不在的IOC:从“看”到”用”,智享实现三屏联动的“驾驶舱”。

华为HCIA-大数据认证练试题与答案-202010

华为HCIA-大数据认证练试题与答案-202010

华为HCIA-大数据认证练试题与答案1.下列选项中无法通过大数据技术实现的是?(A)[单选题]A.商业模式发现B.信用评估C.商品推荐D.运营分析2.FusionInsight Manager 的主要功能有以下哪些?(BCD)[多选题]A.数据集成B.系统管理C.安全管理D.服务治理3.假设每个用户最低资源保障设置为yarn,scheduler,capacity,root, QueueA.minimum-user-limit-percent=24。

则以下说法错误的是?(D)[单选题]A.第 3 个用户提交任务时,每个用户最多获得 33.33%的资源B.第 2 个用户提交任务时,每个用户最多获得 50%的资源C.第 4 个用户提交任务时,每个用户最多获得 25%的资源D.第 5 个用户提交任务时,每个用户最多获得 20%的资源4.华为大数据解决方案中平台架构包括以下哪些组成部分?(ABD)[多选题]A. Hadoop层B. FusioInght ManagerC. GaussDB 200D. DataFram5.Spark 自带的资源管理框架是?(A)[单选题]A.Standal oneB.MesosC.YARND.Docker6.关于 RDD,下列说法错误的是?(B)[单选题]A.RDD 具有血统机制(Lineage)B.RDD 默认存储在磁盘C.RDD 是一个只读的,可分区的分布式数据集D.RDD 是 Spark 对基础数据的抽象7.关于 Spark SQL&Hive 区别与联系,下列说法正确的是?(BCD)[多选题]A.Spark SQL 依赖 Hive 的元数据B.Spark SQL 的执行引擎为 Spark core,Hive 默认执行引擎为 MapReduceC.Spark SQL 不可以使用 Hive 的自定义函数D.Spark SQL 兼容绝大部分 Hive 的语法和函数8.在FusionInsight 集群中,Spark 主要与以下哪些组件进行交互?(ABCD)[多选题]A.HDFSB.YARNC.HiveD.ZooKeeper9.关于 Hive 在 FusionInsight HD 中的架构描述错误的是?(A)[单选题]A.只要有一个 HiveServer 不可用,整个 Hive 集群便不可用B.MotaStore 用于提供元数据服务,依赖于 DBServiceC.在同一时间点,HiveServer 只要一个处于Active 状态,另一个则处于Standby 状态D.HiveServer 负责接收客户端请求.解析.执行 HQL 命令并返回查询结果10.通常情况下,Hive 以文本文件存储的表会以回车作为其行分隔符,在华为FusionInsight Hive 中,可以指定表数据的输入和输出格式处理。

HCIA-大数据试题与答案

HCIA-大数据试题与答案

HCIA-大数据试题与答案HCIA-大数据试题与答案1. 下列选项中无法通过大数据技术实现的是?() * [单选题] *A. 商业模式发现B.信用评估C.商品推荐D.运营分析(正确答案)2. FusionInsight Manager 的主要功能有以下哪些?() * [单选题] *A.数据集成B.系统管理C.安全管理(正确答案)D.服务治理(正确答案)(正确答案)3. 假设每个用户最低资源保障设置为yarn ,scheduler ,capacity ,root ,QueueA.minimum-user-limit-percent=24。

则以下说法错误的是?() * [单选题] *A.第 3 个用户提交任务时,每个用户最多获得33.33%的资源B.第 2 个用户提交任务时,每个用户最多获得50%的资源C.第 4 个用户提交任务时,每个用户最多获得25%的资源D.第 5 个用户提交任务时,每个用户最多获得20%的资源(正确答案)4. 华为大数据解决方案中平台架构包括以下哪些组成部分?() * [单选题] *A.Hadoop 层B.FusioInght Manager(正确答案)C.GaussDB 200D.DataFram(正确答案)(正确答案)5. Spark 自带的资源管理框架是?() * [单选题] *A.StandaloneB.MesosC.YARND.Docker(正确答案)6. 关于 RDD,下列说法错误的是?() * [单选题] *A.RDD 具有血统机制(Lineage)B.RDD 默认存储在磁盘C.RDD 是一个只读的,可分区的分布式数据集D.RDD 是Spark 对基础数据的抽象(正确答案)7. 关于 Spark SQL&Hive 区别与联系,下列说法正确的是?()* [单选题] *A.Spark SQL 依赖 Hive 的元数据B.Spark SQL 的执行引擎为 Spark core,Hive 默认执行引擎为MapReduceC.Spark SQL 不可以使用 Hive 的自定义函数(正确答案)D.Spark SQL 兼容绝大部分 Hive 的语法和函数(正确答案)(正确答案)8. 在FusionInsight 集群中,Spark 主要与以下哪些组件进行交互?() * [单选题] *A.HDFSB.YARN(正确答案)D.ZooKeeper(正确答案)(正确答案)9. 关于 Hive 在FusionInsight HD 中的架构描述错误的是?()* [单选题] *A.只要有一个 HiveServer 不可用,整个 Hive 集群便不可用B.MotaStore 用于提供元数据服务,依赖于 DBServiceC.在同一时间点,HiveServer 只要一个处于 Active 状态,另一个则处于 Standby 状态D.HiveServer 负责接收客户端请求.解析.执行 HQL 命令并返回查询结果(正确答案)10.通常情况下,Hive以文本文件存储的表会以回车作为其行分隔符,在华为FusionInsight Hive 中,可以指定表数据的输入和输出格式处理。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档