大数据应用竞赛复习题4

合集下载

大数据技术与应用赛项竞赛试题样卷

大数据技术与应用赛项竞赛试题样卷

大数据技术与应用赛项竞赛试题(样卷)近年来随着IT产业的加速发展,全国各地对IT类的人才需求也越来越多“ABC公司”为了明确今后IT产业人才培养方向,在多地进行IT公司岗位情况调研分析。

你所在的小组将承担模拟调研分析的任务,通过在招聘网站进行招聘信息的爬取,获取到公司名称、工作地点、岗位名称、招聘要求、招聘人数等信息,并通过对数据的清洗和分析,得出各地域招聘人数,“大数据”相关职位招聘数量,以绘制雷达图展示各地平均薪资情况。

为完成该项任务,你所在的小组计划选用在业界广泛应用的“Python和JAVA”语言,作为整个项目的基础语言,并综合利用requests模块、MapReduce、MySQL、Flask开源框架、Jinja2模板引擎和ECharts组件提高开发效率并实现项目要求,由于本次为模拟任务,总数据量不会过大,项目组计划使用分布式节点Hadoop模式,本次项目环境搭建采用服务器集群方式,配置了小规模的技术演示环境,通过在招聘网站上爬取到的相关信息,使用requests模块、Hive、Python、JAVA等手段对数据进行爬取、清洗、整理、计算、表达、分析,力求实现对IT人才就业信息拥有更清晰的掌握。

请按照下面步骤完成本次技术展示任务,并提交技术报告。

任务一:Hadoop相关组件安装部署(15分)当前环境中已安装Hadoop运行环境和MySQL数据库,相关安装信息如下表所示,请在此环境基础上按照相关操作步骤安装Hive组件。

1.将指定路径下的Hive安装包解压并更名;2.设置Hive环境变量;3.编辑Hive相关配置文件;4.初始化Hive元数据;5.启动并保存输出结果。

任务二:数据采集与数据预处理(20分)1.从指定招聘网站中抓取数据,提取有效数据项,并保存为json格式文件;2.设置post请求参数并将信息返回给变量response;3.将提取数据转化成json格式,并赋值变量;4.用with函数创建json文件,通过json方法,写入json数据;5.爬取的数据需要导入hadoop平台进行数据清洗与分析,在HDFS文件系统中创建文件夹,并将json文件上传到该文件夹下。

大数据应用职业技能大赛题库

大数据应用职业技能大赛题库

大数据应用职业技能大赛题库
1. 数据处理与分析,包括数据清洗、数据转换、数据集成、数据挖掘、数据分析等方面的技能。

题目可能涉及数据预处理、特征工程、数据建模等内容。

2. 数据存储与管理,涵盖了各种大数据存储和管理技术,如Hadoop、Spark、Hive、HBase等。

题目可能涉及对大数据存储和管理工具的使用和优化。

3. 数据可视化与报告,包括数据可视化工具的使用,如Tableau、Power BI、Matplotlib等,以及如何将数据可视化结果转化为有效的报告和决策支持。

4. 机器学习与人工智能,涉及机器学习算法、深度学习、神经网络等方面的知识,以及如何应用这些技术解决实际问题。

5. 数据安全与隐私保护,包括数据加密、数据安全管理、隐私保护技术等内容。

题目可能涉及如何保护大数据系统中的数据安全和隐私。

题库中的问题可能涉及理论知识、实际操作和案例分析等多个方面。

参与者需要具备扎实的数据处理和分析技能,熟练掌握大数据相关工具和技术,并具备解决实际问题的能力。

综合考察了数据处理、存储、分析、可视化、机器学习、安全等多个方面的知识和技能。

希望这些信息能够帮助你更好地了解大数据应用职业技能大赛题库的内容。

大数据知识竞赛试题

大数据知识竞赛试题

大数据知识竞赛试题大数据知识竞赛试题一、大数据概述1.1 什么是大数据1.2 大数据的特点1.3 大数据的应用领域二、大数据技术基础2.1 大数据技术架构2.2 数据采集与清洗2.3 数据存储与管理2.4 数据分析与挖掘2.5 数据可视化三、大数据工具和平台3.1 Hadoop3.2 Spark3.3 NoSQL数据库3.4 数据仓库3.5 数据挖掘工具四、大数据处理算法4.1 MapReduce4.2 数据流处理4.3 分布式机器学习算法4.4 图计算算法五、大数据安全与隐私保护5.1 大数据安全威胁5.2 大数据隐私保护技术5.3 大数据安全管理六、大数据伦理与法律6.1 大数据伦理原则6.2 大数据法律框架6.3 数据保护和隐私法规附件:附件1:大数据知识竞赛试题参考答案注释:1.大数据:指的是规模大、类型多样且处理速度快的数据集合。

2.Hadoop:是一个开源的分布式计算框架,用于存储和处理大规模数据集。

3.Spark:是一个基于内存计算的大数据处理引擎,具有高速的数据处理能力。

4.NoSQL数据库:指的是非关系型数据库,常用于大规模数据存储和查询。

5.MapReduce:是一种用于分布式计算的编程模型,常用于大数据处理。

6.数据流处理:指的是对无限流式数据进行实时处理和分析的技术。

7.分布式机器学习算法:指的是在分布式计算环境下运行的机器学习算法。

8.数据仓库:是一个用于存储和管理结构化数据的集中式数据系统。

9.数据挖掘工具:是用于从大量数据中发现隐藏模式和关联规则的软件工具。

10.大数据安全管理:指的是对大数据进行安全审计、权限控制和数据加密等管理措施的实施。

11.大数据伦理原则:包括数据透明、数据安全和数据使用的合法性原则。

12.大数据法律框架:指的是制定和规范大数据相关法律法规的框架体系。

13.数据保护和隐私法规:包括GDPR、CCPA等一系列涉及个人数据保护的法律法规。

河北省2023届高三年级大数据应用调研联合测评(Ⅳ)历史试题(新教材高考)

河北省2023届高三年级大数据应用调研联合测评(Ⅳ)历史试题(新教材高考)

河北省2023届高三年级大数据应用调研联合测评(Ⅳ)历史试题(新教材高考)一、选择题:本大题共16小题,每小题3分,共计48分。

在每小题列出的四个选项中,只有一项是最符合题目要求的。

1.西周初年,周公告诫子弟臣僚说:“自时厥后(商代祖甲王以后)立王,生则逸。

生则逸,不知稼穑之艰难,不闻小人之劳,惟耽乐之从。

自时厥后,亦罔或克寿。

”周公此论A.强调对小农经济的重视B.体现出一定的民本色彩C.指出了商朝政令不畅的原因D.反映了儒家的以德治国思想2.有学者指出,西汉经过60余年的发展,国力强盛。

同时,诸侯势力肆意发展,大商业主投机牟利,豪强大肆兼并;面对匈奴等少数民族的袭扰,国家缺乏强有力的对抗措施。

该学者意在强调当时A.朝廷的施政方针亟待调整B.阶级矛盾日益尖锐C.郡国并行弊端显现D.统一多民族国家面临转型3.新疆吐鲁番唐墓出土了若干册《论语》手抄本。

其中363号墓葬出土的《论语》郑注,其文本最后有“西州高昌县宁昌乡厚风里义学生卜天寿年十二状”字样。

184号墓出土的《论语》郑注共4件内容有重复,但笔迹不同。

其中,第三件文本末记“高昌县学生贾忠礼写”。

这反映出唐代A.“四书”地位逐渐上升B.书院教育在边疆的发展C.儒学士人投身基层教化D.边疆对中原文化的认同4.北宋初年,宋太祖令刑部制定了严禁官员经商的法律,诏令各级官吏不许私自经商贸易,“违者论如律”。

并采取严厉措施对那些垄断贸易、非法经商的官吏,严刑峻法加以惩办,以“塞浊乱之源”。

据此可知,宋初A.政府鼓励民营工商业的发展B.商业发展环境相对宽松C.朝廷加强了对地方官员的考核D.地方丧失割据的经济基础5.清康熙帝规定:清宗室封爵须经朝廷考封,即袭封或受封者需要先经过马射、步射、清语三项考试。

三项全优者,方能袭、受应得之爵,否则,根据优劣降封一至三等,最劣者不封。

这一规定A.规范了授官程序B.构建了严密的贵族等级C.凸显了专制集权D.完善了科举考试的内容6.据统计,咸丰十年(1860年)以后,太平军治下江南乡村的民变共计70起,其中由士阶层和边缘层(无功名之儒生文人)作为事件主要领导者的比重最高,占民变总数的24.29%,远远高于游民层(8.57%)、农民(8.57%)、商贩(2.86%)等阶层领导的民变。

2024年大数据应用及处理技术能力知识考试题库与答案

2024年大数据应用及处理技术能力知识考试题库与答案

2024年大数据应用及处理技术能力知识考试题库与答案一、单选题1.当图像通过信道传输时,噪声一般与()无关。

A、信道传输的质量B、出现的图像信号C、是否有中转信道的过程D、图像在信道前后的处理参考答案:B2.在留出法、交叉验证法和自助法三种评估方法中,()更适用于数据集较小、难以划分训练集和测试集的情况。

A、留出法B、交叉验证法C、自助法D、留一法参考答案:C3.在数据科学中,通常可以采用()方法有效避免数据加工和数据备份的偏见。

A、A/B测试B、训练集和测试集的划分C、测试集和验证集的划分D、图灵测试参考答案:A4.下列不属于深度学习内容的是(_)oA、深度置信网络B、受限玻尔兹曼机C、卷积神经网络D、贝叶斯学习参考答案:D5.在大数据项目中,哪个阶段可能涉及使用数据工程师来优化数据查询性能?A、数据采集B、数据清洗C、数据存储与管理D、数据分析与可视化参考答案:C6.假定你现在训练了一个线性SVM并推断出这个模型出现了欠拟合现象,在下一次训练时,应该采取下列什么措施()A、增加数据点B、减少数据点C、增加特征D、减少特征参考答案:C7.两个变量相关,它们的相关系数r可能为0?这句话是否正确0A、正确B、错误参考答案:A8.一幅数字图像是()。

A、一个观测系统B、一个由许多像素排列而成的实体C、一个2-D数组中的元素D、一个3-D空间中的场景参考答案:C9.以下说法正确的是:()。

一个机器学习模型,如果有较高准确率,总是说明这个分类器是好的如果增加模型复杂度,那么模型的测试错误率总是会降低如果增加模型复杂度,那么模型的训练错误率总是会降低A、1B、2C、3D、land3参考答案:c10.从网络的原理上来看,结构最复杂的神经网络是0。

A、卷积神经网络B、长短时记忆神经网络C、GRUD、BP神经网络参考答案:B11.LSTM中,(_)的作用是确定哪些新的信息留在细胞状态中,并更新细胞状态。

A、输入门B、遗忘门G输出门D、更新门参考答案:A12.Matplotiib的核心是面向()。

2021大数据知识竞赛考试题及答案

2021大数据知识竞赛考试题及答案

2021大数据知识竞赛考试题及答案1、以下哪项不属于大数据的特征?数据量大数据类型复杂单位处理数据的速度高数据价值密度高【正确答案】2、以下哪项不属于大数据流式处理典型业务应用场景?实时营销实时服务实时监控用户画像【正确答案】3、以下不属于Hadoop内核的组成部分的是HDFSMapReduceHbase【正确答案】YARN4、HDFS默认的当前工作目录是/user/$USER,的值需要在下列哪一个配置文件内说明?mapred-site.xmlcore-site.xml【正确答案】hdfs-site.xml以上均不是5、下列哪一项不属于HDFS相对于分布式系统而言特有的特性?高容错大文件存储大量的随机读应用【正确答案】高吞吐量6、下列存储HDFS某一时段NameNode内存元数据信息的是hdfs-site.xmlfsimage【正确答案】editsfstime7、以下哪个不是HDFS的守护进程?secondarynamenodedatanodemrappmaster/yarnchild【正确答案】namenode8、关于 SecondaryNameNode 哪项是正确的?它是 NameNode 的热备它是内存没有要求它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间【正确答案】SecondaryNameNode 应与 NameNode 部署到一个节点9、以下哪一项不属于HDFS集群中的namenode职责维护HDFS集群的目录树结构维护HDFS集群的所有数据块的分布、副本数和负载均衡负责保存客户端上传的数据【正确答案】响应客户端的所有读写数据请求10、以下哪一项属于SecondaryNamenode的作用监控Namenode管理Datanode合并fsimage和editlogs【正确答案】支持Namenode HA11、下面哪个程序负责 HDFS 中实际数据的存储NameNodeJobtrackerDatanode【正确答案】secondaryNameNode12、关于HDFS集群中的DataNode的描述不正确的是DataNode之间不是独立的,相互之间会有通信和数据传输存储客户端上传的数据的数据块一个DataNode上存储的所有数据块可以有相同的【正确答案】响应客户端的所有读写数据请求,为客户端的存储和读取数据提供支撑13、如果我们现有一个hadoop集群,默认存储文件3份,并且大文件会按照128M 的数据块大小进行切割分散存储,在不修改默认配置的情况下存储200个每个200M的文本文件,请问最终会在集群中产生多少个数据块(包括副本)?200400004001200【正确答案】14、下列选项中,哪一项是存储HDFS某一时段NameNode内存元数据信息?hdfs-site.xmlfsimage【正确答案】editsfstime15、HBase底层依靠什么进行数据的存储HDFS【正确答案】HiveMemoryMapReduce16、下列选项中,哪个选项是用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构?GFSMapReduce【正确答案】ChubbyBitTable17、Mapreduce擅长哪个领域的计算离线批处理【正确答案】DAG计算流式计算实时计算18、在MapReduce中哪一个阶段,把Mapper的输出数据归并整理后分发给Reducer处理Shuffle【正确答案】MapReduceSort19、关于MapReduce原理,下面说法错误的是分为Map和Reduce两个阶段Map阶段由一系列Map任务组成Reduce阶段由一系列Reduce任务组成Map阶段与Reduce阶段没有任何依赖关系【正确答案】20、下列哪个程序通常与NameNode 在同一个节点启动TaskTrackerDataNodeSecondaryNameNodeJobtracker【正确答案】21、MapReduce的Map函数产生很多的keyvalue<key,value>【正确答案】Hash22、下面关于Hive,说法错误的是Hive支持所有标准SQL语法【正确答案】Hive底层采用的计算引擎是MapReduceHive提供的HQL语法,与传统SQL很类似Hive Server可采用MySQL存储元数据信息23、下列哪项通常是Hadoop中MapReduce集群的最主要瓶颈CPU网络磁盘【正确答案】内存24、Hadoop框架的缺陷不包括MR编程框架的限制过多的磁盘操作,缺乏对分布式内存的支持无法高效低支持迭代式计算海量的数据存储【正确答案】25、YARN的调度算法不包括以下哪种FIFO SchedulerFair SchedulerCapacity SchedulerStack Scheduler【正确答案】26、YARN和MapReduce的关系是MapReduce是一个计算框架,可运行在YARN之上【正确答案】YARN是一个计算框架,可运行在MapReduce之上MapReduce和YARN无直接关系以上回答均不正确27、下列选项中,哪个是用来将Hadoop和关系型数据库中的数据相互转移的工具?ZookeeperSqoop【正确答案】HIVESpark28、Hadoop 大数据平台在整个数据挖掘的过程中,起到的作用是数据源处理数据清洗和装载【正确答案】数据展现CUBE生成29、以下哪一项是大数据的核心告知与许可预测【正确答案】匿名化规模化30、以下哪一项是用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构。

大数据应用竞赛复习题

大数据应用竞赛复习题

大数据应用竞赛复习题136、云是网络的一种比喻说法,传统架构图中用来表示电信网,后续扩展到表示互联网和底层基础设施。

用户通过()等方式接入云数据中心,按自己的需求进行数据处理。

*A台式机(正确答案)B笔记本(正确答案)C手机(正确答案)D服务器137、在数据缺失严重时,会对分析结果造成较大的影响,因此剔除的异常值和缺失值,要采用合理的方法进行填补,常用的方法有()。

*A平均值填充(正确答案)B.K最近邻距离法(正确答案)C回归法(正确答案)D极大似然估计(正确答案)E多重插补法(正确答案)138、在数据资产质量管理中,同一责任人产生的同一数据项一年内出现两次以上质量问题需要进行问责,以下说法正确的是()。

*A体现了数据资产质量管理遵循“谁产生、谁负责”的原则(正确答案)B.对责任单位予以通报批评(正确答案)C.按照公司员工奖惩规定第十二条追究相关人员责任(正确答案)D.具体惩处按照公司员工违规违纪行为惩处细则第十三条执行(正确答案)139、在网络爬虫的爬行策略中,应用最为基础的是() *A深度优先遍历策略(正确答案)B广度优先遍历策略(正确答案)C高度优先遍历策略D反向链接策略E大站优先策略140、在重大活动保电工作准备期间应超前谋划部署,加强对公司重要数据管控,加强漏洞隐患排查整改,妥善做好涉密数据传递及应用有关工作,综合运用()等手段,构建全方位、立体式监管与防护体系。

深 *A人防(正确答案)B物防(正确答案)C技防(正确答案)D监管(正确答案)141、噪声数据的产生原因主要有()。

*A数据采集设备有问题(正确答案)B在数据录入过程中发生了人为或计算机错误(正确答案)C数据传输过程中发生错误(正确答案)D由于命名规则或数据代码不同而引起的不一致(正确答案)142、正在推动能源行业变革的技术有哪些? *A.电网运行技术(正确答案)B.互联网技术C.用户侧技术(正确答案)D.信息技术(正确答案)E.能源技术(正确答案)143、中国大数据产业特征包括()。

大数据知识竞赛试题

大数据知识竞赛试题

大数据知识竞赛试题学院队名一、单选题(每题1分)1、小米摄像头记录下来的10分钟视频属于哪类数据:A、结构化数据B、半结构化数据C、非结构化数据2、结构化数据具备哪种特征:A、具备明确逻辑关系B、不具备明确逻辑关系C、不一定具备明确逻辑关系3、指纹打卡的数据属于哪些数据:A、传感数据B、交互数据C、交易数据4、大数据擅长处理哪个级别的数据?A、MBB、GBC、TBD、PB5、电子邮件是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据6、网络新闻是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据7、下列属于结构化数据的是:A、图片B、一卡通学生信息C、简历8、表1属于几维列表?表1A、二维B、三维C、四维D、五维9、图1中的警衔级别属于哪种属性?图1A、标称属性B、二元属性C、序数属性D、数值属性10、关系型数据库中所谓的“关系”是指什么A、数据库中的数据彼此间存在任意关联B、数据模型满足一定条件的二维表格式C、两个数据库之间有一定的关联11、下列哪种数据类型不适合MySQL存储:A、EXCEL报表B、图片和声音C、数据库里的财务数据12、以下不属于ACID原则的是:A、原子性B、相对性C、隔离性D、持久性13、淘宝自主设计的自动化分布式存储系统是:A、MongoDBB、HBaseC、Oceanbase14、BeansDB 是一个由我国哪个公司网站自主开发的:A、淘宝B、豆瓣社区C、优酷D、视觉中国15、下列不是NewSQL数据库的是:A、SybaseB、MemSQLC、TokuDB16、下列不是NoSQL数据库的是:A、BigtableB、DynamoC、DB217、下列不是传统关系型数据库的是:A、MySQLB、HBaseC、Sybase18、下面关于数据挖掘的说法哪些是错误的:A、数据挖掘涉及数据融合、数据分析和决策分析和决策支持等内容B、数据源必须是真实的、大量的、含有噪声的和用户感兴趣的数据C、所有发现的知识都是绝对的19、下列不属于数据挖掘知识的方法A、数学方法B、归纳方法C、实验方法20、一般情况下,舆情监测内容不包含:A、对主流门户网站、国内外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描B、对单位相关刑事、民事、行政案件与信息进行全面收集、精确分析、清晰归类和个性统计C、对个人或家成员庭银行帐户及个人财产情况进行全面收集、分析和统计21、科学可视化、信息可视化和可视分析三者之间如何区分:A、三者从属关系B、三者属于递进关系C、三者之间没有清晰边界22、下列哪个不属于可视化的作用:A、信息传播与协调B、支持对信息的推理和分析C、对信息进行筛选和储存23、下图为百度地图显示某地区的加油站,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化24、下图为伦敦地铁图,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化25、下图为大数据标签云,此图为哪类可视化:A、多变量数据可视化B、时空数据可视化C、非结构化数据可视化26、目前在全球云计算市场份额占有率最高的公司是:A、谷歌B、亚马逊C、微软D、IBM27、在大数据背景下,电子商务的价值创造方式呈现出新的变化,下列说法错误的是:A、电子商务营销精准化和实时化B、产品和服务高度差异化和个性化C、价值链上企业运作差异化和静态化D、新型增值服务模式不断涌现28、下列哪个不是大数据下互联网广告的特点A、广告内容更有针对性B、提高广告决策效率C、广告以平面媒体为主D、广告传播模式的改变29、微信朋友圈的FEED流广告的推广更为准确描述是:A、大数据会使受众与产品的距离更贴近B、对于目标受众的划分更加精细C、大数据最本质的应用就在于预测D、随意投放的广告30、啤酒与尿布的营销案例应用了零售行业的哪种方法:A、发现关联购买行为B、客户群体细分C、供应链管理二、多选题(每题2分)1.Hadoop1.0平台最核心的两个项目(组件)是:A、HDFSB、HIVEC、HBaseD、MapReduce2.以下平台属于Apache软件基金会项目的是:A、HadoopB、SparkC、StormD、MongoDB3.以下属于大数据挖掘算法的是:A、决策树B、支持向量机C、极差规格化D、朴素贝叶斯4.以下属于Spark平台特点的是:A、共享变量B、离线处理C、内存计算D、弹性分布式数据集5.在分布式云计算平台中,分布式文件系统的块文件的大小可以是:A、28MB、64MC、100MD、128M三、判断题(每题1分)1.Newsql是一种新兴的非关系型数据库。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据应用竞赛复习题 4151 数据资产质量管理遵循“谁产生、谁负责”的原则,明确数据资产质量的责任归属,同一责任人产生的同一数据项一年内出现()以上质量问题,对责任单位予以通报批评,同时按照公司员工奖惩规定第十二条追究相关人员责任,具体惩处按照公司员工违规违纪行为惩处细则第十三条执行。

[单选题] *A、一次B、两次(正确答案)C、三次D、三次以上152 数据资产应用以安全可控为前提,按照()的原则,落实安全与保密责任。

[ 单选题] *A、谁经手,谁使用,谁负责(正确答案)B、谁主管,谁负责C、谁使用,谁主管,谁负责D、谁录入,谁使用,谁负责153 数据资产维护是指为保证数据质量,对数据进行()等处理的过程。

[单选题]*A、更正B、删除C、补充录入D、以上三项都是(正确答案)154数据资产维护是指为保证(),对数据进行更正、删除、补充录入等处理的过程。

[单选题] *A、数据完整B、数据共享C、数据质量(正确答案)D、数据标准155 数据资产生成是指数据在业务信息系统中通过()或人工录入创建的过程。

[ 单选题] *A、人工采集B、自动采集(正确答案)C、自动录入D、以上都不是156数据资产的经手人和使用人应接受安全保密教育,签订(),知悉必须承担的保密义务和责任。

[单选题] *A、安全保密协议(正确答案)B、安全协议C、保密协议D、相关协议157 数据中心数据仓库的数据资产,由()组织维护。

各业务部门负责本专业业务系统数据资产的维护。

[单选题] *A、信通公司B、数据资产管理归口部门(正确答案)C、数据产生部门D、数据应用部门158数据中心、业务系统访问权限账号仅供责任人本人登录使用,不得借与他人,账号密码不超过()个月要更换一次。

[单选题] *A、1B、2C、3(正确答案)D、6159 数据中心、业务系统访问权限实行实名制管理,权限账号仅供责任人本人登录使用,不得借与他人,账号密码不超过3 个月要更换一次。

[单选题] *A、1 个月B、2 个月C、3个月(正确答案)D、6个月160 数据中台方面,(),基于统一数据模型,有针对性地按需开展数据接入与整合,逐步实现电网、产业、金融、国际化等各版块数据融通,实现人员、组织、客户、供应商等主数据共建共享,提升数据价值挖掘支撑能力。

[单选题] *A、以价值为导向B、以业务为导向C、以需求为导向(正确答案)D、以数据为导向161 数据支撑单位要加强对所属数据支撑人员的管理,相关人员及变动情况要在所服务的()登记备案。

[单选题] *A、信息化职能部门B、数据资产管理归口部门C、运监中心(正确答案)D、数据资产备份部门162 数据销毁环节的安全技术措施有通过软件或物理方式保障磁盘中存储数据的()、不可恢复,如数据销毁软件、硬盘消磁机、硬盘粉碎机等。

[单选题] *A、暂时隔离B、暂时删除C、永久删除(正确答案)D、不作处理163 数据探索是指针对目标可变、持续、多角度的搜索或分析任务,下列哪项不是其搜索过程的特点?()。

[单选题] *A、有选择B、有策略C、有目标(正确答案)D、反复进行的164数据使用环节的安全技术措施除防火墙、()、防病毒、防DDOS、漏洞检测等网络安全防护技术措施外,还需实现以下安全技术能力:账号权限管理、数据安全域、数据脱敏、日志管理和审计、异常行为实时监控和终端数据防泄漏。

[单选题] *A、入侵检测(正确答案)B、病毒检测C、程序检测D、进程检测A、缺失值处理B、噪声数据清除C、一致性检查D、重复数据记录处理(正确答案)166数据可视化主要旨在借助于()手段,清晰有效地传达与沟通信息。

[单选题]*A、图形化(正确答案)B、文字化C、数字化D、符号化167 数据可视化是利用计算机图形学和(),将数据转换成图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。

[单选题] *A、视觉处理技术B、视频处理技术C、图像处理技术(正确答案)D、图片处理技术168数据科学家可能会同时使用多个算法(模型)进行预测,并且最后把这些算法的结果集成起来进行最后的预测(集成学习),以下对集成学习说法正确的是()。

[单选题] *A、单个模型之间有高相关性B、单个模型之间有低相关性(正确答案)C、在集成学习中使用“平均权重”而不是“投票”会比较好D、单个模型都是用的一个算法169 数据价值挖掘项目生命周期包含业务理解、数据理解、()、建模、评估、部署六个阶段。

[单选题] *A、数据服务B、数据准备(正确答案)C、数据治理D、数据应用170 数据价值挖掘常用的模型有()、描述型模型[ 单选题] *等。

A、聚类模型B、预测型模型(正确答案)C、分类模型D、时间模型171 数据分析可帮助人们作出判断,以便采取适当行动,()作为常用的分析工具,可以实现最基本的分析工作。

[单选题] *A、W ordB、E xcel(正确答案)C、P PTD、V isio172 数据的可用性取决于()[单选题] *A、数据分析B、数据集采C、数据质量(正确答案)D、数据需求A、一手数据B、非结构化数据(正确答案)C、源头数据D、文本数据174数据产品是指基于企业内外部数据的,能够为企业提供更好数据服务的一种产品或软件形式,以下哪项不是数据产品的特点?()[单选题] *A、内容化B、价值化C、自动化D、智能化(正确答案)175 数据仓库是随着时间变化的,下面的描述不正确的是()[单选题] *A、数据仓库随时间的变化不断增加新的数据内容。

B、捕捉到的新数据会覆盖原来的快照。

C、数据仓库随事件变化不断删去旧的数据内容。

(正确答案)D、数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合。

176数据仓库的最终目的是()。

[单选题] *A、收集业务需求B、建立数据仓库逻辑模型C、开发数据仓库的应用分析D、为用户和业务部门提供决策支持(正确答案)177 数据安全技术保护与信息系统“三同步”原则不包括以下哪项?[单选题] *A、同步规划B、同步建设C、同步使用D、同步运维(正确答案)178数据()要求数据在规定的时间和频度周期内接入系统。

[单选题] *A、完整性B、准确性C、及时性(正确答案)D、一致性179 数据()要求数据记录内容完整。

[单选题] *A、完整性(正确答案)B、准确性C、及时性D、一致性180数据()要求数据符合各业务规则和业务实际。

[单选题] *A、完整性B、准确性(正确答案)C、及时性D、一致性181 数据()要求关联数据之间的数据关系正确和完整。

[单选题] * A、完整性B、准确性C、及时性D、一致性(正确答案)182 枢纽型企业是立足公司的()属性,面向以电为中心的能源清洁低碳转型大趋势,充分发挥电网在能源汇集传输和转换利用中的枢纽作用。

[单选题] *A、服务B、网络C、社会D、产业(正确答案)183 适应泛在电力物联网发展需要,借鉴“互联网”思维,按照“()”企业要求,从研究开发、建设实施、运行维护、安全防护、运营机制等方面,持续优化管理模式、业务流程和组织架构,打造高效协同的组织体系和工作机制,促进各类资源优化配置和共享增值,有效赋能各级组织单元,支撑泛在电力物联网科学建设和高效运行。

[单选题] *A、平台型(正确答案)B、枢纽型C、共享性D、服务型184使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务()?[单选题] *A、探索性数据分析(正确答案)B、建模描述C、预测建模D、寻找模式和规则185 什么是大数据智能分析的核心()[单选题] *A、人工智能B、深度学习(正确答案)C 机器学习D、区块链186设X={1 ,2,3}是频繁项集,则可由X产生多少个关联规则()[单选题] *A、4B、5C、6(正确答案)D、7187 熵是为消除不确定性所需要获得的信息量,投掷均匀正六面体骰子的熵是()。

[单选题] *A、1 比特B、2.6比特(正确答案)C、3.2比特D、3.8比特188三型两网、世界一流”的战略安排是到()年初步建成具有全球竞争力的世界一流能源互联网企业。

[单选题] *A、2021(正确答案)B、2022C、2025D、2030189 若不针对MapReduce编程模型中的key和value值进行特别设置,下列哪一项是MapReduce不适宜的运算()。

[单选题] *A、MaxB、MinC、C ountD、A verage(正确答案)190如果规则集R 中不存在两条规则被同一条记录触发,则称规则集R 中的规则为()。

[单选题] *A、无序规则B、穷举规则C、互斥规则(正确答案)D、有序规则191如果对属性值的任一组合,R中都存在一条规则加以覆盖,则称规则集R中的规则为()[单选题] *A、无序规则B、穷举规则(正确答案)C、互斥规则D、有序规则192确保内部合作单位开发测试环境与互联网(),严禁外部合作单位、技术支持单位和供应商在对互联网提供服务的网络和信息系统中存储或运行公司商业秘密数据和重要数据。

[单选题] *A、物理隔离(正确答案)B、逻辑隔离C、正反向隔离D、单向隔离193区块链(Blockchain)是一种由多方共同维护,使用密码学保证传输和访问安全,能够实现数据一致存储、难以篡改、防止抵赖的记账技术,也称为()?[单选题] *A、分层式账本技术B、分布式账本技术(正确答案)C、分类式账本技术D、分块式账本技术194企业中台包括()中台和数据中台。

[单选题] *A、业务(正确答案)B、服务C、生产D、客户195 企业要建立预测模型,需要准备建模数据集,以下四条描述建模数据集正确的是()。

[单选题] *A、数据越多越好B、尽可能多的合适的数据C、训练集数据是建模集数据的一部分D、以上三条都正确(正确答案)196其他条件相同,置信水平越低,则置信区间上下限差值越()[单选题] *A、越大B、越小(正确答案)D、不确定197 平台层主要解决()问题?[单选题] *A、数据的价值创造B、数据的采集C、管理问题(正确答案)D、数据的传输198批处理和复杂数据挖掘计算通常属于()[单选题] *A、分析计算B、实时计算C、查询计算D、非实时计算(正确答案)199 尿布啤酒是大数据分析的()。

[单选题] *A、回归分析B、分类分析C、关联规则挖掘(正确答案)D、聚类分析200 能源互联网是以()为中心,以坚强智能电网为基础平台,以泛在电力物联网为支撑,深度融合先进能源技术、现代信息通信技术和控制技术,实现多能互补、智能互动、泛在互联的智慧能源网络。

[单选题] *A、电(正确答案)B、服务C、产品46、各单位要遵循()、()、()的原则,公开收集使用信息的规则,明示收集使用信息的目的和范围,并经用户同意。

相关文档
最新文档