大数据思考与练习答案 (1)

合集下载

大数据导论大数据思维单元测试与答案

大数据导论大数据思维单元测试与答案

大数据导论大数据思维单元测试与答案大数据导论单元测试与答案一、选择题1. 大数据是指数据量大、类型多样、处理速度快的数据集合。

以下哪个选项不是大数据的特征?A. 数据量大B. 数据价值高C. 数据类型多样D. 处理速度快答案:B2. 大数据分析的目的是什么?A. 提供数据存储和管理B. 发现数据中的模式和趋势C. 构建数据模型和算法D. 优化数据处理速度答案:B3. 大数据技术主要包括以下哪些方面?A. 数据挖掘C. 人工智能D. 数据可视化E. 全部选项都对答案:E4. 下列哪种技术是大数据分析过程中常用的计算模型?A. 逻辑回归B. 线性回归C. 决策树D. 梯度下降答案:C5. 大数据挖掘的技术主要包括以下哪些方面?A. 关联规则挖掘B. 聚类分析C. 分类算法D. 高斯消元E. 全部选项都对二、填空题1. 大数据分析的基本流程是:数据采集、数据存储、数据预处理、数据挖掘和数据可视化。

2. 大数据分析技术的发展使得我们可以更好地利用数据来获取商业洞见和提高决策的准确性和效率。

3. 关联规则挖掘是大数据挖掘技术中常用的方法之一,可以用来发现数据中的关联性。

4. 在大数据分析中,聚类分析是一种将数据样本划分为不同组别的方法,目标是使得组内的数据相似度最大,组间的数据相似度最小。

5. 数据可视化是将大数据分析的结果以图形化形式展示出来,便于人们直观地理解和获取信息。

三、简答题1. 请简要说明大数据的优势及应用领域。

大数据的优势包括:可以处理海量的数据;可以分析各种类型的数据;可以实时处理数据;可以发现数据中的模式和趋势。

大数据的应用领域包括:金融行业、电商领域、医疗健康、交通运输等。

2. 请简要介绍大数据分析的基本流程。

大数据分析的基本流程包括:数据采集(收集大量的数据);数据存储(将数据存储到合适的存储系统中);数据预处理(对数据进行清洗、转换和集成);数据挖掘(使用各种算法和模型分析数据);数据可视化(将数据分析结果以图形化方式展示)。

大数据题目和答案

大数据题目和答案

⼤数据题⽬和答案最新2017年公需科⽬⼤数据培训考试注:蓝⾊为正确答案,判断题正确为√,错误为×1.根据涂⼦沛先⽣所讲,摩尔定律是在哪⼀年提出的?(单选题1分)A.1988年B.2004年C.1965年D.1989年2.2015年,贵阳市的呼叫服务产业达到()坐席。

(单选题1分)A.3万B.5万C.10万D.20万3.以下说法错误的是哪项?(单选题1分)A.⼤数据的思维⽅式遵循因果逻辑推理B.摩尔定律是⼽登?摩尔提出的C.图灵测试是阿兰·图D.ENIAC于1946年诞⽣4.茂名PX事件发⽣后,下列哪个学校的化⼯系学⽣在⽹上进⾏了⼀场“PX词条保卫战”?(单选题1分)A.北⼤B.清华C.浙⼤D.复旦5.促进⼤数据发展部级联席会议在哪⼀年的4⽉13⽇召开了第⼀次会议?(单选题1分)A.2014年B.2015年C.2013年D.2016年6.根据涂⼦沛先⽣所讲,哪⼀年被称为⼤数据元年?(单选题1分)A.2012年B.2010年C.2008年D.2006年7.数据、信息与知识三者之间的变化趋势是(单选题1分)A.价值先增后减B.价值递减8.具体来说,摩尔定律就是每()个⽉,产品的性能将提⾼⼀倍。

(单选题1分)A.18B.16C.12D.69.“()⼤数据交易所”2015年4⽉14⽇正式运营,⽬前,交易所已有包括京东、华为、阿⾥巴巴等超过300家会员企业,交易总⾦额突破6000万元。

(单选题1分)A.毕节B.安顺C.贵阳D.遵义10.()说明如果联⽹越多,从介⼊⽅式、技术上越来越突破,则⽹络规模越⼤、成本越低,⽹络的成本可能会趋向于零。

(单选题1分)A.吉尔德定律B.摩尔定律C.梅特卡尔夫定律D.新摩尔定律11.以下说法错误的是哪项?(单选题1分)A.⼤数据会带来机器智能B.⼤数据不仅仅是讲数据的体量⼤C.⼤数据的英⽂名称是large dataD.⼤数据是⼀种思维⽅式12.美国⾸个联邦⾸席信息官是下列哪位总统任命的?(单选题1分)A.克林顿B.奥巴马C.⼩布什D.⽼布什13.截⾄2015年年底,全国电话⽤户总数达到()。

大数据与云计算学习(1)

大数据与云计算学习(1)

⼤数据与云计算学习(1)⼤数据学习⼀、⼤数据概述:1、⼤数据概念和特征。

正确答案:⼤数据意指⼀个超⼤的、难以⽤现有常规的数据库管理技术和⼯具处理的数据集数据量⼤(Volume):存储的数据量巨⼤,PB级别是常态,因⽽对其分析的计算量也⼤。

数据类型繁多(Variety):数据的来源及格式多样,数据格式除了传统的结构化数据外,还包括半结构化或⾮结构化数据,⽐如⽤户上传的⾳频和视频内容。

⽽随着⼈类活动的进⼀步拓宽,数据的来源更加多样。

处理速度快(Velocity):数据增长速度快,⽽且越新的数据价值越⼤,这就要求对数据的处理速度也要快,以便能够从数据中及时地提取知识,发现价值。

价值密度低(Value):在成本可接受的条件下,通过快速采集、发现和分析,从⼤量、多种类别的数据中提取价值的体系架构。

复杂度(Complexity):对数据的处理和分析的难度⼤。

2、试述⼤数据时代的“数据爆炸”的特性正确答案:⼈类社会产⽣的数据以每年50%速度增长,即每两年增加⼀倍。

3、试述⼤数据对思维⽅式的重要影响?你如何理解数据思维?正确答案:三种思维的转变:全样⽽⾮抽样,效率⽽⾮精确,相关⽽⾮因果具备数据思维,能帮助创业者抓住商业机会。

⽣活中的⼤部分数据,数据思维都可以给你启发。

像AlphaGo ⼀样思考、学习、挑战、迭代AlphaGo= ⼤数据 + ⼈⼯智能 + ⼤规模计算4、举例说明⼤数据的应⽤领域正确答案:⾦融⾏业:⼤数据在⾼频交易、社区情绪分析和信贷风险分析三⼤⾦融创新领域发挥重要作⽤。

汽车⾏业:利⽤⼤数据和物联⽹技术的五⼈驾驶汽车,在不远的未来将⾛进我们的⽇常⽣活。

 互联⽹⾏业:借助于⼤数据技术,可以分析客户⾏为,进⾏商品推荐和有针对性⼴告投放。

个⼈⽣活:利⽤与每个⼈相关联的“个⼈⼤数据”,分析个⼈⽣活⾏为习惯,为其提供更加周全的个性化服务。

5、云计算长定义和短定义:正确答案:长定义:云计算是⼀种商业计算模型。

它将计算任务分布在⼤量计算机构成的资源池上,使各种应⽤系统能够根据需要获取计算⼒、存储空间和信息服务。

大数据基础练习及答案

大数据基础练习及答案

项目一实训练习及答案应知考核一、单项选择题1.()指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。

A.数据B.数字C.文字D.信息2.()是信息的表现形式和载体,可以是符号、文字、数字、语音、图像、视频等。

A.数字B.数字C.数据D.信息3.()指新的数据产生或现有数据内容发生显著改变或更新的阶段。

A.数据采集B.数据存储C.数据处理D.数据传输4.()指非动态数据以任何数字格式进行物理存储的阶段。

A.数据采集B.数据存储C.数据处理D.数据传输5.()指组织机构在内部针对动态数据进行的一系列活动的组合。

A.数据采集B.数据存储C.数据处理D.数据传输6.()指数据在组织机构内部从一个实体通过网络流动到另一个实体的过程。

A.数据采集B.数据存储C.数据处理D.数据传输7.()指数据经由组织机构内部与外部组织机构及个人交互过程中提供数据的阶段。

A.数据采集B.数据交换C.数据处理D.数据传输8.()指通过对数据及数据的存储介质通过相应的操作手段,使数据彻底丢失且无法通过任何手段恢复的过程。

A.数据采集B.数据交换C.数据处理D.数据销毁9.大数据最明显的特点就是()。

A.数据体量大B.数据类型繁多C.价值密度低D.处理速度快10.数据的()是大数据区分于传统数据挖掘的显著特征。

A.数据体量大B.数据类型繁多C.价值密度低D.处理速度快11.()是大数据分析最重要的应用领域。

A.可视化分析B.语义引擎C.预测性分析能力D.数据质量管理12.()是机器学习的成果之一。

A.可视化分析B.语义引擎C.预测性分析能力D.数据、多项选择题1.数据按性质分为()。

A.定位数据B.定性数据C.定量数据D.定时数据2.数据按按表现形式分为()。

A.定位数据B.数字数据C.模拟数据D.定时数据3.数据按按记录方式可分()。

A.表格B.影像C.磁带D.纸带4.数据按数字化方式分()。

大数据基础练习题一

大数据基础练习题一

1下面关于数据的说法,错误的是:()A、数据的根本价值在于可以为人们找出答案B、数据的价值会因为不断使用而削减C、数据的价值会因为不断重组而产生更大的价值D、目前阶段,数据的产生不以人的意志为转移我的答案:B得分:3.3分2云计算的主要优点不包括:()A、初期投入大,需要用户自己维护B、初期零成本,瞬时可获得C、后期免维护,使用成本低D、在供应IT资源量方面“予取予求” 我的答案:A得分:3.3分36.信息科技为大数据时代提供技术支撑,主要体现在三个方面,以下哪个不属于这三个方面。

()A、存储设备容量不断增加B、CPU处理能力大幅提升C、量子计算机全面普及D、网络带宽不断增加我的答案:C 得分:3.3分4假设A班级的平均分是80,标准差是10, A考了90分;B班的平均分是400,标准差是100, 3考了600分。

采用Z-Score规范化以后,二者谁的成绩更加优秀:()A、A的成绩更为优秀B、B的成绩更为优秀C、二者一样优秀D、无法比较我的答案:A得分:0.0分5下面关于手机软件采集个人信息的描述错误的是:()A、在我们的日常生活中,部分手机APP往往会“私自窃密”B、有的APP在提供服务时,采取特殊方式来获得用户授权,这本质上仍属“未经同意”C、在微信朋友圈广泛传播的各种测试小程序是安全的,不会窃取用户个人信息D、手机APP过度采集个人信息呈现普遍趋势,最突出的是在非必要的情况下获取位置信息和访问联系人权限我的答案:C得分:3.3分6关于推进数据共享开放的描述,错误的是:()A、要改变政府职能部门“数据孤岛”现象,立足于数据资源的共享互换,设定相对明确的数据标准,实现部门之间的数据对接与共享B、要使不同省区市之间的数据实现对接与共享,解决数据“画地为牢”的问题,实现数据共享共用C、在企业内部,破除“数据孤岛”,推进数据融合D、不同企业之间,为了保护各自商业利益,不宜实现数据共享我的答案:D得分:3.3分7假设属性的取值范围是-957~924,当属性的值为426时,采用小数定标规范化方法对应的转换结果是:()A、0.421B、0.433C、0.426D、0.489我的答案:A得分:0.0分8以下哪个不是Flume的核心组件:()A、数据块(Block)B、数据源(Source)C、数据通道(Channel)D、数据槽(Sink)我的答案:D得分:0.0分9云计算包括3种类型。

大数据试题答案与解析_最全

大数据试题答案与解析_最全

大数据试题答案与解析_最全1、当前大数据技术的基础是由(C)首先提出的。

(单选题,本题2分)A:微软B:百度C:谷歌D:阿里巴巴2、大数据的起源是(C )。

(单选题,本题2分)A:金融B:电信C:互联网D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( C)。

(单选题,本题2分)A:数据管理人员B:数据分析员C:研究科学家D:软件开发工程师4、(D )反映数据的精细化程度,越细化的数据,价值越高。

(单选题,本题2分)A:规模B:活性C:关联度D:颗粒度5、数据清洗的方法不包括( D)。

(单,本题2分)A:缺失值处理B:噪声数据清除C:一致性检查D:重复数据记录处理6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。

(单选题,本题2分)A:统计报表B:网络爬虫C:API接口D:传感器7、下列关于数据重组的说法中,错误的是(A)。

(单选题,本题2分) A:数据重组是数据的重新生产和重新采集B:数据重组能够使数据焕发新的光芒C:数据重组实现的关键在于多源数据融合和数据集成D:数据重组有利于实现新颖的数据模式创新8、智慧城市的构建,不包含( C)。

(单选题,本题2分)A:数字城市B:物联网C:联网监控D:云计算大数据的最显著特征是( A)。

(单选题,本题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中的(B )。

(单选题,本题2分)A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D )。

(单选题,本题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高12、当前社会中,最为突出的大数据环境是(A )。

大数据测试题答案之一

∙ 1.第一个提出大数据概念的公司是(单选题1分)得分:1分o A.麦肯锡公司o B.脸谱公司o C.微软公司o D.谷歌公司∙ 2.《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》提出,到2020年,统筹区域布局,依托现有资源建成()区域临床医学数据示范中心。

(单选题1分)得分:1分o A.100个o B.300个o C.400个o D.200个∙ 3.茂名PX事件发生后,下列哪个学校的化工系学生在网上进行了一场“PX词条保卫战”?(单选题1分)得分:1分o A.北大o B.浙大o C.复旦o D.清华∙ 4.数据、信息与知识三者之间的变化趋势是()。

(单选题1分)得分:1分o A.宏课程o B.微课程o C.小课程o D.大课程∙ 5.根据涂子沛先生所讲,以下说法错误的是哪项?(单选题1分)得分:1分o A.计算就是物理计算o B.搜索就是计算o C.数据的内涵发生了改变o D.计算的内涵发生了改变∙ 6.大数据的本质是(单选题1分)得分:1分o A.洞察o B.联系o C.挖掘o D.搜集∙7.关于贵州大数据发展的总体思考,下列表述错误的是()。

(单选题1分)得分:1分o A.中期:创建大数据综合试验区o B.起步:建设大数据存储和云计算中心o C.最终:建成国家级大数据综合试验区o D.长期:推动大数据全产业链发展和大数据全领域应用∙8.根据周琦老师所讲,大数据加速道路网络快速更新,高德()完成全国10万公里15万处更新。

(单选题1分)得分:1分o A.2008年o B.2014年o C.2010年o D.2006年∙9.根据周琦老师所讲,高德早在()就开始投入资源来做全国交通信息的采集和发布。

(单选题1分)得分:1分o A.2002年o B.2007年o C.2004年o D.2005年∙10.习近平总书记在2016年几月主持召开了网络安全和信息化工作座谈会?(单选题1分)得分:1分o A.4月o B.3月o C.5月o D.2月∙11.《国务院办公厅关于促进农村电子商务加快发展的指导意见》要求:到()年,初步建成统一开放、竞争有序、诚信守法、安全可靠、绿色环保的农村电子商务市场体系。

大数据CDA考试(习题卷1)

大数据CDA考试(习题卷1)第1部分:单项选择题,共47题,每题只有一个正确答案,多选或少选均不得分。

1.[单选题]在因子分析中,为了帮助解释因子,我们可以使用( )A)因子得分B)因子负载C)因子旋转D)主成分分析答案:C解析:在进行因子分析时,我们可以通过因子旋转来使得最终得到的因子更具有解释性。

2.[单选题]关于Kafka 磁盘容量不足的告警,对于可能的原因以下分析不正确的是?A)业务规划不合理导致数据分配不 均,使部分磁盘达到使用率上限B)数据保存时间配置过长,数据累计 达到磁盘使用率上限C)Broker节点故障导致D)用于存储Kafka 数据的磁盘配置 (如磁盘数目磁盘大小等),无法满 足当前业务数据流量,导致磁盘使 用率达到上限答案:C解析:3.[单选题]基于规则的分类器有Aprior、随机森林,还有()。

A)C4.5B)KNNC)Naive BayesD)ANN答案:A解析:4.[单选题]“将总体中的所有单位( )按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位”,这种抽样方法称为( )A)多阶段抽样(systematicB)分层随机抽样(stratifiedC)集群抽样(clusterD)系统抽样(systematic答案:D解析:根据定义。

5.[单选题]参照以下信息选择能够正确创建orderinfo表的语句A)createB)createC)createD)create答案:A解析:本题考查SQL语句中建表、字段约束条件以及字段数据类型相关知识。

其中建表语句结构为create table 表名(…),字段的约束条件为非空=not null、唯一=unique、主键=primary key。

定长字符串类型为char,可变长字符串类型为varchar,小数类型通常使用float,但“金额”这类对数据精度要求较高的情况,应考虑使用decimal,整数类型为int。

《大数据》试题及答案-1-大数据-李联宁-清华大学出版社

《大数据》题目一、单选题1)大数据的4V特点:Volume、Velocity、Variety、Veracity,其中他们的含义分别是( 1 )、( 2 )、( 3 )、( 4 )。

A.价值密度低B.处理速度快C.数据类型繁多D.数据体量巨大2)大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行( 5 )。

A. 数据信息B. 专业化处理C.速度处理D. 内容处理3)随着谷歌( 6 )和( 7 )的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的( 8 )。

6: A.Map B.Docs C. YouTube D. MapReduce7: A. Google Mobile B. iGoogle C. GoogleFile System D. Google Docs8: A.质量 B. 速度 C.精度 D. 进度4)斯隆数字巡天是使用位于新墨西哥州阿帕奇山顶天文台的2.5米口径望远镜进行的红移巡天项目,2012年4月发布的关于Quasar spectra的数据为( 9 )。

A.932,891,133B. 228,468C. 1,457,002D. 668,0545)下列哪一项不属于大数据的治理:( 10 )A. 安全问题B. 成本问题C. 针对大用户D. 信息生命周期管理6)IBM的大数据战略以其在2012年5月发布智慧分析洞察“3A5步”动态路线图作为基础,指的是在( 11 )的基础上( 12 )、,进而( 13 ),优化决策策划能够救业务绩效。

A. 采取行动(Act)B. 获取洞察(Anticipate)C. 掌握信息(Align)D. 应用管理(management)7)在云生态环境中,用户需求相当于( 14 ),云数据中心相当于( 15 ),云服务相当于( 16 )。

A. 降水B. 水滴C. 水库D. 阳光8)尿布啤酒是大数据分析的( 17 )A. A/B测试B. 分类C. 关联规则挖掘D. 数据聚类9)在GAPMINDER的Wealth & Health of Nations 中,中国在什么区域( 18 )A.黄色B.红色C.绿色D. 蓝色10)舆情研判,信息科学侧重( 19 ),社会和管理科学侧重突发群体事件管理中的群体心理行为及( 20 ),新闻传播学侧重对( 21 )。

大数据参考答案

大数据参考答案大数据参考答案随着科技的不断发展,大数据已经成为当今社会中不可忽视的重要资源。

大数据的应用范围广泛,从商业到医疗,从教育到城市规划,都可以借助大数据来进行分析和决策。

然而,大数据的应用并非一帆风顺,其中存在着许多挑战和问题。

本文将从不同角度探讨大数据的参考答案。

首先,大数据的应用对于商业领域来说具有巨大的潜力。

通过收集和分析大量的消费者数据,企业可以更好地了解消费者的需求和偏好,从而提供更加个性化的产品和服务。

例如,互联网公司可以通过分析用户的搜索记录和购买行为,为用户推荐更加符合其兴趣和需求的商品。

此外,大数据分析还可以帮助企业预测市场趋势和竞争对手的举动,从而制定更加精准的营销策略。

然而,大数据的应用也面临着隐私保护和数据安全的挑战。

在收集和使用大数据时,企业必须遵守相关的法律法规,保护用户的个人信息安全。

其次,大数据在医疗领域的应用也具有重要意义。

通过分析大量的医疗数据,医生可以更加准确地诊断疾病和制定治疗方案。

例如,通过分析患者的基因组数据,医生可以了解患者的遗传病风险,并采取相应的预防措施。

此外,大数据分析还可以帮助医疗机构进行资源分配和疾病监测。

然而,大数据的应用也面临着数据隐私和伦理问题。

医疗数据属于敏感信息,必须严格保护患者的隐私。

同时,医疗数据的使用也需要符合伦理和法律的要求,确保数据的合法性和公正性。

教育领域也可以借助大数据来改善教学质量和学生学习效果。

通过分析学生的学习数据,教师可以了解学生的学习情况和困难,从而针对性地进行教学。

例如,通过分析学生的答题数据,教师可以发现学生的薄弱知识点,并采取相应的辅导措施。

此外,大数据分析还可以帮助学校进行教育资源的配置和教学质量的评估。

然而,大数据的应用也面临着教育公平和数据使用的问题。

大数据分析需要基于大量的学生数据,而这些数据可能存在着不平等的问题。

因此,在使用大数据进行教育决策时,需要考虑到公平和平衡的原则。

最后,大数据在城市规划中的应用也具有重要意义。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2020学年大数据思考与练习一、单选题1.当前大数据技术的基础是由()首先提出的。

A.微软B.百度C.谷歌D.阿里巴巴2.大数据的起源是()。

A.金融B.电信C.互联网D.公共管理3.智能健康手环的应用开发,体现了()的数据采集技术的应用。

A.统计报表B.网络爬虫C.API接口D.传感器4.2012年,()政府发布了《大数据研究和发展倡议》,标志着大数据已经成为重要的时代特征。

A.中国B.美国C.日本D.英国5.大数据的最显著特征是()。

A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高6.下列关于大数据特点的说法中,错误的是()。

A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高7.当前社会中,最为突出的大数据环境是()。

A.互联网B.物联网C.综合国力D.自然资源8.医疗健康数据的基本情况不包括以下哪项?()A.诊疗数据B.个人健康管理数据C.健康档案数据D.公共安全数据8.下列关于计算机存储容量单位的说法中,错误的是()。

A.1KB<1MB<1GBB.基本单位是字节(Byte)C.一个汉字需要一个字节的存储空间D.一个字节能够容纳一个英文字符9.在数据生命周期管理实践中,()是执行方法。

A.数据存储和备份规范B.数据管理和维护C.数据价值发觉和利用D.数据应用开发和管理10.大数据时代,数据使用的关键是()。

A.数据收集B.数据存储C.数据分析D.数据再利用11.大数据的本质是()A.联系B.挖掘C.洞察D.搜集12.规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指的是()。

A.大数据B.贫数据C.富数据D.繁数据13.信息技术的发展非常快,表现在()。

A.集成电路的规模每18到24个月翻一倍B.信息的存储能力每9个月翻一番C.信息的存储能力每9个月翻一番D.光通讯的速率和容量每年翻一番14.与大数据密切相关的技术是()。

A.蓝牙B.云计算C.博弈论D.WiFi15.大数据应用需依托的新技术有()。

A.大规模存储与计算B.数据分析处理C.智能化D.三个选项都是16.数据科学就是从()中提取知识的研究。

A.流量B.互联网C.数据D.人群17.IBM在3V的基础上又归纳总结了第4个V是指()。

A.真实和准确B.无时不在C.巨量D.极速18.IDC的定义除了揭示大数据传统3V基本特征,即Volume、Variety和Velocity,还增添了一个新特征是(),也称4V特征。

A.量大B.速度快C.应用广D.价值19.大数据的()动态性体现在大数据是基于互联网的实时动态数据,而不是历史的或严格控制环境下产生的内容。

A.社会性B.广泛性C.公开性D.动态性20.()数据的最大特点是表现为以行、列组成的二维形式。

A.结构化B.半结构化C.准结构化D.非结构化21.大数据处理的处理过程首先是()。

A.大数据存储及管理B.大数据展现应用C.大数据集处理D.大数据采集22.由于大数据要处理大量、非结构化的数据,所以在各处理环节中都可以采用()处理。

A.串行B.并行C.逻辑D.科学23.数据()和数据()是大数据分析的基础。

A.质量B.管理C.数量D.规模24.大数据分析和处理通常分为离线数据分析和在线数据分析。

当前的离线数据分析通常构建在()平台之上。

A.科学B.数据C.云计算D.网络25.大数据分析的理论核心就是()算法A.聚类分析B.科学计算C.云计算D.数据挖掘二、多选题1.在网络爬虫的爬行策略中,应用最为基础的应用是()。

A.深度优先遍历策略B.广度优先遍历策略C.高度优先遍历策略D.反向链接策略E.大站优先策略2.当前,大数据产业发展的特点是()。

A.规模较大B.规模较小C.增速很快D.增速缓慢E.多产业交叉融合3.大数据人才整体上需要具备()等核心知识。

A.数学与统计知识B.计算机相关知识C.马克思主义哲学知识D.市场运营管理知识E.在特定业务领域的知识4.对大数据的管理和使用包括哪些方面?()A.大数据的应用B.大数据的存储C.大数据的运营D.大数据的挖掘5.信息技术主要包括()。

A.通信技术B.计算机技术C.传感技术D.微电子技术6.以下说法正确的有哪些?()A.机器的智能方式和人是完全一样的B.机器的智能方式是结果导向的C.机器的智能方式和人的智能不同D.机器产生智能的方式是通过数据、数学模型7.大数据作为一种数据集合,它的含义包括()。

A.数据很大B.变化很快C.很有价值D.构成复杂8.大数据的主要特征表现为()。

A.商业价值高B.数据类型多C.处理速度快D.数据容量大9.信息社会经历的发展阶段包括()。

A.大数据时代B.计算机时代C.互联网时代D.云计算时代10.当前大数据产业发展的特点是()。

A.规模较大B.规模较小C.增速很快D.增速缓慢E.多产业交叉融合11.大数据的价值体现在()。

A.大数据给思维方式带来了冲击B.大数据为政策制定提供科学论据C.大数据助力智慧城市提升公共服务水平D.大数据实现了精准营销E.大数据的发力点在于预测12.当前大数据技术的基础包括()。

A.分布式文件系统B.分布式并行计算C.关系型数据库D.分布式数据库13.下列关于计算机存储容量单位换算关系的公式中,正确的是()。

A.1KB=1012ByteB.1KB=1024ByteC.1GB=1024KBD.1GB=1012KBE.1GB=1024MB14.IBM公司用3个V来描述大数据的三个基本特征,这3V是()。

A.体量B.规模C.速度D.多样性E.复杂性15.下列关于云计算和数据库的说法中,错误的是()。

A.获取样本的代价很高B.获取足够大的样本数据乃至全体数据非常容易C.比抽样调查数据更全面D.比抽样调查更能反映整个群体的特征与规律E.可以为发现新的商业机会提供决策支持16.从大数据的不同定义,可以总结其()两点共性。

A.大数据的数据量标准是随着计算机软硬件的发展而不断增长的。

B.大数据无人不知。

C.大数据不仅体现在数据规模上,更体现在技术上。

D.大数据不分国界。

17.大数据的主要来源包括()。

A.图片B.网页C.视频D.传统数据库18.大数据基础架构构建为堆栈式技术架构,包括()。

A.基础层B.管理层C.分析层D.挖掘层E.应用层19.大数据时代的基本特征主要体现在()等几个方面。

A.社会性B.广泛性C.公开性D.动态性20.()等信息是没有固定结构的数据属非结构化数据,( )等一些纯文本数据属半结构化数据。

A.图片B.邮件C.咅频D.视频E.员工简历三、判断题(无F则对)1.对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。

因此,大数据收集的信息量要尽量精确。

F2.一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。

因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。

3.大数据的思维会把原来销售的概念变成服务的概念。

4.2015年8月31日,国务院印发了《促进大数据发展行动纲要》。

5.数据可视化可以便于人们对数据的理解。

6.大数据技术和云计算技术是两门完全不相关的技术。

F7.当前,企业提供的大数据解决方案大多基于Hadoop 开源项目。

8.数据科学家能够从堆积如山的大量数据中找到金矿,并将其价值以易懂的形式传达给决策者,最终得以在业务上实现。

9.数据价值密度的高低与数据总量的大小成反比。

10.在大数据时代,我们无须再紧盯事物之间的因果关系。

11.大数据既能告诉我们“是什么”,也能告诉我们“为什么”。

F12.数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。

13.大数据应用的关键与必要条件,就在于“IT技术”与“经营”的融合。

四、填空题1.大数据最具潜能的三大应用领域分别为商业智能、公共服务和_市场营销__。

2.1pb=(_ 1024__)tb=(_ _2e20_)gb=(_ 2e30__)mb=(_ 2e40__)kb。

3.大数据的4v特征分别是大量化、多样化、快速化和价值密度低。

4.数据产生和_ 更新__的频率,是大数据区别于传统数据的最显著特征。

5.大数据时代的根本特征就是能够从任何_数据__中获得有价值的知识。

6.大数据的动态一是指数据资料的_收集 __具有动态性,二是指处理数据的_工具 __也具有动态性。

7.大数据时代的重要变革体现在_数据__从在以前不被重视,到现在被视为资产。

8.大数据的结构类型主要有_结构化 __、半结构化、准结构化和_ 非结构化__4种。

9.大数据技术是从各种类型的_数据 __中快速获得有价值信息的技术。

10.在大数据的生命周期中,数据采集处于第_ _一_个环节。

11.要对采集的大数据进行有效分析,应将这些数据导入到一个集中的大型_分布式 __数据库或存储集群。

12.对采集的大数据进行有效分析,应将这些数据导入到数据库或存储集群,并且在导入基础上做_ 抽取__与_清洗 __的预处理工作。

13.数据挖掘可分为_机器学习 __、_统计__、神经网络和数据库方法。

14.对大数据的深度分析主要基于大规模的_ _机器_学习技术。

15.基于机器学习的大数据分析具有_ 迭代性__、容错性和参数收敛的非均匀性的特点。

相关文档
最新文档