《数据科学与大数据通识导论》2019年真题-2019年温州市工程技术系列专业技术人员继续教育
大数据导论习题及答案

第1章1.简述什么是大数据?答:大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
2.大数据的数据有什么特点?答:数据量大(Volume)、数据类型复杂(Variety)、数据产生速度快(Velocity)、价值密度低(Value)。
3.大数据对科学研究有什么影响?答:促进了科学研究的第四范式产生和交叉学科的发展。
4.大数据有哪些数据类型?答:有结构化数据、非结构化数据和半结构化数据。
5.大数据有哪些应用?答:大数据可以在众多领域创造巨大的衍生价值:实现数据的资源化,帮助企业抢占市场,提供个性化服务,指定有效方针等;与云计算深度结合;可能会改变数据世界里的很多算法和基础理论,实现科学技术上的突破第2章1.简述什么是云计算?答:①云计算是一种动态扩展的计算模式,通过网络将虚拟化的资源作为服务提供给用户。
②云计算是一种无处不在的、便捷的通过互联网访问的一个可定制的IT资源(IT资源包括网络、服务器、存储、应用软件和服务)共享池,是一种按使用量付费的模式。
它能够通过最少量的管理或与服务供应商的互动实现计算资源的迅速供给和释放2.云计算有什么特点?答:①具有大规模并行计算能力②资源虚拟化和弹性调度③数据量巨大并且增速迅猛产生了典型的大数据处理技术3.请简述云计算的三种主要部署模式。
答:①公有云:提供面向社会大众、公共群体的云计算服务②私有云:提供面向应用行业/组织内的云计算服务③混合云:是把公有云和私有云进行整合,吸纳二者的优点,给企业带来真正意义上的云计算服务4.请简述云计算的三种主要服务模式。
答:1.基础设施即服务(IaaS)①主要用户是系统管理员②直接利用云提供的资源进行业务的部署或简单的开发③服务提供商提供给用户的服务是计算和存储基础设施④用户不管理或控制任何云计算基础设施,但能控制操作系统的选择⑤关键技术及解决方案是虚拟化技术2.平台即服务(PaaS)①主要用户是开发人员②把应用服务的运行和开发环境作为一种服务提供的商业模式即PaaS是把二次开发的平台以服务形式提供给开发软件的用户使用③开发人员不需要管理或控制底层的云计算基础设施,但可以方便地使用很多在构建应用时的必要服务④两个关键技术:分布式的并行计算和大文件分布式存储3.软件即服务(SaaS)①主要用户是普通用户②服务提供商提供给用户的服务是运行在云计算基础设施上的应用程序,用户只需要通过终端设备接入使用即可,简单方便,不需要用户进行软件开发,也无需管理底层资源③关键技术是多租户技术,使资源能够更好的共享5.请画出云计算基础设施Google平台的基础架构图。
最新版精编2019年公需科目大数据完整版考核题库300题(含标准答案)

2019公需科目:大数据题库300题[含参考答案]一、选择题1.下列哪项通常是集群的最主要瓶颈a)CPU b)网络 c)磁盘Id)内存答案.C 磁盘首先集群的目的是为了节省成本,用廉价的 pc 机,取代小型机及大型机。
小型机和大型机有什么特点?2.内存够大,所以集群的瓶颈不可能是 a 和 d3.HDFS 中的 blck 默认保存几份?a)3 份 b)2 份 c)1 份 d)不确定答案.A 默认 3 份二、填空题4.Hadp三种运行的模式.单机版 . 伪分布式和分布式。
5.MapReduce任务过程分为两个处理阶段.map阶段和reduce阶段。
三、单选题6.数据清洗的方法不包括( D)。
(单)A.缺失值处理B.噪声数据清除C.一致性检查D.重复数据记录处理7.支撑大数据业务的基础是( B)。
(单选题)A.数据科学B.数据应用C.数据硬件D.数据人才8.当前社会中,最为突出的大数据环境是(A )。
(单选题) A.互联网B.物联网C.综合国力D.自然资源9.下列国家的大数据发展行动中,集中体现“重视基础.首都先行”的国家是( D)。
(单选题)A.美国B.日本C.中国D.韩国10.下列关于数据交易市场的说法中,错误的是( C)。
(单选题)A.数据交易市场是大数据产业发展到一定程度的产物B.商业化的数据交易活动催生了多方参与的第三方数据交易市场C.数据交易市场通过生产数据.研发和分析数据,为数据交易提供帮助D.数据交易市场是大数据资源化的必然产物11.下列论据中,能够支撑“大数据无所不能”的观点的是( A)。
(单选题)A.互联网金融打破了传统的观念和行为B.大数据存在泡沫C.大数据具有非常高的成本D.个人隐私泄露与信息安全担忧四、多选题12.云计算使得使用信息的存储是一个()的方式,它会大大地节约网络的成本,使得网络将来越来越泛在.越来越普及,成本越来越低。
A.密集式B.共享式C.分布式D.密闭式13.贵州电子商务的发展路径是.与阿里.京东.腾讯等电商企业强化合作,改善信息基础条件.物流条件,培育电商主体和平台,积极发展()。
《数据科学与大数据通识导论》题库及答案-2019年温州市工程技术系列专业技术人员继续教育

1.数据科学的三大支柱与五大要素是什么?答:数据科学的三大主要支柱为:Datalogy (数据学):对应数据管理 (Data management)Analytics (分析学):对应统计方法 (Statistical method)Algorithmics (算法学):对应算法方法 (Algorithmic method)数据科学的五大要素:A-SATA模型分析思维 (Analytical Thinking)统计模型 (Statistical Model)算法计算 (Algorithmic Computing)数据技术 (Data Technology)综合应用 (Application)2.如何辨证看待“大数据”中的“大”和“数据”的关系?字面理解Large、vast和big都可以用于形容大小Big更强调的是相对大小的大,是抽象意义上的大大数据是抽象的大,是思维方式上的转变量变带来质变,思维方式,方法论都应该和以往不同计算机并不能很好解决人工智能中的诸多问题,利用大数据突破性解决了,其核心问题变成了数据问题。
3.怎么理解科学的范式?今天如何利用这些科学范式?科学的范式指的是常规科学所赖以运作的理论基础和实践规范,是从事某一科学的科学家群体所共同遵从的世界观和行为方式。
第一范式:经验科学第二范式:理论科学第三范式:计算科学第四范式:数据密集型科学今天,是数据科学,统一于理论、实验和模拟4.从人类整个文明的尺度上看,IT和DT对人类的发展有些什么样的影响和冲击?以控制为出发点的IT时代正在走向激活生产力为目的的DT(Data Technology)数据时代。
大数据驱动的DT时代由数据驱动的世界观大数据重新定义商业新模式大数据重新定义研发新路径大数据重新定义企业新思维5.大数据时代的思维方式有哪些?“大数据时代”和“智能时代”告诉我们:数据思维:讲故事→数据说话总体思维:样本数据→全局数据容错思维:精确性→混杂性、不确定性相关思维:因果关系→相关关系智能思维:人→人机协同(人 + 人工智能)6.请列举出六大典型思维方式;直线思维、逆向思维、跳跃思维、归纳思维、并行思维、科学思维7.大数据时代的思维方式有哪些?同58.二进制系统是如何实现的?计算机用0和1来表示和存储所有的数据,它的基数为2,进位规则是“逢二进一”,用1表示开,0表示关9.解释比特、字节和十六进制表示。
《数据科学与大数据通识导论》题库及答案-2019年温州市工程技术系列专业技术人员继续教育

1.数据科学的三大支柱与五大要素是什么?答:数据科学的三大主要支柱为:Datalogy (数据学):对应数据管理 (Data management)Analytics (分析学):对应统计方法 (Statistical method)Algorithmics (算法学):对应算法方法 (Algorithmic method)数据科学的五大要素:A-SATA模型分析思维 (Analytical Thinking)统计模型 (Statistical Model)算法计算 (Algorithmic Computing)数据技术 (Data Technology)综合应用 (Application)2.如何辨证看待“大数据”中的“大”和“数据”的关系?字面理解Large、vast和big都可以用于形容大小Big更强调的是相对大小的大,是抽象意义上的大大数据是抽象的大,是思维方式上的转变量变带来质变,思维方式,方法论都应该和以往不同计算机并不能很好解决人工智能中的诸多问题,利用大数据突破性解决了,其核心问题变成了数据问题。
3.怎么理解科学的范式?今天如何利用这些科学范式?科学的范式指的是常规科学所赖以运作的理论基础和实践规范,是从事某一科学的科学家群体所共同遵从的世界观和行为方式。
第一范式:经验科学第二范式:理论科学第三范式:计算科学第四范式:数据密集型科学今天,是数据科学,统一于理论、实验和模拟4.从人类整个文明的尺度上看,IT和DT对人类的发展有些什么样的影响和冲击?以控制为出发点的IT时代正在走向激活生产力为目的的DT(Data Technology)数据时代。
大数据驱动的DT时代由数据驱动的世界观大数据重新定义商业新模式大数据重新定义研发新路径大数据重新定义企业新思维5.大数据时代的思维方式有哪些?“大数据时代”和“智能时代”告诉我们:数据思维:讲故事→数据说话总体思维:样本数据→全局数据容错思维:精确性→混杂性、不确定性相关思维:因果关系→相关关系智能思维:人→人机协同(人 + 人工智能)6.请列举出六大典型思维方式;直线思维、逆向思维、跳跃思维、归纳思维、并行思维、科学思维7.大数据时代的思维方式有哪些?同58.二进制系统是如何实现的?计算机用0和1来表示和存储所有的数据,它的基数为2,进位规则是“逢二进一”,用1表示开,0表示关9.解释比特、字节和十六进制表示。
(完整版)大数据考试题

《大数据》试题单选题1、大数据的核心就是(B)A、告知与许可B、预测C、匿名化D、规模化2、大数据不是要教机器像人一样思考。
相反,它是(A)A、把数学算法运用到海量的数据上来预测事情发生的可能性。
B、被视为人工智能的一部分。
C、被视为一种机器学习。
D、预测与惩罚。
3、采样分析的精确性随着采样随机性的增加而(C),但与样本数量的增加关系不大。
A、降低B、不变C、提高D、无关4、大数据是指不用随机分析法这样的捷径,而采用(A)的方法A、所有数据B、绝大部分数据C、适量数据D、少量数据5、大数据的简单算法与小数据的复杂算法相比(A)A、更有效B、相当C、不具备可比性D、无效6、相比依赖于小数据和精确性的时代,大数据因为更强调数据的(D),帮助我们进一步接近事实的真相。
A、安全性B、完整性C、混杂性D、完整性和混杂性7、大数据的发展,使信息技术变革的重点从关注技术转向关注(A)A、信息B、数字C、文字D、方位8、大数据时代,我们是要让数据自己“发声”,没必要知道为什么,只需要知道(B)A、原因B、是什么C、关联物D、预测的关键9、建立在相关关系分析法基础上的预测是大数据的(C)A、基础B、前提C、核心D、条件10、(C)下列说法正确的是A、有价值的数据是附属于企业经营核心业务的一部分数据;B、数据挖掘它的主要价值后就没有必要再进行分析了;C、所有数据都是有价值的;D、在大数据时代,收集、存储和分析数据非常简单;11、关于数据创新,下列说法正确的是(D)A、多个数据集的总和价值等于单个数据集价值相加;B、由于数据的再利用,数据应该永久保存下去;C、相同数据多次用于相同或类似用途,其有效性会降低;D、数据只有开放价值才能得到真正释放。
12、关于数据估值,下列说法错误的是(B)A、随着数据价值被重视,公司所持有和使用的数据也渐渐纳入了无形资产的范畴;B、无论是向公众开放还是将其锁在公司的保险库中,数据都是有价值的;C、数据的价值可以通过授权的第三方使用来实现D、目前可以通过数据估值模型来准确的评估数据的价值评估13、在大数据时代,下列说法正确的是(B)。
大数据的考试题目和答案

大数据的考试题目和答案一、单项选择题(每题2分,共20分)1. 大数据的核心特征不包括以下哪一项?A. 体量大B. 速度快C. 价值密度高D. 多样性答案:C2. Hadoop的核心组件不包括以下哪一项?A. HDFSB. MapReduceC. HiveD. Spark答案:D3. 在大数据时代,以下哪种技术不是处理数据的关键技术?A. 数据挖掘B. 机器学习C. 云计算D. 传统数据库答案:D4. 下列哪个不是大数据应用的领域?A. 金融B. 医疗C. 教育D. 农业答案:C5. 以下哪个不是大数据的存储技术?A. NoSQL数据库B. 云存储C. 传统关系型数据库D. 分布式文件系统答案:C6. 大数据的4V特性中,哪个代表数据的准确性?A. VolumeB. VelocityC. VarietyD. Veracity答案:D7. 以下哪个不是大数据分析的步骤?A. 数据收集B. 数据清洗C. 数据存储D. 数据解释答案:D8. 以下哪个不是大数据的来源?A. 社交媒体B. 传感器数据C. 传统数据库D. 纸质文档答案:D9. 在大数据技术中,以下哪个不是数据挖掘的算法?A. 决策树B. 聚类分析C. 线性回归D. 神经网络答案:C10. 大数据的实时处理技术不包括以下哪一项?A. StormB. FlinkC. HadoopD. Spark Streaming答案:C二、多项选择题(每题3分,共15分)11. 大数据技术可以应用于以下哪些行业?A. 零售B. 交通C. 教育D. 娱乐答案:ABCD12. 大数据的挑战包括以下哪些方面?A. 数据安全B. 数据隐私C. 数据存储D. 数据分析答案:ABCD13. 以下哪些是大数据的存储解决方案?A. 数据仓库B. 数据湖C. 云存储D. 传统数据库答案:ABC14. 以下哪些是大数据处理框架?A. HadoopB. SparkC. StormD. TensorFlow答案:ABC15. 大数据的分析方法包括以下哪些?A. 描述性分析B. 诊断性分析C. 预测性分析D. 规范性分析答案:ABCD三、判断题(每题2分,共10分)16. 大数据技术只能用于处理结构化数据。
最新《大数据》完整考试题库500题(含标准答案)

大数据考试试题题库500题[含答案]一、选择题1.云计算的特点包括以下哪些方面?abc(多选题3分)得分.3分A.服务可计算B.高性价比C.服务可租用D.低使用度2.2012年全国各城市支付宝人均支出排名中,位居第二位的是(a)(单选题1分)得分.1分A.杭州市B.嘉兴市C.高雄市D.嘉义市3.当今世界四大趋势指的是经济全球化.全球城市化.全球信息化.信息智慧化。
(判断题1分)得分.1分正确1 错误4.大数据仅仅是指数据的体量大。
(判断题1分)正确错误1 得分.1分5.2010年“中央1号文件”指出.要推进农村信息化。
(判断题1分)得分.0分正确错误16.下列哪些国家已经将大数据上升为国家战略?abcd(多选题3分)得分.3分A.英国B.日本C.美国D.法国7.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是(abcd )。
(多选题3分)得分.3分A.从被动反应走向主动预见型管理B.从粗放化管理走向精细化管理C.从单兵作战走向联合共享型管理D.从柜台式管理走向全天候管理8.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是abcd(多选题3分)得分.3分A.从柜台式管理走向全天候管理B.从粗放化管理走向精细化管理C.从被动反应走向主动预见型管理D.从单兵作战走向联合共享型管理9.2012年“中央1号文件”提出,要全面推进农业农村信息化,着力提高(abd)的信息服务水平。
(多选题3分)得分.3分A.农业生产经营B.质量安全控制C.文化交流D.市场流通10.医疗领域如何利用大数据?acd(多选题3分)得分.0分A.临床决策支持B.个性化医疗C.社保资金安全D.用户行为分析11.郭永田副主任指出,物联网在大田作物生产中的应用体现在以下哪些方面?abcd(多选题3分)得分.3分A.农作物病虫害监测B.农业精准生产控制C.农田环境监测D.农作物长势苗情监测12.贵州发展大数据的“八个一”建议包括(abcd)。
数据科学导论考试试题

数据科学导论考试试题一、选择题(每题 3 分,共 30 分)1、以下哪项不是数据科学的主要研究内容?()A 数据预处理B 数据可视化C 数据库管理D 数学建模2、数据清洗的主要目的是()A 去除重复数据B 处理缺失值C 纠正错误数据D 以上都是3、在数据分析中,箱线图主要用于()A 展示数据的分布情况B 比较不同组数据的均值C 观察数据的趋势D 检测异常值4、以下哪种数据结构适合用于快速查找元素?()A 链表B 栈C 队列D 二叉搜索树5、聚类分析属于()A 有监督学习B 无监督学习C 强化学习D 半监督学习6、决策树算法在数据挖掘中用于()A 分类B 回归C 聚类D 关联规则挖掘7、以下哪项不是数据仓库的特点?()A 面向主题B 集成性C 易变性D 时变性8、数据挖掘中的关联规则挖掘,常用的算法是()A Apriori 算法B KMeans 算法C C45 算法D ID3 算法9、以下关于数据隐私保护的方法,错误的是()A 数据加密B 数据匿名化C 数据共享D 差分隐私10、数据科学项目中,最重要的步骤之一是()A 数据收集B 模型选择C 模型评估D 问题定义二、填空题(每题 3 分,共 30 分)1、数据的质量可以从_____、完整性、一致性、准确性和时效性等方面进行评估。
2、常见的数据分析方法包括描述性分析、_____分析和预测性分析。
3、数据预处理中的特征工程包括特征提取、_____和特征选择。
4、机器学习中的监督学习任务包括分类和_____。
5、数据库中的关系模型通过_____、行和列来组织数据。
6、数据可视化的原则包括准确性、_____和简洁性。
7、大数据的特点通常被概括为 5V,即 Volume(大量)、Velocity (高速)、Variety(多样)、Value(价值)和_____。
8、朴素贝叶斯分类器基于_____假设。
9、在数据挖掘中,分类算法的性能评估指标通常包括准确率、_____和 F1 值等。