高中信息技术《数据处理与应用》练习题(附答案解析)

合集下载

第3章数据处理与应用巩固复习-【新教材】人教中图版(2019)高中信息技术必修一

第3章数据处理与应用巩固复习-【新教材】人教中图版(2019)高中信息技术必修一

第三章《数据处理与应用》复习测试卷一.单项选择题(每题4分,共48分)1.李明同学想比较一下前三次考试的成绩是进步了还是后退了,他使用哪种图表进行成绩分析会比较直观?()A.柱形图B.条形图C.折线图D.饼形图2..Excel 图表的显著特点是工作表中的数据变化时,图表()。

A. 自然消失B.不出现变化C. 随之改变D.生成新图表,保留原图表3.有关数据可视化呈现的说法中,正确的是()A.能提升数据分析的效率 B.能丰富人的视觉效果C.能更好地理解数据 D.以上都正确4散点图主要用来()A.观察变量之间的相关关系B.主要用来表示总体各部分所占的比例C.主要用来表示次数分布D.主要用来反映分类数据的频数分布5.()库中有两个主要的数据结构,一维数组(Series)和二维数组(DataFrame)结构。

A.NumpyB.PandasC. ScipyD. Matplotlib6.云盘是互联网上的____工具,具有安全稳定、海量存储的特点。

A.计算B.存储C.交流D.购物7.电子警察就是各路口安装的24小时监控摄像头,将24小时内录下的信息无间断传输到交警的监控中心,此过程属于()。

A.数据分析B.数据采集C.数据处理D.数据整理8.在python中,下面实现导入模块的语句是()A.input moduleB. def moduleC. import moduleD. print module9.散点图用来呈现()A. 数据的比例关系B. 数据的未来趋势C. 随时间变化的连续数据D.各数值之间的关联10.()获取的检测数据通过自动化控制设备能够定时的数据采集、信息转换和信息上传A互联网 B.物联网传感器 C.局域网 D. 红外线11.函数pyplot.figure的功能是( )A.显示图片B.读入文件C.设置字体D.创建绘图区12.利用图表进行数据可视化时,()用于显示各部分数据在总数据中的大小和比例关系A.折线图 B. 饼图 C.散点图 D. 雷达图二、多项多选题(每题5分,共15分)1.想要调查“学生的视力下降与上网课的关系”,在对数据进行调查与分析时,可以采用以下哪些数据化学习工具()A.问卷星B.腾讯在线文档C.思维导图工具D.多媒体课件2.数据分析可以分为()A. 验证性分析B.深度分析C. 描述性分析D. 探索性分析3. 为了全面分析我国水资源情况需要分析不同地区的数据,我们可以用不同方法取得这些数据,下面可以使用的是()A. 官方网站B. 网络爬虫C.问卷调查D. 亲自测量三、判断(每题4分,共20分)( )1.数据分析不但可以对数值型数据进行统计和描述,还可对文本、图像等数据进行分析。

新2024秋季高一必修1信息技术人教中图版第3章数据处理与应用《数据处理的一般过程:数据分析》

新2024秋季高一必修1信息技术人教中图版第3章数据处理与应用《数据处理的一般过程:数据分析》

教学设计:新2024秋季高一必修1 信息技术人教中图版第3章数据处理与应用《数据处理的一般过程:数据分析》一、教学目标(核心素养)1.信息意识:学生能够认识到数据分析在数据处理中的核心地位,理解数据分析对于信息提取、问题解决及决策支持的重要性。

2.数字化学习与创新:学生能够掌握数据分析的基本方法和工具,能够运用所学知识和技能进行简单的数据分析。

3.计算思维:通过数据分析的学习,培养学生的逻辑思维、数据推理和问题解决能力,学会从数据中提取有价值的信息。

4.信息社会责任:引导学生关注数据分析中的伦理问题,如数据隐私、数据真实性等,培养负责任的数据分析态度。

二、教学重点•理解数据分析的概念、目的和重要性。

•掌握数据分析的基本方法和步骤。

三、教学难点•如何选择合适的分析工具和方法进行数据分析。

•如何解读数据分析结果,并将其应用于实际问题解决。

四、教学资源•多媒体课件(包含数据分析的概念、方法、案例等)。

•数据分析软件(如Excel、SPSS等)的演示和操作材料。

•教材及配套习题册。

•互联网资源,用于展示数据分析的实际应用和案例。

五、教学方法•讲授法:介绍数据分析的基本概念、目的、重要性和基本方法。

•演示法:通过实际操作演示数据分析软件的使用和数据分析流程。

•案例分析法:通过分析实际案例,帮助学生理解数据分析的应用场景和结果解读。

•实践操作法:组织学生分组进行数据分析活动,体验数据分析的全过程。

六、教学过程1. 导入新课•情境导入:展示一个与日常生活或社会热点相关的数据分析案例(如电商平台用户行为分析、城市交通流量分析等),引导学生思考这些分析背后的意义和价值。

•提问导入:提问学生:“你们知道这些数据是如何被分析的吗?它们又能告诉我们什么?”引发学生兴趣,进入数据分析的学习。

2. 新课教学•数据分析概念讲解:•定义:数据分析是指运用统计、数据挖掘等方法对收集到的数据进行处理、分析和解释的过程。

•目的:提取数据中的有用信息,为决策提供支持。

第3章数据处理与应用3.2数据采集与整理 高中教学同步《信息技术-数据与计算》(教案)

第3章数据处理与应用3.2数据采集与整理 高中教学同步《信息技术-数据与计算》(教案)
研究题
调研并撰写报告,主题为“物联网技术在数据采集中的应用”。请举例说明物联网技术如何改变了特定行业(如农业、制造业或医疗)的数据采集方式。
探索当前的数据安全威胁,并提出针对个人和企业的数据保护措施。
板书设计
3.2数据采集与整理
3.2.1数据采集
定义:根据需求采用适当的方法和工具获取所需数据。
目的:为数据分析及获取有价值信息奠定基础。
教学难点:
数据采集方法的选择与实施:学生可能难以理解在不同情况下如何选择最合适的数据采集方法和工具。需要通过实际案例让学生理解不同方法的适用场景和优缺点。
数据整理的技术实现:数据整理涉及具体的技术操作,如使用Python进行数据处理,这对学生来说可能较为复杂。教师需要详细解释代码逻辑并提供充足的练习机会。
数据文件:使用CSV格式的数据文件来演示数据整理的过程,让学生实际操作并观察数据处理的结果,增强学习的互动性和实用性。
多媒体内容:可能包括视频或音频材料,用于介绍数据安全的重要性、数据保护的方法等内容,以增强学生的学习兴趣和理解深度。
教学过程
教学环节
教师活动设计
学生活动设计
设计意图
活动一:
创设情境
生成问题
增强实操环节:针对学生在编程实操中的困难,应设计更多分层次的练习,从简到难逐步提升学生的编程能力。
强化数据安全教育:考虑开设专题讲座,邀请业界专家讲解最新的数据安全动态和防护技术,增强学生的数据安全实战能力。
总体来说,本章的教学达到了预期目标,但在实操能力和数据安全教育的深度上还有待提高。希望在未来的教学中能够不断优化改进,使学生能够在快速发展的数据时代中更好地适应和创新。
实践是检验真理的唯一标准。通过实际操作,学生可以将理论知识应用于实际问题中,加深理解。

第3章数据处理与应用3.3数据分析与可视化 高中教学同步《信息技术-数据与计算》(教案)

第3章数据处理与应用3.3数据分析与可视化 高中教学同步《信息技术-数据与计算》(教案)
实践数据分析工具的使用:通过电子表格软件、在线数据分析平台及编程工具(如Python)进行数据分析,使学生能够实际操作并理解不同工具的应用。
体验实际数据分析案例:通过具体的数据分析案例(如南水北调中线工程各地区水资源情况的分析),让学生从实际数据中提取信息,增强理解和应用能力。
3.3.2数据可视化
理解数据可视化的重要性和功能:学生能够描述数据可视化的定义和目的,并解释其如何帮助人们更好地理解数据。
监督学生独立完成真题演练,提供必要的辅导和支持。
组织小组讨论,让学生分享解题过程和答案。
对学生的答案进行点评,给出正确答案和解析。
仔细阅读并理解所选真题的内容和要求。
独立思考并尝试解答真题,运用所学的数据分析方法。
参与小组讨论,与同学分享自己的解题思路和答案。
听取教师的点评和解析,对照自己的答案找出不足之处。
通过互动提问和讨论,检验学生对概念的掌握程度。
促进学生之间的交流与合作,共同探讨数据分析的应用。
培养学生的分析能力,通过实际案例锻炼其应用所学知识的能力。
帮助学生整理思路,明确数据分析的核心要点。
活动三:
调动思维
探究新知
选取历年的真题或模拟题,涉及数据分析与可视化的内容。
指导学生如何审题,理解题目的要求和解题步骤。
3.预测事物的未来走向
通过数据分析,可以预测事物未来可能会发生什么,推断未来的发展趋势,并为制订相应的目标及策略提供依据。目前,利用数据分析进行预测已经应用于各个领域,包括体育赛事预测、用户行为预测、能源消耗预测、交通行为预测和人体健康预测等。例如,通过各个家庭安装的智能电表,对电力的使用状况进行监控,检测出用电模式,从而对用电需求做出预测。
预测未来趋势:使用智能电表数据预测电力使用,体育赛事预测等。

中图版(2019)必修1《第三章_数据处理与应用》2022年单元测试卷+答案解析(附后)

中图版(2019)必修1《第三章_数据处理与应用》2022年单元测试卷+答案解析(附后)

中图版(2019)必修1《第三章数据处理与应用》2022年单元测试卷1. 下列关于数据备份的说法不正确的是( )A. 备份的副本应存储在与源文件同一路径下B. 备份文件有助于避免文件的永久丢失C. 可以用备份的文件恢复丢失的数据D. 为了确保文件不会丢失,可以随时手动备份或者设置自动备份2. 百度公司根据某时段在某区域内“感冒症状”、“治疗”等关键词的搜索量急剧增长,成功预测了甲流的爆发时间、地域。

主要体现了大数据分析理念中的( )A. 在数据规模上强调相对数据而不是绝对数据B. 在分析方法上更注重相关分析而不是因果分析C. 在数据基础上倾向于全体数据而不是抽样数据D. 在分析效果上更追求效率而不是绝对精确3. 下列不属于数据采集是( )A. 系统日志B. 网络爬虫C. 问卷调查D. 数据可视化4. 小明无意间发现了小红记录在笔记本上的邮箱密码,他登录小红邮箱后阅读了小红的各种邮件。

为此小红对邮箱设置进行了调整,现需要用手机接收“动态密码”并输入后才能登录邮箱。

请问小红的做法是属于以下哪种信息系统的安全防范方法?( )A. 身份认证B. 访问控制C. 数据加密D. 修补漏洞5. 下列关于数据安全的说法,不正确的是( )A. 自然灾害也有可能对数据造成损坏B. 数据加密有助于提高数据的安全性C. 数据校验主要是为了保证数据的完整性D. 数据安全只要做好防护上的安全即可6. 因疫情防控需要,学校要求学生家长及时上报体温、行程等数据,汇总后上报上级防控部门,采集上述数据最为高效的方法是( )A. 填写在线收集表B. 填写纸质表格C. 发送电子邮件D. 打电话上报7. 数据分析报告是项目的展示,也是数据分析结论的有效承载形式。

在数据分析报告中,首先需要明确数据分析的,阐述目前及通过分析希望解决的问题;其次需要描述数据来源和数据分析的、和;最后需要重点呈现数据分析的、和。

A. 正确B. 错误8. 数据分析应用对象主要有分析、分析和分析。

2024新高考浙江版高中信息技术专题三 数据处理与应用 考点真题练习

2024新高考浙江版高中信息技术专题三 数据处理与应用 考点真题练习

专题三数据处理与应用考点集训考点一常用表格数据的处理1.小李获取了2020年高一段学生选考报名数据,并使用Excel软件进行数据处理,如图a 所示。

图a请回答下列问题。

(1)区域K3:K9中的数据是通过COUNTIF函数计算得到的。

在K3单元格中输入公式后,利用自动填充功能完成K4:K9的计算。

则K3单元格中输入的公式是。

(提示:COUNTIF(range,criteria)函数可计算某个区域中满足给定条件的单元格数目。

例如:=COUNTIF(C3:C452,1)表示高一段1班的学生人数)图b(2)根据图a的数据,制作了图b的图表,创建该图表的数据区域是。

(3)下列描述正确的是。

(多选,填字母)A.选取区域A2:G452进行筛选,筛选出1班学生的数据,会影响图b的图表效果B.若要对区域A2:G452按“组合”进行筛选,则可以选择区域A2:G2来添加筛选标记C.若要筛选出选考选报了历史的学生,可对“组合”进行筛选包含“历史”D.若要筛选出选考选报了历史的学生,可同时对“科目1”“科目2”和“科目3”进行筛选等于“历史”答案(1)=COUNTIF($D$3:$F$452,J3)或=COUNTIF(D$3:F$452,J3) (2)J2:K9(3)ABC 2.小方收集了2019年2月部分省市社会服务统计数据,并使用Excel软件进行数据处理,如图a所示。

图a请回答下列问题。

(1)当前工作表中仅区域A1:G16有数据,其中G4单元格正确计算了北京市占全国民政事业费累计支出的比例。

小李通过G4单元格中的公式对区域G5:G16进行自动填充,则G16单元格中显示的结果是(填字母:A.0.00/B.1.00/C.100.00/D.#DIV/0!)。

(2)上述操作后,小方发现区域G5:G16计算结果不符合要求。

若要正确计算“民政事业费累计支出占比”列的数据,可先修改G4单元格中的公式,再进行自动填充,修改后G4单元格中的公式为。

验收卷(四) 数据处理与应用(学生版)浙教版(2019)必修1

验收卷(四) 数据处理与应用(学生版)浙教版(2019)必修1

验收卷(四)数据处理与应用(考试时间40分钟;满分50分)一、选择题(本大题共8小题,每小题2分,共16分,在每小题给出的四个选项中,只有一个符合题目要求,多选、少选、不选均不得分)1.下列关于大数据处理的说法,正确的是()A.对动态数据无法进行可视化表示B.在中文文本分析中采用短语或段落作为表示文本的特征项C.大数据数据类型多,无法分析全体数据,只能分析抽样数据D.Hadoop面向大规模的批量处理,适用于处理静态数据,不适用于流数据2.某大型购物网站收集了用户浏览网站的数据用于广告个性化实时推荐,下列处理方式中合理的是()A.应当使用统计分析软件进行数据分析B.应当选用针对流数据的实时计算C.应当选用针对图结构数据的图计算D.应当选用针对静态数据的批处理计算3.有如下Python 程序段:import pandas as pddata=[["小嘉","男",97],["小浙","男",89],["小温","女",98],["小华","女",89],["小杭","男",99]]df=pd.DataFrame(data,columns=["姓名","性别","成绩"])下列选项左侧语句与右侧输出结果不一致...的是()4.数据文件“data.csv”中包含“A”“B”“C”3列1000行数据,下列Python程序段用于实现对象df1中数据按“B”列降序排序,程序中划线处应填写的语句是() import pandas as pddf=pd.read_csv('data.csv')A.df1=df.sort_values('B')B.df=df1.sort_values('B')C.df1=df.sort_values('B',ascending=True)D.df1=df.sort_values('B',ascending=False)5.数据文件“data.csv”中储存了浙江省各地苹果的零售价格数据,数据包含“日期”“地区”“品名”“价格”等6列200000行,处理该文件中数据的Python程序段如下︰import pandas as pddf=pd.read_csv('data.csv')df1=df.groupby('地区').价格.mean()关于该程序段,下列说法正确的是()A.DataFrame对象df中仅存储了文件“data.csv”中的“价格”列数据B.对象df1中数据以“地区”为主要关键字﹑“价格”为次要关键字排序C.读取文件“data.csv”中的数据,计算全部“价格”数据的平均值D.读取文件“data.csv”中的数据,计算各地区“价格”数据的平均值6.下列关于中文分词方法的描述中,属于基于统计的分词方法的是()A.让计算机模拟人的理解方式,根据大量的资料和规则进行学习,然后进行分词B.在分析句子时,与词典上的词语进行对比,词典中出现的就划分为词C.依据词语与词语之间的分隔符号进行分词D.依据上下文中相邻字出现的频率统计,同时出现的次数越高组成一个词的概率就越高7.下列关于数据可视化的描述中,错误..的是 ()A.标签云是文本可视化的一种方式B.数据可视化只能将数据以静态图形图像等形式表示C.数据可视化能直观的呈现数据,容易发现数据中蕴含的信息D.数据可视化增强了数据的解释力与吸引力8.下列关于大数据与大数据处理的说法,不正确...的是()A.大数据价值密度低,“提纯”大数据可以让其发挥更大的价值B.高速公路中实时产生的车流量数据属于静态数据C.词频统计是文本数据处理中特征提取的一种方法D.经过处理后的大数据,利用可视化技术,有助于快捷观察与追踪数据二、非选择题(本大题共4小题,共34分)9.小明设计了一手环,实现对体温的连续监控,4名志愿者的体温检测情况(部分数据隐藏,数据保存在“data.xls”中)如图所示:(1)小明需对图所示的数据进行整理,下列说法正确的是。

高中信息技术《数据管理与分析》练习题(附答案解析)

高中信息技术《数据管理与分析》练习题(附答案解析)

高中信息技术《数据管理与分析》练习题(附答案解析)学校:___________姓名:___________班级:_____________一、选择题1.数据分析报告的基本组成部分包括()A.标题页、前言、正文、结论和建议B.标题页、正文、结论和建议、附录C.前言、正文、结论和建议D.标题页、前言、正文、结论和建议、附录2.数据分析的常见方法包括()A.对比分析、关联分析、平均分析B.对比分析、平均分析、交叉分析C.交叉分析、关联分析、平均分析D.关联分析、对比分析、交叉分析3.数据分析的方法中,下列()不是。

A.特征探索B.建立模型C.线性分析D.聚类与分类4.数据分析的基本方法包括()A.特征探索、关联分析、聚类分析、数据分类B.特征探索、聚类分析、数据分类C.特征探索、数据分类D.关联分析、聚类分析、数据分类5.下列有关数据关联分析的说法正确的是()A.对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。

B.分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。

C.是一种探索性的分析。

不必事先给出一个分类标准,而是让其自动分类。

D.是数据分析中最基本的方法。

先基于样本数据构建分类器,然后进行预测。

6.使用欧式距离度量法对未知鸢尾花进行分类预测,其实施步骤的正确顺序是()①计算待测鸢尾花各属性值与三类鸢尾花属性平均值之间的欧式距离②读入鸢尾花训练集相关数据③计算三类鸢尾花各自特征属性的平均值④读入待测鸢尾花的数据⑤找出欧氏距离的最小值,并确定其对应的鸢尾花类别A.④③②①⑤B.②③④①⑤C.②④③①⑤D.③①④②⑤7.一份有效的数据分析报告,能够帮助用户()A.了解事物发展现状,预判事物发展趋势B.有效判断所需解决问题的影响因素C.有针对性地选择解决问题的方案D.以上都是8.关于数据分析方法,下列说法不正确的是()A.数据分析主要用于现状分析、原因分析和预测分析B.对比有横向对比和纵向对比两种情况C.平均分析是指运用计算平均值的方法反映总体在一定时间、地点条件下某一数量特征的一般水平D.数据分析方法只有对比分析法和平均分析法9.德国男人超市购买婴儿纸尿布的同时往往还购买啤酒,计算机分析超市的购物数据后发现了这一规律,于是将啤酒货架移到了婴儿纸尿布货架旁,啤酒和纸尿布的销量都有所增加。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高中信息技术《数据处理与应用》练习题(附答案解析)学校:___________姓名:___________班级:_____________一、选择题1.现代社会,日常生活中的很多应用都离不开大数据的支持。

下列选项中,可以不依赖大数据的是()A.手机上的购物广告精准推送B.某共享单车公司的投放分布决定C.在线语音电话D.实时地图导航2.对于数据可视化的作用说法不正确的是()。

A.散点图可以清晰地呈现数据之间的空间关系B.饼图可以直观地呈现各项数据所占比例C.关系图可以呈现数据之间的逻辑关系或空间关系D.趋势图可以直观地呈现数据变化趋势3.下列关于大数据处理的说法,错误的是 ()A.处理大数据一般采用分治思想B.数据采集只能收集结构化数据C.图计算主要针对图数据D.并行处理能节省复杂问题的处理时间4.下列关于Hadoop平台的说法正确的是( )A.该平台只能处理结构化数据 B.处理信息必须通过可视化体现处理的结论C.该平台中每台计算机都在处理相同的数据D.该平台可以节省大型和复杂问题的处理时间5.文本数据处理的过程主要包括:①分词;②数据分析;③特征提取;④结果呈现。

顺序正确的是()A.①②③④B.②①③④C.①③②④D.③①②④6.下列有关可视化工具的说法,不正确的是()A.Tableau主要用于实时可视化分析,它可以连接本地或云端数据,还可以连接动态数据源B.D3.js是运行在JavaScript上的数据可视化开源工具库,不可以创建实时交互的网页C.Highcharts是一个开源图表库,支持移动端,能够简单便捷地在web网站或web应用程序中添加动态、交互性的图表D.GoogleCharts是为浏览器与移动设备定制的交互式图表开发包,用于在web上可视化数据7.下列关于词云说法错误的是()。

A.词云是目前常用的关键词可视化形式B.用词云可视化文本数据可以帮助人们快速地了解文本的内容和特征信息C.词云通常使用字体的大小和颜色表示关键词的重要程度或出现频次D.在词云中,字越大表示该关键词使用频率就越低8.以下关于数据整理,错误的是()A.数据的重复值会导致数据分布变化B.数据的缺失值会导致样本信息减少C.数据的异常值增加了分析的难度D.数据整理的科学与否对数据分析的影响不大9.下列选项中,没有..应用大数据技术的是()A.把论文拿到知网比对,得到精准的查重结果B.电子地图根据车辆的行驶轨迹判断拥堵路段C.政府通过建档立卡和数据分析实行精准扶贫D.班主任利用计算机分析统计本班学生的成绩10.下列关于数据整理的说法,错误的是()A.数据集中缺失的数据可以采用中间值来填充B.数据集中异常数据可能包含重要信息C.数据集中的重复数据可进行合并删除处理D.数据集中格式不一致的数据,一般保留一种格式的数据,删除其他格式的数据11.雷达图是一种表现多维数据的图表,专门用来进行多指标体系的比较分析。

这种可视化的方法属于()。

A.有关时间趋势的可视化B.有关比例的可视化C.有关空间关系的可视化D.有关差异的可视化二、填空题12.请列举出五个数据可视化表达的常见图表名称________。

13.常见的数据计算有数值数据、_________、日期/时间数据、逻辑数据。

三、操作题14.我校 2019 级学生高三二模部分成绩如图 a 所示,利用该数据展开了数据的统计分析和可视化呈现。

图 a请回答下列问题:(1)如图所示,M3:M21 单元格的数据由 M2 单元格自动填充而得,现已知 M2 单元格数据为各科总分,则 M2 单元格的公式为________。

(2)总分前 10 名的图表如图 b 所示,该图表类型为___________。

图 b(3)算法思路:先按“总分”降序排序,然后利用“姓名”和“总分”前 10 名制作图表,实现的代码如下。

import pandas as pdimport matplotlib.pyplot as pltfont={'family':'MicroSoft YaHei'} # 显示中文plt.rc('font',** font)df=pd.read_excel("2022WZ2M.xlsx")df_sort=df.sort_values("总分", ___________)#取总分前 10 名制作图表x=df_sort['姓名'].head(10)y=________________plt.bar(x,y,color='b')plt.grid(alpha=0.5)# 添加网格plt.title("2022 年温州二模总分前 10 名")#添加标题plt.show()请在程序划线处填上合适的代码。

(4)制作每门学科的平均分,并按技术成绩降序排序,并将结果保存在文件“2022WZ2M_TJ.xlsx”中,分析结果如图 c 所示。

图 c实现代码如下,请在划线处填上合适的代码。

xk_avg=df.__________("班级")#按班级分组xkavg_mean=_________ #计算各科班级平均分xkavg_mean.to_excel("2022WZ2M_TJ.xlsx",index=True,header=True) #保存结果文件四、简答题15.测量大气压值的著名实验是由托里拆利设计完成的。

他将一根长度为1米的玻璃管灌满水银,然后用手指顶住管口,将其倒插进装有水银的水银槽里,放开手指后,可见管内部顶上的水银已下落,留出空间来了,而下面的部分则仍充满水银。

任务:利用水银气压计测量不同海拔高度的大气压数值如下表所示,分析这些数据,通过数字化学习方式探究大气压与海拔高度的关系,形成可视化报告。

不同海拔高度的气压数值参考答案与解析1.【答案】C【详解】本题主要考查大数据的应用。

大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。

在线语音电话不涉及大数据,故本题选C选项。

2.【答案】A【详解】本题考查数据可视化的相关知识点散点图用于显示两个不同变量之间的关系,或者用于揭示数据的分布趋势。

当数据点较多并且需要显示数据集的相似性时,可以使用散点图。

A说法错误,故本题选A选项3.B【详解】本题主要考查大数据处理。

处理大数据一般采用分治思想;大数据采集的是规模巨大的数据,不局限于结构化数据;图计算主要针对图数据;并行处理能节省复杂问题的处理时间,故本题选B选项。

4.【答案】D【详解】本题考查的是Hadoop平台相关知识。

该平台可以处理结构化、非结构化和半结构化的数据,分析的结果可以通过可视化来体现,也可以是单纯的数据信息。

该平台采用分布式文件格式,不同的计算机往往处理不同的数据,其目的是为了节省计算时间。

5.【答案】C【详解】本题主要考查数据处理。

文本数据处理的过程是:分词→特征提取→数据分析→结果呈现,故本题选C选项。

6.【答案】B【详解】本题主要考查可视化工具。

Tableau主要用于实时可视化分析,它可以连接本地或云端数据,还可以连接动态数据源;D3.js是运行在JavaScript上的数据可视化开源工具库,可以创建实时交互的网页;Highcharts是一个开源图表库,支持移动端,能够简单便捷地在web网站或web应用程序中添加动态、交互性的图表;GoogleCharts是为浏览器与移动设备定制的交互式图表开发包,用于在web上可视化数据,故本题选B选项。

7.【答案】D【详解】本题主要考查可视化工具。

词云是目前常用的关键词可视化形式;用词云可视化文本数据可以帮助人们快速地了解文本的内容和特征信息;词云通常使用字体的大小和颜色表示关键词的重要程度或出现频次;在词云中,字越大表示该关键词使用频率就越高,故本题选D选项。

8.【答案】D【详解】本题主要考查数据整理。

数据的重复值会导致数据分布变化;数据的缺失值会导致样本信息减少;数据的异常值增加了分析的难度;数据整理的科学与否对数据分析的影响较大,故本题选D选项。

9.【答案】D【详解】本题主要考查大数据技术的应用。

大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。

结合选项可知,班主任利用计算机分析统计本班学生的成绩没有应用大数据技术,故本题选D选项。

10.【答案】D【详解】本题考查的是数据处理。

数据集中格式不一致的数据需要根据后续分析和挖掘的需要进行数据转换。

故本题应选D。

11.【答案】D【详解】本题主要考查数据可视化的方法。

雷达图法是日本企业界为评估综合实力而采用的一种综合评价方法。

按这种方法所绘制的财务比率综合图状似雷达,故得此名。

这种可视化的方法属于有关差异的可视化,故本题选D选项。

12.【答案】饼图、条形图、折线图、散点图、雷达图、词云图、热力图等。

【详解】本题主要考查数据可视化。

数据可视化表达的常见图表名称有:饼图、条形图、折线图、散点图、雷达图、词云图、热力图等。

13.【答案】文本数据【详解】本题主要考查数据类型。

常见的数据计算有数值数据、文本数据、日期/时间数据、逻辑数据。

14.【答案】=SUM(C2:L2) 柱形图或垂直柱形图ascending= False df_sort['总分'].head(10)或 df_sort.总分.head或 df_sort['总分'][:10] 或 df_sort.总分[:10] 或其它等价答案 groupby xk_avg.mean()【详解】本题考查的是数据处理。

(1) M2 单元格数据为各科总分,则故M2 单元格的公式为:=SUM(C2:L2)。

(2)由图可知,该图表类型为柱形图。

(3)先按“总分”降序排序,故第一空为:ascending= False,图表y轴表示的前10名总分,故第二空为:df_sort['总分'].head(10)或 df_sort['总分'][:10] 或 df_sort.总分[:10] 或其它等价答案;按班级分组,故第三空应为:groupby;计算各班级平均分,故第四空为:xk_avg.mean()。

15.【答案】从图中可以清晰的看出,海拔与大气压成反比关系【详解】本题考查数据相关知识点;通过Excel的折线图将气压值与海拔的关系清晰展现出来。

如图所示:。

相关文档
最新文档