南开大学2022年9月《大数据开发技术》作业考核试题及答案参考4

南开大学2022 年9 月《大数据开辟技术》作业考核试题及答案参考

1. 如果 numPartitions 是分区个数,那末 Spark 每一个 RDD 的分区 ID 范围是( )

A.[0,numPartitions]

B.[0,numPartitions-1]

C.[1,numPartitions-1]

D.[1,numPartitions]

参考答案: B

2. MapReduce 设计的一个理念就是( ),因为挪移数据需要大量的网络传输开

销。

A.数据向计算靠拢

B.计算向数据靠拢

C.计算向网络靠拢

D.计算与数据并行

参考答案: B

3. Scala 函数组合器中 flatmap 结合了map 和 flatten 的功能,接收一个可以处

理嵌套列表的函数,然后把返回结果连接起来。 ( )

A.正确

B.错误

参考答案: A

4. Spark 中 DataFrame 的( )方法是进行分组查询

A.order by

B.group by

C.select by

D.sort by

参考答案: B

5. 实现大整数的乘法是利用 ( )的算法。

A.贪心法

B.动态规划法

C.分治策略

D.回溯法

参考答案: C

6. Scala 中数组的第一个元素索引为 1。 ( )

A.正确

B.错误

参考答案: B

7. 回溯法搜索解空间树时,常用的两种剪枝函数为约束函数和限界函数。 ( )

A.错误

B.正确

参考答案: B

8. 以深度优先方式系统搜索问题解的算法称为回溯法。 ( )

A.错误

B.正确

参考答案: B

9. 以下哪种数据库适合于批量数据处理和即席查询( )

A.MySQL

B.Oracle

C.Hbase

D.NosSQL

参考答案: C

10. 以下哪个不是 Scala 的数据类型( )

A.Int

B.Short Int

C.Long

D.Any

参考答案: B

11. 以下哪个方法可以创建 RDD( )

A.parallelize

B.makeRDD

C.textFile

D. loadFile

参考答案: ABC

12. Scala 列表中 last 返回一个列表,包含除了第一个元素之外的其他元素。 ( ) T.对

F.错

参考答案: F

13. ( )可解决 HDFS 中名称节点运行期间 EditLog 不断变大的问题

https://www.360docs.net/doc/d419204281.html,Node

B.SecondaryNameNode

C.DataNode

D.Block

参考答案: B

14. 分支限界法与回溯法的求解目标相同。 ( )

A.错误

B.正确

参考答案: A

15. Scala 列表与数组非常相似,列表的所有元素可具有不同的类型。 ( )

T.对

F.错

参考答案: F

16. 内存级分析合用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。 ( )

A.对

B.错

参考答案: A

17. RDD 的 mapPartitions 操作会导致 Partitions 数量的变化。 ( )

A.正确

B.错误

参考答案: B

18. Scala 中合并两个数组的方法是( )

A. line

B.add

C.append

D.concat

参考答案: D

19. ( )是 Spark 的数据挖掘算法库

A.Spark Core

B.BlinkDB

C.GraphX

D.Mllib

参考答案: D

20. ( )是 Microsoft Office 的核心组件。

A.SQL

B.WORD

C.PPT

D.EXCEL

参考答案: D

21. PairRDD 中 ( )函数可以进行分组

A.mapValues

B.groupBy

C.groupByKey

D.reduceByKey

参考答案: BC

22. 以下属于 Hadoop 的安装方式的有( )。

A.单机模式

B.多机模式

C.分布式模式

D.并行模式

E.伪分布式模式

参考答案: ACE

23. 下面哪种函数是回溯法中为避免无效搜索采取的策略?( )

A.递归函数

B.剪枝函数

C.随机数函数

D.搜索函数

参考答案: B

24. Spark 持久化 RDD 后,在再一次需要计算该 RDD 时将需要重新计算。 ( )

A.正确

B.错误

参考答案: B

25. Scala 使用 ( )关键字来继承一个类

A.extends

B.override

C.extend

D.overrides

参考答案: A

26. Storm 中如果要保证相同字段的 Tuple 分配到同一个 Task 中,应该采用哪种Stream Groupings( )。

A.ShuffleGrouping

B.AllGrouping

C.GlobalGrouping

D.FiedlsGrouping

参考答案: D

27. Spark Streming 中 ( )函数可以使用 func 将源 DStream 中的每一个元素进行聚合操作,返回一个内部所包含的 RDD 惟独一个元素的新 DStream

A.union

B.reduce

C.join

D.cogroup

参考答案: B

28. RDD 的 intersection 方法用于求出两个 RDD 的共同元素。 ( )

A.正确

B.错误

参考答案: A

29. Scala 函数组合器中 filter 过滤移除使得传入的函数的返回值为 true 的元素。 ( )

A.正确

B.错误

参考答案: B

30. TF-IDF 中 TF 指的是( )

A.词频

B.词在文档中浮现的次数

C.逆文档概率

D.词在文档集中浮现的概率

E.词在文档集中浮现的概率参考答案: AB

南开大学2022年9月《大数据开发技术》作业考核试题及答案参考4

南开大学2022 年9 月《大数据开辟技术》作业考核试题及答案参考 1. 如果 numPartitions 是分区个数,那末 Spark 每一个 RDD 的分区 ID 范围是( ) A.[0,numPartitions] B.[0,numPartitions-1] C.[1,numPartitions-1] D.[1,numPartitions] 参考答案: B 2. MapReduce 设计的一个理念就是( ),因为挪移数据需要大量的网络传输开 销。 A.数据向计算靠拢 B.计算向数据靠拢 C.计算向网络靠拢 D.计算与数据并行 参考答案: B 3. Scala 函数组合器中 flatmap 结合了map 和 flatten 的功能,接收一个可以处 理嵌套列表的函数,然后把返回结果连接起来。 ( ) A.正确 B.错误 参考答案: A 4. Spark 中 DataFrame 的( )方法是进行分组查询 A.order by B.group by C.select by D.sort by 参考答案: B 5. 实现大整数的乘法是利用 ( )的算法。 A.贪心法 B.动态规划法 C.分治策略

D.回溯法 参考答案: C 6. Scala 中数组的第一个元素索引为 1。 ( ) A.正确 B.错误 参考答案: B 7. 回溯法搜索解空间树时,常用的两种剪枝函数为约束函数和限界函数。 ( ) A.错误 B.正确 参考答案: B 8. 以深度优先方式系统搜索问题解的算法称为回溯法。 ( ) A.错误 B.正确 参考答案: B 9. 以下哪种数据库适合于批量数据处理和即席查询( ) A.MySQL B.Oracle C.Hbase D.NosSQL 参考答案: C 10. 以下哪个不是 Scala 的数据类型( ) A.Int B.Short Int C.Long D.Any 参考答案: B

22春南开大学《大数据开发技术》在线作业二答案参考6

22春南开大学《大数据开发技术》在线作业二答案参考 1. Scala函数组合器可以接收一个可以处理嵌套列表的函数,然后把返回结果连接起来的方法是( ) A.map B.foreach C.flatten D.flatmap 参考答案:D 2. 设计动态规划算法的主要步骤不包括根据计算最优值时得到的信息,构造最优解。( ) A.错误 B.正确 参考答案:A 3. Hbase采用( )作为底层数据存储 A.HDFS B.GFS C.Hbase D.传统文件系统 参考答案:A 4. 算法是由若干条指令组成的有穷序列,且要满足输入、输出、确定性和有限性四条性质。( ) A.错误 B.正确 参考答案:B 5. 分治法与动态规划法的不同点是:适合于用动态规划法求解的问题,经分解得到的子问题往往不是互相独立的。而用分治法求解的问题,经分解得到的子问题往往是互相独立的。( ) A.错误 B.正确

参考答案:B 6. Scala中高阶函数可以产生新的函数,并将新的函数作为返回值。( ) T.对 F.错 参考答案:T 7. 分布式离线分析可以实现秒级别的实时分析响应。( ) A.正确 B.错误 参考答案:B 8. HDFS读数据过程中( )具体实现了FileSystem A.DistributedFileSystem B.GFSSystem C.FileSystem D.HDFSSystem 参考答案:A 9. Spark中DataFrame的( )方法是进行连接查询 A.where B.join C.limit D.apply 参考答案:B 10. ( )可解决HDFS中名称节点运行期间EditLog不断变大的问题 https://www.360docs.net/doc/d419204281.html,Node B.SecondaryNameNode C.DataNode D.Block

南开大学智慧树知到“物联网工程”《大数据开发技术(二)》网课测试题答案4

长风破浪会有时,直挂云帆济沧海。 住在富人区的她 南开大学智慧树知到“物联网工程”《大数据开发技术(二)》 网课测试题答案 (图片大小可自由调整) 第1卷 一.综合考核(共15题) 1.Scala 集合分为可变的和不可变的集合。() A.正确 B.错误 2.MapReudce 不适合()任务。 A.大数据计算 B.迭代 C.交互式 D.离线分析 3.Scala 列表方法中返回所有元素,除了最后一个的方法是() A.drop B.head C.filter D.init 4.Scala 中()方法返回一个列表,包含除了第一个元素之外的其他元素 A.head B.init C.tail https://www.360docs.net/doc/d419204281.html,st 5.Scala 列表与数组非常相似,列表的所有元素可具有不同的类型。() A.正确 B.错误 6.Scala 列表方法中通过给定的方法将所有元素重新计算的方法是()。 A.filter B.foreach C.map D.mkString 7.spark-submit 配置项中()表示启动的executor 数量 A.-num-executors NUM B.-executor-memory MEM C.-total-executor-cores NUM D.-executor-coures NUM 8.图结构中如果任意两个顶点之间都存在边,那么称之为() A.完全图 B.有向完全图 C.无向图 D.简单图 9.Spark Streaming 中时间片也可称为批处理时间间隔(batch interval),时间片是人为地对数据进行定量的标准,作为拆分数据的依据,一个时间片的数据对应一个RDD 实例。() A.正确 B.错误 10.PairRDD 中mapValues 是针对键值对(Key ,Value)类型的数据中的key 和Value 进行Map 操作。() T.对 F.错 11.Spark 支持使用()语言编写应用 A.Scala B.Python C.Java D.R 12.以下算法中属于分类算法的是() A.KNN 算法 B.逻辑回归 C.随机森林 D.Kmeans 13.var a=10; for(aA.10 B.11 C.20 D.19 14.图的结构通常表示为:G(V ,E),其中,G 表示()

南开大学2021年9月《大数据开发技术》作业考核试题及答案参考7

南开大学2021年9月《大数据开发技术》作业考核试题及答案参考 1. RDD中combineByKey不允许返回类型与输入数据类型不同的返回值。( ) A.正确 B.错误 参考答案:B 2. Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是( ) A.filter B.foreach C.map D.mkString 参考答案:D 3. RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回到Driver 端,适用于大数据处理后的返回。( ) T.对 F.错 参考答案:F 4. PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value 进行Map操作。( ) A.正确 B.错误 参考答案:B 5. GraphX中graph.edges可以得到( ) A.顶点视图 B.边视图 C.顶点与边的三元组整体视图 D.有向图 参考答案:B

6. RDD中zip操作要求两个RDD的partition数量以及元素数量都相同。( ) T.对 F.错 参考答案:T 7. RDD的map操作不会改变RDD的分区数目。( ) A.正确 B.错误 参考答案:A 8. 美国奥巴马政府宣布投资2亿美元启动“大数据研发计划”。( ) A.对 B.错 参考答案:A 9. Scala中高阶函数经常将只需要执行多次的函数定义为匿名函数作为参数。( ) T.对 F.错 参考答案:F 10. 阿里云RDS中一个实例可以创建多个数据库,在实例内数据库命名唯一,所有数据库都会共享该实例下的资源,如CPU、内存、磁盘容量等。( ) A.正确 B.错误 参考答案:A 11. Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是 不包括面向对象编程的特性。( ) A.正确 B.错误

南开大学2021年8月《大数据开发技术》作业考核试题及答案参考15

南开大学2021年8月《大数据开发技术》作业考核试题及答案(参考) 1. Storm框架是实时计算系统,所以不能使用数据库。( ) A.正确 B.错误 参考答案:B 2. Spark Streming中( )函数可以对源DStream的每个元素通过函数func返回一个新的DStream A.map B.flatMap C.filter D.union 参考答案:A 3. var a=10; do{ a+=1;}while(aA.9 B.10 C.11 D.12 参考答案:B 4. 贪心选择性质是贪心算法可行的第一个基本要素,但不是贪心算法与动态规划算法的主要区别。( ) A.错误 B.正确 参考答案:A 5. 传统数据处理流程,用户需要主动发起查询或者定时查询;流处理流程中,可以实时查询。( ) A.正确 B.错误 参考答案:A 6. RDD是一个( )的数据结构 A.可读写 B.只读的 C.容错的 D.可进行并行操作的 参考答案:BCD

7. Spark DataFrame中( )方法可以返回一个Array对象 A.collect B.take C.takeAsList D.collectAsList 参考答案:AB 8. MapReduce的main函数中设置输出类型的方法有( )。 A.setOutputKeyClass B.setOutputClass C.setOutputValueClass D.setKeyValueClass 参考答案:AC 9. Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。( ) A.正确 B.错误 参考答案:B 10. 问题的最优子结构性质是该问题不可用动态规划算法或贪心算法求解的关键特征。( ) A.错误 B.正确 参考答案:A 11. Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。( ) T.对 F.错 参考答案:F 12. Scala函数组合器可以对集合中的元素进行分组操作,结果得到的是一个Map的方法是( ) A.filter B.flatten C.grouby D.flatmap 参考答案:C 13. 下列随机算法中运行时有时候成功有时候失败的是( )。 A.数值概率算法 B.舍伍德算法

南开大学《大数据开发技术(二)》在线作业0

《大数据开发技术(二)》在线作业 Spark Streming中()函数当被调用类型分别为(K,V)和(K,W)键值对的2个DStream 时,返回类型为(K,(V,W))键值对的一个新 DStream。 A:union B:reduce C:join D:cogroup 参考选项:D Dstream窗口操作中()方法返回一个基于源DStream的窗口批次计算后得到新的DStream。 A:window B:countByWindow C:reduceByWindow D:reduceByKeyAndWindow 参考选项:A Scala函数组合器可以通过一个函数重新计算列表中所有元素,但是没有返回值的方法是() A:map B:foreach C:flatten D:flatmap 参考选项:B 在图结构中,每个元素都可以有()后继 A:至少一个 B:零个或多个 C:一个 D:零个 参考选项:B Spark Streming中DStream的每个RDD都是由()分割开来的数据集 A:分区 B:一小段时间 C:数据量 D:随机 参考选项:B MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法()训练回归树A:trainClassifier B:trainRegressor

C:LogisticRegressionModel D:LabeledPoint 参考选项:B GraphX中graph.vertices可以得到() A:顶点视图 B:边视图 C:顶点与边的三元组整体视图 D:有向图 参考选项:A Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存 A:print B:saveAsTextFiles C:saveAsObjectFiles D:saveAsHadoopFiles 参考选项:D Scala 使用()关键字来继承一个类 A:extends B:override C:extend D:overrides 参考选项:A spark-submit配置项中()表示executor内存大小 A:--num-executors NUM B:--executor-memory MEM C:--total-executor-cores NUM D:--executor-coures NUM 参考选项:B 当需要将一个普通的RDD转化为一个PairRDD时可以使用()函数来进行操作A:transfer B:change C:map D:build 参考选项:C 如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是()A:[0,numPartitions] B:[0,numPartitions-1]

南开大学2021年9月《数据库应用系统设计》作业考核试题及答案参考4

南开大学2021年9月《数据库应用系统设计》作业考核试题及答案参考 1. 数据库中的数据可以共享。( ) T.对 F.错 参考答案:T 2. 说明游标实际上是执行相应的SELECT语句,把查询结果取到缓冲区中。( ) A.错误 B.正确 参考答案:A 3. 数据库管理系统能实现对数据库中数据的查询、插入、修改和删除等操作,这种功能称为( )。 A.数据定义功能 B.数据管理功能 C.数据操纵功能 D.数据控制功能 参考答案:C 4. 使用mysqldump程序可以备份表中数据、也可以备份表结构。( ) T.对 F.错 参考答案:T 5. 通过外模式/模式映象,使得关系数据库具有高度逻辑独立性。( ) T.对 F.错 参考答案:T 6. 关系数据库中,表与表之间联系的约束是通过实体完整性规则来实现的。( ) T.对 F.错

参考答案:F 7. 下列哪个语句指定查询来源表?( ) A.select B.from C.where D.grup by 参考答案:B 8. GRANT语句的功能是( ) A.把授予用户的权限收回来 B.把对指定操作对象的指定操作权限授予指定的用户 C.把被破坏的数据库进行修复 D.对多个用户同时访问数据库的操作进行并发控制 参考答案:B 9. 在数据管理技术发展过程中,文件系统与数据库系统的主要区别是数据库系统具有( )。 A.数据无冗余 B.数据可共享 C.专门的数据管理软件 D.特定的数据模型 参考答案:D 10. SQL语言是( )语言。 A.层次数据库 B.网络数据库 C.关系数据库 D.非数据库 参考答案:C

11. 结果表中除了匹配行外,还包括右表有的但左表中不匹配的行使用下列哪个命令?( ) A.LEFT OUTER JOIN B.RIGHT OUTER JOIN C.NATURAL JOIN D.INNER JOIN 参考答案:B 12. MySQL中,一个表中最多只能有一个自增字段。( ) T.对 F.错 参考答案:T 13. 根据关系模型Students(学号,姓名,性别,专业),SQL语句:SELECT*FROM Students WHERE ‘姓名’=李明; 是语法正确的。( ) A.正确 B.错误 参考答案:B 14. 要定义数据库描述文件名称和数据库基本连接参数,应选择Database Profile Setup对话框中的( )标签 A.Connection B.Transaction C.Syntax D.Preview 参考答案:A 15. 一名工人可以加工多种零件,每一种零件可以由不同的工人来加工,工人和零件之间为一对多联系。( ) T.对 F.错 参考答案:F

南开大学20秋学期《大数据开发技术(二)》在线作业(参考答案)

1.()是AMPLab发布的一个R开发包,使得R摆脱单机运行的命运,可以作为Spark的Job运行在集群上。 A.SparkR B.BlinkDB C.GraphX D.Mllib 答案:A 2.图的结构通常表示为:G(V,E),其中,V是图G中()。 A.顶点 B.顶点的集合 C.边 D.边的集合 答案:B 3.Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存。 A.print B.saveAsTextFiles C.saveAsObjectFiles D.saveAsHadoopFiles 答案:D 4.()是Spark的核心,提供底层框架及核心支持。 A.Spark Core B.Spark SQL C.Spark Streaming D.Mllib 答案:A 5.Spark中的每个RDD一般情况下是由()个分区组成的。 A.0 B.1

C.多 D.无数 答案:C 6.RDD的()操作通常用来划分单词。 A.filter B.union C.flatmap D.mapPartitions 答案:C 7.图结构中如果任意两个顶点之间都存在边,那么称之为()。 A.完全图 B.有向完全图 C.无向图 D.简单图 答案:A 8.Spark GraphX中类Graph的aggregateMessages方法可以()。 A.收集邻居顶点的顶点Id和顶点属性 B.收集邻居顶点的顶点Id C.向指定顶点发送信息并聚合信息 D.将顶点信息更新到图中 答案:C 9.Spark中DataFrame的()方法是进行连接查询。 A.where B.join C.limit D.apply 答案:B 10.以下哪个不是Scala的数据类型?()

南开大学20秋学期《大数据开发技术(一)》在线作业(参考答案)

1.名称节点和数据节点之间则使用()协议进行交互。 A.名称节点 B.第二名称节点 C.数据节点 D.TCP 答案:C 2.UMP系通过()来实现实现管理每台物理机上的MySQL实例。 A.Controller服务器 B.Procy服务器 C.愚公系统 D.Agent服务器 答案:D 3.以下针对Hive的说法不正确的是()。 A.Hive是一个基于Hadoop的数据仓库工具 B.Hive是关系数据库 C.Hive QL是一种查询语言 D.Hive可以提供查询分析存储等功能 答案:B 4.MapReduce中最优的Reduce任务个数取决于集群中可用的()的数目。 A.Split B.Slot C.Map D.Shuffle 答案:B 5.Pregel计算模型以()作为输入。 A.有向图 B.无向图 C.矢量图 D.树

答案:A 6.HBase的目标是处理非常庞大的表,可以通过()方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表。 A.垂直扩展 B.水平扩展 C.拓扑扩展 D.叠加 答案:B 7.Xtimeline是哪种可视化工具?() A.信息图表 B.地图工具 C.时间线工具 D.分析工具 答案:C 8.HDFS中SecondaryNameNode可减少()重启的时间。 https://www.360docs.net/doc/d419204281.html,Node B.SecondaryNameNode C.DataNode D.Block 答案:A 9.BigTable采用()作为底层数据存储。 A.HDFS B.GFS C.Hbase D.传统文件系统 答案:B 10.应用于专门用于处理具有高度相互关联关系的数据,比较适合于社交网络的数据库是哪种?()

2022-2022国家开放大学电大专科《大数据技术》纸考模拟试题及答案

2022-2022国家开放大学电大专科《大数据技术》纸考 模拟试题及答案 2022-2022国家开放大学电大专科《大数据技术》纸考模拟试题及答案盗传必究一、单选题:在下列各题的备选答案中选择一个正确的。(每题3分,共30分)1.大数据时代数据收集的关键是()。 A.数据存储B.数据分析C.数据收集D.数据再利用2.支持大数据业务的基础是()。 A.数据科学B.数据硬件C.数据应用D.数据人才3.大数据的最显著特征是()。 A.数据处理速度快B.数据类型多C.数据规模大D.数据价值密度高4.Python中单行注释采用的符号是( )。 A.//B.#C.”D.”””5.Python语句print(type([1,2,3,4]))的输出结果是()。 A. B. C. D.6.Python中的len()函数的作用是()。 A.返回字符串、列表、字典、元组等长度B.返回字符串、列表、字典、元组等宽度C.返回字符串、列表、字典、元组等类型D.将字符串、列表、字典、元组等格式化7.下列选项属于不合法标识符的是()。 A.lambdaB.tr123C.tr_123D.123_tr8.下列符号中,不是Python运算符的是()。

A.+ B.++ C.某D.某某9.当前社会中,最为突出的大数据环境是()。 A.互联网B.物联网C.综合国力D.自然资源10.在Python中,下列哪种说法是错误的()。 A.除字典类型外,所有标准对象均可以用于布尔测试B.空字符串的布尔值是FaleC.空列表对象的布尔值是FaleD.值为0的任何数字对象的布尔值是Fale二、判断题:判断下列句子的对错。(每题2分,共20分)1.Python以缩进对齐的方式划分语句块。(√)2.Python中函数type()可以测试对象的类型。(√)3.Python不必创建和赋值即可直接使用。(某)4.Python变量名必须以字母或下划线开头,并且区分字母大小写。(√)5.在Python中可以使用if作为变量名。(某)6.Python 列表中的元素不可以是不同数据类型。(某)7.使用下标可以修改列表的元素。(√)8.使用字符串时,其下标可以是负数。(√)9.在Python 中,列表不能嵌套列表。 (某)10.Python中,while循环里可以嵌套for循环。 (√)三、填空题:(每空2分,共20分)1.转义字符'\n'的含义是换行。 2.Python中,使用比较运算符==检查两个操作数的值是否相。 3.a=7,b=3,则aandb的值为3。 4.Python中唯一的映射类型是字典。 5.设=‘abcde’,则[3]=d。 6.Python字典value()方法的作用是返回字典中的所有值。

2022年南开大学数据科学与大数据技术专业《操作系统》科目期末试卷A(有答案)

2022年南开大学数据科学与大数据技术专业《操作系统》科目期末试 卷A(有答案) 一、选择题 1、()不是操作系统的功能。 A.CPU管理 B.存储管理 C.网络管理 D.数据管理 2、下列选项中,在用户态执行的是()。 A.命令解释程序 B.缺页处理程序 C.进程调度程序 D.时钟中断处理程序 3、某系统有n台互斥使用的同类设备,3个并发进程分别需要3,4,5台设备,可确保系统不发生死锁的设备数n最小为()。 A.9 B.10 C.11 D.12 4、进程和程序的本质区别是() A.前者分时使用CPU,后者独占CPU B.前者存储在内存,后者存储在外存 C.前者在一个文件中,后者在多个文件中 D.前者为动态的,后者为静态的 5、下列关于银行家算法的叙述中,正确的是() A.银行家算法可以预防死锁 B.当系统处于安全状态时,系统中…定无死锁进程

C.当系统处于不安全状态时,系统中一定会出现死锁进程 D.银行家算法破坏了产生死锁的必要条件中的“请求和保持”条件 6、下列有关设备独立性的说法中,正确的是()。 A.设备独立性是指I/O设备具有独立执行I/O功能的种特性 B.设备独立性是指用户程序独立于具体物理设备的·种特性, C.设备独立性是指能够实现设备共享的一种特性 D.设备独立性是指设备驱动程序独立于具体物理设备的·种特性, 7、通道又称I/O处理器,用于实现()之间的信息传输。 A.内存与外设 B.CPU与外设 C.内存与外存 D.CPU与外存 8、若某文件系统索引节点(inode)中有直接地址项和间接地址项,则下列选项中,与单个文件长度无关的因素是(). A.索引节点的总数 B.间接地址索引的级数 C.地址项的个数 D.文件块大小 9、下面关于文件的叙述中,错误的是()。 I.打开文件的主要操作是把指定文件复制到内存指定的区域 II.对一个文件的访问,常由用户访问权限和用户优先级共同限制

南开大学22春“物联网工程”《大数据开发技术(一)》期末考试高频考点版(带答案)试卷号3

南开大学22春“物联网工程”《大数据开发技术(一)》期末考试高频考点 版(带答案) 一.综合考核(共50题) 1. Google Fusion Tables是哪种可视化工具() A.信息图表 B.地图工具 C.时间线工具 D.分析工具 参考答案:B 2. 数据仓库、专家系统产生于大数据发展的成熟期。() A.正确 B.错误 参考答案:B 3. 以下哪种不属于为大数据时代提供关键技术支撑的信息科技变化()。 A.网络宽带不断增加 B.存储设备容量不断增加 C.CPU处理能大幅提升 D.存储设备尺寸不断减小 参考答案:D 4. Hbase中Zookeeper文件记录了()的位置 A..META.表 B.-ROOT-表 C.Region D.Master 参考答案:B

5. MongoDB将数据存储为一个() A.关系 B.属性 C.字段 D.文档 参考答案:D 6. UMP系统的哪个功能实现了负载均衡() A.读写分离 B.资源隔离 C.资源调度 D.可扩展 参考答案:A 7. 静态数据采取()计算模式 A.批量 B.实时 C.大数据 D.动态 参考答案:A 8. 行式数据库采用()存储模型。 A.NSM B.DSM C.Hbase D.MySQL 参考答案:A 9. 数据产生方式的运营式系统阶段的数据产生方式是主动的。()

A.正确 B.错误 参考答案:B 10. SQL中的table对应与MongoDB中的() 参考答案:collection/集合 11. HDFS中()记录了每个文件中各个块所在的数据节点的位置信息 https://www.360docs.net/doc/d419204281.html,Node B.SecondaryNameNode C.DataNode D.Block 参考答案:A 12. Hadoop启动所有进程的命令为()。 A.all-start.sh B.all-start. C.start-all.sh D.start-all. 参考答案:C 13. Hbase中性能监视的工具有()。 A.Ganglia B.Ambari C.OpenTSDB D.Zookeeper 参考答案:ABC

南开大学22春“物联网工程”《大数据开发技术(二)》期末考试高频考点版(带答案)试卷号:1

南开大学22春“物联网工程”《大数据开发技术(二)》期末考试高频考点 版(带答案) 一.综合考核(共50题) 1. Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存。 A.print B.saveAsTextFiles C.saveAsObjectFiles D.saveAsHadoopFiles 参考答案:D 2. GraphX中Edge边对象存有()字段 A.srcId B.dstId C.attr D.val 参考答案:ABC 3. 如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是()。 A.[0,numPartitions] B.[0,numPartitions-1] C.[1,numPartitions-1] D.[1,numPartitions] 参考答案:B 4. MLlib中进行数据标准化的方式有() A.Normalizer B.Standard C.StandardScaleer D.MinMaxScaler

5. Spark GraphX中类Graph的joinVertices方法可以() A.收集邻居顶点的顶点Id和顶点属性 B.收集邻居顶点的顶点Id C.向指定顶点发送信息并聚合信息 D.将顶点信息更新到图中 参考答案:D 6. Scala列表方法中返回所有元素,除了最后一个的方法是()。 A.drop B.head C.filter D.init 参考答案:D 7. Mllib中线性会馆算法中的参数reParam表示() A.要运行的迭代次数 B.梯度下降的步长 C.是否给数据加干扰特征或者偏差特征 https://www.360docs.net/doc/d419204281.html,sso和ridge的正规化参数 参考答案:D 8. 以下哪个方法可以创建RDD() A.parallelize B.makeRDD C.textFile D.loadFile 参考答案:ABC

2022年南开大学数据科学与大数据技术专业《计算机网络》科目期末试卷A(有答案)

2022年南开大学数据科学与大数据技术专业《计算机网络》科目期末 试卷A(有答案) 一、选择题 1、某IP网络的连接如图所示,在这种配置下IP全局广播分组不能够通过的路径是()。 A.计算机P和计算机Q之间的路径 B.计算机P和计算机S之间的路径 C.计算机Q和计算机R之间的路径 D.计算机S和计算机T之间的路径 2、()不是对网络模型进行分层的目标。 A.提供标准语言 B.定义功能执行的方法 C.定义标准界面 D.增加功能之间的独立性 3、数据段的TCP报头中为什么包含端口号()。 A.指示转发数据段时应使用正确的路由器接口 B.标识接收或转发数据段时应使用的交换机端口 C.让接收主机以正确的顺序组装数据报

D.让接收主机转发数据到适当的应用程序 4、A和B之间建立了TCP连接,A向B发送了一个报文段,其中序号字段seq=300,确认号字段ACK=101,数据部分包含7个字节,那么在B对该报文的确认报文段中()。 A.seq-30l,ACK=101 B.seq=301,ACK=108 C.seq=l01.ACK=101 D.seq=101,ACK=307 5、下列关于交换机的叙述中,正确的是() A.以太网交换机本质上是一种多端口网桥 B.通过交换机互连的一组工作站构成一个冲突域 C.交换机每个端口所连网络构成一个独立的广播域 D.以太网交换机可实现采用不同网络层协议的网络互连 6、以太网在检测到()次冲突后,控制器会放弃发送。 A.10 B.15 C.16 D.17 7、下列编码方式中属于基带传输的是()。 A.FSK B.移相键控法 C.曼彻斯特编码 D.正交幅度相位调制法 8、在下列数据交换方式中,数据经过网络的传输延迟长而且是不固定的,所以不能用于语音数据传输的是()。

相关主题
相关文档
最新文档