《档案管理违法违纪行为处分规定》试题参考答案

一、填空

1、监察部、人力资源社会宝珠、国家档案局

2、各级国家档案馆的档案

3、事业单位工作人员处分暂行规定

4、撤职、开除

5、警告，记过

6、降级或撤职处分

7、开除

8、虚假报告，不及时报告，撤职

9、警告、记过、记大过

10司法机关

二、选择

BCAAA,CBBBC

三、判断

错对错对对

四、简答：

1、（一）行政机关公务员；

（二）法律、法规授权的具有公共事务管理职能的组织中从事公务的人员；

（三）行政机关依法委托从事公共事务管理活动的组织中从事公务的人员；

（四）企业、社会团体中由行政机关任命的人员。

2、（一）档案安全事故发生后，不及时组织抢救的；

（二）档案安全事故发生后，隐瞒不报、虚假报告或者不及时报告的；

（三）档案安全事故发生后，干扰阻挠有关部门调查的。

大数据时代下的数据挖掘试题和答案及解析

A. 变量代换 B. 离散化海量数据挖掘技术及工程实践》题目、单选题(共 80 题) 1) ( D ) 的目的缩小数据的取值范围，使其更适合于数据挖掘算法的需要，并且能够得到和原始数据相同的分析结果。 A. 数据清洗 B. 数据集成 C. 数据变换 D. 数据归约 2) 某超市研究销售纪录数据后发现，买啤酒的人很大概率也会购买尿布，这种属于数据挖掘的哪类问题 (A) A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理 3) 以下两种描述分别对应哪两种对分类算法的评价标准 (A) (a) 警察抓小偷，描述警察抓的人中有多少个是小偷的标准。 (b) 描述有多少比例的小偷给警察抓了的标准。据相分离 (B) 哪一类任务 (C) A. 根据内容检索 B. 建模描述 7) 下面哪种不属于数据预处理的方法 (D) A. Precision,Recall B. Recall,Precision A. Precision,ROC D. Recall,ROC 4) 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务 (C) 5) A. 频繁模式挖掘 C. 数据预处理 B. D. 当不知道数据所带标签时，分类和预测数据流挖掘可以使用哪种技术促使带同类标签的数据与带其他标签的数 6) A. 分类 C. 关联分析建立一个模型， B. D. 聚类隐马尔可夫链通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的 C. 预测建模 D. 寻找模式和规则

C.聚集 D. 估计遗漏值 8) 假设12 个销售价格记录组已经排序如下：5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时，15 在第几个箱子内(B) A. 第一个 B. 第二个 C. 第三个 D. 第四个 9) 下面哪个不属于数据的属性类型：(D) A. 标称 B. 序数 C.区间 D. 相异 10) 只有非零值才重要的二元属性被称作：( C ) A. 计数属性 B. 离散属性 C.非对称的二元属性 D. 对称属性 11) 以下哪种方法不属于特征选择的标准方法：(D) A. 嵌入 B. 过滤 C.包装 D. 抽样 12) 下面不属于创建新属性的相关方法的是：(B) A. 特征提取 B. 特征修改 C. 映射数据到新的空间 D. 特征构造 13) 下面哪个属于映射数据到新的空间的方法(A) A. 傅立叶变换 B. 特征加权 C. 渐进抽样 D. 维归约 14) 假设属性income 的最大最小值分别是12000元和98000 元。利用最大最小规范化的方法将属性的值映射到0 至 1 的范围内。对属性income 的73600 元将被转化为：(D) 15) 一所大学内的各年纪人数分别为：一年级200人，二年级160人，三年级130 人，四年级110 人。则年级属性的众数是：(A) A. 一年级 B. 二年级 C. 三年级 D. 四年级 16) 下列哪个不是专门用于可视化时间空间数据的技术：(B) A. 等高线图 B. 饼图

数据挖掘试题与答案

一、解答题（满分30分，每小题5分） 1. 怎样理解数据挖掘和知识发现的关系？请详细阐述之首先从数据源中抽取感兴趣的数据，并把它组织成适合挖掘的数据组织形式；然后，调用相应的算法生成所需的知识；最后对生成的知识模式进行评估，并把有价值的知识集成到企业的智能系统中。知识发现是一个指出数据中有效、崭新、潜在的、有价值的、一个不可忽视的流程，其最终目标是掌握数据的模式。流程步骤：先理解要应用的领域、熟悉相关知识，接着建立目标数据集，并专注所选择的数据子集；再作数据预处理，剔除错误或不一致的数据；然后进行数据简化与转换工作；再通过数据挖掘的技术程序成为模式、做回归分析或找出分类模型；最后经过解释和评价成为有用的信息。 2. 时间序列数据挖掘的方法有哪些，请详细阐述之时间序列数据挖掘的方法有： 1）、确定性时间序列预测方法:对于平稳变化特征的时间序列来说，假设未来行为与现在的行为有关，利用属性现在的值预测将来的值是可行的。例如，要预测下周某种商品的销售额，可以用最近一段时间的实际销售量来建立预测模型。 2）、随机时间序列预测方法:通过建立随机模型，对随机时间序列进行分析，可以预测未来值。若时间序列是平稳的，可以用自回归(Auto Regressive，简称AR)模型、移动回归模型(Moving Average，简称MA)或自回归移动平均(Auto Regressive Moving Average，简称ARMA)模型进行分析预测。 3）、其他方法:可用于时间序列预测的方法很多，其中比较成功的是神经网络。由于大量的时间序列是非平稳的，因此特征参数和数据分布随着时间的推移而变化。假如通过对某段历史数据的训练，通过数学统计模型估计神经网络的各层权重参数初值，就可能建立神经网络预测模型，用于时间序列的预测。

《大学生就业指导课》教学大纲

徐州工业职业技术学院《就业零距离》――大学生就业指导课教学大纲课程名称：《就业零距离》――大学生就业指导课学时：36学时学分：1 课程类别：文化素质教育考核方式：考查使用教材：〈《就业零距离》大纲编写人：宁军胜编写日期：2008.9.1 大纲审定人：慕东周审定日期：2008.11.1 课程性质：必修课 1.性质、任务：随着我国高等教育事业的跨越式发展，毕业生就业工作也越来越受到社会的关注，如何做好高校毕业生就业指导工作，使之在全面建设小康社会中贡献自己的力量是政府、高校的重要任务。毕业生就业工作是涉及全局的重大问题，解决好了，既有利于社会的稳定，也有利于促进经济发展。我院将大学生就业指导课的教学工作纳入日常的教学计划内。（1）开设就业指导课的任务： 1、指导和帮助学生完毕学业，促进全面发展 2、指导和帮助学生了解职业发展趋势，树立合理的择业观念 3、指导和帮助学生掌握求职对策，促进顺利就业 4、激励学生以新的姿态继续学习，走向成功（2）就业指导课程的教学原则和方法 1、把握理论知识的传授同转变思想观念紧密结合 2、发挥教师的主导作用同发挥学生的自为精神紧密结合 3、坚持一般教育同个别教育紧密结合 2.课程的基本教学内容、要求 1）基本要求：

“大学生就业指导课”由学院思政部、就业处和教务处统一安排，五年制高职班一般在第八学期结束前完成，高中后专科班一般在第五学期结束前完成。总课时为36课时。授课老师在授课过程中应紧密结合当前的就业形势对学生进行教学与指导。本教材以课堂教学为主，各系再安排部分讲座、座谈、主题班会等多种形式开展教学活动。 2）基本内容第一讲：大学生活及职业探索教学目的与要求：通过本节的学习使学生重视学业和能力的培养，树立牢固的专业思想，养成良好的生活习惯，同时认清就业形势，自信、从容面对就业。通过职业和国内外职业发展趋势的学习，帮助同学们做出自己的职业选择。第一章：大学生的就业形势和政策第1节：大学生的就业现状第2节：大学生的就业趋势第3节：大学生的就业政策第二章：职业的基本知识第1节：职业的概述第2节：职业的发展趋势第3节：专业、职业与职业资格证书第二讲：规划职业生涯教学目的与要求：教学目的和要求：通过本章学习，了解职业生涯设计的基本规则同择业观念之间的相互关系，能够科学合理地设计职业生涯，迈好人生道路的关键一步，为实现人生价值打下初步的基础。第四章：大学生职业生涯规划第1节：大学生职业生涯规划的概述第2节：大学生职业生涯规划的程序第3节：大学生职业生涯规划的制定第三讲：洞察就业行情做好职业选择教学目的与要求：通过本章节的学习使学生能够进行合理的自我定位，确定职业目标。第五章：大学生职业素质的培养第1节：职业素质的概述第2节：职业素质的的构成

数据挖掘-题库带答案

数据挖掘-题库带答案 1、最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡() 答案：正确 2、决策将日益基于数据和分析而作出,而并非基于经验和直觉() 答案：错误解析：决策将日益基于数据和分析而作出,而并非基于经验和直觉 3、2011年被许多国外媒体和专家称为“大数据元年”() 答案：错误解析：2013年被许多国外媒体和专家称为“大数据元年” 4、我国网民数量居世界之首,每天产生的数据量也位于世界前列() 答案：正确 5、商务智能的联机分析处理工具依赖于数据库和数据挖掘。() 答案：错误解析：商务智能的联机分析处理工具依赖于数据仓库和多维数据挖掘。 6、数据整合、处理、校验在目前已经统称为 EL() 答案：错误解析：数据整合、处理、校验在目前已经统称为 ETL 7、大数据时代的主要特征() A、数据量大 B、类型繁多 C、价值密度低 D、速度快时效高答案： ABCD 8、下列哪项不是大数据时代的热门技术() A、数据整合 B、数据预处理 C、数据可视化 D、 SQL

答案： D 9、()是一种统计或数据挖掘解决方案,包含可在结构化和非结构化数据中使用以确定未来结果的算法和技术。 A、预测 B、分析 C、预测分析 D、分析预测答案： C 10、大数据发展的前提? 答案：解析：硬件成本的降低,网络带宽的提升,云计算的兴起,网络技术的发展,智能终端的普及,电子商务、社交网络、电子地图等的全面应用,物联网的兴起 11、调研、分析大数据发展的现状与应用领域。? 答案：解析：略 12、大数据时代的主要特征? 答案：解析：数据量大(Volume) 第一个特征是数据量大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。类型繁多(Variety) 第二个特征是数据类型繁多。包括网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。价值密度低(Value) 第三个特征是数据价值密度相对较低。如随着物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何通过强大的机器算法更迅速地完成数据的价值“提纯”,是大数据时代亟待解决的难题。速度快、时效高(Velocity) 第四个特征是处理速度快,时效性要求高。这是大数据区分于传统数据挖掘最显著的特征。 13、列举大数据时代的主要技术? 答案：解析：预测分析: 预测分析是一种统计或数据挖掘解决方案,包含可在结构化和非结构化数据中使用以确定未来结果的算法和技术。可为预测、优化、预报和模拟等许多其他用途而部署。随着现在硬件和软件解决方案的成熟,许多公司利用大数据技术来收集海量数据、训练模型、优化模型,并发布预测模型来提高业务

MySQL数据库考试试题及答案

专业：移动通信科目：MySQL数据库一、单项选择题 1．以下聚合函数求数据总和的是( ) A．MAX B．SUM C．COUNT D．AVG 答案：B 2．可以用( )来声明游标 A．CREATE CURSOR B．ALTER CURSOR C．SET CURSOR D．DECLARE CURSOR 答案：D 3．SELECT语句的完整语法较复杂，但至少包括的部分是( ) A．仅SELECT B．SELECT，FROM C．SELECT，GROUP D．SELECT，INTO 答案：B 4．SQL语句中的条件用以下哪一项来表达( ) A．THEN B．WHILE C．WHERE D．IF 答案：C 5．使用CREATE TABLE语句的( )子句，在创建基本表时可以启用全文本搜索A．FULLTEXT B．ENGINE C．FROM D．WHRER 答案：A 6．以下能够删除一列的是( ) A．alter table emp remove addcolumn B．alter table emp drop column addcolumn C．alter table emp delete column addcolumn D．alter table emp delete addcolumn 答案：B 7．若要撤销数据库中已经存在的表S，可用（）。 A．DELETE TABLE S B．DELETE S C．DROP S D．DROP TABLE S 答案：D

8．查找表结构用以下哪一项( ) A．FIND B．SELETE C．ALTER D．DESC 答案：D 9．要得到最后一句SELECT查询到的总行数，可以使用的函数是( ) A．FOUND_ROWS B．LAST_ROWS C．ROW_COUNT D．LAST_INSERT_ID 答案：A 10．在视图上不能完成的操作是( ) A．查询 B．在视图上定义新的视图 C．更新视图 D．在视图上定义新的表答案：D 11．UNIQUE惟一索引的作用是( ) A．保证各行在该索引上的值都不得重复 B．保证各行在该索引上的值不得为NULL C．保证参加惟一索引的各列，不得再参加其他的索引 D．保证惟一索引不能被删除答案：A 12．用于将事务处理写到数据库的命令是( ) A．insert B．rollback C．commit D．savepoint 答案：C 13．查找条件为：姓名不是NULL的记录( ) A．WHERE NAME ! NULL B．WHERE NAME NOT NULL C．WHERE NAME IS NOT NULL D．WHERE NAME!=NULL 答案：C 14．主键的建立有( )种方法 A．一 B．四 C．二 D．三答案：D 15．在视图上不能完成的操作是( ) A．更新视图数据

数据仓库与数据挖掘课后习题答案

数据仓库与数据挖掘第一章课后习题一：填空题 1）数据库中存储的都是数据，而数据仓库中的数据都是一些历史的、存档的、归纳的、计算的数据。 2）数据仓库中的数据分为四个级别：早起细节级、当前细节级、轻度综合级、高度综合级。3）数据源是数据仓库系统的基础，是整个系统的数据源泉，通常包括业务数据和历史数据。4）元数据是“关于数据的数据”。根据元数据用途的不同将数据仓库的元数据分为技术元数据和业务元数据两类。 5）数据处理通常分为两大类：联机事务处理和联机事务分析 6）Fayyad过程模型主要有数据准备，数据挖掘和结果分析三个主要部分组成。 7）如果从整体上看数据挖掘技术，可以将其分为统计分析类、知识发现类和其他类型的数据挖掘技术三大类。 8）那些与数据的一般行为或模型不一致的数据对象称做孤立点。 9）按照挖掘对象的不同，将Web数据挖掘分为三类：web内容挖掘、web结构挖掘和web 使用挖掘。 10）查询型工具、分析型工具盒挖掘型工具结合在一起构成了数据仓库系统的工具层，它们各自的侧重点不同，因此适用范围和针对的用户也不相同。二：简答题 1）什么是数据仓库？数据仓库的特点主要有哪些？数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合，用于支

持管理决策。主要特点：面向主题组织的、集成的、稳定的、随时间不断变化的、数据的集合性、支持决策作用 2）简述数据挖掘的技术定义。从技术角度看，数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中，提取隐含在其中的、人们不知道的、但又是潜在有用的信息和知识的过程。 3）什么是业务元数据？业务元数据从业务角度描述了数据仓库中的数据，它提供了介于使用者和实际系统之间的语义层，使得不懂计算机技术的业务人员也能够读懂数据仓库中的数据 4）简述数据挖掘与传统分析方法的区别。本质区别是：数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先前未知、有效和实用三个特征。 5）简述数据仓库4种体系结构的异同点及其适用性。 a.虚拟的数据仓库体系结构 b.单独的数据仓库体系结构 c.单独的数据集市体系结构 d.分布式数据仓库结构

SQL试题及答案

模拟测验1 一、选择题（在每个小题四个备选答案中选出一个正确答案，填在题末的括号中）（本大题共10小题，每小题2分，总计20分） 1.（）是位于用户与操作系统之间的一层数据管理软件，它属于系统软件，它为用户或应用程序提供访问数据库的方法。数据库在建立、使用和维护时由其统一管理、统一控制。 A．DBMS B．DB C．DBS D．DBA 2.下列四项中，不属于SQL2005实用程序的是（）。 A.对象资源管理器 B.查询分析器 C.服务管理器 D.媒体播放器 3.SQL Server安装程序创建4个系统数据库，下列哪个不是（）系统数据库。 A.master B.model C.pub D.msdb 4.下列哪个不是sql数据库文件的后缀。 A．.mdf B．.ldf C．.tif D．.ndf 5.SQL语言允许使用通配符进行字符串匹配的*作，其中‘%’可以表示（） A.零个字符 B.1个字符串 C.多个字符串 D.以上都是 6.SQL语言中，条件年龄BETWEEN15AND35表示年龄在15至35之间，且()。 A.包括15岁和35岁 B.不包括15岁和35岁 C.包括15岁但不包括35岁 D.包括35岁但不包括15岁 7.SQL的视图是从（）中导出的。 A.基本表 B.视图 C.基本表或视图 D.数据库

8.在SQL语言中，建立存储过程的命令是() A、CREATE PROCEDURE B、CREATE RULE C、CREATE DURE D、CREATE FILE 9.SQL语言中，删除表中数据的命令是()。 A.DELETE B.DROP C.CLEAR D.REMOVE 10.在MS SQL Server中，用来显示数据库信息的系统存储过程是()。 A.sp_dbhelp B.sp_db C.sp_help D.sp_helpdb 二、简答题（16分） 1、什么是游标？使用游标的步骤？ 2、什么是事务？事务的基本属性是什么？三、应用题 1、创建一个名字为ks的数据库，包含一个数据文件和一个日志文件，逻辑文件名为ks_data,磁盘文件名为ks_data.mdf，文件初始容量为5MB，最大容量为10MB，文件递增量为1MB；而事务日志文件的逻辑文件名ks_log，磁盘文件名为ks_log.ldf，文件初始容量为1MB，最大容量为5MB，文件递增量为1MB（数据库创建在C：\SERVER文件夹下）（10分） 2、假设ks数据库有以下三张表，请写出下列问题的SQL语句：（每题6分，共54分）学生（学号，姓名，年龄，性别）课程（课程号，课程名，任课教师）成绩（学号，课程号，成绩）（1）如何在SQL Server上创建这三张表；（2）查询刘峰教师所授课程号，课程名；（3）查询年龄大于20岁的所有男同学的学号、姓名；（4）查询王文芳同学选修的所有课程的课程号；

大学生就业指导课考试答案

1.什么是派遣，毕业生派遣的原则；毕业生落实工作单位的可以派遣，但必须在“报到证”上注明，在规定时间内无接收单位的，由学校将其档案，户口关系转到生源所在地，自谋职业。择业期内未落实就业单位的毕业生，派遣回生源地之后落实具体单位，由生源地毕业生就业主管部门再进行派遣的过程，称为二次派遣。原则：学校依据毕业生提供的毕业去向有效证明（就业协议书、录取通知书或调档函）以及在山东高校毕业生就业信息网上的注册信息（注册办法另行通知）形成就业方案，报经省就业主管部门审批后，核发就业报到证。升学、缓派的毕业生不发放报到证；签约后不确定能否升学被录取的，根据个人意愿直接派至用人单位或录取学校；未签约的非师范类毕业生，生源地为山东省内的派至生源地地市人事局，省外生源的派至省一级毕业生就业主管部门。 2.什么是改派，改派手续是什么改派是已派遣到具体用人单位的毕业生因身体不能适应某项工作或其它原因，由毕业生本人提出申请，原接收单位或市地、县（市）同意，报经毕业生就业主管部门批准，调整工作单位的一种派遣方式。手续：申请办理改派的，应承担违约责任，并提供以下材料：（1）放行函（退函）。原接收单位及主管部门出具的、同意毕业生另行择业的函（说明辞退原因）；（2）接收函。新接收单位出具的经上级主管部门签章同意接收毕业生的函（就业协议书）；（3）个人改派申请和原报到证。凭材料按下列原则办理：（1）不跨地市调整改派的，直接到地市就业主管部门办理；（2）跨地市改派的，由两地市就业主管部门协调办理，不再报省就业主管部门审批；（3）由市地改派至省、部队、中央驻鲁单位或省外单位的，持上述材料至省就业主管部门办理手续。改派毕业生的户籍关系如何办理？未在原接收单位所在地落户的，由毕业生持改派后的就业报到证、原户口迁移证到原就读学校主管部门办理户口改迁；已在原接收单位所在地落户的，由毕业生持改派后的就业报到证到当地派出所办理户口迁出手续。 3.什么是《报到证》，在期限内丢失如何办理补办报到证是由教育部统一印制，经山东省人事厅高等学校毕业生就业主管部门签发的报到凭证，其全称是《全国普通高等学校本专科毕业生就业报到证》和《全国毕业研究生就业报到证》。用人单位以报到证为依据，接收毕业生并接转毕业生的人事档案、户口。《报到证》只能一人一份，由其他部门印制或签发的报到证无效。毕业生对报到证要妥善保管，凡自行涂改、撕毁，一律作废。遗失就业报到证的，应持接收单位证明及时到当地或就读学校所在地日报登报挂失，并持报纸、个人申请、毕业证、学位证向学校就业指导中心提出申请，并办理录简表和就业方案复印件（须加盖学校招办、就业指导中心的公章），然后由学校或毕业生本人自行到省级就业主管部门申请补发。毕业生《报到证》有何作用？（1）毕业生到用人单位就业时，须持《报到证》，用人单位凭《报到证》为毕业生办理相关手续。（2）单位所在地公安部门凭《报到证》为毕业生办理落户手续。（3）学校相关部门依据《报到证》为毕业生办理档案投递，组织关系转移和户籍迁移等手续。

(完整word版)数据挖掘题目及答案

一、何为数据仓库？其主要特点是什么？数据仓库与KDD的联系是什么？数据仓库是一个面向主题的（Subject Oriented）、集成的（Integrate）、相对稳定的（Non-Volatile）、反映历史变化（Time Variant）的数据集合，用于支持管理决策。特点： 1、面向主题操作型数据库的数据组织面向事务处理任务，各个业务系统之间各自分离，而数据仓库中的数据是按照一定的主题域进行组织的。 2、集成的数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的，必须消除源数据中的不一致性，以保证数据仓库内的信息是关于整个企业的一致的全局信息。 3、相对稳定的数据仓库的数据主要供企业决策分析之用，一旦某个数据进入数据仓库以后，一般情况下将被长期保留，也就是数据仓库中一般有大量的查询操作，但修改和删除操作很少，通常只需要定期的加载、刷新。 4、反映历史变化数据仓库中的数据通常包含历史信息，系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息，通过这些信息，可以对企业的发展历程和未来趋势做出定量分析和预测。所谓基于数据库的知识发现（KDD）是指从大量数据中提取有效的、新颖的、潜在有用的、最终可被理解的模式的非平凡过程。数据仓库为KDD提供了数据环境，KDD从数据仓库中提取有效的，可用的信息二、数据库有4笔交易。设minsup=60%，minconf=80%。 TID DATE ITEMS_BOUGHT T100 3/5/2009 {A, C, S, L} T200 3/5/2009 {D, A, C, E, B} T300 4/5/2010 {A, B, C} T400 4/5/2010 {C, A, B, E} 使用Apriori算法找出频繁项集，列出所有关联规则。解：已知最小支持度为60%，最小置信度为80% 1）第一步，对事务数据库进行一次扫描，计算出D中所包含的每个项目出现的次数，生成候选1-项集的集合C1。

数据库试题及答案_

笔试样卷一参考答案一、简答题（25分） 1．数据库阶段数据管理的主要特点是什么？ 2．解释DB、DBMS、DBS三个概念？ 3．什么是物理数据独立性和逻辑数据独立性？ 4．试说明DBMS的主要功能？ 5．在ER模型转换为关系模型时，联系类型要根据不同的情况作不同的处理，试说明之。二、计算题（20分） 1．设有关系R和S R： S： A B C A B C 3 6 7 3 4 5 2 5 7 7 2 3 7 3 4 4 4 3 列表计算R∪S、R－S、R×S、π 3,2(S)、δ B<5 (R)。（5分） 2．设有三个关系 S (SNO, SNAME, AGE, SEX, SDEPT) SC (SNO, CNO, GRANDE) C (CNO, CNAME, CDEPT, TNAME) 试用关系代数表达式表示下列查询

（1）检索LIU老师所授课程的课程号、课程名（2）检索年龄大于23岁的男学生的学号和姓名（3）检索学号为S3的学生所学课程的课程名和认课教师姓名（4）检索WANG同学不学的课程的课程号（5）检索至少选修了两门课程的学生的学号（10分）三、设有三个基本表（45分） S (SNO, SNAME, AGE, SEX, SDEPT) SC (SNO, CNO, GRANDE) C (CNO, CNAME, CDEPT, TNAME) 1．试用T-SQL的查询语句表达下列查询（1）检索LIU老师所授课程的课程号、课程名（2）检索年龄大于23岁的男学生的学号和姓名（3）检索学号为S3的学生所学课程的课程名和认课教师姓名（4）检索WANG同学不学的课程的课程号（5）检索至少选修了两门课程的学生的学号（10分） 2．试用T-SQL的查询语句表达下列查询（1）统计有学生选修的课程的门数（2）求选修C4课程的学生的年龄（3）求LIU老师所授课程的每门课程的学生的平均成绩（4）统计每门课程的学生选修人数（5）求年龄大于所有女同学年龄的男学生的姓名和年龄（10分）3．试用T-SQL更新语句完成下列更新操作（1）往表S中插入一个学生资料（‘S9’, ‘WU’, 18）

数据挖掘试卷及答案

12/13 年第2学期《数据挖掘与知识发现》期末考试试卷及答案一、什么是数据挖掘？什么是数据仓库？并简述数据挖掘的步骤。（20分）数据挖掘是从大量数据中提取或发现（挖掘）知识的过程。数据仓库是面向主题的、集成的、稳定的、不同时间的数据集合，用于支持经营管理中的决策制定过程。步骤： 1）数据清理（消除噪声或不一致数据） 2) 数据集成（多种数据源可以组合在一起） 3 ) 数据选择（从数据库中检索与分析任务相关的数据） 4 ) 数据变换（数据变换或统一成适合挖掘的形式，如通过汇总或聚集操作） 5) 数据挖掘（基本步骤，使用智能方法提取数据模式） 6) 模式评估（根据某种兴趣度度量，识别表示知识的真正有趣的模式；） 7) 知识表示（使用可视化和知识表示技术，向用户提供挖掘的知识）二、元数据的定义是什么？元数据包括哪些内容？（20分）元数据是关于数据的数据。在数据仓库中, 元数据是定义仓库对象的数据。元数据包括：数据仓库结构的描述，包括仓库模式、视图、维、分层结构、导出数据的定义, 以及数据集市的位置和内容。操作元数据，包括数据血统（移植数据的历史和它所使用的变换序列）、数据流通（主动的、档案的或净化的)、管理信息（仓库使用统计量、错误报告和审计跟踪）。汇总算法，包括度量和维定义算法, 数据所处粒度、划分、主题领域、聚集、汇总、预定义的查询和报告。由操作环境到数据仓库的映射，包括源数据库和它们的内容，网间连接程序描述, 数据划分, 数据提取、清理、转换规则和缺省值, 数据刷新和净化规则, 安全 (用户授权和存取控制)。关于系统性能的数据，刷新、更新定时和调度的规则与更新周期，改善数据存取和检索性能的索引和配置。商务元数据，包括商务术语和定义, 数据拥有者信息和收费策略。三、在 O L A P 中，如何使用概念分层? 请解释多维数据模型中的OLAP上卷下钻切片切块和转轴操作。（20分）在多维数据模型中，数据组织成多维，每维包含由概念分层定义的多个抽象层。这种组织为用户从不同角度观察数据提供了灵活性。有一些 O L A P 数据立方体操作用来物化这些不同视图，允许交互查询和分析手头数据。因此， O L A P 为交互数据分析提供了友好的环境。上卷：上卷操作通过一个维的概念分层向上攀升或者通过维归约，在数据立方体上进行聚集。下钻：下钻是上卷的逆操作，它由不太详细的数据到更详细的数据。下钻可以通过沿维的概念分层向下或引入新的维来实现。切片：在给定的数据立方体的一个维上进行选择，导致一个子方。切块：通过对两个或多个维执行选择，定义子方。

数据挖掘离线作业

浙江大学远程教育学院《数据挖掘》课程作业姓名：学号：年级：学习中心：————————————————————————————— 第一章引言一、填空题（1）数据库中的知识挖掘(KDD)包括以下七个步骤：数据清理、数据集成、数据选择、数据交换、数据挖掘、模式评估和知识表示（2）数据挖掘的性能问题主要包括：算法的效率、可扩展性和并行处理（3）当前的数据挖掘研究中，最主要的三个研究方向是：统计学、数据库技术和机器学习（4）孤立点是指：一些与数据的一般行为或模型不一致的孤立数据二、简答题（1）什么是数据挖掘？答：数据挖掘指的是从大量的数据中挖掘出那些令人感兴趣的、有用的、隐含的、先前未知的和可能有用的模式或知识。（2）一个典型的数据挖掘系统应该包括哪些组成部分？答：一个典型的数据挖掘系统应该包括以下部分：1、数据库、数据仓库或其他信息库，2、数据库或数据仓库服务器，3、知识库，4、数据挖掘引擎，5、模式评估魔磕，6图形用户界面。（3）Web挖掘包括哪些步骤？答：数据清理：（这个可能要占用过程60%的工作量）、数据集成、将数据存入数据仓库、建立数据立方体、选择用来进行数据挖掘的数据、数据挖掘（选择适当的算法来找到感兴趣的模式）、展现挖掘结果、将模式或者知识应用或者存入知识库。（4）请列举数据挖掘应用常见的数据源。（或者说，我们都在什么样的数据上进行数据挖掘）答：常见的数据源包括关系数据库、数据仓库、事务数据库和高级数据库系统和信息库。其中高级数据库系统和信息库包括：空间数据库、时间数据库和时间序列数据库、流数据、多媒体数据库、面向对象数据库和对象——关系数据库、异种数据库和遗产数据库、文本数据库和万维网等。

数据库知识试题及答案

数据库基础知识试题及答案－、单项选择题。下列各题A）、B）、C）、D）四个选项中，只有－个选项是正确的。（1）在数据库技术中，实体－联系模型是一种( ) A）概念数据模型 B）结构数据模型 C）物理数据模型 D）逻辑数据模型答案：A）解析：概念模型是对信息世界建模，所以概念模型应该能够方便、准确地表示信息世界中的常用概念。概念模型的表示方法很多，其中最为常用的是P．P．Chen于1976后提出的实体一联系方法。该方法用E—R图来描述现实世界的概念模型，称为实体一联系模型（Entity－ Relationship Model）简称E —R模型。（2）假定学生关系是S（S＃，SNAME，SEX，AGE），课程关系是C（C＃，CNAME，TEACHER），学生选课关系是SC（S＃，C＃，GRADE），要查找选修“COMPUTER”课程的女学生的姓名，将涉及到关系( ) A）S B）SC，C C）S，SC D）S，C，SC 答案：D）解析：选修“COMPUTER”课程的女学生的姓名，涉及的字段有课程名称、学生姓名、学生性别和选课关系，这些分别存放在S，C，SC这3个关系中。（3）数据是信息的符号表示或称载体；信息则是数据的内涵，是数据的( ) A）语法解释 B）语义解释 C）语意说明 D）用法说明答案：B）解析：数据是信息的符号表示或称载体；信息则是数据的内涵，是数据的语义解释。（4）数据管理技术发展阶段中，人工管理阶段与文件系统阶段的主要区别是文件系统( ) A）数据共享性强 B）数据可长期保存 C）采用一定的数据结构 D）数据独立性好答案：B）解析：人工管理阶段的特点是：数据不保存，数据无专门软件管理，数据不共享．数据不具有独立性。文件系统阶段特点是：数据可以长期保存，文件系统管理数据，数据独立性差，数据共享性差。（5）下列关于关系数据模型的术语中，哪一个术语所表达的概念与二维表中的“行”的概念最接近？( ) A）属性 B）关系 C）域 D）元组答案：D）解析：二维表中的“行”即关系数据模型中的“元组”，二维表中的“列”即关系数据模型中的“属性”。（6）在下面的两个关系中，学号和班级号分别为学生关系和班级关系的主键（或称主码），则外键是( ) 学生（学号，姓名，班级号，成绩）班级（班级号，班级名，班级人数，平均成绩） A）学生关系的“学号” B）班级关系的“班级号” C）学生关系的“班级号” D）班级关系的“班级名” 答案：C）解析：外键的概念是：当关系中的某个属性（或属性组合）虽不是该关系的关键字或只是关键字的一部分，但却是另一个关系的关键字时，则称该属性（或属性组合）为这个关系的外部关键字或外键。（7）在FoxBASE中要建立一个与现有的某个数据库有完全相同结构和数据的新数据库，应该使用如下语句中的哪个语句？( ) A）CREATE B）APPEND C）COPY D）INSERT 答案：C）解析：CREATE用于数据定义，COPY用于复制，INSERT用于插入数据。（8）关系数据模型通常由3部分组成，它们是( ) A）数据结构，数据通信，关系操作 B）数据结构，数据操作，数据完整性约束 C）数据通信，数据操作，数据完整性约束 D）数据结构，数据通信，数据完整性约束答案：B）解析：关系模型由关系数据结构、数据操作和数据完整性约束3大要素组成。（9）SQL语言集数据定义功能、数据操纵功能和数据控制功能于一体。如下所列语句中，哪一个是属于数据控制功能的？( ) A）GRANT B）CREATE C）INSERT D）SELECT 答案：A）解析：CREATE属于数据定义语句，INSERT和SELECT属于数据操纵语句，只有GRANT（授权语句）才是数据控制语句。（10）如果有两个事务，同时对数据库中同一数据进行操作，不会引起冲突的操作是( ) A）其中有一个是DELETE B）一个是SELECT，另一个是UPDATE

大学生就业指导网络课考试答案

1 当产品生命周期快进入衰退期的时候不应该做的是（）。（1.0分）1.0分A、增加新特性B、开发新用途C、降低生产成本D、开拓新市场正确答案： C 我的答案：C 2 下列关于成功创业者特征的描述，错误的是（）。（1.0分）1.0分A、自主性强，不愿意受约束。 B、爱好广泛，做事往往没有特定目标。C、自控力强，能自我管理。D、善于发现机会，有商业直觉。正确答案：B 我的答案：B 3关于创业计划书的功能，下列说法错误的是（）。（1.0分）1.0分A、创业计划书是创业的起点和基础B、计划越周密，成功可能性越大C、创业计划书能够体现企业至少十年的发展规划D、创业计划书有助于风险防范正确答案： C 我的答案：C 4下列哪一项不应该出现在创业计划书的第一页？（）（1.0分）1.0分A、介绍公司名称 B、创建者名字 C、公司图标 D、机会与目标市场正确答案： D 我的答案：D 5对市场前景的分析可以通过以下哪个手段进行调查？（）（1.0分）1.0分 A、百度百科

B、市场预估 C、问卷调研 D、银行流水正确答案：C 我的答案：C 6创业行为的产生受（）驱动。（1.0分）1.0分A、社会环境B、市场行情 C、创业者的动机 D、资金链正确答案： C 我的答案：C 7机会是指那些可以建成企业并且创业成功的创意，下列选项中对创业机会的特征描述错误的是（）。（1.0分）1.0分A、符合趋势B、发现问题C、持久性D、真实需求正确答案： B 我的答案：B 8新建企业的选址应该考虑的因素不包括（）。（1.0 分）1.0分A、靠近目标客户B、租金可以承受C、阴阳风水D、符合国家政策正确答案： C 我的答案：C 9企业生命周期中最危险的阶段是（）。（1.0分）1.0分A、婴儿期B、青春期C、盛年期 D、官僚期正确答案： C 我的答案：C 10计划书应该具备的特点不包括（）。（1.0分）1.0分A、简明扼要B、逻辑性强C、具有可行性

数据挖掘在线作业

数据挖掘您的本次作业分数为：95分单选题 1.【第001章】孤立点挖掘适用于下列哪种场合？ A 目标市场分析 B 购物篮分析 C 模式识别 D 信用卡欺诈检测正确答案:D 单选题 2.【第01章】数据挖掘应用和一些常见的数据统计分析系统的最主要区别在于（）。 A 所涉及的算法的复杂性 B 所涉及的数据量 C 计算结果的表现形式 D 是否使用了人工智能技术正确答案:B 单选题 3.【第01章】帮助市场分析人员从客户的基本信息库中发现不同的客户群，通常所使用的数据挖掘功能是（）。 A 关联分析 B 分类和预测 C 聚类分析 D 孤立点分析 E 演变分析正确答案:C 单选题 4.【第01章】假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述，通常所使用的数据挖掘功能是（）。 A 关联分析 B 分类和预测

C 孤立点分析 D 演变分析 E 概念描述正确答案:E 单选题 5.【第01章】下面的数据挖掘的任务中，（）将决定所使用的数据挖掘功能。 A 选择任务相关的数据 B 选择要挖掘的知识类型 C 模式的兴趣度度量 D 模式的可视化表示正确答案:B 单选题 6.【第01章】根据顾客的收入和职业情况，预测他们在计算机设备上的花费，所使用的相应数据挖掘功能是（）。 A 关联分析 B 分类和预测 C 演变分析 D 概念描述正确答案:B 单选题 7.【第01章】下列几种数据挖掘功能中，（）被广泛的应用于股票价格走势分析。 A 关联分析 B 分类和预测 C 聚类分析 D 演变分析正确答案:D 单选题 8.【第01章】下列几种数据挖掘功能中，（）被广泛的用于购物篮分析。 A 关联分析

常见SQL数据库面试题和答案(一)

常见SQL数据库面试题和答案(一) Student(S#,Sname,Sage,Ssex) 学生表S#：学号；Sname：学生姓名；Sage：学生年龄；Ssex：学生性别 Course(C#,Cname,T#) 课程表C#,课程编号；Cname：课程名字；T#：教师编号 SC(S#,C#,score) 成绩表S#：学号；C#,课程编号；score：成绩 Teacher(T#,Tname) 教师表T#：教师编号；Tname：教师名字问题： 1、查询“001”课程比“002”课程成绩高的所有学生的学号； select # from (select s#,score from SC where C#='001') a,(select s#,score from SC where C#='002') b where > and #=#; 2、查询平均成绩大于60分的同学的学号和平均成绩； select S#,avg(score) from sc group by S# having avg(score) >60; 3、查询所有同学的学号、姓名、选课数、总成绩； select #,,count#),sum(score) from Student left Outer join SC on #=# group by #,Sname 4、查询姓“李”的老师的个数； select count(distinct(Tname)) from Teacher where Tname like '李%'; 5、查询没学过“叶平”老师课的同学的学号、姓名； select #, from Student where S# not in (select distinct( #) from SC,Course,Teacher where #=# and #=# and ='叶平'); 6、查询学过“001”并且也学过编号“002”课程的同学的学号、姓名； select #, from Student,SC where #=# and #='001'and exists( Select * from SC as SC_2 where #=# and #='002'); 7、查询学过“叶平”老师所教的所有课的同学的学号、姓名； select S#,Sname from Student where S# in (select S# from SC ,Course ,Teacher where #=# and #=# and ='叶平' group by S# having count#)=(select count(C#) from Course,Teacher where #=# and Tname='叶平')); 8、查询课程编号“002”的成绩比课程编号“001”课程低的所有同学的学号、姓名；Select S#,Sname from (select #,,score ,(select score from SC SC_2 where #=# and #='002') score2

大数据时代下的数据挖掘试题及答案

《海量数据挖掘技术及工程实践》题目一、单选题（共80题） 1)( D )的目的缩小数据的取值范围，使其更适合于数据挖掘算法的需要，并且能够得到和原始数据相同的分析结果。 A.数据清洗 B.数据集成 C.数据变换 D.数据归约 2)某超市研究销售纪录数据后发现，买啤酒的人很大概率也会购买尿布，这种属于数据挖掘的哪类问题(A) 3) A. 关联规则发现 B. 聚类 4) C. 分类 D. 自然语言处理 5)以下两种描述分别对应哪两种对分类算法的评价标准 (A) 6) (a)警察抓小偷，描述警察抓的人中有多少个是小偷的标准。 7) (b)描述有多少比例的小偷给警察抓了的标准。 8) A. Precision,Recall B. Recall,Precision 9) A. Precision,ROC D. Recall,ROC 10)将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务 (C) 11) A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘 12)当不知道数据所带标签时，可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离(B) 13) A. 分类 B. 聚类 C. 关联分析 D. 隐马尔可夫链 14)建立一个模型，通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务(C) 建模描述 B. 根据内容检索 A. 15)． 16) C. 预测建模 D. 寻找模式和规则 17)下面哪种不属于数据预处理的方法 (D) 18) A.变量代换 B.离散化 C.聚集 D.估计遗漏值 19)假设12个销售价格记录组已经排序如下：5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频（等深）划分时，15在第几个箱子内 (B) 20) A.第一个 B.第二个 C.第三个 D.第四个 21)下面哪个不属于数据的属性类型：(D) 22) A.标称 B.序数 C.区间 D.相异