商务智能复习题
南开大学《商务智能方法与技术》19秋期末考核作业资料答案

《商务智能方法与技术》20秋期末考核-复习资料学校:南开大学一、单选题 (共 15 道试题,共 30 分)【题目】)是一种以规范化的方式构造端到端的业务流程为中心,以持续地提高组织绩效为目的的系统化方法A.知识管理B.方法管理C.信息化管理D.业务流程管理[解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:D【题目】识和信息最主要的区别是A.知识比信息重要B.知识比信息更容易被组织C.信息系统比知识系统昂贵D.信息是某种事实而知识是某种经验[解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:D【题目】)存储格式一般比较适合于需要总结数据的查询有较快的响应时间,同时基数据的量又比较大的场合。
A.ServerOLAPB.ROLAPC.MOLAPD.HOLAP[解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:D【题目】种数据库工具采用矩阵方式来存储数据。
A.都不是B.桌面型数据库工具C.多维数据库工具(MOLAP)D.关系型数据库工具(ROLAP)[解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:C【题目】)针对包括Web页面内容、页面结构和用户访问信息等在内的各种Web数据,应用数据挖掘方法发现有用的知识帮助人们从大量Web文档集中发现隐藏的模式A.结构挖掘B.文本挖掘C.内容挖掘D.使用挖掘[解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:B【题目】LAP系统应能处理与应用有关的任何逻辑分析和统计分析,此描述是指OLAP的哪个特性。
A.快速性B.多维性C.可分析性D.信息性[解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:C【题目】)是基于网页内容或其描述中抽取知识的过程A.结构挖掘B.内容挖掘C.使用(日志)挖掘D.个性挖掘[解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:B【题目】)根据文本的不同特征划分为不同的类A.都可以B.文本聚类C.文本概括D.文本分类[解析:此题是必答题,根据所学知识,完成作业]本题参考答案是:B【题目】据仓库系统组成中,哪个部件是把数据从源数据中提取出来,依定义部件的规则将不同数据格式的源数据转换成数据仓库的数据格式并装载进数据仓库。
复习范围商务智能

一、选择题(5道,10分) 二、判断题(10道,10分) 三、名词解释(4道,20分)商务智能 数据仓库 数据挖掘 绩效管理企业经营分析系统. 平衡计分卡 数据规范化 ROLAP 决策树四、简答题(5道,30分)1. 简述数据、信息和知识之间的关系。
2. 画出商务智能的系统架构图,实现其功能的三大技术是什么?3. 实现商务智能的四个阶段是什么?4. 何谓数据仓库?为什么要建立数据仓库?5. 简述OLAP 与数据挖掘的区别和联系。
6. 简述OLAP 的基本操作有哪些?7. 简述数据挖掘从技术角度的定义和含义。
8. 何谓数据挖掘?它有哪些方面的功能?9. 在数据挖掘之前为什么要对原始数据进行预处理? 10. 简述构造智能CRM 系统的完整步骤。
11. 简述智能CRM 系统的特点。
12. 影响客户流失的因素有哪些?13. 简述客户流失模型的建立和应用过程。
14. 简述K-近邻分类法的基本思想。
15. 主成分分析法的基本思想是什么?16. 什么是决策树?ID3算法的步骤是什么? 17. 简述K-近邻分类法的基本思想。
18. 关联规则挖掘能发现什么知识?简述关联规则挖掘的基本步骤。
19. 什么是绩效管理?目的是什么?20. 什么是平衡计分卡?设计平衡计分卡的目的是什么? 五、计算题(10分)给定如下要进行聚类的元组:{3,5,11,13,4,21,31,12,26},假设分为2类,即K 1=2,初始时用前两个数值作为类的均值:m=3 和 m=5。
假设给定如下元组:{3,5,11,13,4,21,31,12,26}已分为两类:K1={3,4,5,110,12,13} 和 K2={21,31,26},应用K-近邻法判断元组x=16属于哪一类?设K=3,写出判断过程。
T )X ,X ,X (X 321=的协方差矩阵⎪⎪⎪⎭⎫ ⎝⎛--=200052021A 的特征值和特征向量分别为:)0,924.0,383.0(e 83.5T11-==,λ,)1,0,0(e 00.2T 22==,λ,)0,383.0,924.0(e 17.0T33==,λ,求X 的主成分,计算其贡献率。
商务智能习题答案

商务智能习题答案商务智能习题答案商务智能(Business Intelligence,简称BI)是一种通过收集、分析和处理大量数据来辅助企业决策的技术和方法。
在当今信息化的时代,商务智能已经成为企业管理的重要工具之一。
下面将针对商务智能的一些习题进行解答,帮助读者更好地理解和应用商务智能。
1. 商务智能的基本概念是什么?商务智能是指通过从海量数据中提取有价值的信息,帮助企业管理者做出准确决策的一种技术和方法。
它包括数据仓库、数据挖掘、数据分析等多个方面的内容,旨在帮助企业发现潜在的商机,优化业务流程,提高经营效益。
2. 商务智能的主要应用领域有哪些?商务智能的应用领域非常广泛,包括但不限于以下几个方面:- 销售和市场营销:通过对销售数据的分析,帮助企业了解市场需求、产品销售情况,提供决策支持,制定更有效的营销策略。
- 客户关系管理:通过分析客户数据,了解客户的喜好和需求,提供个性化的服务和产品,增强客户满意度和忠诚度。
- 供应链管理:通过对供应链数据的分析,帮助企业优化供应链流程,提高供应链效率,降低成本。
- 财务管理:通过对财务数据的分析,帮助企业了解财务状况,进行财务预测和风险评估,提供决策依据。
- 人力资源管理:通过对人力资源数据的分析,帮助企业进行人力资源规划、员工绩效评估和人才管理,提高人力资源管理效果。
3. 商务智能的实施过程包括哪些步骤?商务智能的实施过程一般包括以下几个步骤:- 需求分析:明确企业的需求和目标,确定需要分析的数据和指标。
- 数据采集和清洗:收集和整理各种数据源的数据,进行数据清洗和预处理,确保数据的准确性和完整性。
- 数据仓库建设:设计和构建数据仓库,将数据存储在统一的数据库中,以便进行后续的分析和挖掘。
- 数据分析和挖掘:使用商务智能工具和技术对数据进行分析和挖掘,提取有价值的信息和模式。
- 报告和可视化:将分析结果以报表、图表等形式呈现,便于管理者理解和使用。
商务智能复习

商务智能复习商务智能第第1 章商务智能概述1.1 商业决策需要商务智能一、数据、信息和知识1、数据:符号、事实和数字信息:有用的数据关系:信息是经过某种加工处理后的数据,是反映客观事物规律的一些数据。
数据是信息的载体, 信息是对数据的解释。
知识:对信息内容进行提炼、比较、挖掘、分析、概括、判断和推论。
2、决策离不开信息、知识①决策需要信息,更离不开知识;知识更多地表现为经验__学习的结晶;学习的过程是不断地对信息加工处理;信息的收集、加工、传输与利用贯穿着决策各阶段的工作过程。
②信息已成为企业经营中重要性仅次于人才的第二大要素。
③决策=信息+经验+冒险④商务智能是对企业信息的科学管理。
3、商务智能支持商业决策商务智能如何创造知识和价值1.2 商务智能简介商务智能这一术语1996年由Gartner 公司的分析师Howard Dresner首次提出,他提出商务智能描述了一系列的概念和方法,通过应用基于事实的支持系统来辅助商业决策的制定。
一、商务智能概念商务智能是整合了先进信息技术与创新管理理念的结合体,集成了企业内外的数据,进行加工并从中提取能够创造商业价值的信息,面向企业战略并服务于管理层、业务层,指导企业经营决策,提升企业竞争力,涉及企业战略、管理思想、业务整合和技术体系等层面,促进信息到知识再到利润的转变,从而实现更好的绩效。
①先进信息技术:商务智能是多项技术的综合应用;②集成了企业内外的数据,进行加工并从中提取能够创造商业价值的信息:商务智能的层次;③企业战略:商务智能服务于企业战略;④管理层、业务层:商务智能用户多样性;⑤更好的绩效:商务智能提升企业绩效。
二、商务智能的价值1、在商务智能背后有一些商业驱动力,如:①增加收入,减少费用和更有效地竞争的需求。
②管理和模拟当前商业环境复杂性的需求。
③减少IT 费用和利用已有公司业务信息的需求。
2、商务智能的价值①制定合适的市场营销策略;②改善顾客智能;③经营成本与收入分析;④提高风险管理能力;⑤改善业务洞察力;⑥提高市场响应能力。
商务智能配套习题

考核样题1、讨论你所在的工作岗位对商务智能(数据分析和数据挖掘)有何需求?2、案例分析:阅读下面的案例,分析产生问题的原因并给出对策。
一位新上任的大型国企老总曾经表达过这样的困惑。
当他向下属提出,希望查看近十年企业的生产和运营数据时,他手边得到了各种各样不同的数据报表。
这些数据报表大致可以分成两种类型:一种是两年前,即ERP上线之前的,这是一些简单、杂乱而又枯燥的数据。
另一种是有了ERP以后的,数据变得清楚而有条理,但仍然有来自ERP、CRM、SCM以及计费业务等不同应用的数据和各种分析报告。
在仔细查看这些报表之后,这位国企老总惊讶地发现,不同的系统可以得出截然相反的两种结论。
例如某一产品,它的动态成本反映在ERP系统和CRM、SCM系统中相差很大,如果引用ERP和CRM里面的数据,它就是一款很成功、销量很好的产品,但在SCM中,它的采购和物流成本过高,导致了这款看起来很成功的产品实际上是一笔赔钱的买卖。
更让他难以理解的是,正是由于这些来自不同系统的数据不够准确或不一致,给企业的前任领导提交了相当多顾此失彼的分析报告,导致了许多市场决策上的混乱和失误。
在花费了大量时间和精力之后,这位国企老总困惑了:究竟哪些数据才是真实的?为什么对同一件事不同的系统会得到截然不同的结果?3、案例分析:分析A公司商务智能项目失败的原因,并给出解决方法。
A公司是一家规模较大的工业企业,经过多年的发展,其生产的几十种产品不仅覆盖全国,而且远销国外,经济效益可观。
为了提高企业管理水平,满足集团管理的要求,A公司于2003年底正式启动了ERP 项目,并于2004年成功上线,半年后实现单轨运行,并一直保持平稳运行的状态。
但A公司信息中心人员发现,由于ERP系统主要是对日常运营基础数据的管理,公司领导很少用这个系统,很多领导需要的报表还是需要在系统外进行编制和流转。
基于这个原因,他们决定在ERP系统上拓展一个新项目—BI系统,意在抽取ERP中的数据,并形成供管理人员查看的报表系统。
商务智能考试题目

商务智能考试题(共五个大题,每题20分)1、商务智能应用技术?功能组成?一般认为数据仓库、OLAP和数据挖掘技术是商业智能的三大组成部分数据仓库是存放为分析目的而收集的数据的数据库。
数据挖掘是从数据抽取正确的、有用的、以前未知的及可理解的信息,并使用该信息做商业决策的过程。
OLAP(联机分析处理)是针对特定问题的联机数据访问和分析。
通过对信息(这些信息已经从原始的数据进行了转换,以反映用户所能理解的企业的真实的“维”)的很多可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。
商业智能系统主要包括数据预处理、建立数据仓库、数据分析及数据展现四个主要阶段。
数据预处理是整合企业原始数据的第一步,它包括数据的抽取、转换和装载三个过程。
建立数据仓库则是处理海量数据的基础。
数据分析是体现系统智能的关键,一般采用联机分析处理和数据挖掘两大技术。
在海量数据和分析手段增多的情况下,数据展现则主要保障系统分析结果的可视化。
2、“商业智能是一种解决方案”这句话怎么理解?为什么商业智能没有“专业出版的教材”?(1)商务智能(Business Intelligence,简称BI):商务智能不是通常的业务处理。
它的目标是如何更快、更容易地做更好的决策。
BI将信息转换为知识。
商业智能是在正确的时间将正确的信息交给正确的用户以支持决策过程的应用。
目前,商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。
为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。
因此,从技术层面上讲,商业智能不是什么新技术,它只是数据仓库、OLAP和数据挖掘等技术的综合运用。
为此,把商业智能看成是一种解决方案应该比较恰当。
(2)3、商业智能(BI)与CRM,ERP,CIMS,等系统的异同和关联?4、商业智能系统的应用过程(步骤)?为什么说商业智能的步骤一般是“循环(迭代)”的?5、IBM说“商业智能之客户直销分析”应用商业智能中的什么技术?分析这些技术?。
商业智能考试试题及答案

商业智能考试试题及答案1. 多选题:商业智能的定义是什么?A. 利用数据和分析方法来提供有益的商业见解和指导B. 利用计算机技术来提高商业决策的质量和效率C. 利用互联网技术来推动企业的数字化转型D. 利用人工智能算法来优化商业流程答案:A和B2. 判断题:商业智能的目标是帮助企业做出更明智的商业决策。
答案:正确3. 单选题:以下哪项不是商业智能的关键组成部分?A. 数据仓库B. 数据可视化C. 数据挖掘D. 业务流程管理答案:D4. 填空题:商业智能的四个基本功能包括__________________。
答案:报表和查询、数据分析、数据挖掘、数据可视化5. 简答题:请解释商业智能的数据可视化功能及其重要性。
答案:数据可视化是商业智能的关键功能之一,它将数据以图表、图形等形式展示出来,使得用户可以直观地理解和分析数据。
通过数据可视化,决策者可以更快地发现数据中的模式和趋势,更准确地评估业务绩效,并做出更明智的决策。
数据可视化不仅可以提高决策速度和准确性,还能增强数据沟通的效果,帮助不具备专业数据分析能力的人员也能理解和利用数据。
6. 解答题:请简要描述商业智能的实施过程和关键要素。
答案:商业智能的实施过程包括以下几个关键步骤:1) 需求分析:明确商业智能的应用目标和需求,确定所需要分析的数据内容和指标。
2) 数据准备:收集、整理和清洗数据,建立数据仓库或数据湖,并确保数据的质量和完整性。
3) 数据建模:根据需求,设计和构建数据模型,包拟定数据分析方法和算法。
4) 可视化设计:选择合适的数据可视化工具和技术,设计直观、易于理解的数据可视化界面。
5) 实施和测试:部署商业智能系统,对系统进行测试和调优,确保系统的稳定性和性能。
6) 培训和推广:培训用户和决策者使用商业智能系统,推广系统在企业中的应用和效果。
关键要素包括:明确的需求、高质量的数据、合适的数据模型和算法、直观的可视化界面、稳定可靠的系统性能,以及用户培训和推广。
商务智能复习资料(必读)

商务智能复习纲要第1章 商务智能概述1.1 商业决策需要商务智能一、数据、信息和知识1、数据:符号、事实和数字 信息:有用的数据 关系:信息是经过某种加工处理后的数据,是反映客观事物规律的一些数据。
数据是信息的载体,信息是对数据的解释。
知识:对信息内容进行提炼、比较、挖掘、分析、概括、判断和推论。
2、决策离不开信息、知识①决策需要信息,更离不开知识;知识更多地表现为经验--学习的结晶;学习的过程是不断地对信息加工处理;信息的收集、加工、传输与利用贯穿着决策各阶段的工作过程。
②信息已成为企业经营中重要性仅次于人才的第二大要素。
③决策=信息+经验+冒险④商务智能是对企业信息的科学管理。
3、商务智能支持商业决策商务智能如何创造知识和价值1.2 商务智能简介商务智能这一术语1996年由 Gartner 公司的分析师Howard Dresner 首次提出,他提出商务智能描述了一系列的概念和方法,通过应用基于事实的支持系统来辅助商业决策的制定。
一、商务智能概念事物运动 数据 信息记录解释商务智能是整合了先进信息技术与创新管理理念的结合体,集成了企业内外的数据,进行加工并从中提取能够创造商业价值的信息,面向企业战略并服务于管理层、业务层,指导企业经营决策,提升企业竞争力,涉及企业战略、管理思想、业务整合和技术体系等层面,促进信息到知识再到利润的转变,从而实现更好的绩效。
①先进信息技术:商务智能是多项技术的综合应用;②集成了企业内外的数据,进行加工并从中提取能够创造商业价值的信息:商务智能的层次;③企业战略:商务智能服务于企业战略;④管理层、业务层:商务智能用户多样性;⑤更好的绩效:商务智能提升企业绩效。
二、商务智能的价值1、在商务智能背后有一些商业驱动力,如:①增加收入,减少费用和更有效地竞争的需求。
②管理和模拟当前商业环境复杂性的需求。
③减少IT费用和利用已有公司业务信息的需求。
2、商务智能的价值①制定合适的市场营销策略;②改善顾客智能;③经营成本与收入分析;④提高风险管理能力;⑤改善业务洞察力;⑥提高市场响应能力。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、选择题(本题共5道小题,每小题2分,共10分)1. 数据仓库是随着时间变化的,下面的描述不正确的是( C )。
A. 数据仓库随时间的变化不断增加新的数据内容B. 捕捉到的新数据会覆盖原来的快照C. 数据仓库随事件变化不断删去旧的数据内容D. 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合2. 有关数据仓库的开发特点,不正确的描述是( B )。
A. 数据仓库使用的需求在开发初期就要明确B. 数据仓库开发要从数据出发C. 数据仓库的开发是一个不断循环的过程,是启发式的开发D. 在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式3. 在有关数据仓库测试,下列说法不正确的是( D )。
A. 在完成数据仓库的实施过程中,需要对数据仓库进行各种测试。
测试工作中要包括单元测试和系统测试。
B. 当数据仓库的每个单独组件完成后,就需要对他们进行单元测试。
C. 系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试。
D. 在测试之前没必要制定详细的测试计划。
4. 关于基本数据的元数据是指( D )。
A. 基本元数据与数据源、数据仓库、数据集市和应用程序等结构相关的信息B. 基本元数据包括与企业相关的管理方面的数据和信息C. 基本元数据包括日志文件和简历执行处理的时序调度信息D. 基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息6. 下面关于数据粒度的描述不正确的是( C )。
A. 粒度是指数据仓库小数据单元的详细程度和级别B. 数据越详细,粒度就越小,级别也就越高C. 数据综合度越高,粒度也就越大,级别也就越高D. 粒度的具体划分将直接影响数据仓库中的数据量以及查询质量6. 关于OLAP的特性,下面正确的是:( D )(1)快速性(2)可分析性(3)多维性(4)信息性(5)共享性A. (1) (2) (3)B. (2) (3) (4)C. (1) (2) (3) (4)D. (1) (2) (3) (4) (5)7. 关于OLAP和OLTP的区别描述,不正确的是:( C )A. OLAP主要是关于如何理解聚集的大量不同的数据,它与OTAP应用程序不同。
B. 与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务.C. OLAP的特点在于事务量大,但事务内容比较简单且重复率高.D. OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的。
8. 关于OLAP和OLTP的说法,下列不正确的是:( A )A. OLAP事务量大,但事务内容比较简单且重复率高B. OLAP的最终数据来源与OLTP不一样C. OLTP面对的是决策人员和高层管理人员D. OLTP以应用为核心,是应用驱动的9. OLAP技术的核心是( D )。
A. 在线性B. 对用户的快速响应C. 互操作性D. 多维分析10.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( A )A. 关联规则B. 聚类C. 分类D. 自然语言处理11. 分析型CRM的( C )功能可以让CRM对所进行的销售活动相关信息进行存储和管理,将客户所发生的交易与互动事件转化为有意义、高获利的销售商机。
A. 促销管理B. 个性化和标准化C. 客户分析和建模D. 客户沟通12. 运用关键绩效指标法设计组织关键绩效指标依次经过以下几个步骤( A )。
A. 确定关键成功领域、确定关键绩效要素、确定关键绩效指标B. 计划目标、实施目标、评价结果、反馈C. 确定目标、比较目标、收集分析数据、系统学习与改进、评价和提高D. 确定长期整体目标、确定短期目标13.什么是KDD?( A )A. 知识发现B. 领域知识发现C. 文档知识发现D. 动态知识发现14. 呼叫中心是一种基于( D )的一种新的综合信息服务系统。
A IT技术B CTI技术C WEB技术D CRM技术15. 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C )A. 频繁模式挖掘B. 分类和预测C. 数据预处理D. 数据流挖掘16. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?( B )A. 分类B. 聚类C. 关联分析D. 隐马尔可夫链17. 使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务?(A )A. 探索性数据分析B. 建模描述C. 预测建模D. 寻找模式和规则18. 为数据的总体分布建模,把多维空间划分成组等问题属于数据挖掘的哪一类任务?(B)A. 探索性数据分析B. 建模描述C. 预测建模D. 寻找模式和规则19. 建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?( C )A. 根据内容检索B. 建模描述C. 预测建模D. 寻找模式和规则20. 用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘哪一类任务?( A )A. 根据内容检索B. 建模描述C. 预测建模D. 寻找模式和规则21.下面哪种不属于数据预处理的方法?( D )A. 变量代换B. 离散化C. 聚集D. 估计遗漏值22.下面哪个不属于数据的属性类型( D )。
A. 标称B. 序数C. 区间D. 相异23. 在上题中,属于定量的属性类型是( C )。
A. 标称B. 序数C. 区间D. 相异24. 只有非零值才重要的二元属性被称作( C )。
A. 计数属性B. 离散属性C. 非对称的二元属性D. 对称属性25. 以下哪种方法不属于特征选择的标准方法( D )。
A. 嵌入B. 过滤C. 包装D. 抽样26.下面不属于创建新属性的相关方法的是( C )。
A. 特征提取B. 特征修改C. 映射数据到新的空间D. 特征构造27. 下面哪个属于映射数据到新的空间的方法?( A )A. 傅立叶变换B. 特征加权C. 渐进抽样D. 维归约28. 企业所建立的预测模型的好坏取决于模型在( A )上的表现效果。
A. 得分集B. 训练集C. 测试集D. 评价集29. 客户在经济活动中具有多重身份,下面哪一种不是其身份之一( C )。
A. 行为身份B. 所有权身份C. 学习身份D. 决策身份30. 下列四条描述中,正确的一条是( B )。
A. 企业实施数据挖掘,必须要有数据仓库。
B. 企业要实施数据挖掘最好的方式是请编外专家。
C. 企业购买现成数据挖掘模型的一个先决条件是:该企业的产品、客户、市场定位和所买来的现成模型设计之初的假设相吻合。
D. 在建模的时侯,增益最高的模型就是最好的模型。
31. 数据挖掘算法以( D )形式来组织数据。
A. 行B. 列C. 记录D. 表格32. 企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的是( B )。
A. 数据越多越好。
B. 尽可能多的适合的数据。
C. 得分集数据是建模集数据的一部分。
D. 以上三条都正确。
33. K—均值类别侦测要求输入的数据类型必须是( B )。
A. 整型B. 数值型C. 字符型D. 逻辑型34. 在决策树和累计增益图的关系转化过程图中,决策树上某一页节点的增益与累计增益图上的( D )相对应。
A. 线段长度B. 线段斜率C. 相对应的线段长度D. 相对应的线段斜率35. 企业为提升每个客户的价值,应实现( C )最优化。
A. 促销活动B. 预算最优化C. 客户最优化D. 三者都不是36. 数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了( C )数据挖掘方法。
A. 分类B. 预测C. 组合或关联法则D. 聚类37. 企业成功实施数据挖掘,需要以下( B )知识或技术。
A. 预先的规划B. 对商业文体的理解C. 综合商业知识和技能D. 都需要38. 下列哪个不是专门用于可视化时间空间数据的技术( B )。
A. 等高线图B. 饼图C. 曲面图D. 矢量场图39. 在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是( D )。
A. 有放回的简单随机抽样B. 无放回的简单随机抽样C. 分层抽样D. 渐进抽样40. 设X={1,2,3}是频繁项集,则可由X产生( C )个关联规则。
A. 4B. 5C. 6D. 741. 概念分层图是( B )图。
A. 无向无环B. 有向无环C. 有向有环D. 无向有环42. 以下哪些算法是分类算法( B )。
A. DBSCANB. C4.5C. K-MeanD. EM43. 以下哪些分类方法可以较好地避免样本的不平衡问题( A )。
A. KNNB. SVMC. BayesD. 神经网络44. 以下关于人工神经网络(ANN)的描述错误的有( A )。
A. 神经网络对训练数据中的噪声非常鲁棒B. 可以处理冗余特征C. 训练ANN是一个很耗时的过程D. 至少含有一个隐藏层的多层神经网络45. 通过聚集多个分类器的预测来提高分类准确率的技术称为( A ) 。
A. 组合(ensemble)B. 聚集(aggregate)C. 合并(combination)D. 投票(voting)46. 简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作(B )。
A. 层次聚类B. 划分聚类C. 非互斥聚类D. 模糊聚类47. 在基本K均值算法里,当邻近度函数采用(A )的时候,合适的质心是簇中各点的中位数。
A. 曼哈顿距离B. 平方欧几里德距离C. 余弦距离D. Bregman散度48.( C )是一个观测值,它与其他观测值的差别如此之大,以至于怀疑它是由不同的机制产生的。
A. 边界点B. 质心C. 离群点D. 核心点48. 检测一元正态分布中的离群点,属于异常检测中的基于( A )的离群点检测。
A. 统计方法B. 邻近度C. 密度D. 聚类技术49. DBSCAN在最坏情况下的时间复杂度是( B )。
A. O(m)B. O(m2)C. O(log m)D. O(m*log m)50. 关于K均值和DBSCAN的比较,以下说法不正确的是( A )。
A. K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象。
B. K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念。
C. K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇。
D. K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇。
51. 使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务?(A )A. 探索性数据分析B. 建模描述C. 预测建模D. 寻找模式和规则52.下面哪种不属于数据预处理的方法?( D )A变量代换B离散化 C 聚集 D 估计遗漏值二、判断题(本题共10道小题,每小题1分,共10分)(T )1.商务智能指收集、转换、分析和发布数据的过程,目的是为了更好的决策。