第二章 数据采集、分析与知识管理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
∙
第01讲数据采集、分析与知识管理
∙
[ 讲义编号NODE95267800020100000101:针对本讲义提问]
∙
∙本章考情分析:
本章属于2019新版改动极大的内容,以文字理解为主,知识较杂,考试题型以记忆为主,不必花费太多的时间,在考前三周进行突击记忆即可。
本章应重点关注“信息鉴别常用方法”、“数据统计分析工作”、“企业建立知识管理系统步骤”几个知识点,考试很有可能不涉及本章题目,也有可能出一个小问的问答题。
[ 讲义编号NODE95267800020100000102:针对本讲义提问]
∙
∙
一、工程咨询信息及其管理
1.工程咨询信息类型及来源
(1)信息类型
(2)工程咨询对信息的基本要求
[ 讲义编号NODE95267800020100000103:针对本讲义提问]
∙
∙(3)信息来源
[ 讲义编号NODE95267800020100000104:针对本讲义提问]
∙
∙ 2.“互联网+”背景下的工程咨询信息管理
(1)任务
咨询企业应当利用先进的信息管理手段,建立适合本企业需要的数据库管理系统,加强对本企业内外信息的全面管理,为本企业咨询业务及时提供全面、准确、最新的信息。
(2)方法
基本做法:分类与编目
检索功能与权限(模糊查询)
(3)技术
[ 讲义编号NODE95267800020100000105:针对本讲义提问]
∙
∙
二、信息采集途径和方法
1.工程咨询信息采集途径(暗地卷烟)
文案调查法、实地调查法、问卷调查法、实验调查法
文案调查法:最简单、最一般和常用的方法,也是其他调查方法的基础。
实地调查法:调查周期长,费用高,调查对象容易受调查的心里暗示影响,存在不够客观的可能性。
问卷调查法:适应范围广,简单易行,费用较低,得到大量应用。
实验调查法:用于消费行为调查,最复杂,费用较高,应用范围有限的方法,但调查结果可信度高。
[ 讲义编号NODE95267800020100000106:针对本讲义提问]
∙
∙【案例分析】(2011年真题)
某企业主要生产A、B两种产品,近期拟投资建设生产C产品的项目。该企业委托某工程咨询公司提供相关咨询服务。咨询公司工作过程中,甲咨询工程师提出如下观点:
(1)要获得市场相关数据,只能采用实地调查和问卷调查方法。
【问题】
3.指出甲咨询工程师的各观点是否正确,并说明理由。
【参考答案】
甲的观点(1)不正确。
理由:市场调查的方法除了实地调查和问卷调查外,还有文案调查法和实验调查法。
[ 讲义编号NODE95267800020100000107:针对本讲义提问]
∙
∙ 2.网络信息搜索和提取方法
(1)搜索引擎工作原理
搜索引擎有信息搜集、信息整理和接受用户查询三部分。
[ 讲义编号NODE95267800020100000108:针对本讲义提问]
∙
∙(2)搜索方法与技巧
1)关键词索引
∙2)缩小范围
∙
[ 讲义编号NODE95267800020100000109:针对本讲义提问]
∙
∙
三、信息鉴别
1.信息鉴别常用方法
∙
[ 讲义编号NODE95267800020100000110:针对本讲义提问] ∙
∙ 2.信息的综合
信息综合有两种方式:
一是对已有信息挖掘、延伸,引发创新需求的新信息,达到信息的“增值”;
二是通过设计和试验创造新的信息。有价值的信息往往是反复推理分析和猜想后的结果,这个过程要求咨询工程师具备很强的分析、联想、综合与创造能力。
[ 讲义编号NODE95267800020100000111:针对本讲义提问]
∙
∙
四、数据分析与挖掘
1.概述
信息分析的用途:
∙定性分析:逻辑推理;
定量分析:建立数学模型,计算,求解。
数据分析的对象包括:
[ 讲义编号NODE95267800020100000112:针对本讲义提问]
∙
∙ 2.数据统计分析
数据分析的工作(阶段)有哪些?
(1)选择数字特征;
(2)收集并整理数据;
(3)计算数字特征;
(4)建立模型;
(5)检验模型误差;
(6)利用模型预测;
(7)评价统计与预测结果。
记忆:
选择、整理、计算、建模、检验、预测、评价
[ 讲义编号NODE95267800020100000113:针对本讲义提问]
∙
∙ 3.时间数据分析方法
是按时序排列的一组来自同一现象的观察值。
(1)时间序列成分
(2)时间序列建模
1)取得时间序列样本。
2)将样本点画成图,进行相关分析。
3)模式识别与拟合。
4)预测未来。
时间序列常用模型:
(1)ARMA模型
(2)回归模型
[ 讲义编号NODE95267800020100000114:针对本讲义提问]
∙
∙ 4.大数据系统和数据挖掘技术
(1)大数据
大数据常以万亿或EB衡量,且种类多、实时性强,蕴藏的商业价值大。很多现有的新或旧的信息基础设施、工具和技术可用来开发和利用大数据中蕴藏的价值。
(2)数据挖掘
数据挖掘与数据分析不同,区别在于:
1)处理工作量;(多与少的区别)
2)制约条件;(数据挖掘不做假设,自动建立方程)
3)处理对象;(数据挖掘对象类型繁多)
4)处理结果。(数据挖掘的结果不易解释,着眼于预测未来,并提出决策建议)
[ 讲义编号NODE95267800020100000115:针对本讲义提问]
∙
∙(3)数据挖掘步骤
网络信息挖掘具体步骤如下:
1)确立目标样本。
2)提取特征信息。