第二章 数据采集、分析与知识管理

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第01讲数据采集、分析与知识管理

[ 讲义编号NODE95267800020100000101:针对本讲义提问]

∙本章考情分析:

本章属于2019新版改动极大的内容,以文字理解为主,知识较杂,考试题型以记忆为主,不必花费太多的时间,在考前三周进行突击记忆即可。

本章应重点关注“信息鉴别常用方法”、“数据统计分析工作”、“企业建立知识管理系统步骤”几个知识点,考试很有可能不涉及本章题目,也有可能出一个小问的问答题。

[ 讲义编号NODE95267800020100000102:针对本讲义提问]

一、工程咨询信息及其管理

1.工程咨询信息类型及来源

(1)信息类型

(2)工程咨询对信息的基本要求

[ 讲义编号NODE95267800020100000103:针对本讲义提问]

∙(3)信息来源

[ 讲义编号NODE95267800020100000104:针对本讲义提问]

∙ 2.“互联网+”背景下的工程咨询信息管理

(1)任务

咨询企业应当利用先进的信息管理手段,建立适合本企业需要的数据库管理系统,加强对本企业内外信息的全面管理,为本企业咨询业务及时提供全面、准确、最新的信息。

(2)方法

基本做法:分类与编目

检索功能与权限(模糊查询)

(3)技术

[ 讲义编号NODE95267800020100000105:针对本讲义提问]

二、信息采集途径和方法

1.工程咨询信息采集途径(暗地卷烟)

文案调查法、实地调查法、问卷调查法、实验调查法

文案调查法:最简单、最一般和常用的方法,也是其他调查方法的基础。

实地调查法:调查周期长,费用高,调查对象容易受调查的心里暗示影响,存在不够客观的可能性。

问卷调查法:适应范围广,简单易行,费用较低,得到大量应用。

实验调查法:用于消费行为调查,最复杂,费用较高,应用范围有限的方法,但调查结果可信度高。

[ 讲义编号NODE95267800020100000106:针对本讲义提问]

∙【案例分析】(2011年真题)

某企业主要生产A、B两种产品,近期拟投资建设生产C产品的项目。该企业委托某工程咨询公司提供相关咨询服务。咨询公司工作过程中,甲咨询工程师提出如下观点:

(1)要获得市场相关数据,只能采用实地调查和问卷调查方法。

【问题】

3.指出甲咨询工程师的各观点是否正确,并说明理由。

【参考答案】

甲的观点(1)不正确。

理由:市场调查的方法除了实地调查和问卷调查外,还有文案调查法和实验调查法。

[ 讲义编号NODE95267800020100000107:针对本讲义提问]

∙ 2.网络信息搜索和提取方法

(1)搜索引擎工作原理

搜索引擎有信息搜集、信息整理和接受用户查询三部分。

[ 讲义编号NODE95267800020100000108:针对本讲义提问]

∙(2)搜索方法与技巧

1)关键词索引

∙2)缩小范围

[ 讲义编号NODE95267800020100000109:针对本讲义提问]

三、信息鉴别

1.信息鉴别常用方法

[ 讲义编号NODE95267800020100000110:针对本讲义提问] ∙

∙ 2.信息的综合

信息综合有两种方式:

一是对已有信息挖掘、延伸,引发创新需求的新信息,达到信息的“增值”;

二是通过设计和试验创造新的信息。有价值的信息往往是反复推理分析和猜想后的结果,这个过程要求咨询工程师具备很强的分析、联想、综合与创造能力。

[ 讲义编号NODE95267800020100000111:针对本讲义提问]

四、数据分析与挖掘

1.概述

信息分析的用途:

∙定性分析:逻辑推理;

定量分析:建立数学模型,计算,求解。

数据分析的对象包括:

[ 讲义编号NODE95267800020100000112:针对本讲义提问]

∙ 2.数据统计分析

数据分析的工作(阶段)有哪些?

(1)选择数字特征;

(2)收集并整理数据;

(3)计算数字特征;

(4)建立模型;

(5)检验模型误差;

(6)利用模型预测;

(7)评价统计与预测结果。

记忆:

选择、整理、计算、建模、检验、预测、评价

[ 讲义编号NODE95267800020100000113:针对本讲义提问]

∙ 3.时间数据分析方法

是按时序排列的一组来自同一现象的观察值。

(1)时间序列成分

(2)时间序列建模

1)取得时间序列样本。

2)将样本点画成图,进行相关分析。

3)模式识别与拟合。

4)预测未来。

时间序列常用模型:

(1)ARMA模型

(2)回归模型

[ 讲义编号NODE95267800020100000114:针对本讲义提问]

∙ 4.大数据系统和数据挖掘技术

(1)大数据

大数据常以万亿或EB衡量,且种类多、实时性强,蕴藏的商业价值大。很多现有的新或旧的信息基础设施、工具和技术可用来开发和利用大数据中蕴藏的价值。

(2)数据挖掘

数据挖掘与数据分析不同,区别在于:

1)处理工作量;(多与少的区别)

2)制约条件;(数据挖掘不做假设,自动建立方程)

3)处理对象;(数据挖掘对象类型繁多)

4)处理结果。(数据挖掘的结果不易解释,着眼于预测未来,并提出决策建议)

[ 讲义编号NODE95267800020100000115:针对本讲义提问]

∙(3)数据挖掘步骤

网络信息挖掘具体步骤如下:

1)确立目标样本。

2)提取特征信息。

相关文档
最新文档