管理统计学习题参考答案第十三章

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第十三章

1.解:大数据时代的到来,给管理统计学带来了机遇与挑战。机遇是获取数据的成本低、速度快,大数据中含有丰富的信息价值,使得统计学获得了巨大的发展空间;挑战是大数据中含有丰富价值的同时也含有很多垃圾信息,即存在噪声,给人们决策带来困难——面对如此大量的数据,哪些是有用的数据信息,哪些是垃圾信息或干扰信息。大数据时代下管理统计学的变革趋势:推断统计与回归分析法的淘汰、大数据挖掘方法的兴起、从注重因果分析到注重相关分析、非结构化数据的统计决策方法等。

2.解:大数据(big data)至今还没有统一的定义,从一般意义上来说,是指无法在合理时间内用传统IT技术和软硬件工具对其进行收集、处理和分析的数据集合。具体主要有以下几种定义:第一、Gartner研究机构认为大数据是指无法在一定时间内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。维克托·迈尔·舍恩伯格和肯尼斯·库克耶所著的《大数据时代》一书认为,“通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见”,这正成为“当今社会所独有的一种新型能力”。麦肯锡全球研究所认为大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。

IBM指出大数据的5V特点:V olume(大量)、Velocity(高速)、Variety(多样)、V alue(价值)、Veracity(真实性)。本教材认为大数据主要具有以下七大特征:大量性(V olume);多样性(Variety);高速性(V elocity);真实性(V eracity);价值性(value);复杂性(Complexity);动态性(Dynamic)。

3.解:数据按照存储的规律性分为结构化数据与非结构化数据。结构化数据是指一种存储很规律的行数据,存储在数据库里可以用二维表结构来逻辑表达实现的数据;而非结构化数据是指不方便用数据库二维逻辑表来表现的数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频等。

4.解:统计决策是利用数据信息对可选方案进行选择的行为。大数据往往都是非结构化数据,故人们已经从结构化数据决策向非结构化数据决策发展了。非结构化数据决策是指那些面临复杂的大数据,其决策过程、决策方法和大数据结构没有固定的规律可以遵循,没有固定的决策规则和模型可依,仅凭决策者的主观行为(学识、经验、直觉、判断力、洞察力、个人偏好、决策风格和大数据相关分析挖掘等)对统计结果进行判断。而传统的统计决策方法更多的是结构化数据决策,常用的方法有贝叶斯决策、决策树等,这类决策方法具有规律可循与模型可依。大数据决策往往是决策者根据经验目标和大数据相关分析挖掘情况临时做出决定;而结构化决策的结果一般根据固定的规律与模型推导出来。故大数据决策是一种比传统统计决策更复杂与不确定的决策方法。

5.解:在大数据时代,数据挖掘是最关键的工作。大数据的挖掘是从海量的、不完全的、有噪声的、模糊的、

随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程,也是一种决策支持过程。其主要基于人工智能、机器学习、模式学习,统计学等。通过对大数据高度自动化分析,做出归纳推理,从中挖掘出潜在的模式,可以帮助政府、企业、商家、用户调整市场政策等做出正确的决策。目前,在很多领域尤其是在商业领域如银行、电信、电商等,数据挖掘可以解决很多问题,包括市场营销策略制定、客户挖掘等。大数据的挖掘方法有很多种,常用的方法包括:分类分析、聚类分析、相关分析、关联规则、神经网络、Web 数据挖掘等。

相关文档
最新文档