大数据与统计学的关系

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据与统计学的关系

班级:2013212101

学号:2013212296

姓名:郑梦圆

近年来,大数据这一概念越来越多的被提及,与大数据有关的相关内容和学科也逐渐走俏。大数据作为信息技术发展到成熟阶段的产物,并不是想象中的那么神秘,分析大数据与统计学的关系,首先要从大数据是什么入手。

借用百度百科的定义,大数据(Big Data)是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。这一定义主要是强调了大数据的技术特点,强调大数据的数量特征以及难以用常规方法进行捕捉和衡量。

而在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》一书中,大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。书中还指出了大数据的4V特点,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。这一定义则是从大数据的来源上对其进行了定义,它强调了大数据来自于采用所有数据进行分析处理,这一来源又决定了大数据的4V特性,这一特性可以理解为大量数据,高速处理,结果多样化,从数据中挖掘价值。研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

另一方面,从统计学的定义来看,统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。统计学的基础是数据,传统的数据收集方法主要包括实验数据、调查数据以及各种途径收集到的二手数据。而在长期的实践过程中,采用传统收集方法得到的数据大多存在误差,样本的客观性难以保证,样本选取也可能对结果产生影响,因此传统的数据收集方法不能再适应统计学发展的需要。从这种意义上来说,大数据的出现可以说是科学发展的必然。大数据的出现使统计学最关键的数据收集环节实现了跨越:大数据意味着所有统计对象的数据都能应用到统计过程中,统计数据不再存在局限性,配合适当的统计方法和数据处理方法,得出的统计结果将更具有代表性和说服力。

同时,大数据和云计算结合是必然的趋势。大数据离不开云计算,云计算为大数据提供了弹性可拓展的基础设备,是产生大数据的平台之一。自2013年开始,大数据技术已开始

和云计算技术紧密结合,预计未来两者关系将更为密切。在可预见的未来,结合了大数据和云计算的统计学势必会发生革命性的变革。

大数据将对未来产生深刻影响,目前可以预见的发展趋势,与统计学相关的主要有以下两点:一是数据科学和数据联盟的成立。数据科学将成为一门专门的学科,数据的的重要性不言而喻,统计学也会借此契机迎来新的发展。基于数据基础平台,还将建立起跨领域的数据共享平台,之后,数据共享将扩展到企业层面,并且成为未来产业的核心一环。二是数据管理成为核心竞争力。数据管理成为核心竞争力,直接影响财务表现。当“数据资产是企业核心资产”的概念深入人心之后,企业对于数据管理便有了更清晰的界定,将数据管理作为企业核心竞争力,持续发展,战略性规划与运用数据资产,成为企业数据管理的核心。数据资产管理效率与主营业务收入增长率、销售收入增长率显著正相关。届时,统计学的相关知识将被广泛的应用在生产生活的各个方面,全面深入的融入人们的生活。

相关文档
最新文档