大数据带来的四种思维
大数据带来的四种思维[试题]
![大数据带来的四种思维[试题]](https://img.taocdn.com/s3/m/e9c21d9470fe910ef12d2af90242a8956becaa90.png)
大数据带来的四种思维作者:张义祯近年来大数据技术的快速发展深刻改变了我们的生活、工作和思维方式。
大数据研究专家舍恩伯格指出,大数据时代,人们对待数据的思维方式会发生如下三个变化:第一,人们处理的数据从样本数据变成全部数据;第二,由于是全样本数据,人们不得不接受数据的混杂性,而放弃对精确性的追求;第三,人类通过对大数据的处理,放弃对因果关系的渴求,转而关注相关关系。
事实上,大数据时代带给人们的思维方式的深刻转变远不止上述三个方面。
笔者认为,大数据思维最关键的转变在于从自然思维转向智能思维,使得大数据像具有生命力一样,获得类似于“人脑”的智能,甚至智慧。
总体思维社会科学研究社会现象的总体特征,以往采样一直是主要数据获取手段,这是人类在无法获得总体数据信息条件下的无奈选择。
在大数据时代,人们可以获得与分析更多的数据,甚至是与之相关的所有数据,而不再依赖于采样,从而可以带来更全面的认识,可以更清楚地发现样本无法揭示的细节信息。
正如舍恩伯格总结道:“我们总是习惯把统计抽样看作文明得以建立的牢固基石,就如同几何学定理和万有引力定律一样。
但是,统计抽样其实只是为了在技术受限的特定时期,解决当时存在的一些特定问题而产生的,其历史不足一百年。
如今,技术环境已经有了很大的改善。
在大数据时代进行抽样分析就像是在汽车时代骑马一样。
在某些特定的情况下,我们依然可以使用样本分析法,但这不再是我们分析数据的主要方式。
”也就是说,在大数据时代,随着数据收集、存储、分析技术的突破性发展,我们可以更加方便、快捷、动态地获得研究对象有关的所有数据,而不再因诸多限制不得不采用样本研究方法,相应地,思维方式也应该从样本思维转向总体思维,从而能够更加全面、立体、系统地认识总体状况。
大数据是数据数量上的增加,以至于我们能够实现从量变到质变的过程。
如:照片到电影,一分钟一张,一秒钟一张,一秒钟24张成了电影量变质变定律有时间阶段发展影响和空间相关关联影响离散思维向连续思维转换让我来告诉大家,美国有一家创新企业。
数据分析的五大思维方式

今天要讲数据分析的五大思维方式首先,我们要知道,什么叫数据分析。
其实从数据到信息的这个过程,就是数据分析。
数据本身并没有什么价值,有价值的是我们从数据中提取出来的信息。
然而,我们还要搞清楚数据分析的目的是什么?目的是解决我们现实中的某个问题或者满足现实中的某个需求。
那么,在这个从数据到信息的过程中,肯定是有一些固定的思路,或者称之为思维方式。
下面零一给你一一介绍。
(本文用到的指标和维度是同一个意思)第一大思维【对照】【对照】俗称对比,单独看一个数据是不会有感觉的,必需跟另一个数据做对比才会有感觉。
比如下面的图a和图b。
图a毫无感觉图b经过跟昨天的成交量对比,就会发现,今天跟昨天实则差了一大截。
这是最基本的思路,也是最重要的思路。
在现实中的应用非常广,比如选款测款丶监控店铺数据等,这些过程就是在做【对照】,分析人员拿到数据后,如果数据是独立的,无法进行对比的话,就无法判断,等于无法从数据中读取有用的信息。
第二大思维【拆分】分析这个词从字面上来理解,就是拆分和解析。
因此可见,拆分在数据分析中的重要性。
在派代上面也随处可见“拆分”一词,很多作者都会用这样的口吻:经过拆分后,我们就清晰了……。
不过,我相信有很多朋友并没有弄清楚,拆分是怎么用的。
我们回到第一个思维【对比】上面来,当某个维度可以对比的时候,我们选择对比。
再对比后发现问题需要找出原因的时候?或者根本就没有得对比。
这个时候,【拆分】就闪亮登场了。
大家看下面一个场景。
运营小美,经过对比店铺的数据,发现今天的销售额只有昨天的50%,这个时候,我们再怎么对比销售额这个维度,已经没有意义了。
这时需要对销售额这个维度做分解,拆分指标。
销售额=成交用户数*客单价,成交用户数又等于访客数*转化率。
详见图c和图d图c是一个指标公式的拆解图b是对流量的组成成分做的简单分解(还可以分很细很全)拆分后的结果,相对于拆分前会清晰许多,便于分析,找细节。
可见,拆分是分析人员必备的思维之一。
大数据思维的五种思维方式

大数据思维是指一种基于数据驱动的思维方式,它强调通过收集、分析和利用大量数据来揭示事物的本质和规律,从而更好地理解和解决问题。
以下是大数据思维的五种思维方式:
1. 数据驱动思维:大数据思维强调以数据为基础,通过数据分析和挖掘来发现问题、解决问题和做出决策。
2. 全样本思维:传统的数据分析往往基于抽样调查,但大数据思维则强调全样本分析,即通过收集和分析所有可用数据来获取更全面和准确的信息。
3. 相关性思维:大数据思维强调关注数据之间的相关性,而不仅仅是因果关系。
通过分析数据之间的相关性,可以发现一些以前难以察觉的规律和趋势。
4. 开放性思维:大数据思维鼓励开放的数据共享和合作,通过共享数据和知识,可以更好地发挥数据的价值,促进创新和发展。
5. 快速迭代思维:大数据思维强调快速迭代和实验,通过不断尝试和改进,可以更快地找到最佳的解决方案。
总之,大数据思维是一种以数据为中心的思维方式,它强调通过数据分析和挖掘来发现问题、解决问题和做出决策,具有全样本、相关性、开放性、快速迭代等特点。
大数据思维是哪四个(一)2024

大数据思维是哪四个(一)引言概述:在当今信息时代,数据已经成为各个领域决策和创新的基础。
大数据思维作为一种重要的思维模式,成为了越来越多企业和组织所追求的目标。
本文将介绍大数据思维的四个重要方面,以帮助读者更好地理解和运用大数据思维。
正文:一、数据整合与共享1. 数据收集:通过各种渠道和方式收集大量的数据,包括从内部系统和外部来源获取的结构化和非结构化数据。
2. 数据清洗和处理:对收集到的数据进行清洗和预处理,消除噪声和不一致性,确保数据的质量和一致性。
3. 数据整合:将来自不同源头和不同格式的数据整合为一个统一的数据集,以便更好地进行数据分析和挖掘。
4. 数据共享:通过建立数据共享平台,促进不同部门和组织之间的数据共享,以达到资源优化和协同创新的目的。
5. 数据安全和隐私保护:采取措施保护数据的安全性和隐私,包括数据加密、访问控制和身份验证等。
二、数据分析和挖掘1. 数据探索和可视化:通过数据分析工具和技术,对数据进行可视化和探索,发现数据的规律和潜在模式。
2. 数据建模和预测:利用统计学和机器学习算法,构建数学模型并预测未来趋势和结果,以辅助决策和规划。
3. 关联分析和推断:通过关联分析和推理技术,找出数据之间的关联关系和因果关系,识别隐藏的业务规则和问题。
4. 实时分析和决策:利用实时数据分析和大数据平台,为决策者提供及时的、准确的和全面的决策支持。
5. 数据驱动的运营和管理:基于数据分析的结果,优化业务流程和资源分配,提高运营和管理的效率和效果。
三、创新和发展模式1. 数据驱动的创新:根据数据分析的结果,发现市场机会和潜在的创新点,推动企业和组织的创新和发展。
2. 个性化和定制化服务:基于对个体用户的数据分析,提供更个性化和定制化的产品和服务,满足用户的需求和期望。
3. 用户参与和共创:通过用户数据的收集和分析,与用户进行互动和合作,共同创造价值和解决问题。
4. 数据驱动的商业模式:将数据作为核心资源和竞争优势,构建以数据为基础的商业模式,创造新的商业价值。
大数据思维的六大特性

大数据思维的六大特性信息时代大数据的应用对社会的运行和治理产生了重大影响,使社会运行和治理由事前防范、事后处理变成在线治理。
大数据应用中越来越多成功的案例,让人们愈发重视用大数据的方法和意识来处理碰到的新问题,这就是大数据思维。
主要有以下几个方面的特性。
一、全局大局思维大数据研究的对象是所有样本,而非抽样数据,关注样本中的主流,而非个别,这要求应用人员必须有全局和大局思维。
二、开放包融思维数据分享、信息公开在分享资源的同时,也在释放善意,取得互信,在数据交换的基础上产生合作,这将打破传统封闭与垄断,形成开放、共享、合作思维。
大数据不仅关注数据的因果关系,更多的是相关性,提高数据采集频度,而放宽了数据的精确度,容错率提高,用概率看待问题,使人们的包融思维得以强化。
三、优质服务思维互联网通过免费的基本服务换来了大量客户数据的积累,从经济学角度来看,所有的免费都是不可持续的。
这要求大数据使用者有能力依靠挖掘数据,改变价值的生成基础和价值链条的新价值,用更优质服务、提升变现能力来实现可持续发展。
四、学习趋势思维研究数据相关性,使人们更容易提前发现事物的规律,预测事物进展的趋势,大数据就是通过成功的预测而引起广泛关注的。
五、成本控制思维原来的社会治理模式中,用增量来配置社会资源,机构和人员不断扩大,成本不断加大。
大数据让社会资源的存量得以精确配置,高效使用,避免忙闲不均,社会治理由劳动密集型到技术动态调度转变。
六、创造性思维创造性思维是大数据思维方式的特性之一,通过对数据的重组、扩展和再利用,突破原有的框架,开拓新领域、确立新决策,发现隐藏在表面之下的数据价值,数据也创造性地成为了可重复使用的“再生性”资源。
历来的变革都是由生产工具推动思维方式转变开始的,旧的经济体制和传统理念在面临新思维逻辑的时候,如果不能与时俱进,吸收并转变为顺应潮流的新思维,通过新思维重新重组社会、国家、企业的战略、结构、文化和各种策略,那么貌似强大的社会反而变成了历史前进的阻力。
大数据带来的四种思维(一)

大数据带来的四种思维(一)引言概述:在当今数字化时代,大数据已经成为了各行各业的核心竞争力之一。
它的出现不仅给企业带来了巨大的商业机会,同时也对传统的思维方式提出了挑战。
在本文中,我们将探讨大数据带来的四种新的思维方式,以及它们对企业的影响。
正文内容:一、数据驱动思维1. 数据驱动决策的意义:通过对大量数据的分析和利用,可以更准确地进行决策,避免主观臆断。
2. 多维度数据分析:借助大数据技术,可以从不同维度对数据进行分析,揭示隐藏在数据背后的规律和趋势。
3. 实时数据反馈:大数据技术的快速处理能力,使得实时数据反馈成为可能,帮助企业更加及时地做出调整和优化。
二、创新思维1. 探索新的商业模式:通过深度挖掘数据,企业可以发现潜在的新市场和商业机会,从而开辟出全新的商业模式。
2. 提供个性化产品和服务:大数据的精准分析能力,使得企业能够更好地了解消费者需求,为其提供个性化的产品和服务。
3. 预测未来趋势:通过对大数据的分析和挖掘,可以有效预测市场趋势,帮助企业提前布局和应对未来的变化。
三、协同思维1. 跨部门协作:大数据技术的使用需要跨部门的协作,促进信息的共享和流通,提高企业的决策效率。
2. 企业生态系统:大数据可以作为企业与合作伙伴、供应商、客户之间建立生态系统的桥梁,促进共赢发展。
3. 数据共享与开放创新:大数据的共享和开放可以促进不同企业之间的合作和创新,实现资源优化配置。
四、智能思维1. 人工智能的应用:大数据与人工智能的结合,可以帮助企业实现更高效的业务流程和更精准的决策。
2. 自动化与智能化工作:借助大数据技术,一些繁琐、重复和容易出错的工作可以被自动化和智能化,提高工作效率。
3. 智能决策支持:大数据技术可以为企业提供智能化的决策支持,减少风险,优化决策结果。
总结:大数据带来的这四种思维方式,即数据驱动思维、创新思维、协同思维和智能思维,对企业的经营和发展具有重要的影响。
在大数据时代,企业应该引领思维转变,充分利用大数据的优势,不断创新和进步,抓住机遇,实现持续发展。
大数据的思维方式(一)

大数据的思维方式(一)引言概述:在当今信息爆炸的时代,大数据已经成为企业和组织决策中不可或缺的重要元素。
大数据的思维方式则是指我们在面对大规模、多样化的数据时,所需要具备的一种思维模式和技能。
本文将从五个大点来阐述大数据的思维方式,并探讨其在决策和创新中的应用。
正文:一、数据意识1. 理解数据的价值:认识数据对企业发展的重要性,了解数据可以带来的商业价值。
2. 掌握数据采集和分析技术:学习数据采集、存储和处理的方法和工具,提高数据处理能力。
3. 建立数据驱动的决策机制:倡导以数据为基础做出决策,降低主观臆断的风险。
二、跨领域思维1. 学习多个领域的知识:拓宽视野,还可以从其他领域中借鉴经验和方法论。
2. 带着问题来思考:以问题驱动的思维方式,利用不同领域的知识来解决实际问题。
3. 发掘数据中的潜在联系:对多个领域的知识进行连接和整合,挖掘出新的洞察和发现。
三、统计分析能力1. 学习基本统计学原理:了解统计学的基本概念和方法,掌握常用的统计分析技巧。
2. 掌握数据可视化技术:通过图表和可视化工具将数据转化为更直观的形式,便于分析和传达。
3. 进行数据模型建立和预测:利用统计学和机器学习的方法,对数据进行建模和预测,提供决策支持。
四、创新思维1. 提倡挑战常规和传统观念:打破固有的思维模式,敢于尝试和创新。
2. 鼓励多元化的想法:从多个角度思考问题,纳入不同的观点和意见。
3. 快速试错和迭代:以快速试错的方式进行创新实验,从中学习和不断改进。
五、团队协作1. 建立跨学科的团队:组建既懂领域知识又懂数据分析的团队,共同解决问题。
2. 推行数据共享和开放合作:鼓励团队成员之间分享数据和思路,促进协作和共同学习。
3. 培养有效沟通和解释能力:能够将复杂的数据分析结果以简洁明了的方式向团队和决策者解释和传达。
总结:大数据的思维方式是在处理大规模、多样化的数据时所需要具备的思考方式和技能。
它要求我们具备数据意识、跨领域思维、统计分析能力、创新思维和团队协作能力。
大数据思维是什么?

大数据思维是什么?大数据时代的来临必将会使互联网行业发生一场新型的革命。
大数据已经迅速的影响了整个行业,正在显示自身的强大功能。
无论是大数据相关的技术专家,还是未来学者,都认为必须加快解读和丰富大数据的步伐。
目前大数据思维分为容错思维、全样思维和相关思维3种。
接下来小编就这3种思维为大家进行解读和分享。
1、容错思维▼过去我们只能采用小数据抽样的方法解读数据,这就导致了样品的不稳定性。
而全样的样本数量比抽样样本的数量高很多倍,因此也决定了他不能出现丝毫的错误,否则带来的后果是不可估量的。
因此,为了保证结果的精准,就需要提高对抽样数据的要求。
大数据时代的来临就提供了很好的契机,在大数据时代,我们需要优先采用全样数据的方式,不再是对一部分数据进行分析,最终结果也更接近于客观现实。
2、全样思维▼大数据和“小数据”是相对应的。
他们最直观的差别就是大数据采用全样思维模式,小数据更注重抽样。
随着时代的发展和计算机技术的更新迭代,小数据的抽样方法开始慢慢退出人们的视野,取而代之的是高薪高科技,这也是大数据给我们带来的改变。
3、相关思维举一个简单的例子,我们去超市买饮料的时候,顺便买了垃圾桶。
这两种商品并不是同类商品,而且也不是互补商品。
不是买饮料就需要买垃圾桶,所以这两者也不是因果关系。
大数据的相关思维亦是如此。
我们强调全样,忽略抽样,当我们对做的全部数据进行步骤分析时,由于存在一个反例,因此因果关系并不成立。
在大数据时代中,因果关系几乎是不可能存在的,剩下的就是相关关系。
在这个大数据时代,程序员也要与时俱进,不能只关注眼前的工作,使用自己熟悉的编程语言,大数据的学习也刻不容缓。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据带来的四种思维作者:张义祯近年来大数据技术的快速发展深刻改变了我们的生活、工作和思维方式。
大数据研究专家舍恩伯格指出,大数据时代,人们对待数据的思维方式会发生如下三个变化:第一,人们处理的数据从样本数据变成全部数据;第二,由于是全样本数据,人们不得不接受数据的混杂性,而放弃对精确性的追求;第三,人类通过对大数据的处理,放弃对因果关系的渴求,转而关注相关关系。
事实上,大数据时代带给人们的思维方式的深刻转变远不止上述三个方面。
笔者认为,大数据思维最关键的转变在于从自然思维转向智能思维,使得大数据像具有生命力一样,获得类似于“人脑”的智能,甚至智慧。
总体思维社会科学研究社会现象的总体特征,以往采样一直是主要数据获取手段,这是人类在无法获得总体数据信息条件下的无奈选择。
在大数据时代,人们可以获得与分析更多的数据,甚至是与之相关的所有数据,而不再依赖于采样,从而可以带来更全面的认识,可以更清楚地发现样本无法揭示的细节信息。
正如舍恩伯格总结道:“我们总是习惯把统计抽样看作文明得以建立的牢固基石,就如同几何学定理和万有引力定律一样。
但是,统计抽样其实只是为了在技术受限的特定时期,解决当时存在的一些特定问题而产生的,其历史不足一百年。
如今,技术环境已经有了很大的改善。
在大数据时代进行抽样分析就像是在汽车时代骑马一样。
在某些特定的情况下,我们依然可以使用样本分析法,但这不再是我们分析数据的主要方式。
”也就是说,在大数据时代,随着数据收集、存储、分析技术的突破性发展,我们可以更加方便、快捷、动态地获得研究对象有关的所有数据,而不再因诸多限制不得不采用样本研究方法,相应地,思维方式也应该从样本思维转向总体思维,从而能够更加全面、立体、系统地认识总体状况。
大数据是数据数量上的增加,以至于我们能够实现从量变到质变的过程。
如:照片到电影,一分钟一张,一秒钟一张,一秒钟24张成了电影量变质变定律有时间阶段发展影响和空间相关关联影响离散思维向连续思维转换让我来告诉大家,美国有一家创新企业。
它可以帮助人们做购买决策,告诉消费者什么时候买什么产品,什么时候买最便宜。
预测产品的价格趋势。
这家公司背后的驱动力就是大数据。
他们在全球各大网站上搜集数以十亿计的数据,然后帮助数以十万计的用户省钱,为他们的采购找到最好的时间,提高生产率,降低交易成本,为终端的消费者带去更多价值。
在这类模式下,尽管一些零售商的利润会进一步受挤压,但从商业本质上来讲,可以把钱更多地放回到消费者的口袋里,让购物变得更理性。
这是依靠大数据催生出的一项全新产业。
这家为数以十万计的客户省钱的公司,在几个星期前,被ebay以高价收购。
再举一个例子,SWIFT是全球最大的支付平台,在该平台上的每一笔交易都可以进行大数据的分析。
他们可以预测一个经济体的健康性和增长性。
比如,该公司现在为全球性客户提供经济指数,这又是一个大数据服务。
容错思维在小数据时代,由于收集的样本信息量比较少,所以必须确保记录下来的数据尽量结构化、精确化,否则,分析得出的结论在推及总体上就会“南辕北辙”,因此,就必须十分注重精确思维。
然而,在大数据时代,得益于大数据技术的突破,大量的非结构化、异构化的数据能够得到储存和分析,这一方面提升了我们从数据中获取知识和洞见的能力,另一方面也对传统的精确思维造成了挑战。
舍恩伯格指出,“执迷于精确性是信息缺乏时代和模拟时代的产物。
只有5%的数据是结构化且能适用于传统数据库的。
如果不接受混乱,剩下95%的非结构化数据都无法利用,只有接受不精确性,我们才能打开一扇从未涉足的世界的窗户”。
也就是说,在大数据时代,思维方式要从精确思维转向容错思维,当拥有海量即时数据时,绝对的精准不再是追求的主要目标,适当忽略微观层面上的精确度,容许一定程度的错误与混杂,反而可以在宏观层面拥有更好的知识和洞察力。
相关思维在小数据世界中,人们往往执着于现象背后的因果关系,试图通过有限样本数据来剖析其中的内在机理。
小数据的另一个缺陷就是有限的样本数据无法反映出事物之间的普遍性的相关关系。
而在大数据时代,人们可以通过大数据技术挖掘出事物之间隐蔽的相关关系,获得更多的认知与洞见,运用这些认知与洞见就可以帮助我们捕捉现在和预测未来,而建立在相关关系分析基础上的预测正是大数据的核心议题。
通过关注线性的相关关系,以及复杂的非线性相关关系,可以帮助人们看到很多以前不曾注意的联系,还可以掌握以前无法理解的复杂技术和社会动态,相关关系甚至可以超越因果关系,成为我们了解这个世界的更好视角。
舍恩伯格指出,大数据的出现让人们放弃了对因果关系的渴求,转而关注相关关系,人们只需知道“是什么”,而不用知道“为什么”。
我们不必非得知道事物或现象背后的复杂深层原因,而只需要通过大数据分析获知“是什么”就意义非凡,这会给我们提供非常新颖且有价值的观点、信息和知识。
也就是说,在大数据时代,思维方式要从因果思维转向相关思维,努力颠覆千百年来人类形成的传统思维模式和固有偏见,才能更好地分享大数据带来的深刻洞见。
当然,相关关系并不是大数据洞察的终结目标。
在很多情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅“是什么”时,我们就会继续朝向因果关系的研究,寻求“为什么”,并且基于相关关系的分析,进一步寻求因果关系将会大大降低其分析成本。
其实,因果关系就是一种特殊的相关关系。
智能思维不断提高机器的自动化、智能化水平始终是人类社会长期不懈努力的方向。
计算机的出现极大地推动了自动控制、人工智能和机器学习等新技术的发展,“机器人”研发也取得了突飞猛进的成果并开始一定应用。
应该说,自进入到信息社会以来,人类社会的自动化、智能化水平已得到明显提升,但始终面临瓶颈而无法取得突破性进展,机器的思维方式仍属于线性、简单、物理的自然思维,智能水平仍不尽如人意。
但是,大数据时代的到来,可以为提升机器智能带来契机,因为大数据将有效推进机器思维方式由自然思维转向智能思维,这才是大数据思维转变的关键所在、核心内容。
众所周知,人脑之所以具有智能、智慧,就在于它能够对周遭的数据信息进行全面收集、逻辑判断和归纳总结,获得有关事物或现象的认识与见解。
同样,在大数据时代,随着物联网、云计算、社会计算、可视技术等的突破发展,大数据系统也能够自动地搜索所有相关的数据信息,并进而类似“人脑”一样主动、立体、逻辑地分析数据、做出判断、提供洞见,那么,无疑也就具有了类似人类的智能思维能力和预测未来的能力。
“智能、智慧”是大数据时代的显著特征,大数据时代的思维方式也要求从自然思维转向智能思维,不断提升机器或系统的社会计算能力和智能化水平,从而获得具有洞察力和新价值的东西,甚至类似于人类的“智慧”。
舍恩伯格指出,“大数据开启了一个重大的时代转型。
就像望远镜让我们感受宇宙,显微镜让我们能够观测到微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发”。
大数据时代将带来深刻的思维转变,大数据不仅将改变每个人的日常生活和工作方式,改变商业组织和社会组织的运行方式,而且将从根本上奠定国家和社会治理的基础数据,彻底改变长期以来国家与社会诸多领域存在的“不可治理”状况,使得国家和社会治理更加透明、有效和智慧关于大数据本身的价值已无需赘述,此处重点讨论关于大数据的3个思维变化:1.不是随机样本,而是全体数据;2.不是精确性,而是混杂性,尤其是大数据的简单算法比小数据的复杂算法有效;3.不是因果关系,而是相互关系。
《大数据时代》一书提醒读者,大数据是全数据,至少维度要全,这带来了观察和分析事物的角度变化,尤其相对于传统IT系统数据,大数据强调了数据的外部性和实时性,这两个特性也使得“证析”提到的基于事实(Evidence)的分析成为可能,不过此书忽略了外部数据与企业内部数据结合的分析价值。
比如,对于政府来说,分析大范围的公共卫生事件、传染病可以更快地利用大数据(比如微博)发现目前的情况,但具体要调度资源,还是需要结合“小数据”的精确决策。
第2点的核心观念关于大数据的简单算法来自谷歌的洞见,也来自于Hadoop (一个分布式系统基础架构,由Apache基金会开发)这类算法的核心理念。
大数据的简单算法是一种统计学的逻辑,这个如同热力学的分析模式,热力学并不关心具体的分子运动,而是关心温度、体积、压强之间的宏观联系,关于这种理念的内在理解,建议读者从吴军的《数学之美》一书中获得,只有真正理解了大数据基于统计学的思维方式,才能理解它的独特优势和局限。
这种方式可以解决以往技术无法解决的大范围、实时性和并行处理等问题,并带来新的洞见,它用概率说话,并不是和人就细节较真。
这个来自互联网公司的观念是,希望先解决80%的趋势问题,然后慢慢精细化。
第3点,大数据关注“是什么”,而不是“为什么”,经常网购的人会更容易体会。
很多电商网站的推荐引擎具备这种能力,它能够在顾客买书的时候,推荐顾客刚好喜欢的其他书籍,顾客可能不知道“为什么”,其实网站也不在乎“为什么”,(“为什么”可以由学术专家慢慢分析)。
但是网站根据成千上万甚至上亿人的统计学分析,就可以发现“关联物”,或者说大数据更擅长通过统计分析人类所不能感知的关联,并建议人采取行动。
这个革命式的思维非同小可,以前“啤酒+尿布”的数据仓库故事数据整理、清洗转换和专家建模挖掘,其采购行为的关联性可能被Hadoop等算法轻易的发现。
上述方式由于分析门槛低,已经成为一种常见的工具,并衍生大数据的云服务的商业模式,成为企业可以购买的“分析即服务”(Analytics as a Services),国内阿里系正致力于这种模式的建立。
正如周涛教授所言,大数据的核心问题在于预测。
电子商务网站通过数据预测顾客是否会购买推荐的产品;信贷公司通过数据预测借款人是否会违约;执法部门用大数据预测特定地点发生犯罪的可能性;交通部门利用数据预测交通流量。
但是,预测不是大数据时代才有的新问题,它是人类本能的一部分。
心理学家认为,对世界一致性观点的需求以及对环境控制力的需求是人类的两个基本需求,以赛亚*伯林(Isaish Berlin)曾经援引古希腊诗人的残简“狐狸多知而刺猬有一大知”将知识分子分为狐狸和刺猬两类。
刺猬用一个宏大的概念解释所有现象,如约翰博士一般;狐狸知道很多事情,用多元化的甚至相互矛盾的视角看待问题,狐狸也愿意包容新的证据以使得自己的模型与之相适应,如胖托尼一般。
Tetlock等人的研究表明,在现实的预测中,狐狸的表现要优于刺猬。
在大数据时代,人们能够接触越来越多的信息,这些信息能否修订决策者已有的观念,对决策者的决策产生影响,这是大数据能否发挥价值的关键所在。
有些刺猬类决策者,他们可能会有意无意忽略与其观念相左数据而只保留那些能够证明其想法的数据,在这里无论系统处理了什么规模的数据,这些系统投资也只是粉饰太平的装饰,没有太大意义。