大数据时代的大数据思维讲义
大数据培训讲义PPT(共 75张)

大数据生态:软件是引擎
大数据技术要解决的问题
企业用以分析的数据越全面,分析的结果就越接近于真实。大数据分析意 味着企业能够从这些新的数据中获取新的洞察力,并将其与已知业务的各 个细节相融合。
大数据技术被设计用于在 成本可承受的条件下,通 过非常快速(velocity) 地采集、发现和分析,从 大量(volumes)、多 类别(variety)的数据 中提取价值(value), 将是IT 领域新一代的技 术与架构。
大数据
主讲人:刘永磊
大数据的定义理解
1
大数据时代的背景
什么是大数据 2
大数据的“4V”特征
3
大数据的构成
大数据时代的背景
半个世纪以来,随着计算机技术全面融入社会生活,信息爆炸已经积累到 了一个开始引发变革的程度。它不仅使世界充斥着比以往更多的信息,而且其 增长速度也在加快。互联网(社交、搜索、电商)、移动互联网(微博)、物 联网(传感器,智慧地球)、车联网、GPS、医学影像、安全监控、金融(银 行、股市、保险)、电信(通话、短信)都在疯狂产生着数据。
• 统计和分析:A/B test; top N排行榜;地域占比; 海量数据的查询、统计、更新等操作效率低
文本情感分析
• 非结构化数据
• 数据挖掘:关联规则分析;分类;聚类
图片、视频、word、pdf、ppt等文件存储
• 模型预测:预测模型;机器学习;建模仿真
不利于检索、查询和存储
• 半结构化数据
• 非关系数据库
(NoSQL)
• 数据仓库
• 云计算和云存储
• 实时流处理
分布式文件系统
分布式文件系统(Distributed File System)是指文件系统管理 的物理存储资源不一定直接连接在本地节点上,而是通过计算机 网络与节点相连。
大数据时代的大数据思维(一)2024

大数据时代的大数据思维(一)引言概述:随着科技的不断进步和互联网的快速发展,大数据已经成为当今社会中一个非常重要且不可忽视的概念。
大数据时代,各行各业面临着海量数据的挑战和机遇,要想在这个时代中保持竞争优势,就必须具备大数据思维。
本文将介绍大数据时代的大数据思维,具体包括数据驱动、数据融合、数据分析、数据隐私和数据安全等五个大点,并为每个大点详细列举了相关的小点。
正文:一、数据驱动1. 数据驱动的概念和作用2. 如何将数据驱动融入企业决策中3. 数据驱动对于创新和竞争力的重要性4. 数据驱动的成功案例5. 数据驱动对于业务战略的影响二、数据融合1. 数据融合的定义和意义2. 数据融合的方法和技术3. 数据融合的挑战及解决方案4. 数据融合在企业中的应用场景5. 数据融合带来的业务效益和价值三、数据分析1. 数据分析的基本概念和目的2. 数据分析的方法和工具3. 数据分析在决策中的应用4. 数据分析对于产品和市场的影响5. 数据分析对于预测和规划的重要性四、数据隐私1. 数据隐私的定义和保护措施2. 数据隐私对企业和个人的影响3. 数据隐私法律与合规要求4. 数据隐私管理的挑战及应对策略5. 数据隐私保护的最佳实践五、数据安全1. 数据安全的重要性和威胁2. 数据安全的保护措施和技术3. 数据安全管理的挑战与解决方案4. 数据安全对企业和个人的影响5. 数据安全保护的最佳实践总结:大数据时代的大数据思维已经成为各行各业必备的核心能力。
数据驱动、数据融合、数据分析、数据隐私和数据安全是大数据思维的重要组成部分。
通过充分利用数据驱动、数据融合和数据分析,企业可以更好地应对市场变化,加强创新能力。
同时,数据隐私和数据安全保护是企业和个人必须重视的问题,需要合理规划和实施相应的保护措施。
随着大数据时代的不断发展,大数据思维将成为帮助企业取得成功的关键因素之一。
大数据需要什么思维(二)2024

大数据需要什么思维(二)引言概述:随着大数据时代的到来,企业和组织对数据分析和处理的需求日益增加。
在这个过程中,如何正确应用大数据思维成为了一个关键问题。
本文将从五个大点出发,探讨大数据需要什么思维。
正文:一、数据驱动思维1. 了解数据的价值:认识到数据是企业和组织的重要资产,具有巨大的商业价值。
2. 数据收集与整理:建立完善的数据收集机制,保证数据的准确性和完整性。
3. 数据分析与决策:将数据分析结果应用于决策过程,并通过数据驱动决策提高企业和组织的效率和准确性。
4. 数据共享与合作:积极寻求数据共享合作,扩大数据的应用范围和影响力。
5. 数据隐私和安全:重视数据的隐私和安全问题,建立合适的数据保护机制。
二、创新思维1. 挖掘潜在需求:通过大数据分析发现用户或市场的新需求,为产品和服务创新提供支持。
2. 快速迭代与反馈:通过不断试错和快速迭代,实现产品和服务的优化和改进。
3. 开放式创新:通过开放接口和数据共享,促进创新生态系统的建立,吸引更多创新者参与。
4. 多元思维融合:借助大数据分析,整合不同领域的知识和思维,实现创新的跨越性发展。
5. 利用数据科学方法:结合数据科学方法,进行分析和模型建立,推动创新的发展和落地。
三、智能思维1. 机器学习和算法:通过机器学习和算法的应用,实现有针对性的推荐和决策。
2. 自动化与智能化:借助人工智能技术,实现流程的自动化和智能化,提高效率和精确度。
3. 数据挖掘与发现:通过大数据分析挖掘潜在的信息和趋势,为企业和组织的决策提供支持。
4. 辅助决策工具:利用数据分析和智能算法,开发辅助决策工具,提供决策的参考和建议。
5. 数据驱动的智慧及时决策:通过实时数据分析和智能决策系统,实现智慧及时决策的能力。
四、技术思维1. 技术的理解与应用:掌握大数据相关的技术知识和工具,灵活运用于实际项目中。
2. 数据清洗和预处理:了解数据处理的流程和方法,对数据进行清洗和预处理,提高数据质量和可用性。
大数据时代的大数据思维课件

利用大数据技术分析教学效果、学生反馈,优化教学方法 和策略。
政府领域:智慧政务与公共管理
智慧政务
通过大数据提高政府服务的效率和质量,实现政务信息 的共享和协同。
公共管理
基于大数据的监测和分析,提高公共安全、应急管理的 响应速度和效果。
04
大数据思维的挑战与应对策 略
数据安全与隐私保护的挑战
数据泄露风险
03
大数据思维在各领域的应用
商业领域:精准营销与个性化服务
精准营销
利用大数据分析消费者的购买行 为、兴趣偏好,实现精准的产品 推荐和广告投放。
个性化服务
根据用户需求和习惯,提供定制 化的产品或服务,提升客户满意度。
医疗领域:个性化医疗与精准诊断
个性化医 疗
基于患者的基因、生活习惯等数据, 制定个性化的治疗方案。
精准诊断
通过分析医疗影像、病理切片等数据, 提高诊断的准确性和效率。
பைடு நூலகம்
金融领域:风险管理与投资决策
风险管理
利用大数据分析市场趋势、企业财务 数据,预测和防范潜在风险。
投资决策
基于大数据的量化分析和预测,做出 更科学、合理的投资选择。
教育领域:个性化教育与智能教学
要点一
个性化教育
要点二
智能教学
根据学生的学习能力、兴趣爱好,提供个性化的学习资源 和辅导。
数据质量与可靠性的挑战
01
数据来源多样性和复杂性
大数据来源广泛,数据类型多样,导致数据质量参差不齐,难以保证数
据的准确性和可靠性。
02
数据清洗和整理难度大
由于数据量大、格式不统一等问题,数据清洗和整理工作量大,成本高。
03
应对策略
大数据基础教学讲义—大数据思维

项目二大数据思维知识目标➢熟悉大数据思维的核心原理➢熟悉大数据思维的三个维度➢熟悉运用大数据思维的案例分析能力目标➢掌握大数据思维的三个维度➢掌握大数据的思维方式素质目标通过本项目的学习,学生应该具备大数据思维。
知识精讲任务一大数据思维的核心原理1一、数据核心原理在大数据时代,计算模式发生了转变,从“流程”核心转变为“数据”核心。
非结构化数据及分析需求,将改变IT系统的升级方式:从简单增量到架构变化。
例如,IBM将使用以数据为中心的设计,目的是降低在超级计算机之间进行大量数据交换的必要性。
大数据下,云计算找到了破茧重生的机会,在存储和计算上都体现了以数据为核心的理念。
大数据和云计算的关系:云计算为大数据提供了有力的工具和途径,大数据为云计算提供了很有价值的用武之地。
而大数据比云计算更为落地,可有效利用已大量建设的云计算资源,最后加以利用。
1教育信息化行业大数据工作相关人士必备10大数据思维原理.苏州教育信息化,2017(3):1-4。
科学进步越来越多地由数据来推动,海量数据给数据分析既带来了机遇,也构成了新的挑战。
大数据往往是利用众多技术和方法,综合源自多个渠道、不同时间的信息而获得的。
为了应对大数据带来的挑战,我们需要新的统计思路和计算方法。
以数据为核心,反映了当下IT产业的变革,数据成为人工智能的基础,也成为智能化的基础,数据比流程更重要,数据库、记录数据库,都可开发出深层次信息。
云计算机可以从数据库、记录数据库中搜索出你是谁,你需要什么,从而推荐给你需要的信息,这是大数据核心的典型体现。
二、数据价值原理非互联网时期的产品,功能是它的价值;当今互联网时期的产品,数据是它的价值。
大数据并不在“大”,而在于“有用”,价值含量、挖掘成本比数量更为重要。
不管大数据的核心价值是不是预测,但是基于大数据形成决策的模式已经为不少企业带来了盈利和声誉。
数据能告诉我们,每一个客户的消费倾向,他们想要什么,喜欢什么,每个人的需求有哪些区别,哪些又可以被集合到一起来进行分类。
大数据时代的大数据思维

随着大数据技术的不断发展,数据驱动决策的应用范围将越来越广泛。越来越多的行业和领域将开始采 用数据驱动决策的方法,以提高决策效率和准确性。
数据价值的深度挖掘
01
数据价值的认识
在大数据时代,数据的价值得到了更深入的认识。数据不仅是记录事实
的载体,更是蕴含着巨大价值的资源。通过对数据的深度挖掘和分析,
大数据需要快速地处理,以满足实时 性需求。
06
价值密度低
由于数据量巨大,有用的信息可能被淹没,需 要经过筛选和处理才能提取出有价值的信息。
大数据的发展历程
萌芽期
起步期
随着计算机技术的普及,人们开始意识到 数据的价值,但受限于数据处理能力和存 储成本,大数据的应用受到限制。
随着云计算技术的出现,大数据的存储和 计算能力得到提升,大数据开始在某些领 域得到应用。
创新对大数据思维的 影响
数据技术的持续创新将进一步推动大 数据思维的发展和应用。随着技术的 不断进步,数据分析将更加深入、全 面和精准,从而帮助人们更好地理解 数据背后的规律和趋势,进一步推动 大数据思维的应用和发展。
THANKS FOR WATCHING
感谢您的观看
06 大数据思维的发展趋势与 展望
数据驱动决策的普及化
数据驱动决策
在大数据时代,越来越多的组织和个人开始依赖数据来制定决策。数据不仅提供了客观的事实依据,还能够帮助决策 者深入了解问题,从而做出更明智的决策。
数据驱动决策的优势
数据驱动决策具有客观性、准确性和可预测性等优势。通过数据分析,组织可以更好地了解市场趋势、用户需求和业 务运营情况,从而制定出更有效的战略和计划。
数据质量
大数据时代的数据来源众多,数据质 量参差不齐。为了确保数据的准确性 和可靠性,需要进行数据清洗和质量 控制,去除无效和错误的数据。
大数据时代生活工作与思维的大变革概述PPT课件

– 美国国土安全部声称,在研究测试中,系统检 测的准确度可以达到70%。
大数据时代生活工作与思维的大变革 概述(PP T37页)
大数据时代生活工作与思维的大变革 概述(PP T37页)
• 大多数情况下,我们已经在以预测之名采 用大数据分析。它把我们放在一个特定的 人群之中来对我们进行界定。
我们的隐私被二次利用了
• 实例:能源的使用情况暴露了一个人的日 常习惯、医疗条件和非法行为等。
– 实例,美国和欧洲部署的一些智能电表每6秒 钟采集一个实时读数,这样一天所得到的数据 比过去传统电表收集到的所有数据还要多。因 为每个电子设备通电时都会有自己独特的“负 荷特征”,比如热水器不同于电脑,而它们与 Led大麻生长灯又不一样。
– 传感器从炼油厂采集的数据工厂的机器数据、 – 机场的气象数据 – 沙井盖爆炸数据等。
• 事实上,这方面的数据分析并不威胁个人 隐私。
我们的隐私被二次利用了
• 目前所采集的大部分数据都包含有个人信 息,而且存在着各种各样的诱因,让我们 想尽办法去采集更多、存储更久、利用更 彻底,甚至有的数据表面上并不是个人数 据,但是经由大数据处理之后就可以追溯 到个人了。
大数据时代生活工作与思维的大变革 概述(PP T37页)
大数据时代生活工作与思维的大变革 概述(PP T37页)
我们的隐私被二次利用了
1. 法律手段保护——告知于许可:大数据的 二次利用颠覆了隐私保护法:无法征得个人 同意
– 公司无法告知个人尚未想到的用途,而个人亦 无法同意这种尚是未知的用途。
– 一开始的时候就要用户同意所有可能的用途, 也是不可行的。
– 大数据时代,告知与许可这个经过了考验并且 可信赖的基石,要么太狭隘,限制了大数据潜 在价值的挖掘,要么就太空泛而无法真正地保 护个人隐私。
大数据带来的四种思维

大数据带来的四种思维大数据带来的四种思维一、引言随着大数据时代的到来,我们需要调整我们的思维方式以适应变化的环境。
传统的思维方式已经无法满足对海量数据的处理和分析需求。
因此,本文将介绍大数据时代下的四种思维方式,以帮助读者更好地适应并应用大数据。
二、数据驱动思维大数据时代下的数据驱动思维是基于大数据的分析和应用。
它强调通过数据的收集、存储、分析和应用来推动决策和创新。
数据驱动思维需要具备数据收集和分析的能力,以及对数据产生的洞察力和创新思考的能力。
通过数据驱动思维,我们可以更好地理解客户需求、优化业务流程、提升产品质量等。
2.1 数据收集数据收集是数据驱动思维的关键环节。
我们需要收集各种类型的数据,包括结构化数据(如数据库中的数据)和非结构化数据(如社交媒体上的评论)。
我们可以通过各种手段收集数据,包括传感器、网络爬虫、调研等。
2.2 数据存储数据存储是数据驱动思维的另一个关键环节。
我们需要建立可靠和高效的数据存储系统,以存储海量数据并实时访问。
常用的数据存储技术包括关系型数据库、NoSQL数据库、分布式文件系统等。
2.3 数据分析数据分析是数据驱动思维的核心环节。
我们需要通过数据分析来揭示数据中的规律和趋势,并从中获得有价值的信息。
常用的数据分析技术包括统计分析、机器学习、数据挖掘等。
2.4 数据应用数据驱动思维的最终目标是通过数据的应用来推动决策和创新。
我们可以将数据应用于市场营销、产品设计、供应链管理等各个方面,以实现更好的业务结果和用户体验。
三、实时思维大数据时代下的实时思维是基于实时数据分析和应用。
它强调通过实时数据的收集、分析和应用来获取决策和创新的实时洞察力。
实时思维需要具备实时数据收集和分析的能力,以及对实时数据的快速处理和应用的能力。
通过实时思维,我们可以更快速地做出决策、应对市场变化和提供实时服务。
3.1 实时数据收集实时数据收集是实时思维的关键环节。
我们需要通过各种实时数据源收集实时数据,包括传感器、日志、交易记录等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
农夫山泉用大数据卖矿泉水
“大自然搬运工” ,在全国有十多个水源地 “搬上搬下,银子哗哗”:一瓶超市售价2元的 550ml饮用水,其中3毛钱花在了运输上 如何根据不同的变量因素来控制物流成本 道路等级、天气、配送中心辐射半径、季节性变化 、不同市场的售价、不同渠道的费用、各地的人力 成本、甚至突发性的需求 业务员每天例行公事:到销售点拍摄10张照片:水怎 么摆放、位置有什么变化、高度如何…… 一天要跑15个,下班之前150张照片传回总部,产 生的数据量在10M 全公司1万个业务员,每天100G,每月3TB
速度( Velocity):实时变化(输入和处理速 度快) 对处理时间的要求 种类(Variety)):多样化(多源异构) 结构化 非结构化:文本、图象等 价值(Value):价值密度低 大海捞针? 数据本身不产生价值,如何分析和利用大数 据对业务产生帮助才是关键 例:Facebook上市前有形资产价值66亿美元, 但估值1040亿美元 2009年-2011年间收集了2.1万亿条获利信息
大数据时代的大数据思维
茅宁 南京大学管理学院
不讲大数据就“OUT”了
如何理解大数据 技术:大云平移 产业:商业革命 资产:数据资产 思维:管理革命和思维革命 大数据时代:改变我们的生活、工作和思维方式 Gartner公司(3V+1):大数据是指数量大、变 化快和(或)多样化的信息资产,需要新的处理 形式,从而强化决策、促进洞察力和优化流程
传统 抽样数据、局部数据和片面数据 经验、假设和价值观 未来 要全体不要抽样 要效率不要绝对精确 要相关不要因果 分析过去,提醒现在,展望未来
Gary Loveman博士的经历
1989年在MIT获经济学博士学位后在哈佛商学院任教 专长是数据挖掘和服务管理:客户心理分析 数学只是象牙塔里学究们出于个人兴趣的消遣,而对真 实世界的决策没有帮助,这让他一度感到沮丧 1994年在HBR发表一篇文章引起企业关注 1997年接受主营赌场业务的哈拉斯娱乐公司(Harrah’s Entertainment)邀请,担任该公司COO 他只准备待两年,为此请了两年学术假期 再没有返回哈佛大学,2003年接任该公司CEO 关键:使用数学运营赌场
利用大数据提供优质服务
通过对顾客消费模式的分析,计算出顾客的长期价值 (customer worth) 一个顾客理论上长期会在Harrah’s总共消费多少 26%的客户贡献了82%的收入:前者并不是大多数 赌场一直在争取的金领豪客,而是中产阶级的中老 年顾客(教师、医生、银行职员等) 系统能根据顾客背景资料及历史消费模式计算出顾客 的痛苦点(pain point) 如果他输钱超过痛苦点,今晚的赌博会成为一个痛 苦的回忆,离开Harrah’s后一去不返 实时做出对策:提供免费餐券劝退
Google流感预测:国家、地区
预测 疾病预测 城市预测 房地产预测 票房预测 就业预测品牌分析 媒体分析 舆情分析 统计 精算 推荐 筷搜?
大数据:价值潜力与捕捉难度
大数据对企业的革命性影响
有能力从以自我为中心改变为以客户为中心 从产品创新到需求创新:强需求胜过好产品 导致管理方式的重构 业务本身就可以自决策,不必要依靠膨大的组织和 复杂的流程 改变了商业逻辑 从观察、思考、推理、决策到直接获得答案 决策文化变革:让数据做主 从全新视角来发现新的商业机会和重构新的商业模式 广角镜+显微镜
哈拉斯娱乐公司的特色
每年在信息系统上的投资超过1亿美元 推行了一套名为“完全回馈”(Total Reward )的会员卡制度,所有消费都用卡 到2010年,已积累超过4000万会员的信息,是 博彩业最大的客户数据库 公司从地方性企业成长为全球最大的博彩公司 (拥有39家本土赌场、13家海外赌场) 2010年改名为凯撒娱乐公司(Caesars Entertainment)
例2:把握居民电力消费行为特征
人类对自身能源消耗的细节并不了解 在这些细节中暗藏了大量无效率的能源浪费 不同的消费形态造成不同的发电成本 不同发电成本负担的消费者支付了相同价格,从而造 成巨大的无效率 现有定价机制无法根据消费形态不同区分不同价格 通常假设居民电力消费行为具有“双峰”特点 由智能电表得到的大数据分析不支持:每隔15分钟测 量 虽然总体呈现此模式,但个体模式各异(只有10%) 通过大数据技术设计高效节能电力消费模式
大数据内涵的三维度解析
实践
公共(互联网)数据 政务数据 产业(企业)数据 个人(用户)数据(i-data)
大数据特征
技术
数据信息采集、传输、存贮、处理和分析能力 ——云技术、分布式处理技术、存贮技术、感 知技术 ——分析技术:可视化分析、数据挖掘算法、 语义搜索引擎、数据质量与数据管理、预测性 分析
大数据实践
广泛应用数据、使用统计与量化分析方 法、使用描述性与预测性模型以及基于 事实的管理方法影响决策和行动 核心:用大数据思维去发掘大数据的潜 在价值
以基于大数据的预测分析为例
消费行为:营销 人的社交活动:恋爱、离婚、生育 人的思考与决策:竞选、论文评分、情绪 人的放弃:惠普对30多万员工的离职风险评估 事故:保险、破产 疾病和死亡 撒谎、欺诈、犯罪 西格尔,《大数据预测》,中信出版社,2014年4月 大数据预测的147项案例
林彪的大数据思维
辽沈战役期间,林彪要求每天要进行“军情汇报” 由值班参谋读出各单位用电台报告的当日战况和缴获 几乎是重复着千篇一律枯燥无味的数据 一天,参谋汇报当日战况时,林彪突然打断他:“刚 才念的在胡家窝棚那个战斗的缴获,你们听到了吗?” 见无人回答,接连问了三句 为什么那里缴获的短枪与长枪比例比其它战斗略高 为什么那里缴获和击毁的小车与大车的比例比其它 战斗略高? 为什么在那里俘虏和击毙军官与士兵的比例比其它 战斗略高? “我猜想,不,我断定!敌人的指挥所就在这里! 果然,部队很快就抓住了敌方指挥官廖耀湘
大数据不擅长的
数据不懂社交:”质“与”量“ 数据不懂背景:情景因素 数据会制造出更大的“干草垛”:噪声 数据偏爱潮流,忽视杰作:短期与长期 大数据无法解决大问题 数据掩盖了价值观念
结语
大数据并不是一个充斥着运算法则和机器的冰冷世界 ,其中仍需要人类扮演重要角色 人类独有的弱点、错觉、错误都是十分必要的,因为 这些特征的另一头牵着的是人类的创造力、直觉和天 赋 更大的数据源于人本身 如何拥抱大数据 明道:掌握核心理念 优术:提升分析能力 合众:鼓励合作攻关 践行:坚持知行合一
基因测序与个性化医疗的实现
一种新型基因检测技术,能够从血液或唾液中分析测定 基因全序列 意义:预知未来健康状况,有针对性地进行保健和治疗 ,帮助人们从被动预防治疗走向主动预知健康 乔布斯和影星安吉丽娜· 朱莉 市场比保健市场更为庞大,未来将达到几百万亿美元 问题:消耗时间、代价昂贵 一个肿瘤患者的基因组容量是2-3T 借助于大数据,基因测序的成本已经从几十万美元逼近 1000美元大关
投资决策
电影《永无止境》的故事 一位落魄的作家库珀服用了一种可以迅速提升智力的 神奇蓝色药物,然后他将这种高智商用于炒股 在短时间掌握无数公司资料和背景:将世界上已经存 在的海量数据(包括公司财报、电视、互联网、小道 消息等)挖掘出来 甚至将Face Book、Twitter的海量社交数据挖掘得到普 通大众对某种股票的感情倾向 通过海量信息的挖掘、分析,使一切内幕都不是内幕 ,使一切趋势都在眼前 在10天内赢得了200万美元,神奇的表现让身边的职业 投资者目瞪口呆 启示:如果人类将剩余80%的大脑潜能激发出来
大有大的道理
戴明:除了上帝,任何人都必须用数据来说话 对大部分事物来说,平均值猜猜瓶子里有多少钱? 猜得最准的个人距离正确答案10美元 所有猜测的平均值距离正确答案3美元 365美元
数据、模型和理论的关系
光大是不够的
大数据相关技术
苏珊.朗格,《哲学新解》
某些观念有时会以惊人的力量给知识状况带来巨大的 冲击 由于这些观念能够一下子解决许多问题,所以,它似 乎将有希望解决所有基本问题,澄清所有不明了的疑 点 每个人都想迅速地抓住它们,作为进入某种新实证科 学的法宝,作为可以用来建构一个综合分析体系的概 念轴心 这种“宏大概念突然流行起来,一时间把几乎所有的 东西都挤到了一边
例3 再现现场环境发现新的需求
PRADA在纽约的旗舰店中每件衣服上都有RFID码 每当一个顾客拿起一件PRADA进试衣间,RFID会被自 动识别,数据会传至PRADA总部 每一件衣服在哪个城市哪个旗舰店什么时间被拿进试 衣间停留多长时间,数据都被存储起来加以分析 如果有一件衣服销量很低,以往的作法是直接干掉 如果RFID传回的数据显示这件衣服虽然销量低,但进 试衣间的次数多 某个细节的微小改变就会重新创造出一件非常流行的 产品
数据量(Volume)
全量超大规模(海量) K、MB(兆)、G、T、P、E、Z、Y、N、D、C 大数据的起始计量单位至少是P(1000个T) 不仅是规模,更重要的是增长速度 到2012年,人类生产的所有印刷材料数据量是200PB ,全人类历史上说过的所有话的数据量大约是5EB 整个人类文明所获得的全部数据中,有90%是过去两 年内产生的 到了2020年,全世界所产生的数据规模将达到今天 的44倍