大数据时代的特征

大数据时代的特征
大数据时代的特征

随着云时代的来临,大数据也吸引了越来越多的关注。那么,大数据有哪些特征呢?

1、多元化。大数据时代,数据类别和格式多样,使得海量数据能够凸显出事物的多方面关联性,显示出多方面的信息内涵。大数据时代,全媒体趋势、信息媒体化趋势进一步加强,从而体现出多元化和多样性。

2、可量化。大数据时代,文字可以变成数据、方位可以变成数据、沟通可以变成数据、人从身体到心理可以实现自我量化,世间万物都可以变成数据,世间一切事物都可以作为“变量”。庞大的数据资源使得学术界、商业界、政府等各个领域开始量化进程。

3、个性化。海量数据是一种共享性、开放性的公共信息资源,大数据时代的文化共享、民主平权,使得每个人都可以从“云”中海量的共享性数据资源中调用、择取自己所需要的数据进行挖掘、分析,为己所用,从而真正地实现个性化发展、满足个性化需求。

4、互动性。大数据时代,人-人、人-机、机-机之间将实现全面互动。互联网实现了无距离互动,移动终端实现了时空互动,物联网实现了设备互动。信息和数据在各种互动中实现交流和共享,在不断传播中相互影响和相互作用。而人们则可以根据自己的需要和偏好,随时控制信息、信息量和信息呈现的秩序。

5、开放性。大数据时代是一个开放的时代,一切都被置于“第三只眼”中,分享、共享成为共识,社会将呈现出透明、公开、有序和生机的特征。移动终端、智能手机、摄像头以及其他诸多的信息采集设备和存储设备将海量数据置于公共空间,数据的对外开放为公众共享信息提供了基础。

6、预测性。大数据时代,依托多维度、多来源、多形式的海量数据和挖掘工具与分析技术的深度、广度与精度,通过海量交叉验证征兆与变化规律、发掘事件概率,做出较为精准的预判、预测,将引领人类无限接近控制未来的终极梦想。

以上就是全部内容,希望对大家有所帮助,感谢您的阅读!

互联网时代的四个特点

互联网时代的四个特点 现在关于互联网,有互联网思维、互联网技术革命、互联网创新,各种提法很多。但是我认为互联网不单是一种思维、一种技术,它是一个时代。置身于这个时代,不管你了解不了解,喜欢不喜欢,你都难以回避它的影响:它在改变我们的生活方式,颠覆我们的商业模式,冲击我们固有的思维方式,它迫使我们重新认识外部环境,重新认识客户,重新认识自己;要求我们自我否定、自我超越! 互联网作为一个时代,它具有什么特点?我认为这个时代有四个鲜明特点。 第一个特点:这是一个“通融互联”时代。 通,就是互联互通。互联互通超越时空差距,使组织与客户、人与人之间的距离零成本趋近,无障碍沟通与交流价值倍增。 融,就是整个世界的多元要素融为一体了。各种要素交织,形成了你中有我,我中有你;不知道敌人是谁,也不知道朋友是谁。人与人之间无距离融合后,界限就模糊了。 通融互联给企业带来的最大影响是信息对称和平衡了,由此形成了你中有我、我中有你的状态,这就把过去靠信息不对称进行“暗箱操作”来获取利益的盈利模式彻底颠覆了。互联网时代,企业要从不对称竞争走向对称竞争,利益都要摊到一个共同的桌面上,而且必须有新规则。由此,企业跟客户的关系、企业内部的管理模式,统统都将发生一场革命。 通融对称,这是互联网时代的一个突出特点,它带来的变化就是使得透明、规则、价值观这些东西变得更加重要。 第二个特点:这是一个“网状价值结构”时代。即以客户为中心的价值交互网和以人为中心的价值创造网。这里面又有几个关键特点:一个是先有客户价值才有企业价值。第二个就是组织从串联到并联,在内部呈网状结构,在外部也是如此。你中有我,我中有你,由无数个微型组织、自主经营体所编织而成的一个价值创造交互网。 网状结构的突出特点是:抓住一个点施力就可能迅速布满全局。在网状结构下,一个微创新可能会像“蝴蝶效应”一样引发巨大的价值创造能量。在网状价值结构的前提条件下,员工的创新精神和潜能的激发是组织活力的核心。所以也可以说,这将是一个围绕客户和人的价值来进行价值创造的时代。 第三个特点:这是一个大数据和高流动时代。互联网产生大数据,而大数据的特点是不精确和动态的。有人说,这是个“大明星也去吃大排档,小老百姓去买奢侈品”的时代,也就是说,客户的需求是不确定的、很多数据也变为不确定。但同时,大数据实际上也是大样本、全样本,可能比之前的抽样还要精准,从小数据、小样本中可预测到大趋势。因此,企业不能再单纯依靠精确定量化的数据来做理性分析,还需要基于大数据来分析趋势、捕捉机会。 同时,在互联网时代,资金、人、知识和信息等各种要素都将是高速流动的。这种情况下,企业最大的财富不再是简单的人才了,而是所拥有的数据与知识,以及如何使得你的数据和知识能够在各利益相关方之间进行应用、转换与创新。

大数据的概念、特征及其应用

马建光等:大数据的概念、特征及其应用 (2013-09-05 16:15:35) 转载▼ 分类:学习资料 标签: 杂谈 大数据的概念、特征及其应用 马建光,姜巍 (国防科技大学人文与社会科学学院,湖南长沙410074) 源自:国防科技2013年4月 [摘要]随着互联网的飞速发展,特别是近年来随着社交网络、物联网、云计算以及多种传感器的广泛应用,以数量庞大,种类众多,时效性强为特征的非结构化数据不断涌现,数据的重要性愈发凸显,传统的数据存储、分析技术难以实时处理大量的非结构化信息,大数据的概念应运而生。如何获取、聚集、分析大数据成为广泛关注的热点问题。介绍大数据的概念与特点,分别讨论大数据的典型的特征,分析大数据要解决的相关性分析、实时处理等核心问题,最后讨论大数据可能要面临的多种挑战。 [关键词]大数据; 非结构化信息; 解决核心问题; 未来挑战 一、引言 自上古时代的结绳记事起,人类就开始用数据来表征自然和社会,伴随着科技和社会的发展进步,数据的数量不断增多,质量不断提高。工业革命以来,人类更加注重数据的作用,不同的行业先后确定了数据标准,并积累了大量的结构化数据,计算机和网络的兴起,大量数据分析、查询、处理技术的出现使得高效的处理大量的传统结构化数据成为可能。而近年来,随着互联网的快速发展,音频、文字、图片视频等半结构化、非结构化数据大量涌现,社交网络、物联网、云计算广泛应用,使得个人可以更加准确快捷的发布、获取数据。在科学研究、互联网应用、电子商务等诸多应用领域,数据规模、数据种类正在以极快的速度增长,大数据时代已悄然降临。 首先,全球数据量出现爆炸式增长,数据成了当今社会增长最快的资源之一。根据国际数据公司IDC 的监测统计[1],即使在遭遇金融危机的2009 年,全球信息量也比2008 年增长了62%,达到80 万PB ( 1PB 等于10亿GB) ,到2011 年全球数据总量已经达到1. 8ZB ( 1ZB 等于1 万亿GB,) ,并且以每两年翻一番的速度飞速增长,预计到2020 年全球数据量总量将达到40 ZB,10年间增长20 倍以上,到2020 年,地球上人均数据预计将达5247GB。在数据规模急剧增长的同时,数据类型也越来越复杂,包括结构化数据、半结构化数据、非结构化数据等多种类型,其中采用传统数据处理手段难以处理的非结构化数据已接近数据总量的75%。 如此增长迅速、庞大繁杂的数据资源,给传统的数据分析、处理技术带来了巨大的挑战。为了应对这样的新任务,与大数据相关的大数据技术、大数据工程、大数据科学和大数据应用等迅速成为信息科学领域的热点问题,得到了一些国家政府部门、经济领域以及科学领域有关专家的广泛关注。2012 年3 月22 日,奥巴马宣布美国政府五大部门投资2 亿美元启动“大数据研究和发展计划( Big Data Research and Development Initiative) ”[2],欲大力推

大数据时代的挑战--价值与应对策略

2012中国国际信息通信展专刊 14 2012年第17期 大数据时代的挑战、价值与应对策略 随着全球数据量爆炸式的增长,大数据时代已经到来。文章从大数据时代的基本特征入手,引出了大数据时代面临的挑战以及大数据带来的价值,提出了以创新为核心的务实应对策略。 【摘 要】 【关键词】大数据时代 “四V ”特征 流量经营 安全威胁 收稿日期:2012-08-14 责任编辑:左永君 zuoyongjun@https://www.360docs.net/doc/5b4073558.html, 随着移动互联网、物联网、云计算等的快速发展,及视频监控、智能终端、应用商店等的快速普及,全球数据量出现爆炸式增长。即使在遭遇金融危机的2009年,全球信息量也比2008年增长62%,达到80万PB(1015字节),2010年增至120万PB。据IDC预测,至2020年全球以电子式形存储的数据量将达32ZB (1021字节)。以120万PB数据为例,如果将其刻录在DVD上,再将这些盘片堆叠起来,可从地球到月球垒一个来回! 在此背景下,电信运营商在其网络无休止扩容的同时,却面临“增量不增收”的困境;而一些采用“数据驱动型决策”模式经营的公司,则可将其生产力提高5%~6%。因此,有必要深入研究大数据时代(Big Data Era)的挑战、价值与务实应对策略。 1 大数据时代的基本特征 据统计,2010年以互联网为基础所产生的数据比之前所有年份的总和还要多;而且不仅是数据量的激增,数据结构亦在演变。Gartner预计,2012年半结构和非结构化的数据,诸如文档、表格、网页、音频、图像和视频等将占全球网络数据量的85%左右;而 且,整个网络体系架构将面临革命性改变。由此,所谓大数据时代已经来临! 对于大数据时代,目前通常认为有下述四大特征,称为“四V”特征: (1)量大(V o l u m e B i g )。数据量级已从T B (1012字节)发展至PB乃至ZB,可称海量、巨量乃至超量。 (2)多样化(Variable Type)。数据类型繁多,愈来愈多为网页、图片、视频、图像与位置信息等半结构化和非结构化数据信息。 (3)快速化(Velocity Fast)。数据流往往为高速实时数据流,而且往往需要快速、持续的实时处理;处理工具亦在快速演进,软件工程及人工智能等均可能介入。 (4)价值高和密度低(V a l u e H i g h a n d L o w Density)。以视频安全监控为例,连续不断的监控流中,有重大价值者可能仅为一两秒的数据流;360°全方位视频监控的“死角”处,可能会挖掘出最有价值的图像信息。 2 大数据时代面临的挑战 (1)运营商带宽能力与对数据洪流的适应能力面临前所未有的挑战,管道化压力化解及“云-管- 端”的有效装备也均面临新挑战。 (2)大数据的“四V”特征在数据存储、传输、

《我们的大数据时代》考试题目及答案

我们的大数据时代 (一) 单选题(每题2分) 1. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D) A. 数据规模大 B. 数据类型多样 C. 数据处理速度快 D. 数据价值密度高 2. 下列关于大数据的分析理念的说法中,错误的是(D) A. 在数据基础上倾向于全体数据而不是抽样数据 B. 在分析方法上更注重相关分析我不是因果分析 C. 在分析效果上更追究效率而不是绝对精确 D. 在数据规模上强调相对数据而不是绝对数据 3. 万维网之父是(C) A. 彼得·德鲁克 B. 舍恩伯格 C. 蒂姆·伯纳斯—李 D. 斯科特·布朗 4. 下列关于普查的缺点的说法中,正确的是(A)。 A. 工作量较大,容易导致调查内容有限、产生重复和遗漏现象 B. 误差不易被控制 C. 对样本的依赖性比较强 D. 评测结果不够稳定 5.下列关于聚类挖掘技术的说法中,错误的是(B)。 A. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别 B. 要求同类数据的内容相似度尽可能小 C. 要求不同类数据的内容相似度尽可能小 D. 与分类挖掘技术相似的是,都是要对数据进行分类处理 6. 智慧城市的构建,不包含(C)。 A. 数字城市 B. 物联网 C. 联网监控 D. 云计算 7.大数据的起源是(C)。 A. 金融 B. 电信 C. 互联网 D. 公共管理 8. 智慧城市的智慧之源是(C)。 A. 数字城市 B. 物联网 C. 大数据 D. 云计算 9. 假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是(A)关系,而吸烟和肺癌则是(A)关系。

A. 因果;相关 B. 相关;因果 C. 并列;相关 D. 因果;并列 10. 下列关于数据交易市场的说法中,错误的是(C)。 A. 数据交易市场是大数据产业发展到一定程度的产物 B. 商业化的数据交易活动催生了多方参与的第三方数据交易市场 C. 数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助 D. 数据交易市场是大数据资源化的必然产物 11. 下列关于计算机存储容量单位的说法中,错误的是(C)。 A. 1KB<1MB<1GB B. 基本单位是字节(Byte) C. 一个汉字需要一个字节的存储空间 D. 一个字节能够容纳一个英文字符 12. 当前大数据技术的基础是由(C)首先提出的。 A. 微软 B. 百度 C. 谷歌 D. 阿里巴巴 13. 下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是(D)。 A. 美国 B. 日本 C. 中国 D. 韩国 14. 下列演示方式中,不属于传统统计图方式的是(D)。 A. 柱状图 B. 饼状图 C. 曲线图 D. 网络图 15. 当前社会中,最为突出的大数据环境是(A)。 A. 互联网 B. 物联网 C. 综合国力 D. 自然资源 16. 可以对大数据进行深度分析的平台工具是(C)。 A. 传统的机器学习和数据分析工具 B. 第二代机器学习工具 C. 第三代机器学习工具 D. 未来机器学习工具 17. 智能健康手环的应用开发,体现了(D)的数据采集技术的应用。 A. 统计报表 B. 网络爬虫 C. API接口 D. 传感器 18. 过一系列处理,在基本保持原始数据完整性的基础上,减小数据规模的是(C)。 A. 数据清洗

大数据时代的特征

随着云时代的来临,大数据也吸引了越来越多的关注。那么,大数据有哪些特征呢? 1、多元化。大数据时代,数据类别和格式多样,使得海量数据能够凸显出事物的多方面关联性,显示出多方面的信息内涵。大数据时代,全媒体趋势、信息媒体化趋势进一步加强,从而体现出多元化和多样性。 2、可量化。大数据时代,文字可以变成数据、方位可以变成数据、沟通可以变成数据、人从身体到心理可以实现自我量化,世间万物都可以变成数据,世间一切事物都可以作为“变量”。庞大的数据资源使得学术界、商业界、政府等各个领域开始量化进程。 3、个性化。海量数据是一种共享性、开放性的公共信息资源,大数据时代的文化共享、民主平权,使得每个人都可以从“云”中海量的共享性数据资源中调用、择取自己所需要的数据进行挖掘、分析,为己所用,从而真正地实现个性化发展、满足个性化需求。

4、互动性。大数据时代,人-人、人-机、机-机之间将实现全面互动。互联网实现了无距离互动,移动终端实现了时空互动,物联网实现了设备互动。信息和数据在各种互动中实现交流和共享,在不断传播中相互影响和相互作用。而人们则可以根据自己的需要和偏好,随时控制信息、信息量和信息呈现的秩序。 5、开放性。大数据时代是一个开放的时代,一切都被置于“第三只眼”中,分享、共享成为共识,社会将呈现出透明、公开、有序和生机的特征。移动终端、智能手机、摄像头以及其他诸多的信息采集设备和存储设备将海量数据置于公共空间,数据的对外开放为公众共享信息提供了基础。 6、预测性。大数据时代,依托多维度、多来源、多形式的海量数据和挖掘工具与分析技术的深度、广度与精度,通过海量交叉验证征兆与变化规律、发掘事件概率,做出较为精准的预判、预测,将引领人类无限接近控制未来的终极梦想。 以上就是全部内容,希望对大家有所帮助,感谢您的阅读!

《大数据时代下的数据挖掘》试题和答案及解析

《海量数据挖掘技术及工程实践》题目 一、单选题(共80题) 1)( D )的目的缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到 和原始数据相同的分析结果。 A.数据清洗 B.数据集成 C.数据变换 D.数据归约 2)某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖 掘的哪类问题?(A) A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理 3)以下两种描述分别对应哪两种对分类算法的评价标准? (A) (a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。 (b)描述有多少比例的小偷给警察抓了的标准。 A. Precision,Recall B. Recall,Precision A. Precision,ROC D. Recall,ROC 4)将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C) A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘 5)当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数 据相分离?(B) A. 分类 B. 聚类 C. 关联分析 D. 隐马尔可夫链 6)建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的 哪一类任务?(C) A. 根据内容检索 B. 建模描述 C. 预测建模 D. 寻找模式和规则 7)下面哪种不属于数据预处理的方法? (D) A.变量代换 B.离散化

C.聚集 D.估计遗漏值 8)假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内? (B) A.第一个 B.第二个 C.第三个 D.第四个 9)下面哪个不属于数据的属性类型:(D) A.标称 B.序数 C.区间 D.相异 10)只有非零值才重要的二元属性被称作:( C ) A.计数属性 B.离散属性 C.非对称的二元属性 D.对称属性 11)以下哪种方法不属于特征选择的标准方法: (D) A.嵌入 B.过滤 C.包装 D.抽样 12)下面不属于创建新属性的相关方法的是: (B) A.特征提取 B.特征修改 C.映射数据到新的空间 D.特征构造 13)下面哪个属于映射数据到新的空间的方法? (A) A.傅立叶变换 B.特征加权 C.渐进抽样 D.维归约 14)假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方 法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:(D) A.0.821 B.1.224 C.1.458 D.0.716 15)一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年 级110人。则年级属性的众数是: (A) A.一年级 B.二年级 C.三年级 D.四年级

大数据时代简介

大数据时代 最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。” “大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。 大数据 随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。著云台的分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。 “大数据”在互联网行业指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为数据。这些数据的规模是如此庞大,以至于不能用G或T来衡量。 大数据到底有多大?一组名为“互联网上一天”的数据告诉我们,一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的社区帖子达200万个(相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万…… 截止到2012年,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB (1024PB=1EB)乃至ZB(1024EB=1ZB)级别。国际数据公司(IDC)的研究结果表明,2008年全球产生的数据量为0.49ZB,2009年的数据量为0.8ZB,2010年增长为1.2ZB,2011年的数量更是高达1.82ZB,相当于全球每人产生200GB以上的数据。而到2012年为止,人类生产的所有印刷材料的数据量是200PB,全人类历史上说过的所有话的数据量大约是5EB。IBM 的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了2020年,全世界所产生的数据规模将达到今天的44倍。

大数据的基本特性

对大数据的基本特征有很多看法,但学术界普遍认可的是“3V”或“4V”的说法。3V特性是指容量巨大(V olume)、品种复杂(Velocity)、处理速度快,4V在此基础之上增加了价值密度低(Value)。随着数据挖掘技术和数据处理技术的发展,大数据的价值开始体现出来。 (1)容量巨大。十年前,我们对数据容量认知单位仅限于MB 和GB,但现在业务中使用的最基本的数据容量单位已达到TB。百度、腾讯、阿里等网络公司已经达到ZB(1ZB=1万亿GB)。目前,全球数据量仍在增长,年增长率超过40%。 (2)种类复杂。我们通常所说的数据是一个整体性的概念,按照不同的划分方式,数据可以被划分为多种类型,最常用和最基本的就是利用数据关系进行划分,有结构化数据、半结构化数据和非结构化数据,在小数据时代基本以结构化数据为主,随着数据技术的不断发展才出现了半结构化和非结构化数据。另外,从数据来源上划分,有社交媒体数据、传感器数据和系统数据。从数据格式上划分,有文本数据、图片数据、音频数据、视频数据等。近几年数据的种类增加

了很多,主要原因是移动设备、传感器以及通讯手段的增加,如此复杂多变的数据种类,带来的将是数据分析和数据处理的困难,势必会引发相应技术的变革。 (3)处理速度快。数据的数量和类型都在不断增加,直接影响到的就是数据的处理速度。大数据时代的基本要求就是速度要快,在数据资源化的趋势下,当今时代数据已然成为一种资源,但数据同现实中的物质资源不同,物质资源是不会消失和失去自身价值的,由于数据自身具有时效性,其所能挖掘的价值可能稍纵即逝,如果大量的数据来不及处理,就会变成数据垃圾。所以,现在的网络市场,各大互联网公司进行的不仅仅是数据的竞争,同时还是速度的竞争,要想在市场中占据主动地位,就必须要对拥有的数据进行快速的、实时的处理。 (4)价值密度低。价值性是大数据最本质的特性之一,大数据之所以能够得到各行各业的重视,主要原因就是其背后巨大的潜在价值,但是它的价值密度却很低。价值密度我们可以理解成有用数据在总数据中所占的比例。价值密度低的原因一方面是因为庞大的数据量和复杂的数据类型,基数过大带来的不仅是有价值的数据,更多的是垃圾数据和无用数据;另一方面是因为处理速度过慢,无法迅速准确的获取有价值的数据。纵使价值密度低,也无法阻挡人们对大数据的狂热,其根源还是在于数据背后所隐藏的巨大价值,大数据预测,将是大数据发展的主要方向。 以上就是全部内容,希望对大家有所帮助,感谢您的阅读!

大数据的特征与发展趋势

大数据时代的特征与发展趋势 在云计算、物联网等技术的带动下,中国已步入…大数据?时代。邬贺铨说,我们正在进行一场全新的革命,庞大的数据带来的量化转变将在各领域迅速蔓延,没有哪个领域能够逃脱它的影响。据有关机构测算,大数据已成为全球IT产业中增长最快的领域。2010年全球大数据以及相关的硬件、软件和服务市场达到30亿美元,2015年将超过170亿美元,平均年增长速度超过50%。作为全球大数据产业的重要组成,中国大数据潜在市场规模未来有望达到2万亿人民币。身处“大数据”时代,中国正多方位布局“大数据”产业,各地政府、通信公司、科研院所、IT企业等都“摩拳擦掌”,希望能分到“一杯羹”。 1.大数据的含义 大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据”这个术语最早期的引用可追溯到apache org的开源项目Nutch。当时,大数据用来描述为更新网络搜索索引需要同时进行批量处理或分析的大量数据集。随着谷歌MapReduce和GoogleFile System (GFS)的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的速度。 2.大数据的特征 关于大数据的特征,业内专业认识人士表示,可以用很多词语来表示。比较有代表性的即为2001年DougLaney最先提出“3V”模型,包括数量(V olume)、速度(Velocity)和种类(Variety)【1】。除此之外,在3V的基础上又提出了一些新的特征。关于第四个V的说法不一,IDC 认为大数据还应当具有价值性(Value),大数据的价值往往呈现出稀疏性的特点。而IBM 认为大数据必然具有真实性(Veracity)。维基百科对大数据的定义则简单明了:大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集【2】。如今,业内人士已经将其扩展到了11个V,包括有效性、可见性等。 下面就目前使用最多的“4V”模型进行分析。“4V”特征主要体现在以下方面: 2.1.规模性(volume) V olume指的是数据巨大的数据量以及其规模的完整性。数据的存储TB扩大到ZB。这与数据存储和网络技术的发展密切相关。数据的加工处理技术的提高,网络宽带的成倍增加,以及社交网络技术的迅速发展,使得数据产生量和存储量成倍增长。实质上,在某种程度上来说,数据的数量级的大小并不重要,重要的是数据具有完整性。数据规模性的应用有如下的体现,比如对每天12 tb的tweets进行分析,了解人们的

认识OA平台化时代的四个重要特征

认识OA平台化时代的四个重要特征 送走了中国60岁大典,迎来了OA的平台化时代。 算起来OA大致有30岁了,在自己的而立之年,OA步入了一个全新的时代,从历史角度看,这可能是OA发展史上最具革命性的一次飞跃。就像人要在30岁结婚生子,完成一次重大的成熟和提升,开始肩负新的使命一样,OA也开启了自己崭新的发展阶段。 但现在的确还有很多人在怀疑和犹豫:OA的平台化时代真的到来了么?如果说已经到来了,这个时代有什么重要特征呢?现在我们就一起去探寻一下。 1、用户需求发生重大改变 近两年来,OA厂家们明显感觉到,现在客户的需求越来越多样,越来越复杂,客户需要的已经不是一个简单的oa系统,而是一个OA平台,OA变成了平台的一部分,这种需求在凡是有点规模的客户身上都体现得非常明显。 “你的OA到底有什么不同?”华天动力的市场总监陈秋男对笔者说,“这几乎是每个客户都会问厂家的问题,OA的高度雷同已经让客户感到腻歪,以前很多厂家用一套万能的标准化软件去应付所有客户的做法,靠概念去引导客户的做法,现在已经行不通了,只有真正解决他们的实际问题,客户才会认可你,选择你”。 实际上,客户的需求在向更高、更深的方向发展,从最基本的信息沟通、文件管理、公文审批到业务管理、团队协作、数据整合、自定义开发……他们要求OA具有更高的业务性、平台性、开放性和智能性,能够满足自己综合性的需要。

2、OA定位发生变革 正是基于用户需求的变化,OA的定位也发生了根本的转变,在以前,OA定位于行政办公,从事的都是些很独立、很简单的工作,主要完成信息发布、文件管理、流程审批这几个主要任务。 但现在,OA已经逐渐成为一个综合性的协同办公和管理平台(之所以还叫OA,只是为了便于理解),除了日常的行政办公,OA开始越来越多的从事业务管理和项目管理,甚至人事管理、客户管理、资产管理、服务管理、知识管理等等。更重要的是,这些功能并非孤立存在,而是互相关联的。 而且,OA还开始连接其他的业务系统,实现数据的交换和共享,为管理者集中呈现各种统计报表,服务于管理和决策。 如果说传统OA是一个好员工,那么现在他已经成长为一个经理了。 3、OA技术发生变革 客户需求和OA定位的转变,必然对OA产品的技术设计提出了更高的要求。 从1989年开始,采用C/S架构的LOTUS系统几乎成为了办公自动化(OA)的代名词,并成为一种事实上的标准。当时大企业们以使用这种复杂而昂贵的系统为荣,也成为信息化的重要标志。 正好10年后,1999年6月,时任Sun公司Java企业开发部门主管的Mala Chandr a兴奋地宣布了J2EE的诞生,到2003年左右,J2EE便逐渐成为中国OA开发商的首选技

大数据的概念、特征及其应用

大数据的概念、特征及 其应用 集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

马建光等:大数据的概念、特征及其应用 (2013-09-05 16:15:35) 标签:分类: 大数据的概念、特征及其应用 马建光,姜巍 (国防科技大学人文与社会科学学院,湖南长沙410074) 源自:国防科技2013年4月 [摘要]随着互联网的飞速发展,特别是近年来随着社交网络、物联网、云计算以及多种传感器的广泛应用,以数量庞大,种类众多,时效性强为特征的非结构化数据不断涌现,数据的重要性愈发凸显,传统的数据存储、分析技术难以实时处理大量的非结构化信息,大数据的概念应运而生。如何获取、聚集、分析大数据成为广泛关注的热点问题。介绍大数据的概念与特点,分别讨论大数据的典型的特征,分析大数据要解决的相关性分析、实时处理等核心问题,最后讨论大数据可能要面临的多种挑战。 [关键词]大数据;非结构化信息;解决核心问题;未来挑战 一、引言 自上古时代的结绳记事起,人类就开始用数据来表征自然和社会,伴随着科技和社会的发展进步,数据的数量不断增多,质量不断提高。工业革命以来,人类更加注重数据的作用,不同的行业先后确定了数据标准,并积累了大量的结构化数据,计算机和网络的兴起,大量数据分析、查询、处理技术的出现使得高效的处理大量的传统结构化数据成为可能。而近年来,随着互联网的

快速发展,音频、文字、图片视频等半结构化、非结构化数据大量涌现,社交网络、物联网、云计算广泛应用,使得个人可以更加准确快捷的发布、获取数据。在科学研究、互联网应用、电子商务等诸多应用领域,数据规模、数据种类正在以极快的速度增长,大数据时代已悄然降临。 首先,全球数据量出现爆炸式增长,数据成了当今社会增长最快的资源之一。根据国际数据公司IDC的监测统计[1],即使在遭遇金融危机的2009年,全球信息量也比2008年增长了62%,达到80万PB ( 1PB等于10亿GB),到2011年全球数据总量已经达到1. 8ZB ( 1ZB等于1万亿GB,),并且以每两年翻一番的速度飞速增长,预计到2020年全球数据量总量将达到40 ZB,10年间增长20倍以上,到2020年,地球上人均数据预计将达5247GB。在数据规模急剧增长的同时,数据类型也越来越复杂,包括结构化数据、半结构化数据、非结构化数据等多种类型,其中采用传统数据处理手段难以处理的非结构化数据已接近数据总量的75%。 如此增长迅速、庞大繁杂的数据资源,给传统的数据分析、处理技术带来了巨大的挑战。为了应对这样的新任务,与大数据相关的大数据技术、大数据工程、大数据科学和大数据应用等迅速成为信息科学领域的热点问题,得到了一些国家政府部门、经济领域以及科学领域有关专家的广泛关注。2012年3月22日,奥巴马宣布美国政府五大部门投资2亿美元启动“大数据研究和发展计划( Big Data Research and Development Initiative)”[2],欲大力推动大数据相关的收集、储存、保留、管理、分析和共享海量数据技术研究,以提高美国的科研、教育与国家安全能力。这是继1993年美国宣布“信息高速公路”计划后的又一次重大科技发展部署,美国政府认为大数据是未来信息时代

大数据时代

大数据时代 一.大数据时代来临 从互联网诞生至今,其数据量已经从TB(1024GB=1TB)级别跃升到PB (1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。公元元年至2003年,人类生产活动共产生50亿GB的数据,而到了2013年,产生50亿GB数据只要两天。 即便是在“摩尔定律”——每18个月芯片性能将提高1倍——的支撑下,硬件性能进化的速度也早已赶不上数据增长的速度,并且差距越来越巨大。 海量的数据来自各种各样的活动,如:互联网上的微博、电子商务网站;智能终端产生的数据;移动、电信等运营商短信业务;医疗图像、卫星云图、工业传感等各行各业的数据…… 1分钟之内,新浪微博发送数万条微博,苹果应用商店下载次数以万计,淘宝卖出了几万件商品,百度产生了百万次搜索查询……所有这些行为都由海量的数据来呈现。 在去年12月12日电商的促销期,淘宝网推出“时光机”——一个根据淘宝买家几年来的购买商品记录、浏览点击次数、收货地址等数据编辑制作的“个人网购志”,从而记录和勾勒出让人感怀的生活记忆。背后,是基于对4.7亿淘宝注册用户网购数据的分析处理,这正是大数据的典型应用。 随着传统互联网向移动互联发展,全球范围内,除了个人电脑、平板电脑、智能手机、游戏主机等常见的计算终端之外,更广阔的、泛在互连的智能设备,比如智能汽车、智能电视、工业设备和手持设备等都连接到网络之中。基于社会化网络的平台和应用,让数以百亿计的机器、企业、个人随时随地都会获取和产生新的数据。 互联网搜索引擎是大数据最为典型的应用之一。百度日处理数据量达到数十PB,并呈现高速增长的态势。如果一张光盘容量为1GB,这相当于垒在一起的几千万张光盘。微软Bing(在中国为必应)搜索引擎,一周需要响应100亿次量级的搜索请求。通过和Facebook的合作,每天有超过10亿次的社交网络搜索请求通过Bing来处理。 短短的18个月,中国移动互联网流量增加了10倍。中国工程院院士邬贺铨说,随着社交网络的逐渐成熟、移动带宽迅速提升,更多的传感设备、移动终端接入网络,产生的数据及其增长速度比历史上任何时期都要多,互联网上的数据流量正在迅猛增长。邬贺铨认为,在云计算、物联网等技术的带动下,中国的移动互联网已经步入“大数据”时代。 而根据市场调研公司IDC的报告,全球信息总量每过两年就会增长一倍,2011年全球产生的数据总量为1.8ZB(1ZB约为百万PB),相比2010年增长了1ZB,相当于全球历史数据总和。 继云计算后,大数据(big data)成为信息技术领域最为热门的概念之一。最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。” 二.大数据的四大特征 1.数据量大(Volume)

大数据的概念_特征及其应用_马建光

第34卷第2期2013年4月 国防科技 NATIONAL DEFENSE SCIENCE&TECHNOLOGY Vol.34,No.2 Apr.2013大数据的概念、特征及其应用* 马建光,姜巍 (国防科技大学人文与社会科学学院,湖南长沙410074) [摘要]随着互联网的飞速发展,特别是近年来随着社交网络、物联网、云计算以及多种传感器的广泛应用,以数量庞大,种类众多,时效性强为特征的非结构化数据不断涌现,数据的重要性愈发凸显,传统的数据存储、分析技术难以实时处理大量的非结构化信息,大数据的概念应运而生。如何获取、聚集、分析大数据成为广泛关注的热点问题。介绍大数据的概念与特点,分别讨论大数据的典型的特征,分析大数据要解决的相关性分析、实时处理等核心问题,最后讨论大数据可能要面临的多种挑战。 [关键词]大数据;非结构化信息;解决核心问题;未来挑战 [中图分类号]E924.2[文献标识码]A[文章编号]1671-4547(2013)02-0010-08 一、引言 自上古时代的结绳记事起,人类就开始用数据来表征自然和社会,伴随着科技和社会的发展进步,数据的数量不断增多,质量不断提高。工业革命以来,人类更加注重数据的作用,不同的行业先后确定了数据标准,并积累了大量的结构化数据,计算机和网络的兴起,大量数据分析、查询、处理技术的出现使得高效的处理大量的传统结构化数据成为可能。而近年来,随着互联网的快速发展,音频、文字、图片视频等半结构化、非结构化数据大量涌现,社交网络、物联网、云计算广泛应用,使得个人可以更加准确快捷的发布、获取数据。在科学研究、互联网应用、电子商务等诸多应用领域,数据规模、数据种类正在以极快的速度增长,大数据时代已悄然降临。 首先,全球数据量出现爆炸式增长,数据成了当今社会增长最快的资源之一。根据国际数据公司IDC的监测统计[1],即使在遭遇金融危机的2009年,全球信息量也比2008年增长了62%,达到80万PB(1PB等于10亿GB),到2011年全球数据总量已经达到1.8ZB(1ZB等于1万亿GB,),并且以每两年翻一番的速度飞速增长,预计到2020年全球数据量总量将达到40ZB,10年间增长20倍以上,到2020年,地球上人均数据预计将达5247GB。在数据规模急剧增长的同时,数据类型也越来越复杂,包括结构化数据、半结构化数据、非结构化数据等多种类型,其中采用传统数据处理手段难以处理的非结构化数据已接近数据总量的75%。 如此增长迅速、庞大繁杂的数据资源,给传统的数据分析、处理技术带来了巨大的挑战。为了应对这样的新任务,与大数据相关的大数据技术、大数据工程、大数据科学和大数据应用等迅速成为信息科学领域的热点问题,得到了一些国家政府部门、经济领域以及科学领域有关专家的广泛关注。2012年3月22日,奥巴马宣布美国政府五大部门投资2亿美元启动“大数据研究和发展计划(Big Data Research and Development Initiative)”[2],欲大力推动大数据相关的收集、储存、保留、管理、分析和共享海量数据技术研究,以提高美国的科研、教育与国家安全能力。这是继1993年美国宣布“信息高速公路”计划后的又一次重大科技发展部署,美国政府认为大数据是未来信息时代的重要资源,战略地位堪比 *[收稿日期]2012-04-12 [作者简介]马建光,男,教授,国防科技大学; 姜巍,男,博士研究生

“互联网+”时代创新有三大特征

“互联网+”时代创新有三大特征(周子学,中芯国际董事长) 工信部总经济师 “未来20年,所有的企业都可能是互联网企业。传统的制造、医疗、金融、农业、交通、运输、教育等行业都将被互联网化。”周子学指出,“从这个意义上来说,‘互联网+’正是信息化与工业融合发展的进一步延伸,包括产业互联网和企业互联网。”“互联网+传统产业”的融合将极大地改变人们的生产、工作和生活方式,成为创新驱动发展的新引擎和新常态。周子学向记者展示了“互联网+传统产业”在四个方面的突出表现:一是在生产领域,越来越突出以用户为导向的个性化和智能化设计。一方面,在工业时代以供给方为导向的规模型发展转变为以用户为导向的个性化设计。生产的每一环节都充分体现了互联网思维和用户需求的紧密结合。另一方面,过去几十年以数字化和网络化为主的生产模式将逐渐转变为智能化生产和设计。智能化要求能自动执行程序、具备可编程可演化的系统。如无人驾驶汽车、智慧家具等。德国提出的工业4.0,其特征也是智能化。未来智能化产品将为发展新一代信息技术提供巨大的市场。二是在销售领域,线上线下一体化是主要趋势。企业应充分利用线下资源的优势,拓展线上平台,并将线下的物流、退货等业务流程进行线上管理,最终实现线上线下一体化管理、营销一体化。物流交付平台和信息集成交易平台的建立将是产业互联网发展的一个重要方向。三是融资体系发生改变,突出表现是互联网金融的蓬勃发展。我国金融行业长期受体制因素的限制,导致结构失衡,明显体现在20%的大企业客户占用了80%的金融资源,银行借贷动力不足,众多中小微型企业得不到有效的金融服务, 制约其发展。互联网金融由于其交易成本低、效率高等优势,可有效解决信息不对称等问题,或将在中小微企业融资领域发挥重要作用。四是融合发展将是产业发展主旋律,产业生态体系日益完善。“互联网+”行动计划被写入2015政府工作报告中,无疑是给传统企业注入了一针强心剂,“融合”将是“互联网+”发展的主要方向。未来信息网络发展的一个趋势是实现物与物、物与人、物与计算机的交互联系,通过泛在网络形成人、机、物三元融合的世界,进入万物互联时代。万物互联将带来改革红利的全面释放,通过万物相连,将极大提高工业、农业和服务业的效率,拉动GDP的增长。互联网已经对生活方式产生了很大影响,比如Uber没有一部车,是全球最大的出行公司;Airbnb没有一家酒店,却是全球最大的酒店公司。百度原来在虚拟世界寻找信息,现在索引真实世界,连接人和服务。谈到未来“互联网+”产业将出现的特点,周子学引用了GE等公司的研究结果:未来产品价值的变化将呈现三大趋势,即硬件的创造价值在软件体现,网络连接使价值从产品转向云,商业模式从产品转向服务。周子学告诉记者,中国的iGDP实际上已经达到了7%。在麦肯锡全球研究院发布的《中国的数字化转型:互联网对生产力与增长的影响》报告中,提出了iGDP的概念,即互联网经济占GDP的比重。报告认为,2010年,中国的互联网经济占GDP的比例仅为3.3%,落后于大多数发达国家;而到了2013年,中国的iGDP指数升至4.4%,已经达到全球领先国家的水平。在全球互联网企业十强中,来自中国的互联网企业占据了四席。麦肯锡还对中国的iGDP计算进行了补充说明,即在大部分国家的二级市场交易中,C2C线上零售模式主要是个 人在进行,且比例可以忽略;但在中国,主要是没有公司注册的小微企业从事C2C,如果C2C 被计算在内,中国的iGDP会达到7%,超过七国集团的任何一个国家。互联网对于全球经济的重塑,已可以和工业革命相提并论。周子学强调,伴随着互联网和信息技术的快速发展,互联网经济正成为驱动世界经济增长的新引擎,引发人类生产方式、生活方式、消费方式前所未有的深刻革命,所以,“互联网+”是中国抢占未来发展制高点的战略选择。周子学进一步补充道,互联网具有打破信息不对称、降低交易成本、促进专业化分工和提升劳动生产率的特点。它通过信息通信技术在传统价值链条上的不断深化应用,给企业运营管理带来巨

相关文档
最新文档