迎接大数据时代的来临_倪光南

合集下载

自主创新是我国软件产业发展壮大的基石——专访中国工程院院士倪光南

自主创新是我国软件产业发展壮大的基石——专访中国工程院院士倪光南

自主创新是我国软件产业发展壮大的基石——专访中国工程
院院士倪光南
龚雪
【期刊名称】《中国高新区》
【年(卷),期】2006(000)009
【摘要】@@ 当"自主创新"作为一项国家战略实施以来,各行各业表现出了前所未有的激情,开展了一场"自主创新"的全民运动.在这场热潮中,对创新最为渴求的莫过于中国的软件产业.
【总页数】3页(P28-30)
【作者】龚雪
【作者单位】无
【正文语种】中文
【相关文献】
1.国产操作系统亟待建立统一生态体系--专访中国工程院院士倪光南 [J], 郝迎聪
2.促进信息产业自主创新,实现科技强国梦想--记中国工程院院士、中国科学院计算所研究员倪光南 [J], 牛新志
3.核心技术依靠自主创新才能有所作为——专访中国工程院院士倪光南 [J], 王洁;
4.提高自主创新能力加强支持与引导--中国工程院院士倪光南 [J],
5.中国软件产业有远大的发展前途——访中国工程院院士倪光南 [J], 韩跃清
因版权原因,仅展示原文概要,查看原文内容请购买。

倪光南:新技术发展环境下的电子政务建设

倪光南:新技术发展环境下的电子政务建设

倪光南:新技术发展环境下的电子政务建设作者:倪光南前言当前电子政务建设应重视新一代信息技术发展趋势。

国家领导人对此高度重视,不久前胡主席在两院院士大会上讲话指出:“互联网、云计算、物联网、知识服务、智能服务的快速发展为个性化制造和服务创新提供了有力工具和环境”。

去年温家宝总理视察无锡,提出在无锡加快建立中国的感知中国中心,由此启动了全国范围内的物联网建设。

在这些新兴技术中,我们尤其应积极采用云计算、物联网、开源软件等新技术、新模式,以便又好又快地推进电子政务建设,并更好地实现胡主席提出的“可靠、低成本信息化”的目标。

一、云计算云计算是一新计算模式。

自计算机发展以来,计算模式已经历了主机、个人计算机(PC)、互联网等阶段,现在云计算也被普遍认为是一新阶段(如图1所示)。

图1.计算模式的演进最早的主机-终端模式是集中计算,一切计算资源都集中在主机上。

到了PC时代,变成了分散计算,主要计算资源分散在各个PC上。

互联网的出现将分散的PC联在了一起,部分计算资源虽然还分布在PC上,但已经越来越多地集中到互联网上。

云计算的出现实现了更高程度的集中,它继承和发展了网格计算、公用计算(又称效能计算)和SaaS等的优点(如图2所示)。

它可将分布在世界范围内的计算资源整合为一个统一的资源为用户提供服务;另一方面,云计算又可按某个用户的需求分出所需的资源为他服务,从而使计算资源可以像电力和自来水一样,统一地实现按需服务。

图2. 云计算的演进云计算的需求驱动来自多个方面。

主要是:满足海量数据高速处理的需求,缓解当前信息时代“信息爆炸”的压力;适应业务需求和业务量的快速变化及软件服务化SaaS的趋势;大大提高IT资源的利用率,降低成本,满足绿色节能的需求。

例如有人估计,云计算可以帮助节约大至80%的使用面积,60%的电源和制冷消耗,提升可高达三倍的设施利用率,使现有的资源更加高效。

有数据表明,一般数据中心中,90%服务器、90%时间里的平均CPU利用率只有5%,而云计算公司CPU利用率可达60%;我国一般数据中心的能效比(总能耗/IT 设备能耗)PUE=3,即通风冷却的能耗二倍于IT设备的能耗,而云计算公司的PUE只有1.2左右,基本上不需通风冷却。

倪光南:传统媒体应加快数字化转型

倪光南:传统媒体应加快数字化转型

倪光南:传统媒体应加快数字化转型
佚名
【期刊名称】《《青年记者》》
【年(卷),期】2012(000)016
【摘要】基于互联网、无线通信网、有线电视网、卫星直投网等传播渠道,并以电脑、电视、手机、电子书等手持阅读终端为接收载体的、全新的数字出版形态,已经成为思想文化传播的重要途径。

【总页数】1页(P5-5)
【正文语种】中文
【中图分类】G219.712
【相关文献】
1.“苹果”的启示:传统媒体数字化转型与新媒体数字化生存 [J], 周笑
2.媒体融合背景下期刊数字化转型的出路——传统媒体数字化转型典型案例及其启示 [J], 杨青
3.媒介融合视阈下传统媒体的数字化转型探究——以《人民日报》为例 [J], 王雪晴
4.传统媒体如何向数字化转型 [J], 张英
5.传统媒体数字化应加快转型步伐 [J],
因版权原因,仅展示原文概要,查看原文内容请购买。

倪光南中国著名计算机专家

倪光南中国著名计算机专家

倪光南中国著名计算机专家
倪光南
【期刊名称】《航空制造技术》
【年(卷),期】2007(000)006
【摘要】@@ M:近年来,您一直致力于中国推进开放源代码的Linux操作系统以及基于国产CPU和Linux的网络计算机等具有自主核心技术的研究,请您谈一下近年来的研究情况.
【总页数】2页(P36-37)
【作者】倪光南
【作者单位】中国工程院
【正文语种】中文
【相关文献】
1.著名计算机专家倪光南院士受聘为我院名誉院长 [J],
2.潘云鹤中国著名智能CAD和计算机专家 [J], 潘云鹤
3.计算机专家眼中的中国EC发展:专访中国计算机学会副秘书长杜子德 [J], 谢征
4.IT核心技术中国非做不可——访中国工程院院士、计算机专家倪光南 [J],
5.世界著名计算机专家姚期智院士做客华中科大 [J],
因版权原因,仅展示原文概要,查看原文内容请购买。

计算“先锋”倪光南

计算“先锋”倪光南

计算“先锋”倪光南作者:苗正卿来源:《中国经济和信息化》2013年第12期他呼吁中国要掌握IT核心技术,因为这关系到信息安全和产业可持续发展。

他是中国科学院计算技术研究所(下简称中科院计算所)最早“下海”的一批科学家。

他见证了中国大型机、汉字信息处理、微机、软件和“中国芯”的所有过程。

他就是中国工程院院士倪光南。

20世纪60年代,我国计算机水平并不落后,当时只有美国、英国、前苏联、法国和中国这几个大国能自主设计制造计算机。

倪光南一进中科院计算所就参与了我国计算机自主开发的工作——研制第一台大型通用数字电子计算机119机。

3年后,119机研制成功,倪光南成为所里“业务尖子”之一。

他参与了我国最早的汉字显示器717机显示器的研制,这项研究揭开倪光南研制联想式汉字系统的序幕。

倪光南参与自主研发的工作并不仅于此。

显示组“SK-1光笔图形显示器”大大增强了汉字显示功能,并实现了光笔与显示屏的人机交互功能。

在输入方面,倪光南首次提出了联想输入方法,研制联想式汉字系统的条件基本具备。

值得一提的是,倪光南参与的“手写文字识别机”是国内最早的文字识别机之一,“111汉字信息处理实验系统”解决了汉字输入、输出、显示、人机交互等技术问题,并为机器翻译、情报检索等研究项目提供汉字处理服务。

那时候,微机已经开始进入中国市场,却因不能处理汉字而难以在国民经济和社会生活中应用。

为了突破汉字信息处理制约计算机在我国普及应用的瓶颈,倪光南中止了文字识别研究而专注于汉字处理成果的产业化。

1980年,第一项汉字处理产品——“汉字、图形显示功能板”正式诞生,它插在当时流行的微机上,可具备汉字处理功能。

国外工作的经验为联想式汉字处理成果做成一台实用的汉字微机提供了契机。

那时候,倪光南在国外发现“中国制造”始终和低级、丑陋联系在一起,他立志改变这个现状。

为此,他自己掏出几千加元买了够研制几台汉字微机样机的关键器材带回国,回来后他立即组织课题组研发。

倪光南 网信领域将出现各种“国产化替代”,并且是“先进替代落后”!

倪光南 网信领域将出现各种“国产化替代”,并且是“先进替代落后”!

倪光南网信领域将出现各种“国产化替代”,并且是“先进替代落后”!作者:史亚娟来源:《中外管理》2018年第12期习总书记最近指出:“网络安全的核心是技术安全”。

未来网信领域还将出现各种国产化替代。

中国科学院院士倪光南11月4日在“第27届中外管理官产学恳谈会”上,做出了如上判断。

并且,倪光南院士举例说明:“国产自主可控替代,不一定是落后替代先进,很可能是先进替代落后。

”那么,具体而言这个进程在怎样发展?内在逻辑正怎样运行?为什么“国产化替代”不一定是落后替代先进?以下是倪光南观点的精彩摘编。

中国网信总体排名世界第二,但短板明显“中兴事件”发生后,很多人为此感到悲观。

中国工程院各学部认真分析了各自领域的形势,有哪些短板?该怎么补齐?旨在避免出现中兴那样的问题,减少不必要的损失。

我所在的信息和电子学部,大家的一致意见是:我国网信领域总体产业水平世界第二,但存在着明显的短板。

也就是说,对于网信我们要给予充分的信任,尽管和发达国家相比还有不少的差距,但没有差很多,这跟中兴事件没有必然关系。

那为何还会出现中兴事件呢?因为我们有短板,木桶原理。

这个短板很容易被人家卡了脖子。

中国网信的短板分为硬的和软的两个方面:“硬的”是指芯片产业。

不过客观来讲,我国芯片产业也不是都短,芯片的产业链很长,中国在芯片设计领域并不短——中国的芯片设计企业数量世界第一,实际水平能达到世界第二,这相当好。

但我们短在芯片制造,中国最好的、最大的就是中芯国际,世界排行第五。

但装备国产化大概还不到20%,很多材料全部依赖进口,EDA(电子设计自动化)设计工具也是短板。

由此,从芯片产业看,很容易被卡脖子,因为我们大量依赖于进口。

总体而言中国芯片的短板是短在芯片制造的工具、装备、材料几个方面,至少要经过一二十年的努力,才能克服这几个短板。

“软的”是指基础软件,反映在两块:一是操作系统,特别是智能终端的操作系统,现在的手机、电脑,操作系统都是国外的,但如果有一天人家不给你用了怎么办?潜在的风险很大,还有安全的风险。

倪光南:网络安全防护需多层次多维度进行

倪光南:网络安全防护需多层次多维度进行

倪光南:网络安全防护需多层次多维度进行+李刚随着我国国民经济和社会信息化建设进程的全面加快,网络信息系统的基础性、全局性作用在日益凸显。

随着网络信息技术的迅猛发展和广泛应用,网络安全保护也就成为了我们当前面临的新的综合性挑战。

6月15日,中国工程院院士倪光南在工业互联网高峰论坛上针对大数据与云安全进行了交流和探讨,他表示,网络安全特别是云安全的防护需要多层次多维度进行。

多维度测评落实网络安全观网络安全对国家安全牵一发而动全身。

如何加强对网络安全问题的防护,目前已被世界各国高度关注。

作为中国工程院院士的倪光南,多年来一直致力于发展我国自主可控的信息核心技术和产业,曾参与我国自行设计的第一台计算机的研制,分别于2011年和2015年获得中国信息协会和中国计算机协会终身成就奖。

他认为,加强对网络安全问题的防护首要的是学习和贯彻习近平主席强调的网络安全观,从意识上正确树立安全观念,同时,云计算的发展必须和云安全同步推进。

“应当明确,发展是硬道理,安全也是硬道理;落后挨打,不安全也要挨打。

”倪光南表示,讨论云安全的一个目的,也是为了更好地评估云安全;目前云计算往往成为信息乃至关键信息的基础设施,所以需要比较高的等级保护和多维度测评,并且需要制度保障,比如建立等保制度,等。

倪光南表示,在《国家安全法》、《网络安全法》、《网络产品和服务安全审查办法》等等有关法规上,对网络安全的要求往往归结为“安全可控”、“安全可信”、“安全性”和“可控性”等等。

这里“安全”、“可控”、“可信”等等都是网络安全的内涵,但属于不同的维度(或层面)。

过去传统的产品和服务测评往往偏重功能、性能,不能很好的反映网络安全,Copyright©博看网. All Rights Reserved.020《卫星与网络》2017年6月Special Feature•特稿专题为落实网络发展安全观念,单靠过去功能性常规设备是不够的。

为此有专家主张实行多维度测评,例如除实行常规的功能、性能测评外,还增加“自主可控测评”,主要评估“可控性”。

倪光南:航天科工“商密网”是实行自主可控替代的典型

倪光南:航天科工“商密网”是实行自主可控替代的典型

倪光南:航天科工“商密网”是实行自主可控替代的典型【观察者网讯】日前,在乌镇举行的第四届世界互联网大会上,中国工程院院士倪光南做了《使中国“泛互联网之树”根深叶茂》的报告。

倪光南介绍称,航天科工“商密网”是实行自主可控替代的典型,此外,航天昆仑数据库一体机等人们不熟悉的自主创新实例表明,在网信领域,整体上中国已进入第一梯队,正从跟跑向跟跑并跑发展。

倪光南表示,不久前,在“砥砺奋进的五年·大型成就展”上,“泛互联网之树”成果引人注目,可以说是“根深叶茂”。

“根深”指这棵树扎根扎实,基本具备了核心芯片、基础软件、关键设备等三个方面的支撑,沿着这个方向前进,我们的网信事业就可以不受制于人、持续健康发展。

“叶茂”指这棵树惠及到社会经济的每个角落,惠及到千家万户,惠及到每一个人。

今天中国的“新四大发明”——高铁、网购、移动支付和共享单车,这后三项基本上都是互联网应用推广的成果。

根深才能叶茂。

为了使“泛互联网之树”能持续发展,取得更大成果,我们要使它扎根更深、更牢,为此要坚持安全和发展同步推进,还要尽快弥补我国网信技术的短板。

倪光南称,网信领域的软硬件是形成技术体系的,单项软硬件不成气候,要使网信事业能持续健康发展,必须打造安全可控的信息技术体系。

近年来,政府部门推行国产自主可控替代计划:在桌面领域要用国产操作系统+CPU构成的电脑及其应用去替代Wintel架构电脑及其应用。

这方面我们和世界网络强国——美国相比,还有很大的差距,例如我国网信技术和产品的对外技术依存度很高。

而美国网信领域几乎不依赖于外国,几乎全用本国的软硬件产品和服务。

据工信部测评,目前国产软硬件基本上达到了可用阶段,与外国差距约三五年。

今后要继续缩小差距,使国产软硬件达到好用,要努力完善生态支撑,使安全可控的信息技术体系及其生态系统发展壮大。

倪光南还介绍说,在去年“科技三会”上,航天科工集团作为中国大企业集团的代表,介绍了集团实施自主可控替代计划的经验。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6
科学研究方法(范式)的发展
科学研究范式(paradigm)的发展过程,最早是实验型科 研(Experimental Science),这已有几千年的历史了,后来发 展到理论型科研(Theore;cal Science),这也有数百年的历史 了,近几十年发展到计算型科研(Computa;onal Science),现 在则推进到第四范式——以大数据为基础的数据密集型科研 (Data-­‐intensive Science)。
美国流感传染率的官方数据与基于推特的数据比较17
推特上关于米价的贴子 (每月)
实际米价
在印尼的推特上,讨论米价的信息和实际米价的关系
18
领先标志 降低汽 车档次
失业高峰
滞后标志 增加典押和 出租
减少杂 品开销
减少保健 开支
多乘公 共交通
取消度假
19 观察社会媒体揭示了领先或滞后于失业高峰的某些标志
§
§
11
大数据支撑平台的分层思路
来源:姚宏宇,《大数据与云计算》
12
数据可视化
美国全国枪击死亡情况
数据可视化是关于数据之视觉表现形式的研究;其中,这种数据
的视觉表现形式被定义为一种以某种概要形式抽提出来的信息,包括 相应信息单位的各种属性和变量。数据可视化主要旨在借助于图形化 手段,清晰有效地传达与沟通信息,并且早在大数据出现之前就已经 被广泛地应用了;但在大数据领域,可视化技术具有了更大的作用。
2013 中国国际云计算技术和应用论坛 (Cloud China 2013)
迎接大数据时代的来临
——大数据发生、特征、科研范式、处理与应用
倪光南编写 2013年4月7-8日
1
从商业智能(BI)到大数据
n 大数据从数据挖掘、商业智能(BI)发展而来,经典 实例如下: n “啤酒与尿布”:20世纪90年代沃尔玛的超市管理人员分析
20
21
用大数据指导政府网站建设
国家信息中心:《中国政府网站发展数据报告
用大数据指导政府网站建设(续)
国家信息中心:《中国政府网站发展数据报告2012》
大数据对决策者的意义
n 早期预警:早期检测居民使用数字设备和服务中的异常 可以在时间上快速响应危机; n 实时感知:大数据可以描绘一幅关于现实情况的很细粒 度的且当前的表述,它有助于制定行动计划和政策; n 实时反馈:大数据具有实时监测居民的能力,使其可用 来了解哪里政策和行动计划失效并作出必要的调整。 n 应当指出:实时的大数据信息不能代替政府决策时传统 应用的定量的统计证据,但如正确理解的话,它可以表 明哪里需要做进一步的调查(在时间不太紧要的情况 下),或者哪里需要作出立即的响应(在发生自然灾难 情况下),而这是其他手段无法做到的。
l 对突发事件 更快的跟踪 和响应 l 对危机性质 和变化的更 好了解 l 对需要服务 地区的准确 定位 l 对供求关系 的预测能力
共享 数据
数据挖掘 和分析
9
hCp:///docs/WEF_TC_MFS_BigDataBigImpact_Briefing_2012.pdf
数据来源
应用领域
大数据的一些特性
n 大数据的“实时”性并不意味着真正的实时,而往往 是近似的“实时”:
n 在一个相对短、相对新的时间里产生并可资利用; n 在一个与场景有关的短时期里,即能容许作出响应,并 判定效果的一个时间段里(即容许产生一个反馈过程) 产生并可资利用。
n 新的数字数据源的特点:
15
Source: hCp:///denguetrends/about/how.html
“Google登革热趋势”利用搜索数据近乎实时地估计登革热在 全球的传播情况 16 (蓝色——该系统估计数据,橙色——巴西官方数据)
Source: « You Are What You Tweet: Analyzing TwiCer for Public Health. M. J. Paul and M. Dredze, 2011. hCp:///%7Empaul/files/2011.icwsm.twiCer_health.pdf
大数据时代的 美国总统选举
n 奥巴马竞选活动经理Jim Messina: “我们要用数据去衡量这场竞选活动中 的每一件事情。” n 芝加哥竞选总部还任命Rayid Ghani为“首席科学家”,此人是埃森哲技术实 验室的分析性研究带头人,新的大数据库能让竞选团队筹集到比他们曾预料 到的更多的资金。 n 华盛顿那些基于直觉与经验决策的竞选人士的优势在急剧下降,取而代之的 是数量分析专家与电脑程序员的工作,一位官员说:“在政治领域,大数据 的时代已经到来。”
大数据的一个典型处理流程
典型的大数据处理流程包括:数据的获取和记录、数据 的清洁/抽取/标注、数据的整合/聚类/表达、数据的分析/建 模和数据解释等5个阶段。在处理的过程中,异构性、规模、 即时性、复杂性和隐私权等问题是大数据想要创造价值所需 解决的困难。
资料来源:潘柱廷,《攻击大数据》
7
各种科学研究范式的关系
n 这几种范式在实际科研中往往同时使用,相辅相成。 n 第一种范式即实验型科研是最基本的方法,因为任何科学都 需要用实验来检验;理论在未经实验证实前,只能作为假设 ,所以第二种范式即理论型科研是以实验为基础并依赖于实 验验证的;第三种范式即计算型科研往往需要利用第二种范 式取得的成果,即需要在理论的指导下,利用计算能力发挥 理论的作用;同样,第四种范式可以认为是第三种范式的 延伸,它们都依赖于计算能力,只是第三种范式是在已知规 律的情况下,运用计算能力发挥规律的作用,而第四种范式 则是在未知规律的情况下,运用计算能力从大数据中发现规 律并发挥规律的作用。 n 第四种范式是否将成为基本的科研方法还有待于实践的进一 步检验,但其重要性已毋庸置疑。
n n n n 从人们使用数字服务被动收集到的交易数据 联机数据,网页搜索、新闻媒体和社会媒体的交互数据 物理传感器数据 居民报告或群体源的主动数据
5
科学研究的第四范式
n 图灵奖获得者吉姆•格雷(Jim Gray)基于e-Science的思路提出: 大数据是科学研究的第四范式(the fourth paradigm)。 n e-Science是英国科学技术局研究理事会前任会长约翰•泰勒 (John Taylor)提出的,它实际上是一种基础设施,它提供了一 种信息化的科学研究的环境和平台,使得不同学科领域的研究 和科研活动能够有针对地开发特定的科学研究与应用。实际上, 像现在的核反应模拟、航空航天设计、生命科学研究……无一 不依赖于高性能计算机及相应的数值计算方法,属于计算密集 型科研。 n 第四范式的思想是和e-Science一脉相承的,第四范式是从计算 密集型科研发展到以大数据为基础的数据密集型科研方法,从 目前看来它将在越来越多领域的研究中发挥重大的甚至是决定 性的作用。
销售数据时发现了一个令人难于理解的现象:在某些特定的情 况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常 出现在同一个购物篮中。这样,他们在尿布货柜附近放置了 啤酒,结果销量大幅上升。 n 美国第二大超市Target为了抓住含金量很高的一个顾客群体— —孕妇,通过数据挖掘建立了一个模型,选出了25种典型商品 的消费数据构建了“怀孕预测指数”,由此,它能在很小的误 差范围内预测到顾客的怀孕情况,从而能早早地把孕妇优惠广 告夹杂在其他一大堆与怀孕不相关的商品广告中发出去,有效 地招揽了孕妇顾客群。这种优惠广告间接地令一个蒙在鼓里的 父亲意外发现他高中生的女儿怀孕了,一时轰动全美。
13
来源:《可视化数据告诉你美国枪击案到底多严重》
美国
可视化技术应用实例
俄国 荷兰
意大利 印度 德国 中国 法国 西班牙
日本 伊朗 巴西
14
h$p://internet-­‐
关联性分析、发现异常
n 很多时候,从新的数字数据源提供的数据中发现的关联性会 正确地反映传统的官方统计,从而能提供更便宜、更快的、 近似的预测。 n 发现相关性只是手段,重要目的是利用相关性以及其他手段 来发现人类社会活动的异常,帮助制订正确的反应策略。 n 许多新数据源的价值不仅在于它的规模和速度,还在于它所 包含信息的丰富性。在许多情况下,大数据不仅是官方统计 数据的代替或作为它的近似,而且能对它进行补充,增加深 度和细节。 n 定性的社会媒体信息越多,越有助于描绘出一个关于事件的 全貌,便于做出快速响应。这里,大数据的规模、速度和数 据本性的组合具有很大的价值。
10
资料来源:《Challenges and Opportuni;es with Big Data》
大数据和云计算
§ 如果说大数据是一座蕴含巨大价值的矿藏,云计算则可以被 看作是采矿作业的得力工具;而且,云计算也是为了解决大 数据等“大”问题而发展而来的技术趋势,没有大数据的 需求,云计算的功用也将得不到完全发挥。因此,大数据与 云计算是相辅相成的。 对于大数据而言,云计算的意义不仅在于通过相关技术解决 各种具体问题,还在于通过云计算构建一种通用、高效和可 靠的大数据支撑平台,掌握以数据流为中心的系统集成思想 ,在大数据应用层面探索更广阔的内容。 为了更好地利用大数据的价值,我们需要用一种新的思路来 考虑支撑整个数据处理过程的体系架构,即把分层的思路从 单一系统的架构中延展到整个平台范围,将整个数据处理平 台按照分层的思路统一规划设计,依据系统不同组件的物理 和逻辑特性在系统范围内分层。
8
大数据生态系统
个人: 数据形式:群体源信息、被 吸取数据 动力:价格/优惠、改进服 务 要求:隐私权标准、选择权 公共部门: 数据形式:统计、保健、税 收、经费信息、设施数据 动力:改进服务保障、提升 经费效率 要求:隐私权标准、选择权 私人部门: 数据形式:交易数据、消费和 用户信息 动力:改进客户知识和预测趋 势能力 要求:商 随着互联网、移动互联网的发展,1. 数据产生和发送的速度和频 率急剧增长;2. 数据源的数目和种类上升。全球范围内可用的数 字数据从2005年的150EB增长到2010年的1200EB。预计在以后一些 年里将年增长40%,即相当于人口增长速度的40倍。这意味着数字 数据从2007到2020将增长44倍,或每20个月翻一番。 n 这些新的数字数据源包括搜索、新闻、博客、微博等社交网、移 动电话和短信、热线电话、监控数据、遥测数据……,产生的新 数据的特点是:一般以数字方式产生;往往是我们日常生活或与 数字服务交互的副产品;一般是自动收集、有在数据产生时同时 提取和存储它的系统;在地理上或短时期里可以跟踪,如手机位 置数据或通话持续时间;可连续地进行实时或近乎实时的分析。 n 这些新的情况再加上云计算的发展,为大数据提供了合适的环境 和处理能力,推动数据挖掘、商业智能发展到大数据。
相关文档
最新文档