大数据的机会与挑战

大数据的机会与挑战
大数据的机会与挑战

大数据的机会与挑战

我们活在大数据的世界,数据的数量与多样化的程度,每日都以前所未有的规模扑向人类。无论你是不是在相关产业工作,都不可能逃离被大数据「围攻」的现实。自哈佛大学电脑科学系毕业、Cambridge Semantics共同创办人Lee Feigenbaum撰写的〈Turnning Big Data into Smart Data〉一文,告诉我们横亘企业眼前的「大数据挑战」。让我们先来看看,大数据到底有多大?

每天全球每一个人聚沙成塔,累积的新数据达到「艾位元组(exabytes)」(甚

至达到「皆位元组(zettabytes)」,端赖统计的来源)。

至今一半以上(有些报告甚至指出高达90%)的数据资料是在过去12个月产生的。

人们创造数据的速度每一个月都以双倍速度成长。

除了吓人以外,光有这些「大数据」,其实没有什么意义,唯有人类能够从中发

掘价值,大数据才产生意义。所幸,已有很多应用实例,让大数据发出应有的光芒,也让我们看到各行各业有无穷尽的机会,等待数据科学家的探勘。

在「大数据」还没变成人人琅琅上口的流行词汇之前,小说改变而成的电影《魔球》描述美国大联盟运动家队点石成金在缺乏明星球员的状况下杀出血路的真实故事,早已让人津津乐道,而它正是数据分析的绝佳体现。

医疗与制药产业纷纷投入大笔经费,研发「客制化」的个人医学,透过分析病人的特徵与基因组成,给予个别病人量身定做的诊断与疗法,实验室与临床都需要大量且多样化的数据整合。

智能手机、运动手环甚至後来的智慧型手表,我们分分秒秒都在「量化自我」,

健身的程度、摄取的营养、身心状况、行为趋向全部都被巨细靡遗的记录下来。

大型银行与隶属政府的金融部门对资料长(chief data officer,CDO)与数据

科学家需求若渴,他们要能全盘考量组织职能,针对数据的蒐集、分析与应用做出策略性的思维。

无论地方政府或中央政府,都正流行「资料透明化」,如英美政府皆建立网站揭

示公开资料。人们自发性要求政府公布更多资料的行动也如火如荼,例如美国的DATA Act。

大数据在美国总统大选中扮演了很关键的角色,帮助候选人清晰的辨识出摇摆不定的选民。

Target、Walmart等零售商巨擘已经透彻分析顾客的资料好几年,早就能够在家人与朋友察觉之前,抢先一步知道某个消费者怀孕的消息。

智能恒温器Nest Thermostat、智能监控Quirky、利用使用者GPS「群众外包」塞车情况的Waze,都是基於数据蒐集与预测成就物联网生活的新创公司,他们都已

获得GE、Google等大企业投入钜资甚至并购,企盼能从大数据中挖掘巨量价值。

尽管有这么多成功的案例,对很多企业来说,大数据仍像一座无法翻越的山岭,难以将数据完美的融入决策过程。通常公司在运用大数据时,会遇到下列五个挑战:

挑战1:我们不知道答案,甚至连问题是什么都很模糊

大数据时代的其中一个关键特徵是,我们很难知道我们需要的答案,有时甚至连想要解决的问题都很模糊。有一部分原因是,大数据的价值在於模式(pattern)与

相关性(relationship),但这些过去隐藏在大量资料中的模式与相关性,经常都是

意外发现的。我们不能期待专家为每一行资料都特制MapReduce(Google提出的软

体架构,用於大规模数据的并行运算),其他大数据分析框架也一样有很高的进入壁垒,阻碍简单的资料探索与分析。

拥有深度分析、数学、统计与程式技能的数据科学家,无疑是现阶段最炙手可热的人才,不过人才养成的速度远远不及市场需求。

挑战2:非结构化的数据难以采集

就现实面来说,大数据其实就等於「非结构化」的数据,也就是从文本分析到未经梳理的文字、声音与影片导出的数据。这些文本分析景观,有着几乎堆积成山的问题,让我们难以利用非结构化的数据帮助日常的企业营运决策。这些问题包括:

不同的内容需要运用不同的工具:客户回响与产业分析各有不同的语言分析工具,如果使用一般的分析软体,可能就会牺牲精准度。

不同的时机需要运用不同的文本分析技术:自文本中萃取企业内部资讯,跟分析社群媒体情绪波动是完全不同的挑战。

文本分析的结果不可预测:挖掘大量网页、电子信箱中的信件、以及其他文件,通常能够显示过去未知的关联性。只是,即使大数据的贮存,让我们能够更便利的捕捉难以控制的数据,不过後续的分析,光有大数据的存在是没有多少帮助的。

挑战3:大数据难以重复利用

一般而言,数据的搜集、贮存、使用,都是针对单一目的,像是投资银行搜集10-K文件(美国上市公司年度报表),协助买方从事权益分析,生技公司在资料库中储存临床实验的结果,向FDA(美国食品药品监督管理局)提交报告,电商从制造商撷取库存滋料库,与他们自己的网站内容管理系统整合在一起。这些数据既然只为特定目的服务,自然很难再被利用到其他使用情境上。因此,风险管理人员无法从10-K文件的分析获取与自己职务相关的资讯,生技公司的资深科学家没办法自临床数据滋料库预测早期药物的成功机率,电商从业者也没办法重复利用库存资料库,辨识不同商品的战略性差距。

挑战4:大数据只是故事的一小部分

从前几项挑战看下来,想要促成一家真正由数据驱动、且由数据决策的公司,光有大数据是远远不足的。大数据得跟传统的企业资料来源(如交易与营运资料库或ERP储存系统),或者云端SaaS应用(如Salesforce的CRM资料)、无数的影

子IT(shadow IT)数据来源(包括试算表、简报、文件、SharePoint),整合的工作极端昂贵而且旷日费时,但是如果不做,那也甭想利用大数据解决企业的问题了。

挑战5:大数据的「准备」阶段成本极高

大数据时代的普遍心态与工具,总是鼓舞着我们蒐集愈多数据愈好。不过数据要有价值,在准备的阶段就需考量整合、散布与利用。大数据的「准备」可能代表三种情况:

发现:在大量的数据储存中辨识正确的数据记录

去芜存菁:评估与改善数据的品质、可靠度与精确度

组合(alignment):将数据概要与个人记录以常态的模式联系起来,以利整合与分析。

普遍来说,数据的准备,几乎完全是纯手工作业,因此非常冗长乏味,消耗很多时间,而且还很容易出错。

要克服这些挑战的方法,就是把大数据「变聪明」。Lee Feigenbaum把未经处理的数据称为「哑数据」,他也提供了「让数据说话」的五个方法,我们将会在下个礼拜分享给大家。

摘自:中国大数据

大数据带来的给予和挑战

大数据带来的机遇和挑战 互联网高端技术的创新与发展,给人类社会带来了巨大变化。今后20年全球将步入大数据新时代。高端互联网将再铸新世界。我们正处在一个数据爆发增长的时代。移动互联网、移动终端和数据感应器的出现,使数据以超出人们想象的速度在快速增长。据国际数据资讯公司(GlobalPulse)估测,数据数量一直在快速增加,每年增长50%,这个速度不仅是指数据流的增长,而且还包括全新的数据种类的增多。据统计,全球企业2010年在硬盘上存储了超过7EB的新数据,消费者在PC和笔记本电脑等设备上存储了超过6EB新数据,而1EB数据就相当于美国国会图书馆中存储数据的4000多倍。目前数据容量增长的速度,已经大大超过了硬件技术的发展速度,并正在引发数据存储和处理的危机。 有研究统计,从人类文明开始到2003年,人类共创造了5TB(兆亿字节)的信息,而现在,这样的数据量却仅需两天就被创造出来,且速度仍在加快。数据显示,2011年全球创建和复制的数据总量,就达到了1.8ZB(1ZB等于10的21次方比特),相当于全球每人产生300GB以上的数据。目前这个数字仍在快速增长,预计2020年,全球产生的数据量更将超过80ZB。由此可见,我们的确已经迈入了大数据时代。 2012年3月,美国奥巴马政府发起了《大数据研究和发展倡议》,将大数据定义为“未来的新石油”,称将斥资2亿美元用于大数据研究,以应对大数据革命正在带来的大机遇。据美国咨询机构Gartner预测,从现在起到2015年,大数据将会在世界范围内创造440万个工作岗位。 “大数据”,这一新兴概念,正在被赋予极其丰富的内涵,并被寄予特别巨大的希望……大数据时代,我们该如何寻找对策,迎接挑战? 一、“大数据资源”成为重要战略资源 互联网时代,“资源”的含义正在发生极大的变化,它已不再仅仅只是指煤、石油、矿产等一些看得见、摸得着的实体,“大数据”,也正在演变成不可或缺的战略资源。互联网、物联网每天都在产生大量的数据,这些庞大的数据资源,为人们依据数据了解世界、了解市场、了解人们的生活提供了可能。大数据已经被视为一种资产、一种财富、一种可以被衡量和计算的价值。得大数据者得天下,是一些推崇大数据时代的变革者所坚信不疑的判断。

大数据时代的机遇与挑战论文3000字[精品文档]

大数据时代的机遇与挑战 什么是大数据时代? “大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。” 大数据时代是怎样产生的? 物联网、云计算、社交网络、社会媒体以及信息获取技术的飞速发展,数据正以前所未有的速度迅速增长和积累,数据是人类社会最重要的财富大数据时代的到来 大数据时代的特点? 1.数据量大(Volume) 第一个特征是数据量大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。 2.类型繁多(Variety) 第二个特征是数据类型繁多。包括网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。 3.价值密度低(Value) 第三个特征是数据价值密度相对较低。如随着物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何通过强大的机器算法更迅速地完成数据的价值“提纯”,是大数据时代亟待解决的难题。 4.速度快、时效高(Velocity) 第四个特征是处理速度快,时效性要求高。这是大数据区分于传统数据挖掘最显著的特征。既有的技术架构和路线,已经无法高效处理如此海量的数据,而对于相关组织来说,如果投入巨大采集的信息无法通过及时处理反馈有效信息,那将是得不偿失的。可以说,大数据时代对人类的数据驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。 大数据时代的机遇 大数据技术通过对海量数据的快速收集与挖掘、及时研判与共享,成为支持社会治理科学决策和准确预判的有力手段,为社会转型期的社会治理创新带来了机遇。建立大数据中心,及时搜集、实时处理数据信息,为科学决策提供坚实基础。对社会大数据进行历时性和实时性分析,加强社会风险控制,提高政府预测预警能力和应急响应能力。

《“互联网+”与大数据时代的机遇与挑战》在线考试

《“互联网+”与大数据时代的机遇与挑战》在线考试 时间限制:90分钟 离考试结束还剩 1小时 29分 11秒 (到时间后将自动交卷) 一、单项选择题(共20小题,每小题2分) 1.1969年,美国国防部高级研究计划署建成世界上第一个实际运营的封包交换网络(),标志计算机网络的产生。 A. 阿帕网 B. 万维网 C. NSFNET D. Internet 2.截止2013年底,我国互联网的普及率达到() A. 23% B. 32% C. 39% D. 47% 3.本讲提到,“工业 4.0”是指利用物联信息系统,将生产中的供应、制造、销售信息(),最后达到快速、有效、 A. 立体化 B. 数据化 C. 表面化 D. 方便化 4.()是一种新兴的大众创新创业模式,其中有一个非常火的名词叫做“创客”。 A. 众筹 B. 众创

C. 众包 D. 众集 5.下列不属于本文提到的大数据新概念陷阱的是()。 A. 大数据会带来许多似是而非的“规律” B. 信息的增长赶不上噪声的增长 C. 数据越多可能思维越片面 D. 大数据发展不需要考虑经济性 6.根据本讲,信息化最主要的特征是() A. 融合 B. 包容 C. 安全 D. 转型 7.国家发改委专门设定“大数据提升政府治理能力研究”重大课题的年份是()。 A.2012 B.2013 C.2014 D.2015 8.根据本讲,国家战略传播是以()作为主要内容的。 A. 正能量 B. 道义感召力 C. 价值观和意识形态 D. 国家的核心利益

9.要从制度上破解新技术、新业态的障碍,其中一个原则是要构建激励约束的机制,保证()。 A. 信息动力 B. 物质动力 C. 技术动力 D. 原创动力 10.本讲认为,信息技术经过几十年的扩散储备后,21世纪的前()年可能是信息技术提高生产率的黄金时期。 A.10 B.20 C.30 D.35 12.()的社会联系和组织具有非自主性。 A. 信息时代 B. 机器及以前时代 C. 工业时代 D. 农业时代 13.分布式能源是上世纪()年代从热电联产开始的。 A.60 B.70 C.80 D.90 14.新技术、新业态是经济结构优化、转型升级的()。 A. 基础

大数据技术的挑战和启示分析

大数据技术的挑战和启示 目前,大数据技术的运用仍存在一些困难与挑战,体现在大数据挖掘的四个环节中。首先在数据收集方面。要对来自网络包括物联网和机构信息系统的数据附上时空标志,去伪存真,尽可能收集异源甚至是异构的数据,必要时还可与历史数据对照,多角度验证数据的全面性和可信性。其次是数据存储。要达到低成本、低能耗、高可靠性目标,通常要用到冗余配置、分布化和云计算技术,在存储时要按照一定规则对数据进行分类,通过过滤和去重,减少存储量,同时加入便于日后检索的标签。第三是数据处理。 有些行业的数据涉及上百个参数,其复杂性不仅体现在数据样本本身,更体现在多源异构、多实体和多空间之间的交互动态性,难以用传统的方法描述与度量,处理的复杂度很大,需要将高维图像等多媒体数据降维后度量与处理,利用上下文关联进行语义分析,从大量动态而且可能是模棱两可的数据中综合信息,并导出可理解的内容。第四是结果的可视化呈现,使结果更直观以便于洞察。目前,尽管计算机智能化有了很大进步,但还只能针对小规模、有结构或类结构的数据进行分析,谈不上深层次的数据挖掘,现有的数据挖掘算法在不同行业中难以通用。 大数据技术的运用前景是十分光明的。当前,我国正处在全面建成小康社会征程中,工业化、信息化、城镇化、农业现代化任务很重,建设下一代信息基础设施,发展现代信息技术产业体系,健全信息安全保障体系,推进信息网络技术广泛运用,是实现四化同步发展的保证。大数据分析对我们深刻领会世情和国情,把握规律,实现科学发展,做出科学决策具有重要意义,我们必须重新认识数据的重要价值。 为了开发大数据这一金矿,我们要做的工作还很多。首先,大数据分析需要有大数据的技术与产品支持。发达国家一些信息技术(IT)企业已提前发力,通过加大开发力度和兼并等多种手段,努力向成为大数据解决方案提供商转型。国外一些企业打出免费承接大数据分析的招牌,既是为了练兵,也是为了获取情报。过分依赖国外的大数据分析技术与平台,难以回避信息泄密风险。有些日常生活信息看似无关紧要,其实从中也可摸到国家经济和社会脉搏。因此,我们需要有自主可控的大数据技术与产品。美国政府2012年3月发布《大数据研究与发展倡议》,这是继1993年宣布“信息高速公路”之后又一重大科技部署,联邦政府和一些部委已安排资金用于大数据开发。我们与发达国家有不少差距,更需要国家政策支持。 中国人口居世界首位,将会成为产生数据量最多的国家,但我们对数据保存不够重视,对存储数据的利用率也不高。此外,我国一些部门和机构拥有大量数据却不愿与其他部门共享,导致信息不完整或重复投资。政府应通过体制机制改革打破数据割据与封锁,应注重公开信息,应重视数据挖掘。美国联邦政府建立统一数据开放门户网站,为社会提供信息服务并鼓励挖掘与利用。例如,提供各地天气与航班延误的关系,推动航空公司提升正点率。

大数据的应用及带给企业的挑战

大数据的应用及带给企业的挑战 随着信息技术特别是信息通讯技术的发展,互联网、社交网络、物联网、移动互联网、云计算等相继进入人们的日常工作和生活中,全球数据信息量呈指数式爆炸增长之势。根据国际数据公司IDC发布的研究报告,预计全球数据量大约每两年翻一番,到2020年全球将达到35ZB的数据信息量。随着前所未有巨量数据信息的聚集,“大数据”已得到广泛关注。本文将分企业数据、机器数据和社会化数据三类,针对企业数据处理面临的挑战、机器数据应用场景、社会化数据带来的变革展开讨论。 1、企业数据处理面临的挑战 中国的企业已经认识到大数据蕴含着巨大的商业价值,但国内互联网巨头作为率先使用大数据技术的用户,仅仅是基于开源软件自主开发大数据应用,未形成企业级的个性化应用。 (1)非结构化和结构化数据的统一及整合 随着互联网和通信技术的迅猛发展,企业中的数据类型早已不是单一的以文本为主的结构化数据,还充斥着广泛存在于社交网络、物联网、电子商务等之中的网络日志、音频、视频、图片、地理位置信息等多类型的数据。这些数据称为非结构化数据。据统计,企业中

85%的数据属于非结构化数据。但是企业现有的数据处理方法仅适用于结构化数据,无法将大量的非结构化数据与结构化数据进行统一、整合,就无法发掘数据中的价值。 (2)跨业务平台数据的关联 当今企业环境中存在着:不同业务模块的数据分布在不同的系统平台,这些被割裂的数据在单一业务平台无法得到有效利用;不同业务模块的数据无法实现共享、关联;仅对关键业务的数据进行收集、整合和利用,非关键业务的数据被忽视等现状。企业中的数据由于业务模块的划分而被割裂开来.单一业务模块的数据价值远远小于所有业务模块数据关联起来进行分析运用,企业将如何实现跨业务平台数据的关联与整合将面临巨大的挑战。 (3)面向数据的实时分析 随着经济的飞速发展,企业所面临的市场行情也在瞬息万变,企业曾经惯用的事后处理机制已经不能应对,企业需要实时洞察业务运营状态,以便迅速应对不断变化的市场形势。 企业业务的运营状态将体现在海量数据的快速处理和有效进行 实时分析的基础上。但随着大数据的爆炸式增长,与企业相关的数据可能在无限量的不断增长,这些不断变化的数据,需要企业进行全面、实时的分析。

大数据时代信息安全面临的挑战与机遇

大数据时代信息安全面临的挑战与机遇 2013-7-11 10:17:00来源:中国科技网 根据有关学者的研究,数据密集型科学将成为继实验科学、理论科学、计算机科学之后,人类科学研究的第四个范式。以大数据为代表的数据密集型科学将成为新一次技术变革的基石。随着数据的进一步集中和数据量的增大,对海量数据进行安全防护变得更加困难,数据的分布式处理也加大了数据泄露的风险,信息安全正成为制约大数据技术发展的瓶颈。 大数据时代已经到来 物联网、云计算、移动互联网等新技术的发展,使得手机、平板电脑、PC及遍布地球各个角落的传感器,成为数据来源和承载方式。据估计,互联网上的数据量每两年会翻一番,到2013年,互联网上的数据量将达到每年667EB(1EB=230GB)。这些数据绝大多数是“非结构化数据”,通常不能为传统的数据库所用,但这些庞大的数据“宝藏”将成为“未来的新石油”。 1.大数据具有四个典型特征 大数据(Big Data)是指“无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合”。业界通常用四个V来概括大数据的特征。 ——数据体量巨大(Volume)。到目前为止,人类生产的所有印刷材料的数据量是200PB(1PB=210TB),而历史上

全人类说过的所有的话的数据量大约5EB(1EB=210PB)。当前,典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。 ——数据类型繁多(Variety)。这种类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。 ——价值密度低(Value)。价值密度的高低与数据总量的大小成反比。以视频为例,一部1小时的视频,在连续不间断的监控中,有用数据可能仅有一两秒。如何通过强大的机器算法更迅速地完成数据的价值“提纯”,成为目前大数据背景下亟待解决的难题。 ——处理速度快(Velocity)。这是大数据区分于传统数据挖掘的最显著特征。根据IDC的“数字宇宙”报告,预计到2020年,全球数据使用量将达到35.2ZB(1ZB=210EB)。在如此海量的数据面前,处理数据的效率就是企业的生命。 2.大数据成为国家和企业的核心资产 2012年瑞士达沃斯论坛上发布的《大数据大影响》报告称,数据已成为一种新的经济资产类别,就像货币或黄金一样。奥巴马政府已把“大数据”上升到国家战略层面,2012年3月,美国宣布投资2亿美元启动“大数据研究和发展计划”,借以增强收集

大数据时代的机遇和挑战

大数据时代的机遇和挑战 【】First of all ,the paper makes a simple analysis of the concept and characteristics of large data. Secondly ,it explores the opportunities and challenges that big data brings to all aspects of economic life. Finally ,it explores how to deal with opportunities and challenges ,and improve the development environment of big data. improve the environment for the development of big data ,so as to make a certain contribution to the economic development in the era of big data. 【Keywords】big data age ;quantitative economics ;application 1引言 “大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。被称为“第三次浪潮的华彩乐章”。近几年来,大数据吸引了越来越多的关注,

人们随时都能感觉到生活在一个日益信息化的世界中。随着网络技术的发展,越来越多的人使用社交软件进行网上聊天,发布个人心情状态,对网络中的信息进行评论,这些都极大的丰富了我们的生活。同时,网上每天都会产生大量的数据,根据有关统计,每天网络中大约出现220 万TB 的新数据, 而且这个速度还在不断增加 伴随着大数据时代的到来,数据资源越来越庞大,数据处理速度越来越快,人们可以通过大数据技术实现各种构想。学者能够利用大数据这一有利条件进行更加科学且贴近现实的经济研究。银行能够通过大数据考查企业的诚信状况,并决定是否放贷。而计算机则可以在海量的数据中统计分析出人的行为、习惯等方式,从而更好地学习模拟人类智能。随着科学技术的不断发展,未来大数据会发挥出更加强大的作用, 而如何应对大数据时代的机遇与挑战,有效利用大数据资源,是各行各业应关注的焦点。 2大数据时代的特点 大数据又可以称之为巨量资料,它的概念比较抽象,其定义是依靠互联网技术下的主流软件对一些规模较大、较复杂的资料进行处理、分析、管理,从而形成对经济发展更加有用的信息。大数据的主要特点就是信息量大、多样化、高速等。大数据的形成需要特殊专业的技术,例如互联网、数据挖掘电子网或者大规模并行处理数据库等软件,通过有效的掌握丰富的数据资源,并对这些数据进行专业化的处理,从而在经济社会的发展中实现盈利,把对大数据的处理加工有效的转变为信息资

浅谈大数据时代的机遇与挑战

湖南农业大学课程论文学院:信息科学技术学院班级:计算机1班姓名:XXX 学号:2015XXXX 课程论文题目:浅谈大数据时代的机遇与挑战 课程名称: 评阅成绩: 评阅意见: 成绩评定教师签名: 日期:年月日

课程论文题目 ——浅谈大数据时代的机遇与挑战 学生:XXX (信息科学技术学院计算机1班) 摘要:随着时代的发展,大数据这个词慢慢进入了人们的视野的当中,而大数据也与我们的生活关联越来越紧密,对我们的影响也越来越大。怎么样才能把握住机遇,在大数据时代中脱颖而出,怎么样才能在大数据时代到来的挑战中稳步前行。 关键词:大数据;机遇与挑战;大数据时代分析 Abstract:with the development of The Times, the word big data slo wly into the people's horizons, and big data is linked to our life more and more closely, to our influence is growing. How to seize the opportunity, in the era of big data, how can ability in the er a of big data move steadily in the coming challenges. Key Words: Big data; Opportunities and challenges; The era of big da ta analysis

一、绪论 (一)什么是大数据? “大数据”作为时下最火热的IT行业的词汇在互联网时代显得越来越重要。大数据究竟有多大?大数据能做些什么?在新互联网时代,这些词汇让我们应接不暇。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据还有四个特性分别是数据量大,种类多,速度快,价值大。大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”(二)大数据能做些什么? 大数据的应用示例包括了大科学、传感设备网络、天文学、大气学、基因组学、生物学、大社会数据分析、互联网文件处理、制作互联网搜索引擎索引、通信记录明细、军事侦察、社交网络、通勤时间预测、医疗记录、照片图像和图像封存、大规模的电子商务等。仅仅十余年,现在越来越多的政府、企业等组织机构意识到数据正在成为组织最重要的资产,数据分析能力正在成为组织的核心竞争力。大数据不仅是一种海量的数据状态及其相应的数据处理技术,更是一种思维方式,一项重要的基础设施。这或是明天我们治理交通拥堵、雾霾天气、看病难、食品安全等“城市病”的利器,也会为政府打开了解社情民意的更大窗口。众所周知,大数据已经不简简单单是数据大的事实了,而最重要的现实是对大数据进行分析,只有通过分析才能获取很多智能的、深入的、有价值的信息。二、本论 (一)大数据的重要性 1.大数据的处理分析正成为新一代信息技术融合应用的结点 有专家指出,大数据及其分析,会在未来10年改变几乎每一个行业的业务功能,从科学研究到保险,从银行业到互联网,各个不同的领域都在遭遇爆发式增长的数据量。在美国的17个行业中,已经有15个行业大公司拥有大量的数据,其平均拥有的数据量已经远远超过了美国国会图书馆所拥有的数据量。在医疗与健康行业,根据数据预测,如果具备相关的IT设施,数据投资和分析能力等条

医疗大数据面临的挑战及思考

doi:10.3969/j.issn. 1672-5166.2013.04.03 医疗大数据面临的挑战及思考 蔡佳慧①张 涛①宗文红①△ 文章编号:1672-5166(2013)04-0292-04 中图分类号:R-37 文献标志码:A 摘 要随着卫生信息化建设进程的不断加快,医疗数据的类型和规模正以前所未有的速度增长,医疗卫生领域已进入“大数据时代”。本文在对医疗大数据基本概念进行剖析的基础上,归纳总结医疗大数据时代所面临的新挑战,详细介绍闸北区为应对这些挑战在数据管理、整合、存储、利用等方面所实施的具体措施,并对下一步工作进行了有益的思考。 关键词大数据卫生信息化数据处理 Challenges and Considerations of the Big Data of Medicine Cai Jiahui, Zhang Tao, Zong Wenhong Zhabei District Health Research and Information Center, Shanghai 200070, China Abstract With the rapid development of health information, the type and scale of medical and health data continue to expand at an unprecedented pace. Medical and health ? eld has entered a big-data era. On the basis of the analysis of the basic concepts of health data, this paper summarizes the new challenges faced in medical and health ? eld in the age of big data and introduces in details the implementation of speci? c measures of Zhabei District to meet these challenges in data management, integration, storage, utilization. The bene? cial thinking for the next step has also been put forward. Key words Big data, Health information, Data processing 1 引言 当前我们正处于一个数据爆炸性增长的“大数据”时代。据IDC( International Data Corporation ,国际数据公司)预测,中国的大数据市场在2012~2016年间将增长5倍,政府、银行、医疗卫生、电信等行业将在其中占据最多的份额。在医疗卫生领域,各种信息系统在医疗机构的广泛应用以及医疗设备和仪器的数字化,使医院数据库的信息容量不断膨胀,这些宝贵的医疗信息资源对于疾病的管理、控制和医疗研究都是非常有价值的。如何利用这些海量的信息资源更好地为医疗卫生行业的管理、诊疗、科研和教学服务,已经越来越为人们所关注。 ① 上海市闸北区卫生科技与信息中心,上海市,200070 作者简介:蔡佳慧(1986),女,学士学位;研究方向:卫生信息管理;E-mail:caijiahui86@https://www.360docs.net/doc/1415393077.html, 通讯作者:宗文红(1968),女,硕士学位;副主任医师;研究方向:卫生信息管理;E-mail:zongwenhong2006@https://www.360docs.net/doc/1415393077.html, △通讯作者 292

浅谈基于大数据时代的机遇与挑战

浅谈基于大数据时代的机遇与挑战 本文从网络收集而来,上传到平台为了帮到更多的人,如果您需要使用本文档,请点击下载按钮下载本文档(有偿下载),另外祝您生活愉快,工作顺利,万事如意! 随着信息时代的到来,大数据(Big Data)一词逐渐被人们认知和熟悉,其常被用于定义和描述“信息爆炸时代产生的海量数”。随着“大数据”时代的来临,在商业、经济及其他领域中,人们做出决策不仅仅依靠经验和直觉,常以数据分析作为决策依据,这种方式大大提高了决策的科学性,最大限度避免决策失误。用好大数据,必将对商业发展、科学研究和政府决策产生积极的影响。 1 大数据的基本概况 大数据(Big Data)是指那些超过传统数据库系统处理能力的数据,其具有以下四个基本特性,即海量性、多样性、易变性、高速性。同时数据类型繁多、数据价值密度相对较低、处理速度快、时效性要求高等也是其主要特征。 2 大数据的时代影响 大数据,对经济、政治、文化等方面都具有较为深远的影响,其可帮助人们进行量化管理,更具科学性和针对性,得数据者得天下。大数据对于时代的影

响主要包括以下几个方面: (1)“大数据决策”更加科学有效。如果人们以大数据分析作为基础进行决策,可全面获取相关决策信息,让数据主导决策,这种方法必将促进决策方式的创新和改变,彻底改变传统的决策方式,提高决策的科学性,并推动信息管理准则的重新定位。2009 年爆发的甲型H1N1 流感就是利用大数据的一个成功范例,谷歌公司通过分析网上搜索的大量记录,判断流感的传播源地,公共卫生机构官员通过这些有价值的数据信息采取了有针对性的行动决策。 (2)“大数据应用”促进行业融合。虽然大数据源于通信产业,但其影响绝不局限于通信产业,势必也将对其他产生较为深远的影响。目前,大数据正逐渐广泛应用于各个行业和领域,越来越多的企业开始以数据分析为辅助手段加强公司的日常管理和运营管理,如麦当劳、肯德基、苹果公司等旗舰专卖店的位置都是基于大数据分析完成选址的,另外数据分析技术在零售业也应用越来越广泛。 (3)“大数据开发”推动技术变革。大数据的应用需求,是大数据新技术开发的源泉。相信随着时代的不断发展,计算机系统的数据分析和数据挖掘功能将逐渐取代以往单纯依靠人们自身判断力的领域应用。借

大数据应用及其面临的挑战

16 摘要:随着“物联网”、“云计算”等新概念被政府强调、被企业运用推广,“大数据”也逐渐进入公众的视野。如何及时地获取数据、如何高效地分析数据,已成为软件工程师不得不面对的一个挑战。本文以一个软件工程专业本科生的视角,谈大数据的特点和大数据的应用,并猜想大数据可能面对的挑战。 关键词:大数据;特点;应用;挑战 数据是指所有文字、符号、图片等总称。计算机出现后,数据一般被默认为是所有能输入到计算机并被计算机程序处理的符号的总称。自互联网普及以来,数据的数量就在成指数级数增长,尤其是电子商务的快速发展和物联网技术的应用,使数据的增长速度达到难以想象的地步。据统计,Google一天产生20P的数据,(1P=1024T=1024*1024G);沃尔玛一小时要处理100万消费者的交易,要向数据库输入2.5P的数据;2009年,Facebook拥有2.5P用户数据,每天产生15T的数据;2009年,eBay拥有6.5P用户数据每天产生50T的数据;我们熟悉的阿里巴巴、淘宝拥有的数据量更是无法估计。大数据时代,无论是数据学家、统计学家还是金融学家,亦或是我们软件工程师,都开始觉得,传统的数据处理方式已经在日益增长且复杂多变的数据面前显得力不从心。人类,迫切地需要寻找一条出路——面对繁杂琐碎的数据,如果我们不能跳出传统的数据处理方式,用新方法有效地提取信息,就只能被无边无际的数据淹没。 幸运的是,在2010年,维克托·迈尔·舍恩伯格的《大数据时代》正式宣告了“大数据时代”的来临,并为即将被数据流沙淹没而束手无策的工程师们指明了一条出路:“我们要放弃对因果关系的追求,转而关注数据之间的相关度。”随后,金融行业、互联网行业都掀起了一场针对数据的变革风暴,“大数据”这一颠覆人们传统认知的思想,开始成为新发明和新服务的灵感源泉[1]。 1、大数据的概念及特点 “大数据”一词首次出现在2011年麦肯锡发布的《大数据,下一个创新、竞争和生产力的前沿》的报告中,2013年开始风靡全球。其实大数据就是一种数量庞大、种类繁多的资料数据。正所谓“成也萧何,败也萧何”:海量和多样的数据使得用常规的工具无法在短时间内捕捉和整理,想要处理并挖掘其中的财富更是难上加难,但是,通过采用新的大规模数据处理手段(主要是云计算),从杂乱无章的巨大数据中发现很有价值的信 大数据应用及其面临的挑战 文/胡钰玺 息,为政府、企业、组织或者个人提供决策依据,这就是大数据的魅力所在。有能力对数据处理和利用的企业必将成为大数据浪潮下的“弄潮儿”。大数据,主要有五大特点[2][3]: 1)数据容量大 在我看来,这是首要的特点。正是数据量的爆炸式增长引起了数据处理方式的变革,改变了我们以往对数据的看法。曾经因处理方式跟不上而“食之无味弃之可惜”的庞大数据如今因其潜在价值——相关性,而变得越来越重要,甚至已经成为一笔巨大的财富。 2)数据种类繁多 数据种类由单一走向繁多,不仅体现在数据形式上繁多(有文本数据、视频数据、音频数据等),还体现在数据来源的繁多(工厂生产过程中的生产数据、业务系统中业务数据、来自监控设备的视频数据,来自手机的通话数据等)。使我们不得不放弃曾经在数据处理上对因果关系的执着追求——即对“为什么”的探求,转而将目光投向数据之间的相关关系——即对“怎么做”的预测。这一思想不仅使得数据处理工作少了无谓的推演论证、多了高效的“找规律”和预判,而且让我们的眼界变得更广阔——或许我们曾经认为毫不相干的两者,其实存在内在联系? 3)数据处理速度快 数据产生的速度和数据更新的速度都出现了前所未有的高速发展,毋庸置疑,快速的处理也是体现了大数据的速度,大数据的处理速度得益于“云计算”助力。大数据的处理必须要有令人惊叹的速度,才能让我们尽早提出具有前瞻性的观点,达到先发制人的效果。 4)数据价值密度低 数据价值密度低是指和大量数据相比,真正有价值的数据所占比例很小,比如,在破案过程中产几十个小时的视频,但真正对破案有用的视频往往只有几分钟,甚至几十秒。庞大的数据看似是无用的糟粕,但倘若加以分析处理,便能用低廉的成本创造巨大的价值,取得“四两拨千斤”的奇效。 5)数据实时性强 随著传感技术和自动采集系统的应用和普及,数据的真实性和实时性大大提高,真实的数据才有利用的价值,它不仅能反映过去事物之间的联系和规律,也能在未来为我们的决策提供可靠的信息。 2、大数据的应用 在我还是个孩子的时候,就曾听父亲讲过一个这样的故

大数据时代的挑战--价值与应对策略

2012中国国际信息通信展专刊 14 2012年第17期 大数据时代的挑战、价值与应对策略 随着全球数据量爆炸式的增长,大数据时代已经到来。文章从大数据时代的基本特征入手,引出了大数据时代面临的挑战以及大数据带来的价值,提出了以创新为核心的务实应对策略。 【摘 要】 【关键词】大数据时代 “四V ”特征 流量经营 安全威胁 收稿日期:2012-08-14 责任编辑:左永君 zuoyongjun@https://www.360docs.net/doc/1415393077.html, 随着移动互联网、物联网、云计算等的快速发展,及视频监控、智能终端、应用商店等的快速普及,全球数据量出现爆炸式增长。即使在遭遇金融危机的2009年,全球信息量也比2008年增长62%,达到80万PB(1015字节),2010年增至120万PB。据IDC预测,至2020年全球以电子式形存储的数据量将达32ZB (1021字节)。以120万PB数据为例,如果将其刻录在DVD上,再将这些盘片堆叠起来,可从地球到月球垒一个来回! 在此背景下,电信运营商在其网络无休止扩容的同时,却面临“增量不增收”的困境;而一些采用“数据驱动型决策”模式经营的公司,则可将其生产力提高5%~6%。因此,有必要深入研究大数据时代(Big Data Era)的挑战、价值与务实应对策略。 1 大数据时代的基本特征 据统计,2010年以互联网为基础所产生的数据比之前所有年份的总和还要多;而且不仅是数据量的激增,数据结构亦在演变。Gartner预计,2012年半结构和非结构化的数据,诸如文档、表格、网页、音频、图像和视频等将占全球网络数据量的85%左右;而 且,整个网络体系架构将面临革命性改变。由此,所谓大数据时代已经来临! 对于大数据时代,目前通常认为有下述四大特征,称为“四V”特征: (1)量大(V o l u m e B i g )。数据量级已从T B (1012字节)发展至PB乃至ZB,可称海量、巨量乃至超量。 (2)多样化(Variable Type)。数据类型繁多,愈来愈多为网页、图片、视频、图像与位置信息等半结构化和非结构化数据信息。 (3)快速化(Velocity Fast)。数据流往往为高速实时数据流,而且往往需要快速、持续的实时处理;处理工具亦在快速演进,软件工程及人工智能等均可能介入。 (4)价值高和密度低(V a l u e H i g h a n d L o w Density)。以视频安全监控为例,连续不断的监控流中,有重大价值者可能仅为一两秒的数据流;360°全方位视频监控的“死角”处,可能会挖掘出最有价值的图像信息。 2 大数据时代面临的挑战 (1)运营商带宽能力与对数据洪流的适应能力面临前所未有的挑战,管道化压力化解及“云-管- 端”的有效装备也均面临新挑战。 (2)大数据的“四V”特征在数据存储、传输、

大数据的机会与挑战

大数据的机会与挑战 我们活在大数据的世界,数据的数量与多样化的程度,每日都以前所未有的规模扑向人类。无论你是不是在相关产业工作,都不可能逃离被大数据「围攻」的现实。自哈佛大学电脑科学系毕业、Cambridge Semantics共同创办人Lee Feigenbaum撰写的〈Turnning Big Data into Smart Data〉一文,告诉我们横亘企业眼前的「大数据挑战」。让我们先来看看,大数据到底有多大? 每天全球每一个人聚沙成塔,累积的新数据达到「艾位元组(exabytes)」(甚 至达到「皆位元组(zettabytes)」,端赖统计的来源)。 至今一半以上(有些报告甚至指出高达90%)的数据资料是在过去12个月产生的。 人们创造数据的速度每一个月都以双倍速度成长。 除了吓人以外,光有这些「大数据」,其实没有什么意义,唯有人类能够从中发 掘价值,大数据才产生意义。所幸,已有很多应用实例,让大数据发出应有的光芒,也让我们看到各行各业有无穷尽的机会,等待数据科学家的探勘。

在「大数据」还没变成人人琅琅上口的流行词汇之前,小说改变而成的电影《魔球》描述美国大联盟运动家队点石成金在缺乏明星球员的状况下杀出血路的真实故事,早已让人津津乐道,而它正是数据分析的绝佳体现。 医疗与制药产业纷纷投入大笔经费,研发「客制化」的个人医学,透过分析病人的特徵与基因组成,给予个别病人量身定做的诊断与疗法,实验室与临床都需要大量且多样化的数据整合。 智能手机、运动手环甚至後来的智慧型手表,我们分分秒秒都在「量化自我」, 健身的程度、摄取的营养、身心状况、行为趋向全部都被巨细靡遗的记录下来。 大型银行与隶属政府的金融部门对资料长(chief data officer,CDO)与数据 科学家需求若渴,他们要能全盘考量组织职能,针对数据的蒐集、分析与应用做出策略性的思维。

最新在“大数据”时代背景下-当代大学生应该如何应对“大数据”带来的机遇和挑战

请大家结合实际,在“大数据”时代背景下,当代大学生应该如何应对“大数据”带来的机遇和挑战。 大数据时代是一场革命,庞大的数据资源使得各个领域开始了量化进程。本文主要从当代大学生角度阐述了以下内容:面对各个领域的飞速变化,身处校园但即将面向社会的大学生应从知识和能力两方面储备,既要学好专业课程知识又需了解时代发展方向、掌握社会发展脉搏,为自己以后踏入社会做好准备。 大数据对整个社会产生了不可忽视的影响,教育作为社会的子系统,也受到了它的极大冲击。有人曾说,信息化社会,我们相互之间的距离只是一根网线的问题。随着公开课、E-learning等新学习方式的出现,传统学习方式“遭遇”了挑战。 一、立足当下:当前学习模式概述 学习模式往往受到时代环境的影响,随着科技进步与技术创新,大学学习模式也在不断地向前发展。较为常见的主要有以下几种: 第一,师生授受学习模式。这种学习模式就如同“母鸭带小鸭”,学生把注意力集中在授课教师身上,由教师带着学。学生把教师当作知识的来源,“唯教师,唯书本”,缺乏学习主动性。在大数据时代,大量知识需要自主学习,大量数据背后的潜在意义也需要自主探寻,一味依赖“灌输”则不能适应社会要求。 第二,探究与问题解决模式。这种模式往往从一个或多个具有挑战性或有争议的问题开始,然后借助各种媒介资源,由学生自己获取信息、分析信息、确定问题并提供解答,之后吸收他人建议,进行修改最终完成。这种学习模式有利于提升学生的思维能力和问题解决能力,相对第一种模式而言,这种模式对学生的能力和素质有更高的要求。 第三,专题合作学习模式。“学会学习,学会创造,学会合作,学会生存”已成为当下教育的主题。在合作学习模式中,要求学生作为成员参与到学习团队中,完成专题研究或研究项目。这是一个动手实践、自主探索和合作交流的过程,也是有明确责任分工的互助性学习,最终通过团队合作达到课程或项目规定的要求。 二、机遇和挑战:大数据时代对大学生学习模式的双重影响 第一,快速便捷。大数据时代有快速化的特点,人们的学习不再受时间和地点的限制,随时随处都可以学习,而且可以走在时代的前沿,第一时间了解最新的知识和信息。以往的学习主要是通过书本,但书本学习往往面临时间滞后等方面的限制,会影响学习效果与知识更新。 第二,经济有效。大学生的家庭背景各不相同,家庭环境不好的学生没有能力支付课外培训学习的费用。在大数据时代,很多公开课程都是免费的,只要有学习的时间和需要,经济不再是制约大学生学习的因素。这在某种程度上也促进了区域之间、校际之间、城乡之间以及个人之间的教育公平。 第三,资源共享。大数据时代具有量大、多样化的特点,丰富的学习资源将呈现在学生面前。网络学习拉近了国际、区域和校际之间的距离,所有的学习者在学习资源利用方面拥有同等的权利。一直以来,好的学校是稀缺资源,但在不远的将来,由于在线教育的普及,人人皆可上名校将不再是梦想,教育资源匮乏的问题也将得到一定的缓解。在线教育对个人的重大意义,还不仅仅是教育机会的增加,更是学习方式的改变。 三、与时俱进:大数据时代大学生学习模式的三大转向 1.由被动学习模式向自主学习模式转变。在传统的学习模式中,学生就像嗷嗷待哺的婴

大数据时代对社会的影响与挑战

大数据时代面临机遇和挑战。 一、“大数据”概念的界定 (一)“大数据”概念的提出与发展 2008年9月4日,《自然》(Nature)刊登了一个名为“Big Data”的专辑,首次提出 大数据(Big Data)概念,该专辑对如何研究PB级容量的大数据流,以及目前正在制订的、用以最为充分地利用海量数据的最新策略进行了探讨。[1]2011年5月,EMC(全球最大的外置存储硬盘供应商)举办了主题为“云计算相遇大数据”的大会;紧随其后,IBM、麦肯锡等众多国外机构发布了“大数据”的相关研究报告,2011年6月,麦肯锡全球研究所发布研究报告——《大数据的下一个前沿:创新、竞争和生产力》(Big Data: The Next Frontier for Innovation, Competition, and Productivity)[2],首次提出“大数据时代”来临。此后,联合国、世界经 济论坛也纷纷关注信息时代海量数据对社会经济发展所带来的冲击,2012年5月,联合国“全 球脉冲”(Global Pulse)计划发布《大数据开发:机遇与挑战》(Big Data for Development: Challenges & Opportunities)[3]报告,阐述了大数据带来的机遇、主要挑战和大数据应用。2011、2012年达沃斯世界经济论坛将大数据作为专题讨论的主题之一,发布了《大数据、大影响:国 际发展新的可能性》(Big Data, Big Impact: New Possibilities for International Development)[4]等系列报告。 奥巴马政府创造性地将“大数据”概念全面引入到公共行政领域。2009年,美国联邦政府 发布《开放政府指令》(The Open Government Directive),作为大数据的前奏推出了“https://www.360docs.net/doc/1415393077.html,”公共数据开放网站。2012年3月,美国联邦政府发布了《大数据研究和发展倡议》(Big Data Research and Development Initiative)[5],正式启动了“大数据发展计划”,宣布将投入超 过2亿美元在大数据研究上[6];同年5月,联邦政府发布《数字政府战略》(Digital Government Strategy)[7],致力于为公众提供更好的“数字化”服务,围绕数据进行的一系列措施在美国政府全面推进,大数据对美国政府的影响逐步显现。 (二)大数据的概念 “大数据”作为信息社会发展的一个新生事物,目前尚处在逐渐被认识、被应用的初始阶段,无论是学术界还是IT行业对大数据的理解各有侧重,尚未形成一套完整的理论体系,因此很难进行精准的定义。维基百科将大数据定义为“所涉及的资料量规模巨大到无法通过目前主流软件工具在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的资讯”[8]。全球知名的咨询公司如麦肯锡、Gartner以及知名信息化企业如IBM等作为大数据的推崇者,更侧重于从技术层面界定大数据。2011-2013年,Gartner发布了多个与大数据有关的白皮书,如“Hype Cycle for Big Data, 2012”,定义了大数据的技术生命周期,报告中指出大数据不只是一项单一的技术,而是一个概念,一套技术。《互联网周刊》则认为,“大数据是通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见,最终形成变革之力”。[9]

相关文档
最新文档