大数据管理:概念、技术与挑战

合集下载

大数据管理概念、技术与挑战

大数据管理概念、技术与挑战
大数据管理:概念、技术与挑战
概念: 大数据管理是指对海量数据进行有效的收集、处理、存储、
分析和应用的一系列管理手段。 大数据管理是从数据的本质和特点
出发,通过有效的技术手段实现对数据的有效管理和利用,最终实现
数据的高效利用和价值最大化。
技术: 大数据管理涵盖了多种技术手段,包括数据采集、数据存储、
数据处理、数据分析、数据可视化等方面。其中,数据采集是获取数
.
数据的安全性和隐私性需要重视,需要采用多层次的安全管理
措施;
.
数据的分析和应用需要紧密结合业务需求,需要深入了解业务
和用户的需求。
是通过各种图表、报表等形式将数据呈现出来,以便于用户直观的理
解和分包括以下几个方面:
.
数据量巨大,海量数据存储和处理需要庞大的计算资源和存储
空间;
.
数据的多样性和复杂性,需要采用多种数据存储和处理技术;
.
数据的实时性和准确性要求高,需要采用高效的数据采集和处
理技术;
据的重要手段,常用的数据采集方式包括爬虫、传感器、日志、监控
等;数据存储是将数据存储在数据库、数据仓库、分布式文件系统等
不同的存储介质中;数据处理是通过分布式计算、并行计算等技术手
段对数据进行处理,以实现数据的快速处理和分析;数据分析是通过
各种数据分析算法对数据进行处理,提取有价值的信息;数据可视化

《大数据管理》,教材

《大数据管理》,教材

《大数据管理》,教材大数据管理相关的教材有很多,以下是其中一些具有代表性的教材:1. "大数据管理:概念、技术与挑战"(Big Data Management: Concepts, Technologies, and Challenges)- 作者:Jafar Husain,这本书从概念、技术和挑战三个方面全面介绍了大数据管理。

2. "大数据:概念、技术和管理"(Big Data: Concepts, Technologies, and Management)- 作者:Amit S. Bavle,这本书详细介绍了大数据的概念、技术和管理的各个方面。

3. "大数据管理:基础、应用和挑战"(Big Data Management: Foundations, Applications, and Challenges)- 作者:David B. Audretsch,这本书涵盖了大数据管理的基础知识、应用和挑战,包括数据存储、数据安全、数据隐私等方面的内容。

4. "大数据管理:技术、应用和挑战"(Big Data Management: Technologies, Applications, and Challenges)- 作者:Bijan Amini,这本书主要介绍了大数据管理的技术、应用和挑战,包括数据处理、数据挖掘等方面的内容。

5. "大数据管理教程"(Big Data Management Tutorial)- 作者:Herman van den Bosch,这本书以教程的形式介绍了大数据管理的基础知识和技能,包括数据存储、数据处理等方面的内容。

这些教材都具有一定的系统性、可读性和实用性,适合作为学习大数据管理的参考书籍。

同时,也可以结合实际项目进行实践,加深对大数据管理的理解。

大数据管理与储存的挑战与解决方案

大数据管理与储存的挑战与解决方案

大数据管理与储存的挑战与解决方案随着互联网的快速发展以及各类传感器和设备的普及,大数据已经成为了我们生活中无法回避的现象。

大数据的处理和管理已经成为了一个全球范围内的挑战,尤其是在数据储存和管理方面。

本文将探讨大数据管理和储存所面临的挑战,并提出解决方案。

一、大数据管理的挑战1. 数据量巨大:大数据的特点之一就是数据量巨大,每天产生的数据量以TB、PB甚至EB来计量。

这使得传统的数据库管理系统无法有效地处理和存储这么大规模的数据,导致信息检索和数据分析变得困难。

2. 数据多样性:大数据不仅仅包括结构化数据,还包括非结构化数据如文本、图像、音频和视频等。

这些数据的多样性给数据的处理和管理带来了极大的复杂性,传统的数据库无法满足对这些数据的处理需求。

3. 数据速度:大数据处理不仅需要面对海量的数据,还需要实时地进行处理和分析。

大数据应用的一个重要场景是实时数据分析,这要求数据管理系统必须能够以高速进行数据处理和分析,以便进行即时决策。

二、大数据管理的解决方案1. 分布式存储系统:针对数据量巨大的问题,传统的集中式数据库已经无法胜任,分布式存储系统应运而生。

这种系统通过将数据分散存储到多个服务器节点上,提高了数据的存储能力和吞吐量,从而更好地满足了大数据的处理需求。

2. NoSQL数据库:传统关系型数据库在面对大数据的非结构化数据时效率低下,因此需要使用一种能够更好地处理这类数据的数据库系统。

NoSQL(Not Only SQL)数据库是一种非关系型数据库,它相对于传统数据库更加灵活、高效,并且能够处理多种类型的数据。

3. 分布式计算框架:为了解决大数据处理的速度问题,分布式计算框架应运而生。

这种框架可以将大数据分成多个小任务,分配到不同的计算节点上进行并行处理,并最终将结果合并。

常见的分布式计算框架包括Apache Hadoop和Spark等。

4. 数据压缩和索引技术:对于海量的数据,压缩和索引是提高存储和检索效率的关键。

大数据管理_概念_技术与挑战_孟小峰

大数据管理_概念_技术与挑战_孟小峰
修回日期 : - - - - 2 0 1 2 1 1 3 0; 2 0 1 2 1 2 0 4 收稿日期 :
的处理流程 , 并提出大数据所面临的若干挑战 .
) ; ) ; 国家自然科学基金项目 ( 中国人民大学科学研究基金项目 ( 国家 “ 八六三 ” 6 1 0 7 0 0 5 5, 9 1 0 2 4 0 3 2, 9 1 1 2 4 0 0 1, 6 0 8 3 3 0 0 5 1 1 XN L 0 1 0 基金项目 : ) 高技术研究发展计划基金项目 ( 2 0 1 2 AA 0 1 0 7 0 1
) , 投资2 亿 d a t a r e s e a r c h a n d d e v e l o m e n t i n i t i a t i v e p 以上美元, 正式启动“ 大数据发 展计划” 计划在科 . 环境、 生物医学等领域利用大数 据 技 术 进 学研究、 奥巴马政府的这一计划被视为美国政府 行突破. ) 继信 息 高 速 公 路 ( 计划之后 I n f o r m a t i o n H i h w a g y 在信息科学领域的又一重大举措. 与此 同 时, 联合 ” 国一 个 名 为 “ 的倡议项目在今年5月 G l o b a l P u l s e : 发布报告“ B i d a t a f o r d e v e l o m e n t C h a l l e n e s & g p g ” , 该报告主 要 阐 述 大 数 据 时 代 各 国 o o r t u n i t i e s p p ) 特别是发展中国家在面临数据洪流 ( 的 d a t a d e l u e g
r o w i n A b s t r a c t a t a t e a n d a m o u n t i n h u m a n s o c i e t i s i n a m a z i n s e e d w h i c h i s c a u s e d b D g g y p y g p y , e m e r i n n e w s e r v i c e s s u c h a s c l o u d c o m u t i n i n t e r n e t o f t h i n s a n d s o c i a l n e t w o r k, t h e e r a o f b i g g p g g g , d a t a h a s c o m e . D a t a h a s b e e n f u n d a m e n t a l r e s o u r c e f r o m s i m l e d e a l i n o b e c t a n d h o w t o m a n a e p g j g a n d u t i l i z e b i d a t a b e t t e r h a s a t t r a c t e d m u c h a t t e n t i o n. E v o l u t i o n o r r e v o l u t i o n o n d a t a b a s e r e s e a r c h g , r o b l e m.T h i s a e r f o r b i d a t a i s a d i s c u s s e s t h e c o n c e t o f b i d a t a a n d s u r v e s i t s s t a t e o f t h e p p p g p g y f r a m e w o r k o f b i d a t a i s d e s c r i b e d a n d k e t e c h n i u e s a r e s t u d i e d .F i n a l l s o m e n e w a r t .T h e g y q y c h a l l e n e s i n t h e f u t u r e a r e s u mm a r i z e d . g ; ; K e w o r d s i d a t a d a t a a n a l s i s c l o u d c o m u t i n b g y p g y 物联网 、 社交网络等新兴服务促使人类社会 的 数 据 种 类 和 规 模 正 以 前 所 未 有 的 速 度 增 摘 要 云计算 、 长, 大数据时代正式到来 . 数据从简单的处理对象开始转变为一种基础 性 资 源 , 如何更好地管理和利用 大数据已经成为普遍关注的话题 . 大数 据 的 规 模 效 应 给 数 据 存 储、 管理以及数据分析带来了极大的挑 数据管理方式上的变革正在酝酿和发生 . 对大数据的基本概念进行 剖 析 , 并对大数据的主要应用作 战, 在此基础上 , 阐述大数据处理的基本框架 , 并就云计算技术对 于 大 数 据 时 代 数 据 管 理 所 产 生 简单对比 . 的作用进行分析 . 最后归纳总结大数据时代所面临的新挑战 . 数据分析 ; 云计算 关键词 大数据 ;

数据管理与大数据技术

数据管理与大数据技术

数据管理与大数据技术随着现代科技的快速发展,大数据已成为日常生活中不可或缺的一部分。

在处理大数据的同时,数据管理也变得越发重要。

本文将探讨数据管理与大数据技术的关系,以及数据管理在大数据时代的挑战和应对之策。

一、数据管理的定义及重要性数据管理是指对数据进行收集、存储、处理、分析和保护的一系列活动。

数据管理的目标是确保数据的完整性、一致性和可用性,以支持组织的决策和业务发展。

在大数据时代,数据管理变得尤为重要。

大数据的特点是数据量巨大、类型多样、速度快,并具有高价值及高复杂性。

在这样的环境下,有效的数据管理成为了企业成功的关键因素。

二、大数据技术的介绍及应用大数据技术是指为了处理大数据而发展起来的一系列技术和方法。

其中,最为重要的有数据采集、存储、处理和分析。

数据采集:大数据技术可以帮助企业从各种内部和外部渠道收集数据,例如传感器、社交媒体、网页点击等。

数据存储:大数据技术提供了各种存储方法,包括关系型数据库、非关系型数据库、分布式文件系统等,以应对海量数据的存储需求。

数据处理:大数据技术可以处理海量的结构化和非结构化数据,例如数据清洗、数据集成、数据转换等。

数据分析:大数据技术使得企业可以从庞大的数据集中提取有价值的信息和洞察,以支持决策和预测。

大数据技术在各行各业都有广泛的应用,例如金融领域的风险管理、医疗领域的疾病诊断和治疗、零售领域的市场分析和个性化推荐等。

三、数据管理在大数据时代的挑战然而,大数据时代也给数据管理带来了新的挑战。

以下是几个主要的挑战:1. 数据安全和隐私:大数据的收集和存储涉及大量的个人和敏感信息,因此数据安全和隐私成为了重要关注点。

2. 数据质量:大数据的多样性和复杂性导致了数据的质量问题,例如数据的不一致、缺失和错误。

3. 数据集成和共享:在大数据环境中,许多企业都面临数据集成和共享的挑战。

不同系统和平台之间的数据集成成为了一个复杂的问题。

4. 数据治理:在大数据时代,数据治理变得尤为重要。

大数据管理与应用介绍

大数据管理与应用介绍

大数据管理与应用介绍随着信息技术的快速发展和互联网的普及,大数据正逐渐成为我们生活的一部分。

在互联网时代,大量的数据源源不断地产生并积累,如何高效地管理和应用这些数据成为了重要的课题。

本文将介绍大数据管理的概念、挑战以及应用领域,并探讨大数据管理和应用对个人、企业和社会的重要意义。

首先,让我们了解一下大数据管理的概念。

大数据管理是一种综合性的管理方法,旨在处理海量、多样和高速增长的数据。

大数据管理包括数据收集、存储、处理、分析和应用等各个方面。

通过有效地管理大数据,可以提取有价值的信息、发现隐藏的规律,并为决策提供科学依据。

然而,大数据管理面临着诸多挑战。

首先,大数据的规模庞大,给数据收集、存储和处理带来了巨大的压力。

其次,大数据的多样性使得数据的结构和格式各异,增加了数据处理的难度。

此外,由于数据生成速度快、实时性要求高,大数据管理要求系统处理能力强大,能够及时响应和处理数据的变化。

大数据管理的应用范围广泛。

首先,在商业领域,大数据管理可以帮助企业进行市场分析、用户行为预测、产品推荐等,从而提高企业的竞争力。

例如,互联网巨头通过对用户行为进行分析,可以根据用户的喜好进行个性化推荐,提高用户体验。

其次,大数据管理对于医疗行业也有重要的应用价值。

通过对大量的医疗数据进行分析,可以帮助医生做出准确的诊断和治疗方案,提高医疗水平。

再者,在城市管理方面,大数据管理可以帮助政府进行交通管理、环境监测等,提高城市的生活质量。

大数据管理和应用对个人、企业和社会都具有重要意义。

对个人来说,大数据管理可以帮助我们更好地理解自己,根据个人喜好获取个性化的服务。

对于企业来说,大数据管理可以帮助企业提高效率、降低成本、增加竞争力。

对于社会来说,大数据管理可以帮助政府更好地管理资源、提高公共服务水平、推动社会进步。

然而,大数据管理和应用也面临着一些问题和风险。

首先,大数据的处理涉及到个人隐私和数据安全问题。

在数据的收集、存储和传输过程中,要保证数据的安全性,防止数据泄露和滥用。

大数据时代数据管理的挑战与机遇

大数据时代数据管理的挑战与机遇

大数据时代数据管理的挑战与机遇在大数据时代,数据管理面临着前所未有的挑战与机遇。

随着互联网和信息技术的快速发展,海量的数据源不断涌现,数据的价值和影响力也日益凸显。

数据管理成为了企业和组织中不可或缺的一环,而如何应对这些挑战,并将其转化为机遇,成为了摆在我们面前的重要课题。

一、数据管理的挑战在大数据时代,数据管理面临着以下几个方面的挑战:1. 数据量的急剧增长:在互联网和物联网的驱动下,数据量以指数级增长。

企业和组织需要面对海量数据的获取、存储、处理和分析,而传统的数据管理方法和技术已无法胜任。

2. 数据多样性的增加:数据不再是以结构化数据为主,而是包含了结构化、半结构化和非结构化数据。

这些数据带来了新的分析挑战,需要采用更灵活和多样化的数据管理方式。

3. 数据质量的保证:数据质量对于数据管理至关重要。

然而,在大数据时代,数据的来源不尽相同,质量参差不齐,需要消除数据中的噪声和错误,并确保数据的准确性和完整性。

4. 数据安全与隐私保护:随着数据的增多和广泛应用,数据安全和隐私保护问题日益突出。

数据管理需要建立完善的安全机制,保护数据的机密性、完整性和可用性。

二、数据管理的机遇在挑战之中,数据管理也带来了许多机遇:1. 数据驱动决策的能力:大数据时代使得企业和组织能够基于更全面、准确的数据进行决策。

通过有效的数据管理,可以发现隐藏在数据背后的洞见,为企业创造新的机会,提高竞争力。

2. 智能化数据分析的能力:大数据时代的数据管理可以采用先进的数据分析技术,如机器学习、人工智能等,对海量的数据进行挖掘和分析,以发现数据中存在的规律和趋势,为企业决策提供更深入的参考。

3. 消费者洞察的能力:通过有效的数据管理,企业可以更好地了解消费者的需求和偏好,从而提供更个性化的产品和服务。

数据管理为企业提供了更多与消费者进行有效沟通的机会。

4. 创新与新业务模式:大数据时代的数据管理可以帮助企业发现新的商机和创新点。

大数据管理:概念、技术与挑战 张超宇

大数据管理:概念、技术与挑战 张超宇

大数据管理:概念、技术与挑战张超宇发表时间:2017-11-22T16:39:23.720Z 来源:《电力设备》2017年第19期作者:张超宇[导读] 摘要:近年来,随着越来越多的大型科学仪器的建设和重大科学实验的发展,科学研究进入了前所未有的大数据时代。

大数据时代的科学研究是一门科学性强、需求量大、数据量大、计算量大、发现过程大、研究开发大的数据,支持全生命周期的数据管理系统具有重要意义。

(长江大学计算机科学学院湖北武汉 430100)摘要:近年来,随着越来越多的大型科学仪器的建设和重大科学实验的发展,科学研究进入了前所未有的大数据时代。

大数据时代的科学研究是一门科学性强、需求量大、数据量大、计算量大、发现过程大、研究开发大的数据,支持全生命周期的数据管理系统具有重要意义。

本文分析了R&D科学大数据管理系统的产生背景,阐述了科学数据的概念和三个特点。

通过对科学数据资源的开发和科学数据管理系统的研究分析,提出了全生命周期管理的科学数据分析的关键技术在科学数据管理系统从五个方面:数据融合,实时数据分析,长期存储,云服务的系统和数据的开放共享机制。

最后,展望了科学数据管理系统在科学研究领域的应用前景。

关键词:科学数据;大数据;数据流水线;数据全生命周期的大型测量望远镜,大型粒子加速器,高通量基因测序和其他来源继续产生大量的科学数据,使得全球科技创新为科学数据前所未有的时代。

科学数据已成为新战略资源的科学发现,一个国家的科学研究水平将直接取决于它在科学数据上的优势和将数据转化为知识的能力。

大规模科学数据管理和科学数据的应用,往往需要突破,今天所有的数据管理系统的限制,实现高效科学的知识发现,它已经成为科学和数据管理工作领域共同解决“问题”。

总之,在科学数据的管理存在的主要问题和挑战包括:1)大型关系型数据管理。

比如天文数据中心领域千亿甚至万亿线天文海图数据管理。

2)多源数据关联和知识发现。

如全球开放的生物资源、文献、序列和疾病等10000种数据源100亿种相关数据的知识发现,需要6多个相关的挖掘。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Abstract: Data type and amount in human society is growing in amazing speed which caused by emerging new service such as cloud computing, internet of things and social network, the era of Big Data has come. Data has been fundamental resource from simple dealing object, and how to manage and utilize big data better has attracted much attention. Evolution or revolution on database research for big data is a problem. This paper discusses the concept of big data, and surveys its state of the art. The framework of big data is described and key techniques are studied. Finally some new challenges in the future are summarized.
2、大数据的基本概念、来源与应用
2.1 大数据的基本概念 大数据本身是一个比较抽象的概念,单从字面来看,它表示数据规模的庞大。但是仅仅
数量上的庞大显然无法看出大数据这一概念和以往的“海量数据”(Massive Data)、“超大规 模数据”(Very Large Data)等概念之间有何区别。对于大数据尚未有一个公认的定义,不同 的定义基本是从大数据的特征出发,通过这些特征的阐述和归纳,试图给出其定义。在这些 定义中,比较有代表性的是 3V 定义[10],即认为大数据需满足 3 个特点:规模性(Volume)、 多样性(Variety)和高速性(Velocity)。除此之外,还有提出 4V 定义的,即尝试在 3V 的基础上 增加一个新的特性。关于第四个 V 的说法并不统一,IDC 认为大数据还应当具有价值性 (Value)[11],大数据的价值往往呈现出稀疏性的特点。而 IBM 认为大数据必然具有真实性 (Veracity)[12]。维基百科对大数据的定义[13]则简单明了:大数据是指利用常用软件工具捕获、 管理和处理数据所耗时间超过可容忍时间的数据集。
大数据管理:概念、技术与挑战
孟小峰 慈祥 (中国人民大学信息学院 北京 100872)
Big Data Management: Concepts, Techniques and Challenges
Meng Xiaofeng and Ci Xiang (School of Information, Renmin University of China, Beijing 100872)
景下,解决大数据问题所需的技术以及面临的一些挑战。Science 在 2011 年 2 月推出专刊 《Dealing with Data》[3],主要围绕着科学研究中大数据的问题展开讨论,说明大数据对于 科学研究的重要性。美国一些知名的数据管理领域的专家学者则从专业的研究角度出发,联 合发布了一份白皮书《Challenges and Opportunities with Big Data》[4]。该白皮书从学术的角 度出发,介绍了大数据的产生,分析了大数据的处理流程,并提出大数据所面临的若干挑战。
Table 1 Four Science Paradigms
表 1 科学发现的四种范式
Science Paradigms
Time
Methodology
Empirical
Thural phenomena
Theoretical
Last few hundred years Using models, generalizations
大数据的火热并不意味着对于大数据的了解深入,反而表明大数据存在过度炒作的危险。 大数据的基本概念、关键技术以及对其的利用上均存在很多的疑问和争议。本文从大数据问 题背后的本质出发,对现有的大数据研究资料进行全面的归纳和总结。首先简要介绍大数据 的基本概念,阐述其同传统数据库的区别。在此基础上,对大数据处理框架进行详细解析。 我们认为大数据的发展离不开云计算技术,云计算支撑着大数据存储、管理以及数据分析等。 因此本文展开介绍了大数据时代不可或缺的云计算技术和工具。最后全面阐述大数据时代面 临的新挑战。
关键字 大数据;数据分析;云计算
中图法分类号 TP311
1、引言
随着以博客、社交网络、基于位置的服务 LBS 为代表的新型信息发布方式的不断涌现, 以及云计算、物联网等技术的兴起,数据正以前所未有的速度在不断的增长和累积,大数据 时代已经来到。学术界、工业界甚至于政府机构都已经开始密切关注大数据问题,并对其产 生浓厚的兴趣。就学术界而言,Nature 早在 2008 年就推出了 Big Data 专刊[1]。计算社区联 盟(Computing Community Consortium)在 2008 年发表了报告《Big-Data Computing: Creating revolutionary breakthroughs in commerce, science, and society》[2],阐述了在数据驱动的研究背
从“池塘”到“大海”,不仅仅是规模的变大。传统的数据库代表着数据工程(Data Engineering)的处理方式,大数据时代的数据已不仅仅只是工程处理的对象,需要采取新的 数据思维来应对。图灵奖获得者、著名数据库专家 Jim Gray 博士观察并总结人类自古以来, 在科学研究上,先后历经了实验、理论和计算三种范式。当数据量不断增长和累积到今天, 传统的三种范式在科学研究,特别是一些新的研究领域已经无法很好的发挥作用,需要有一 种全新的第四种范式来指导新形势下的科学研究。基于这种考虑,Jim Gray 提出了一种新的 数据探索型研究方式,被他自己称之为科学研究的“第四种范式”(The Fourth Paradigm)[14]。
2、数据类型:过去的“池塘”中,数据的种类单一,往往仅仅有一种或少数几种,这 些数据又以结构化数据为主。而在“大海”中,数据的种类繁多,数以千计,而这些数据又 包含着结构化、半结构化以及非结构化的数据,并且半结构化和非结构化数据所占份额越来 越大。
3、模式(Schema)和数据的关系:传统的数据库都是先有模式,然后才会产生数据。这 就好比是先选好合适的“池塘”,然后才会向其中投放适合在该“池塘”环境生长的“鱼”。 而大数据时代很多情况下难以预先确定模式,模式只有在数据出现之后才能确定,且模式随 着数据量的增长处于不断的演变之中。这就好比先有少量的鱼类,随着时间推移,鱼的种类 和数量都在不断的增长。鱼的变化会使大海的成分和环境处于不断的变化之中。
1、数据规模:“池塘”和“大海”最容易发现的区别就是规模。“池塘”规模相对较小, 即 便 是 先 前 认 为 比 较 大 的 “ 池 塘 ”, 譬 如 VLDB(Very Large Database) , 和 “ 大 海 ” XLDB(Extremely Large Database)相比仍旧偏小。 “池塘”的处理对象通常以 MB 为基本单位, 而“大海”则常常以 GB,甚至是 TB、PB 为基本处理单位。
眼下在大数据定义问题上很难达成一个完全的共识,这点和云计算的概念刚提出时的情 况是相似的。在面对实际问题时,不必过度的拘泥于具体的定义之中,把握 3V 定义的基础 上,适当的考虑 4V 特性即可。
2.2 从数据库(Database, DB)到大数据(Big Data, BD) 从数据库(DB)到大数据(BD),看似只是一个简单的技术演进,但细细考究不难发现两
Keywords Big Data; Data Analysis; Cloud Computing
摘要 云计算、物联网、社交网络等新兴服务促使人类社会的数据种类和规模正以前所未有 的速度增长,大数据时代正式到来。数据从简单的处理对象开始转变为一种基础性资源,如 何更好的管理和利用大数据已经成为普遍关注的话题。大数据的规模效应给数据存储、管理 以及数据分析带来了极大的挑战,数据管理方式上的变革正在酝酿和发生。本文对大数据的 基本概念进行剖析,并对大数据的主要应用做简单对比。在此基础上,阐述大数据处理的基 本框架,并就云计算技术对于大数据时代数据管理所产生的作用进行分析。最后归纳总结大 数据时代所面临的新挑战。
Computational
Last few decades
全球知名的咨询公司麦肯锡(McKinsey)去年 6 月份发布了一份关于大数据的详尽报告 《Big data: The next frontier for innovation, competition, and productivity》[5],对大数据的影响、 关键技术和应用领域等都进行了详尽的分析。进入 2012 年以来,大数据的关注度与日俱增。 1 月份的达沃斯世界经济论坛上,大数据是主题之一,该次会议还特别针对大数据发布了报 告《Big Data, Big Impact: New Possibilities for International Development》[6],探讨了新的数 据产生方式下,如何更好的利用数据来产生良好的社会效益。该报告重点关注了个人产生的 移动数据与其他数据的融合与利用。3 月份美国奥巴马政府发布了《大数据研究和发展倡议》 [7](Big Data Research and Development Initiative),投资 2 亿以上美元,正式启动“大数据发 展计划”。计划在科学研究、环境、生物医学等领域利用大数据技术进行突破。奥巴马政府 的这一计划被视为美国政府继信息高速公路(Information Highway)计划之后在信息科学领域 的又一重大举措。与此同时,联合国一个名为 Global Pulse 的倡议项目在今年 5 月发布报告 《Big Data for Development:Challenges & Opportunities》[8],该报告主要阐述大数据时代各 国特别是发展中国家在面临数据洪流(Data Deluge)的情况下所遇到的机遇与挑战,同时还对 大数据的应用进行了初步的解读。《纽约时报》的文章《The Age of Big Data》[9]则通过主流 媒体的宣传使普通民众开始意识到大数据的存在,以及大数据对于人们日常生活的影响。
相关文档
最新文档