大数据时代的数据库的创新与发展

大数据时代的数据库的创新与发展
大数据时代的数据库的创新与发展

大数据时代的数据库的创新与发展

大数据时代的数据库的创新与发展

摘要:大数据时代的到来,使得传统数据库在处理百TB以上、特别是PB级数据的查询、

统计、分析等应用时,遇到性能上的瓶颈。面对电信、金融、安全、政企等大数据量应用,包括电信话单、金融细帐、智能电网、经营分析、公安网监、舆情监控、审计稽查、应急指挥等,用户体验往往不可接受。海量数据的3V(数量Volume、速度Velocity、多样Variety)挑战着传统数据库曾经非常成功的“一种架构支持多类应用”的模式。互联网和大数据应用的冲击下,世界数据库格局在发生革命性的变化,通用数据库(OldSQL)一统天下变成了OldSQL、NewSQL、NoSQL共同支撑多类应用的局面。

大数据是信息化的一个崭新发展阶段,通过分析各种大数据,人类对知识的认知可以见微知著、集腋成裘、由此及彼,对世界的认知也将更全面、更深入、和更具前瞻性。自2011年5月,EMC和IDC在合作研究“数字宇宙”五年之后提出“大数据”概念以来,“大数据经济”的影响力愈发显著,谷歌、Facebook竞相超过微软,曾经的“软件为王”让位于“数据为王”。

可以预见,大数据时代将引发大量应用创新,比如,城市大数据应用将支撑智慧城市建设,还有智慧教育、智慧医疗、智慧交通、智慧金融等;

关键词:大数据时代,数据库;系统;创新;

引言:“大数据”( big data)或者称为“海量数据”,这个直白的名词,已经在全球

引起了广泛关注,已经引领了又一轮数据技术的革命。

美国EMC 公司于2011 年5 月在美国拉斯维加斯举办第11 届 EMC World 大会,大会的核心是帮助企业利用IT变革的重要趋势。此次大会以“云计算相遇大数据( Cloud Meets Big Data)”为主题,着重展现当今两个最重要的技术趋势,正式抛出了“大数据”概念。

根据IDC《数字世界》研究项目在2012年的统计,2010年全球数字资源的规模首次突破了ZB(1ZB=1万亿GB)级别,达到了1.227ZB;而2005年只有130Eb,五年增长了10倍。如果保持这种爆炸式的增长速度,到了2020年,我们的数字资源规模将超过40ZB,相当于世界上每个人拥有超过5200GB的数据。无疑,我们已进入了大数据时代。

在 2011 年 12 月,我国工信部发布了物联网“十二五”规划,提出了4项关键技术创新工程。信息处理技术的内容包括海量数据存储、数据挖掘、图像视频智能分析等,都是大数据技术的重要组成部分;另外 3 项关键技术创新工程,包括信息感知技术、信息传输技术、信息安全技术,这些也都与“大数据”密切相关。我国也对大数据技术给与了足够的重视。基于以上概述,大数据时代已经到来,已经对我们的社会产生了重大影响,本文将尝试对大数据时代我国的索引和数据库事业的发展与创新进行研究和展望。

大数据时代:

多权威机构和企业对大数据给予了不同的定义。麦肯锡认为,“大数据所涉及的数据集规模已经超过了传统数据库软件获取、存储、管理和分析的能力。”IBM公司认为,可以用3个特征相结合来定义大数据:数量(V olume)、种类(Variety)和速度(Velocity),即庞大容量、极快速度和种类丰富的数据。IDC认为,“大数据不是一个事物,而是一个跨多个信息技术领域的活动。大数据技术描述了新一代的技术和架构,其被设计用于通过使用高速(V elocity)的采集、发现或分析,从超大容量(V olume)的多样(Variety)数据中经济地提取价值(Value)。”

综合对种不同的见解,本文认为,具备以下特征的就是大数据。

(1)数量大(V olume)。大数据所包含的数据量很大,而且在急剧增长之中。但是,可供使用的数据量在不断增长的同时,可处理、理解和分析的数据比例却不断下降。

(2)种类多(Variety)。随着技术的发展,数据源不断增多,数据的类型也不断增加。不仅包含传统的关系型数据,还包含来自网页、互联网、搜索索引、论坛、电子邮件、传感器数据等原始的、半结构化和非结构化数据。

(3)速度快(Velocity)。除了收集数据的数量和种类发生变化,生成和需要处理数据的速度也在变化。数据流动的速度在加快,要有效的处理大数据,需要在数据变化的过程中实时地对其进行分析,而不是滞后的进行处理。

(4)价值量(Value)。在信息时代,信息具有很重要的商业价值。但是,信息具有生命周期,数据的价值会随时间快速减少。另外,大数据数量庞大,种类繁多,变化也快,数据的价值密度很低,如何从中尽快的分析得出有价值的数据非常重要。对海量的数据进行挖掘分析,这也是大数据分析的难点。

(5)真实性(Veracity)。这是一个衍生特征。真实有效的数据才具有意义。随着新数据源的增加,信息量的爆炸式增长,我们很难对数据的真实性和安全性进行控制,因此需要对大数据进行有效的信息治理。

大数据在结构类型上也有其特点:大多数的大数据都是半结构化或非结构化的。半结构化的数据是指具有一定的结构性并可被解析或者通过使用工具可以使之格式化的数据,如包含不一致的数据之和格式的员工薪酬数据。非结构化的数据是指没有固定结构,通常无法直接知道其内容,保存为不同类型文件的数据,如各种图像、视频文件。根据目前大数据的发展状况,未来数据增长的绝大部分将是半结构化或非结构化的数据。

大数据时代的到来:

(1)大数据时代的到来

理论的提出:2008年,《Nature》杂志出版一期专刊专门讨论未来的大数据(Big Data)处理相关的一系列技术问题和挑战。

现实的节点:2007 人类创造的信息量有史以来第一次在理论上超过可用存储空间总量的一年。

(2)大数据时代到来的原因:

首先,信息技术和计算机网络技术的发展,为大数据时代的到来奠定了坚实的技术基础。各种技术的发展,使得数据的产生、来源、类型变得越来越多,由此产生出了的数目庞大且不断急剧增长的非结构化数据、半结构化数据,整个社会发展进入到了大数据时代。

其次,大量智能终端的广泛应用与网络应用的不断增长,为大数据时代的到来奠定了坚实的物质基础。通过互联网和社交网络,数码相机等工具,每个人的日常生活正在被数字化,人们可以随时方便的根据自己的需要,产生大量的非结构化数据、半结构化数据。特别是智能手机和笔记本电脑的普及,是当前数据量爆炸增长的一个重要原因。

最后,信息社会的快速建立,信息成为越来越重要的经济资源,也是大数据时代到来的重要原因。在信息时代,数据已经成为社会资源的重要部分,基于数据的处理、分析、挖掘等服务都被信息服务机构广泛应用和开展,信息的经济价值越来越大,对数据的重视程度越来越高,由此也产生了大量的数据。

(3)大数据时代的到来,必定会对索引和数据库事业也产生了重大影响,本文将论述大数据为索引和数据库带来的机遇和挑战,探讨大数据时代索引和数据库事业的发展与创新,以引起业界学者对相关问题的关注与探讨。

大数据对于索引和数据库事业而言,既是巨大的机遇,又是巨大的挑战。面对海量的种类繁多的半结构化和非结构化数据,从中迅速的进行分析,找出有效的价值,这一方面具有重大的经济价值,另一方面也要求我们必须改进现有的技术,使用新方法来从数据中提取价

值。

在大数据时代,对索引和数据库事业的创新提出了如下的重大挑战:

(1)理念更新。大数据带来的是一种全新的模式,索引和数据库的观念也要跟随变化,以适应时代的需要。同时要更加注重商业思维,充分利用大数据,获取经济价值。

(2)及时有效。大叔据时代的数据产生迅速,数据的价值生命周期却很短暂,如何能够及时有效的从数据中发现商机并付诸行动才能获取价值。

(3)集成分析。如果将分析集成到与数据所面临的环境中,将加快信息分析的速度,使分析结果能够更快的实现可操作化。

(4)可扩展。面对大数据必须采取新方法来处理数据,要实现从规模较小的数据集到大规模数据集的分析,因为我们不能控制所面临的数据源产生数据的规模。

大数据时代数据库的创新与发展:

目前,大数据时代的索引和数据库事业已经创造出了很多重要的基础性的新技术,如下:(1)云计算(cloud computing)。

云计算是在分布式处理、并行处理和网格计算等技术的基础上发展起来的,是一种新兴的共享基础架构的方法。它可以自我维护和管理庞大的虚拟计算资源(包括计算服务器、存储服务器、宽带资源等等),为我们提供了跨地域、高可靠、按需付费、快速部署的能力。甚至可以说,云数据库是数据库技术的未来发展方向。

云数据库具有以下特性:动态可扩展,理论上,云数据库具有无限可扩展性;高可用性,不存在单点失效问题;较低使用代价,可以实现按需付费;可以大规模并行处理。

云计算和大数据之间关联非常紧密,大数据为云计算提供了应用空间,云计算为大数据提供了处理工具。

(2)虚拟化(virtualization)。

虚拟化技术是云计算所有要素中最重要的部分,主要包括计算虚拟化、存储虚拟化和网络虚拟化。

利用虚拟化技术可以在一台主机上运行多台虚拟计算机,允许很多用户共享一台高性能设备的使用,可以极大的节约成本,也为云计算的实现奠定了技术基础。

(3)数据存储。

大数据的特征,需要新的数据存储技术和数据存储工具来满足。

目前已经出现了一些新型的大数据存储系统,具有以下特点:大容量、高可靠性、高可用性、高性能、高安全、高度自治、高成本、访问接口的多样化。因此,具有优秀可扩展能力的分布式存储成为大数据存储的主流架构方式。

大数据存储还需解决一些问题:如何对数据进行去重;如何更好地实现分层存储;如何解决数据的安全性问题等。

(4)数据分析。

大叔据时代的数据分析需要满足及时有效的要求,既要能处理高速的数据,又要能够实现实时的分析。目前产生了一些新型的在线事务处理系统,如NoSQL方案和NewSQL方案。NoSQL方案通过消除SQL的语言查询来实现性能的提高和扩展性的增加。有以下特征:不需要预定的模式;没有共享架构;具有弹性可扩展性;可对数据进行分区处理;能够异步复制等。常用的产品有HBase、MongoDB等。NewSQL方案是既能保留SQL查询的方便性,又能提供高性能和高扩展性的新型数据分析工具,是一种新型的关系数据库管理系统。常见的系统有Google Spanner、Clustrix、VoltDB等。

对大数据进行处理,目前有两大主流的方向:一个是MPP数据库(大规模并行数据库)为首的并列关系数据库方向,一个是以MapReduce为首的分布式NoSQL方向。除此之外,流数据管理也是大数据处理分析的一种解决方案。

为了成功的实现对大数据的分析,还要建立具有敏捷的计算平台,线性扩展能力,全方位、协作性用户体验的大数据分析平台,还需要聚类分析等高级的分析理论和方法以及方便易用的数据可视化技术。

(5)信息索引技术。

当前硬、软件环境越来越好,从而为索引技术向智能化、多语种化、索引手段的自动化提供了物质条件,使搜索引擎向高层次发展成为可能。目前在搜索引擎智能化、用户接口的多语种化、索引手段的自动化等方面已取得了一定的成果。

结语:大数据时代的到来,数据库事业带来了巨大的冲击,提出了新的要求,必然会给用

户提供更高水平的服务。数据库事业的发展也会推向一个新阶段。

大数据时代的三大发展趋势和投资方向

大数据时代的三大发展趋势和投资方向 (2012-03-27 14:01:49) 赵国栋 应约写一篇介绍大数据的文章,发表在某公司的内刊上。阅读对象多为非IT行业的咨询顾问和投资人。因此,必须做到深入浅出,言之有物。IT本身枯燥,大数据这个概念又过于时髦,业界亦是众说纷纭。不用技术词汇说明白这件事情,还是蛮有挑战的,因此写成博文,先请方家、网友们批驳。 1993年《纽约客》刊登了一副漫画:标题是:“互联网上,没有人知道你是一条狗”。据说作者彼得·施泰纳因为此漫画的重印而赚取了超过5万美元。彼时关注互联网社会学的一些专家,甚至担忧“计算机异性扮装”而引发的社会问题。譬如同性恋和恋童癖,可能会借助互联网而大行其道。 20年后互联网发生的巨大的变化,移动互联、社交网络、电子商务大大拓展了互联网的疆界和应用领域。我们在享受便利的同时,也无偿贡献了自己的“行踪”。现在互联网不但知道对面是一只狗,还知道这只狗喜欢什么食物、几点出去遛弯,几点回窝睡觉。我们不得不接受这个现实,每个人在互联网进入到大数据时代,都将是透明性存在。在物理世界中,许多行为是“人似秋鸿有来信,事如春梦了无痕”。但在互联网上却是“处处行迹处处痕”。任何行为,皆有前兆。要买商品,必先浏览,对比,询价;要搞活动,必先征集、讨论、策划;互联网上恰恰保留了大量的前兆性的数据,通过对这些数据的收集和分析,互联网企业具备了预判物理世界中,人类未来行为的能力。收集分析海量的各种类型的数据,并快速获取影响未来的信息的能力,这就是大数据技术的魅力。事实上大数据的来源非常广泛,天上的卫星、地上汽车、埋在土壤里面的各类传感器,无时无刻不在生成大量的数据。这些数据如果综合利用,产生的社会价值和经济价值将是难以估量的。 第一篇报告——《大数据时代即将到来》,之所以用时代这个词作为标题,是因为大数据是历史上首个可以预测人类短期行为的技术。未来的不确定性,是人类产生恐惧的根源之

数据库新技术及其发展趋势

数据库新技术及其发展趋势 内容摘要:由于数据库技术在特殊领域的应用和其他相关学科技术的发展,促使数据库技术不断创新、发展。本文阐述了一些新的数据库技术及新一代数据库技术的发展方向。 关键词:数据库信息集成网格数据管理移动数据库数据加密技术发展趋势 一、引言[1] 数据库技术是计算机科学的重要分支,主要研究如何安全高效地管理大量、持久、共享的数据。数据库的研究始于20世纪60年代中期,从诞生到现在,在不到半个世纪的时间里,形成了坚实的理论基础、成熟的商业产品和广泛的应用领域,目前数据库成为一个研究者众多且被广泛关注的研究领域。随着信息管理内容的不断扩展和新技术的层出不穷,数据库技术面临着前所未有的挑战。面对新的数据形式,人们提出了丰富多样的数据模型(层次模型、网状模型、关系模型、面向对象模型、半结构化模型等),同时也提出了众多新的数据库技术(XML 数据管理、数据流管理、Web 数据集成、数据挖掘等)。在Web 大背景下的各种数据管理问题成为人们关注的热点。本文讨论目前数据库研究领域中最热门的几个研究方向的发展现状、面临的问题和未来趋势。 二、数据库发展动力[2] 目前Internet 是主要的驱动力。现在,大部分企业感兴趣的是如何与供应商和客户进行更密切的交流,以便提供更好的客户支持。在这方面的应用从根本上说是跨企业的,需要安全和信息集成的有力工具。 另一个重要应的用领域是自然科学,特别是物理科学、生物科学、保健科学和工程领域,这些领域产生了大量复杂的数据集,需要信息集成机制的支持。除此之外,它们也需要对数据分析器产生的数据管道进行管理,需要对有序数据进行存储和查询(如时间序列、图像分析、网格计算和地理信息),需要世界范围内数据网格的集成。 此外,还有一个推动数据库研究发展的动力是相关技术的成熟。

大数据时代下一城一报的发展趋势

大数据时代下一城一报的发展趋势 1、概念界定: 1.1“一城一报” “一城一报”现象最早出现在世界大战至第二次世界大战期间的美国,资本主义经济经济迅猛发展,报纸发行量亦不断持续上升。但在激烈的竞争下,报业发展下却出现了极度垄断的态势。日报的总数不断减少,为数众多的日报经过激烈的竞争兼并之后,以至于出现了许多城市只有一家日报,或有几家报纸但却同属一个老板。据悉,美国98%的城市只有一家报纸,“一城一报”现象也是报业经过多年自由竞争的结果。其实早在2008年,中国本土传统媒体行业也有类似的合并尝试。 以互联网为代表的新媒体技术的冲击加大,再加上全球性的金融危机以及中国传媒业的体制困境等多重压力,中国传媒界开始了新一轮的重组,各家报业集团纷纷进行“报网融合”,出版集团则纷纷股改上市,个别传媒集团甚至兼并报纸和进军影视。但是,这一轮传媒集团重组的声势和效果并不明显。直到2013 年前后,随着新一轮文化体制改革的深化,包括非时政类报刊转企改制等一系列举措出台,新闻出版总署与广电总局合并,传媒产业新的合并重组拉开了帷幕。上海两大报业集团合并重组,可谓引领风气之先。新媒体乃至“自媒体”的崛起彻底改变了受众接受信息的途径与习惯,导致传统媒体受众大量流失。上海报业集团的成立带着浓厚的新媒体意味,不再类似以往的重组兼并,仅

仅局限在几家报纸媒体的融合或是仅停留在组织、经营的合并层面。此举也意味着中国报业真正迎来转型的拐点。 1.2大数据时代: 大数据,顾名思义即数据规模庞大之意,至少需要满足规模性(volume)、多样性(variety)和高速性(velocity)三个特点。大数据时代,通信技术的发展造就了信息传播的数字化、社会化和移动化,因此产生了巨大的数据量,新浪微博每日发博量超过一亿条,百度则每日处理数十亿次搜索指令,淘宝网站交易次数超过千万,联通每日用户的上网记录信息流量高到为计算机信息技术用于计量存储容量和传输容量的一种计而太字节甚至拍字节将 成为大数据时代数据处理的基本单位。 如果数据能够提炼出规律,它就是知识;如果数据能够借助于各种各样的工具在分析的基础之上为我们提供正确的决策,它就是资源。”可见,身处大数据时代,突发事件舆论引导不应止于发布信息、引导舆论,还应重视对信息进行挖掘、处理、管理、运用,“基于特定社会需求,在特定的社会理论指导下,收集、整理和分析数据足迹以便进行社会解释、监控、预测与规划的过程因此,面对规模化、多样性、高速化的数据,思维转变是第一步。 “一种信息传播的新方式随之带来的社会变迁,绝不止于它所传递的内容,其更大意义在于它本身定义了某种信息的象征方式、传播速度、信息的来源、传播的数量以及信息存在的语境”

促进大数据发展行动纲要

【TechWeb报道】9月6日消息,国务院日前印发《促进大数据发展行动纲要》(下称《纲要》),对大数据开放应用等工作提供指导意见。而根据中国信息通信研究院发布的《2015年中国大数据发展调查报告》显示,2015年中国大数据市场规模将达到115.9亿元,增速达38%。 报告显示,2014年中国大数据市场规模约为84亿元,主要由3部分组成,即大数据软件产值、用于承载大数据应用的硬件产值,以及大数据相关的专业服务产值 2014年大数据软件产值为35.6亿元,占比约42%;大数据硬件产值达28.5亿元,占比约34%;大数据服务产值为19.9亿元,占比约为24%。 此外,预计2016至2018年中国大数据市场规模还将维持40%左右的高速增长。 根据中国政府网消息,日前国务院印发《促进大数据发展行动纲要》,《纲要》提出未来5至10年我国大数据发展和应用应实现的目标,将惠及全民,助力经济转型。 《纲要》部署三方面主要任务。一要加快政府数据开放共享,推动资源整合,提升治理能力。二要推动产业创新发展,培育新兴业态,助力经济转型。三要强化安全保障,提高管理水平,促进健康发展。 根据《纲要》计划,2017年底前跨部门数据资源共享共用格局基本形成;到2018年,开展政府和社会合作开发利用大数据试点,2018年底前建成国家政府数据统一开放平台等;2020年,形成一批具有国际竞争力的大数据处理、分析、可视化软件和硬件支撑平台等产品。 此外,《纲要》提出政府治理大数据工程等十大工程,其中,包括推进政府数据资源共享开放工程、国家大数据资源统筹发展工程、政府治理大数据工程、公共服务大数据工程等4大“政府大数据”工程;工业和新兴产业大数据工程、现代农业大数据工程、万众创新大数据工程、大数据关键技术及产品研发与产业化工程、大数据产业支撑能力提升工程等5大“大数据产业”工程;以及网络和大数据安全保障工程。 《纲要》全文如下: 国务院关于印发促进大数据发展行动纲要的通知 国发〔2015〕50 号

数据库技术的发展现状及趋势

第24卷第1期长春师范学院学报(自然科学版)2005年3月V o l.24 N o.1Journal of Chang Chun T eachers Co llege(N atural Science)M ar 2005 数据库技术的发展现状及趋势 赵玉萍,廖运文 (西华师范大学计算机学院,四川南充 637002) [摘 要]数据库技术已发展成为信息科学里一项十分重要的技术,其应用领域之宽引人瞩目。本文介 绍了数据库技术发展的现状及最新研究动态。 [关键词]数据库技术;数据仓库;实时数据库;W eb数据库 [中图分类号]T P311.13 [文献标识码]A [文章编号]1008-178X(2005)01-0107-03 1.引言 数据库技术从20世纪70年代流行的层次、网状数据库系统到80年代的关系数据库,在很多领域都取得了巨大的成功;随着应用领域的不断扩展,关系数据库的限制和不足日益显现出来,随着面向对象技术的出现,面向对象数据库系统成为数据库系统领域研究和发展的新方向。数据库技术与网络技术、人工智能技术、面向对象技术、并行计算技术、多媒体技术等的相互融合,为数据库技术的应用开拓了更广阔的空间。 2.数据库技术发展现状 数据库技术与多学科技术的有机结合是当前数据库技术发展的重要特征。计算机领域中,其它新兴技术的发展对数据库技术产生了重大的影响。传统的数据库技术和其他计算机技术的相互结合、相互渗透,使数据库中新的技术内容层出不穷。数据库的许多概念、技术内容、应用领域,甚至某些原理都有了重大的发展和变化。建立和实现了一系列新型数据库系统,如分布式数据库系统、面向对象数据库系统、演绎数据库系统、知识库系统、多媒体数据库系统等,它们共同构成了数据库系统的大家族。传统的数据库系统仅是数据库大家族的一员,当然,它也是最成熟的和应用最广泛的一员。它的核心理论、应用经验、设计方法等仍然是整个数据库技术发展和应用开发的先导和基础。 2.1 面向对象方法和技术正逐步融入数据库 传统数据库主要适于商务或事务型这类传统应用,而对于CAD、CAM、C I M S、CA SE、过程控制与实时应用、地理信息管理及各种工程应用等,传统数据库系统已不能适应其要求。在这些领域,不仅数据本身的结构和存储形式各异,而且不同领域对数据的处理技术的要求也比一般事务管理环境复杂得多,而这些并不是传统数据库技术所能解决的,因而人们将面向对象的方法引入数据库领域,形成了面向对象数据库管理系统(OODBM S)。它实际上是数据库技术(DB)和面向对象技术(OO)结合的产物。OODBM S首先是一个数据库系统,即系统具备数据库系统的处理能力,其次又是一个面向对象的系统,即包含对象的概念、方法和技术。与传统的数据库相比,OODBM S在复杂系统的模拟、表达和处理能力等方面具有优势,不足之处是理论技术还相当不成熟、不够完善。但随着数据库技术和面向对象技术的不断发展和完善,OODBM S必将得到广泛应用。 2.2 网络技术与数据库技术的融合 分布式数据库系统是数据库技术与计算机网络技术相结合的产物。传统的集中式数据库将数据存储于单个计算机上,但随着数据库应用的不断发展,规模的不断扩大,逐渐感觉到集中式数据库系统 [收稿日期]2004—10—23 [作者简介]赵玉萍(1975- ),女,湖北荆门人,西华师范大学计算机学院讲师,从事数据库理论与应用的研究。 ? ? 1 7

大数据时代的数据库的创新与发展

大数据时代的数据库的创新与发展

大数据时代的数据库的创新与发展 摘要:大数据时代的到来,使得传统数据库在处理百TB以上、特别是PB级数据的查询、 统计、分析等应用时,遇到性能上的瓶颈。面对电信、金融、安全、政企等大数据量应用,包括电信话单、金融细帐、智能电网、经营分析、公安网监、舆情监控、审计稽查、应急指挥等,用户体验往往不可接受。海量数据的3V(数量Volume、速度Velocity、多样Variety)挑战着传统数据库曾经非常成功的“一种架构支持多类应用”的模式。互联网和大数据应用的冲击下,世界数据库格局在发生革命性的变化,通用数据库(OldSQL)一统天下变成了OldSQL、NewSQL、NoSQL共同支撑多类应用的局面。 大数据是信息化的一个崭新发展阶段,通过分析各种大数据,人类对知识的认知可以见微知著、集腋成裘、由此及彼,对世界的认知也将更全面、更深入、和更具前瞻性。自2011年5月,EMC和IDC在合作研究“数字宇宙”五年之后提出“大数据”概念以来,“大数据经济”的影响力愈发显著,谷歌、Facebook竞相超过微软,曾经的“软件为王”让位于“数据为王”。 可以预见,大数据时代将引发大量应用创新,比如,城市大数据应用将支撑智慧城市建设,还有智慧教育、智慧医疗、智慧交通、智慧金融等; 关键词:大数据时代,数据库;系统;创新; 引言:“大数据”( big data)或者称为“海量数据”,这个直白的名词,已经在全球 引起了广泛关注,已经引领了又一轮数据技术的革命。 美国EMC 公司于2011 年5 月在美国拉斯维加斯举办第11 届 EMC World 大会,大会的核心是帮助企业利用IT变革的重要趋势。此次大会以“云计算相遇大数据( Cloud Meets Big Data)”为主题,着重展现当今两个最重要的技术趋势,正式抛出了“大数据”概念。 根据IDC《数字世界》研究项目在2012年的统计,2010年全球数字资源的规模首次突破了ZB(1ZB=1万亿GB)级别,达到了1.227ZB;而2005年只有130Eb,五年增长了10倍。如果保持这种爆炸式的增长速度,到了2020年,我们的数字资源规模将超过40ZB,相当于世界上每个人拥有超过5200GB的数据。无疑,我们已进入了大数据时代。 在 2011 年 12 月,我国工信部发布了物联网“十二五”规划,提出了4项关键技术创新工程。信息处理技术的内容包括海量数据存储、数据挖掘、图像视频智能分析等,都是大数据技术的重要组成部分;另外 3 项关键技术创新工程,包括信息感知技术、信息传输技术、信息安全技术,这些也都与“大数据”密切相关。我国也对大数据技术给与了足够的重视。基于以上概述,大数据时代已经到来,已经对我们的社会产生了重大影响,本文将尝试对大数据时代我国的索引和数据库事业的发展与创新进行研究和展望。 大数据时代: 多权威机构和企业对大数据给予了不同的定义。麦肯锡认为,“大数据所涉及的数据集规模已经超过了传统数据库软件获取、存储、管理和分析的能力。”IBM公司认为,可以用3个特征相结合来定义大数据:数量(V olume)、种类(Variety)和速度(Velocity),即庞大容量、极快速度和种类丰富的数据。IDC认为,“大数据不是一个事物,而是一个跨多个信息技术领域的活动。大数据技术描述了新一代的技术和架构,其被设计用于通过使用高速(V elocity)的采集、发现或分析,从超大容量(V olume)的多样(Variety)数据中经济地提取价值(Value)。” 综合对种不同的见解,本文认为,具备以下特征的就是大数据。

大数据时代的大数据管理研究报告

大数据时代的大数据管理研究 摘要:进入21世纪,信息技术成为这个时代发展的主流,大数据时代也正是信息技术下的产物,对我国各个行业的发展都起到了重要作用。但是,在大数据时代不断发展的过程中,大数据管理成为急需要解决的问题。文章就从大数据时代的发展形式出发,对大数据的管理形式,进行了简要的分析和阐述,并提出了一些建议,希望对大数据时代的发展有所帮助。 关键词:大数据时代;大数据管理;策略 信息技术作为时代不断发展的象征,不管是在我国行业的发展中,还是在人们的日常生活,都起到了重要作用。同时,在信息技术不断发展的过程中,大数据时代的应用范围也在不断的扩大,其来源渠道也非常多,数量也在不断增加。在这种情况下,大数据时代的大数据管理就显的尤为重要。由于大数据的数量不断增加,现有的管理形式已经无法满足大数据时代的发展,并且在利用计算机对大数据进行全面分析和处理的过程中,也受到了严重的影响,因此,要想有效的对大数据进行充分利用,就要对大数据管理形式给予高度重视,采取有效的措施,不断加强大数据的管理形式,最终实现有效、便捷、安全等管理性能,这也为对我国信息技术

提供了重要的发展方向。 1 大数据时代的大数据管理发展历程 近几年,在大数据管理不断发展的过程中,也取得了一定的成绩。但是,大数据管理也经历了一个漫长的过程,主要经历的人工、文件、数据库等管理阶段。同时,随着大数据时代的大数据不断增加,所管理的范围和环境也在不断的变化。并且,在大数据管理不断发展的过程中,一些管理问题逐渐的暴露出来,为大数据管理的发展带来了新的挑战和机遇,下面就大数据管理的发展历程,管理中存在的不足进行简要的分析和阐述。 1.1 大数据时代的大数据人工管理形式 在20世纪50年代,计算机技术的形成主要是针对科学计算等形式。同时,根据当时的发展技术来说,并没有磁盘、U盘等一些先进设备,将其计算的结果进行去全面的保存和整理,仅仅只是依靠纸带、卡片等形式,对大数据的进行有效的记录。大数据时代的大数据管理的人员管理形式,不仅仅对大数据的记录存在着一定程度上的误差,并且在保存的过程中,也会经常发生丢失的现象,对大数据时代的大数据管理形式的发展,是没有任何的帮助。但是,依照当时的技术水平来看,也只能的依靠人工管理的形式了。 1.2 大数据时代的大数据的文件管理形式 在大数据时代的大数据管理的人员管理形式,不断发展

工信部_大数据产业发展规划(2016-2020)〔2016〕412号_20161218

大数据产业发展规划 (2016-2020年) 数据是国家基础性战略资源,是21世纪的“钻石矿”。党中央、国务院高度重视大数据在经济社会发展中的作用,党的十八届五中全会提出“实施国家大数据战略”,国务院印发《促进大数据发展行动纲要》,全面推进大数据发展,加快建设数据强国。“十三五”时期是我国全面建成小康社会的决胜阶段,是新旧动能接续转换的关键时期,全球新一代信息产业处于加速变革期,大数据技术和应用处于创新突破期,国内市场需求处于爆发期,我国大数据产业面临重要的发展机遇。抢抓机遇,推动大数据产业发展,对提升政府治理能力、优化民生公共服务、促进经济转型和创新发展有重大意义。为推动我国大数据产业持续健康发展,深入贯彻十八届五中全会精神,实施国家大数据战略,落实国务院《促进大数据发展行动纲要》,按照《国民经济和社会发展第十三个五年规划纲要》的总体部署,编制本规划。 一、我国发展大数据产业的基础 大数据产业指以数据生产、采集、存储、加工、分析、服务为主的相关经济活动,包括数据资源建设、大数据软硬件产品的开发、销售和租赁活动,以及相关信息技术服务。 “十二五”期间,我国信息产业迅速壮大,信息技术快速发展,互联网经济日益繁荣,积累了丰富的数据资源,技术创新取得了明显突破,应用势头良好,为“十三五”时期我国大数据产业加快发展奠定了坚实基础。 信息化积累了丰富的数据资源。我国信息化发展水平日益提高,对数据资源的采集、挖掘和应用水平不断深化。政务信息化水平不断提升,全国面向公众

的政府网站达8.4万个。智慧城市建设全面展开,“十二五”期间近300个城市进行了智慧城市试点。两化融合发展进程不断深入,正进入向纵深发展的新阶段。信息消费蓬勃发展,网民数量超过7亿,移动电话用户规模已经突破13亿,均居世界第一。月度户均移动互联网接入流量达835M。政府部门、互联网企业、大型集团企业积累沉淀了大量的数据资源。我国已成为产生和积累数据量最大、数据类型最丰富的国家之一。 大数据技术创新取得明显突破。在软硬件方面,国内骨干软硬件企业陆续推出自主研发的大数据基础平台产品,一批信息服务企业面向特定领域研发数据分析工具,提供创新型数据服务。在平台建设方面,互联网龙头企业服务器单集群规模达到上万台,具备建设和运维超大规模大数据平台的技术实力。在智能分析方面,部分企业积极布局深度学习等人工智能前沿技术,在语音识别、图像理解、文本挖掘等方面抢占技术制高点。在开源技术方面,我国对国际大数据开源软件社区的贡献不断增大。 大数据应用推进势头良好。大数据在互联网服务中得到广泛应用,大幅度提升网络社交、电商、广告、搜索等服务的个性化和智能化水平,催生共享经济等数据驱动的新兴业态。大数据加速向传统产业渗透,驱动生产方式和管理模式变革,推动制造业向网络化、数字化和智能化方向发展。电信、金融、交通等行业利用已积累的丰富数据资源,积极探索客户细分、风险防控、信用评价等应用,加快服务优化、业务创新和产业升级步伐。 大数据产业体系初具雏形。2015年,我国信息产业收入达到17.1万亿元,比2010年进入“十二五”前翻了一番。其中软件和信息技术服务业实现软件业务收入4.3万亿元,同比增长15.7%。大型数据中心向绿色化、集约化发展,跨地区经营互联网数据中心(IDC)业务的企业达到 295家。云计算服务逐渐成熟,主要云计算平台的数据处理规模已跻身世界前列,为大数据提供强大的计算存储

数据库新技术

数据库新技术综述 摘要:综述数据库新技术,指出数据库技术目前的研究状态和发展趋势,介绍一些数据库新技术的最新动态,并指出数据库应用所面临的挑战,指出数据库技术当今的研究热点和未来的发展趋势。 关键词:数据库;面向对象数据库;分布式数据库;数据仓库;数据挖掘;联机分析处理;发展 一、引言: 自从计算机问世以来,就有了处理数据、管理数据的需求,由此,计算机技术新的研究分支——数据库技术应运而生。随着计算机应用领域的不断扩展和多媒体技术的发展,数据库已经是计算机科学技术中发展最快、应用最广泛的重要分支之一。目前,数据库技术已经相当成熟,被广泛应用于各行各业中,成为现代信息技术的主要组成部分,是现代计算机信息系统和计算机应用的基础和核心。 另外,各种学科与数据库技术的有机结合,从而使数据库领域中新内容、新应用、新技术层出不穷,形成了各种各样的数据库系统:面向对象数据库系统、分布式数据库系统、知识数据库系统、模糊数据库系统、并行数据库系统、多媒体数据库系统等;数据库系统被应用到特定的领域后,又出现了工程数据库、演绎数据库、时态数据库、统计数据库、空间数据库、科学数据库、文献数据库等;他们继承了传统数据库的成果和技术,加以发展优化,从而形成的新的数据库,视为“进化”的数据库。可以说新一代数据库技术的研究与发展呈现了百花齐放的局面。 首先我们来了解一下数据库新技术有哪些:面向对象数据库;分布式数据库;数据仓库;数据挖掘;联机分析处理等。 二、概述新技术 (一).面向对象数据库技术 面向对象是一种认识方法学,也是一种新的程序设计方法学。把面向对象的方法和数据库技术结合起来可以使数据库系统的分析、设计最大程度地与人们对客观世界的认识相一致。面向对象数据库系统是为了满足新的数据库应用需要而产生的新一代数据库系统。 其优点为: (1).易维护:可读性高且方便低成本; (2).质量高:在设计时,可重用现有的,在以前的项目的领域中已被测试过的类使系统满足业务需求并具有较高的质量; (3).效率高:在软件开发时,根据设计的需要对现实世界的事物进行抽象,产生类。使用这样的方法解决问题,接近于日常生活和自然的思考方式,势必提高软件开发的效率和质量。

数据库技术的最新发展

数据库技术的最新发展 数据库技术经过短短三十年,已从第一代的网状、层次数据库系统, 第一代的关系数据库系统,发展到第三代以面向对象模型为主要特征的数 据库系统。并且数据库技术与网络通信技术、人工智能技术、面向对象程 序设计技术、并行计算技术等等互相渗透,互相结合,也成为当前数据库 技术发展的主要特征。 数据库技术的发展体现 在三个方面:数据模型、新技术内容、 应用领域。通过右图,立体的阐述了 新一代数据库系统及其相互关系。 数据模型是数据库系统的核心和基础。 1、第一代数据库系统(层次数据库系统和网状数据库系统) - 格式化模型,层次模型是网状模型的特例 2、第二代数据库系统(关系数据库系统) -关系模型简单、清晰,关系代数作为语言模型,关系数据理论作为理论基础。关系数据库系统具有形式基础好、数据独立性强、数据库语言非过程化等特色。 3、第三代数据库系统 -更加丰富的数据模型、更强大的数据管理功能、满足新应用要求。 新一代数据库技术的研究与发展。 一、新应用领域的需求 新的数据库应用领域,如CAD/CAM、CIM、CASE、OIS(办公信息系统)、

GIS(地理信息系统)、知识库系统、实时系统等,需要数据库的支持,而其所需的数据管理功能有相当一部分是传统的数据库系统所不能支持的。例如它们通常需要数据库系统支持以下功能: –存储和处理复杂对象。这些对象不仅内部结构复杂,很难用普通的关系结构来表示,而且相互之间的联系也有复杂多样的语义。 –支持复杂的数据类型。包括抽象数据类型、半结构或无结构的超长数据、时间和版本数据等。还要具备支持用户自定义类型的可扩展能力。 –需要常驻内存的对象管理以及支持对大量对象的存取和计算。 –实现程序设计语言和数据库语言无缝地集成。 –支持长事务和嵌套事务的处理。 二、传统数据库系统的局限性 传统数据库系统的局限性主要表现在以下几个方面: 1. 面向机器的语法数据模型 2. 数据类型简单、固定 3. 结构与行为分离 4. 阻抗失配(编程模式不同、类型系统不匹配) 5. 被动响应 6. 存储、管理的对象有限 7. 事务处理能力较差(只能支持非嵌套事务) 三、新一代数据库技术的特点 ?一方面立足于数据库已有的成果和技术,加以发展进化,有人称之为“进化论”的观点和方法。另一方面的努力是立足于新的应用需求和计算机

国内外大数据发展现状和趋势(2018)

行业现状 当前,许多国家的政府和国际组织都认识到了大数据的重要作用,纷纷将开发利用大数据作为夺取新一轮竞争制高点的重要抓手,实施大数据战略,对大数据产业发展有着高度的热情。 美国政府将大数据视为强化美国竞争力的关键因素之一,把大数据研究和生产计划提高到国家战略层面。在美国的先进制药行业,药物开发领域的最新前沿技术是机器学习,即算法利用数据和经验教会自己辨别哪种化合物同哪个靶点相结合,并且发现对人眼来说不可见的模式。根据前期计划,美国希望利用大数据技术实现在多个领域的突破,包括科研教学、环境保护、工程技术、国土安全、生物医药等。其中具体的研发计划涉及了美国国家科学基金会、国家卫生研究院、国防部、能源部、国防部高级研究局、地质勘探局等6个联邦部门和机构。 目前,欧盟在大数据方面的活动主要涉及四方面内容:研究数据价值链战略因素;资助“大数据”和“开放数据”领域的研究和创新活动;实施开放数据政策;促进公共资助科研实验成果和数据的使用及再利用。 英国在2017年议会期满前,开放有关交通运输、天气和健康方面的核心公共数据库,并在五年内投资1000万英镑建立世界上首个“开放数据研究所”;政府将与出版行业等共同尽早实现对得到公共资助产生的科研成果的免费访问,英国皇家学会也在考虑如何改进科研数据在研究团体及其他用户间的共享和披露;英国研究理事会将投资200万英镑建立一个公众可通过网络检索的“科研门户”。 法国政府为促进大数据领域的发展,将以培养新兴企业、软件制造商、工程师、信息系统设计师等为目标,开展一系列的投资计划。法国政府在其发布的《数字化路线图》中表示,将大力支持“大数据”在内的战略性高新技术,法国软件编辑联盟曾号召政府部门和私人企业共同合作,投入3亿欧元资金用于推动大数据领域的发展。法国生产振兴部部长ArnaudMontebourg、数字经济部副部长FleurPellerin和投资委员LouisGallois在第二届巴黎大数据大会结束后的第二天共同宣布了将投入1150万欧元用于支持7个未来投资项目。这足以证明法国政府对于大数据领域发展的重视。法国政府投资这些项目的目的在于“通过发展创新性解决方案,并将其用于实践,来促进法国在大数据领域的发展”。众所周知,法国在数学和统计学领域具有独一无二的优势。 日本为了提高信息通信领域的国际竞争力、培育新产业,同时应用信息通信技术应对抗灾救灾和核电站事故等社会性问题。2013年6月,安倍内阁正式公布了新IT战略——“创建最尖端IT国家宣言”。“宣言”全面阐述了2013~2020年期间以发展开放公共数据和大数据为核心的日本新IT国家战略,提出要把日本建设成为一个具有“世界最高水准的广泛运用信息产业技术的社会”。日本著名的矢野经济研究所预测,2020年度日本大数据市场规模有望超过1兆日元。 在重视发展科技的印度,大数据技术也已成为信息技术行业的“下一个大事件”,目前,不仅印度的小公司纷纷涉足大数据市场淘金,一些外包行业巨头也开始进军大数据市场,试图从中分得一杯羹。2016年,印度全国软件与服务企业协会预计,印度大数据行业规模在3年内将到12亿美元,是当前规模的6倍,同时还是全球大数据行业平均增长速度的两倍。印度毫无疑问是美国亦步亦趋的好学生。在数据开放方面,印度效仿美国政府的做法,制定了一个一站式政府数据门户网站https://www.360docs.net/doc/3e3100117.html,.in,把政府收集的所有非涉密数据集中起来,包括全国的人口、经济和社会信息。 我国大数据行业仍处于快速发展期,未来市场规模将不断扩大 ?目前大数据企业所获融资数量不断上涨,二级市场表现优于大盘,我国大数据行业的市

数据库新技术及其发展趋势

数据库新技术及其发展 趋势 公司内部编号:(GOOD-TMMT-MMUT-UUPTY-UUYY-DTTI-

数据库新技术及其发展趋势 数据库技术是计算机科学的重要分支,主要研究如何安全高效地管理大量、 持久、共享的数据。数据库的研究始于20世纪60年代中期,它的发展有着三大 标志性事件。第一件大事, 1969年IBM公司研制开发了基于层次模型的数据库管理系统的商品化软件InformationManagement System,即IMS系统,是首例成功的数据库管理系统软件。第二件大事,美国数据系统语言协会CODASYL (Conference On DataSystem Language)下属的数据库任务组DBTG(Data Base TaskGroup)对数据库方法进行系统的研究和讨论后,于20世纪60年代末到70年代初提出了若干报告。DBTG报告确定并建立了数据库系统的许多概念、方法和技术。DBTG所提议的方法是基于网状结构的,它是数据库网状模型的基础和典型代表。第三件大事, 1970年IBM公司San Jose研究实验室的研究员E. F. Codd博士发表了题为“大型共享数据库数据的关系模型”的论文,提出数据库的关系模型,从而开创了数据库关系方法和关系数据理论的研究领域,为关系数据库技术奠定了理论基础, E. F. Codd因此在1981年获得ACM图录奖。20世纪80年代几乎所有新开发的 系统都是关系系统。随着计算机系统硬件、Internet和Web技术的发展,数据库系统所管理的数据格式、数据处理方法以及应用环境不断变化,同时人工智能、 多媒体技术和其他学科技术的发展,数据库技术面临着前所未有的挑战。 当前数据库技术发展的现状,关系数据库技术仍然是主流 国内数据库的发展趋势也是飞速的,在数据库技术的当前及未来发展里程中, 数据仓库以及基于此技术的商业智能无疑将是大势所趋。IBM的实验室在这方面进行了10 多年的研究, 并将研究成果发展成为商用产品。除了用于

大数据时代数据领域未来发展的三大趋势

大数据时代数据领域未来发展的三大趋势 市场的变幻无常和商业全球互联的趋势使得直觉决策不再有效。今天,企业业务决策涉及的数据和参数越来越复杂,企业决策者们都希望身边能有一个数据分析专家可以求助,数据蕴含着对企业有价值的信息,所以数据已经是企业的重要资产,驾驭大数据的能力成为企业的核心能力。这种能力将帮助企业寻找最优的模式支持商业决策,并确保做出接近于最优的商业决策。那么针对信息数据自身未来的发展趋势将成为首要关注点,今天就让我们一起来探究信息数据的三大发展趋势。 大数据时代飘然而至 何为大数据,对于这个新名词相信还是有不少人会对它感到陌生。其实“大 数据”这个术语的使用不太恰当,因为它暗示着预先存在的数据比较小(其实不然)或者我们面临的唯一的挑战只是它的大小(大小是挑战之一,但还有其他许多挑战)。简言之,“大数据”指无法使用传统流程或工具处理或分析的信息。为了让大家更形象的理解这个新名词,我就拿一根金条的诞生过程给大家做个比喻。如今对金矿的挖掘可使用需要巨额资本的设备来执行,用于处理数百万吨无用的泥土。如果要肉眼可看到金矿,通常需要30 mg/kg (30 ppm) 的矿石品味,也就是说,现在金矿中的大部分黄金是肉眼看不到的。尽管所有黄金(高价值数据)都在整堆泥土(低价值数据)中,但通过使用正确的设备,您可以经济地处理大量泥土并保留您找到的金箔。然后将金箔集中在一起制成金条,存储并记录在安全、受到严密监视、可靠且值得信赖的地方。这就是大数据的真正含义! 如今,许多企业日渐面临着越来越多的大数据挑战。它们能够访问丰富的 信息,但不知道如何从中获得价值,因为这些信息以最原始的形式或半结构化或非结构化格式存在,这导致他们甚至不知道这些信息是否值得保留以及如何保留。信息的搜集和存储是对信息分析的前提,云计算技术是目前信息搜集存储的首选,云计算和大数据就是相辅相成的关系,未来数据就是企业重要的资产,云计算为数据资产提供存储、访问和计算,盘活资产,使其为企业管理、企业决策、个人生活服务等选择提供依据,这是大数据核心价值,也是云计算的最终目的。 数据领域的三大发展趋势 大数据时代的来临是科技世界里的每个人决定站在哪一队的一个机会,因为这个时代将为科技公司和个人带来自互联网诞生以来最大的机会。让我们回头看看本世纪以来,科技世界发生了哪些变化:

(完整版)大数据产业发展规划(2016-2020年)

大数据产业发展规划(2016-2020年) 数据是国家基础性战略资源,是21世纪的“钻石矿”。党中央、国务院高度重视大数据在经济社会发展中的作用,党的十八届五中全会提出“实施国家大数据战略”,国务院印发《促进大数据发展行动纲要》,全面推进大数据发展,加快建设数据强国。“十三五”时期是我国全面建成小康社会的决胜阶段,是新旧动能接续转换的关键时期,全球新一代信息产业处于加速变革期,大数据技术和应用处于创新突破期,国内市场需求处于爆发期,我国大数据产业面临重要的发展机遇。抢抓机遇,推动大数据产业发展,对提升政府治理能力、优化民生公共服务、促进经济转型和创新发展有重大意义。为推动我国大数据产业持续健康发展,深入贯彻十八届五中全会精神,实施国家大数据战略,落实国务院《促进大数据发展行动纲要》,按照《国民经济和社会发展第十三个五年规划纲要》的总体部署,编制本规划。 一、我国发展大数据产业的基础 大数据产业指以数据生产、采集、存储、加工、分析、服务为主的相关经济活动,包括数据资源建设、大数据软硬件产品的开发、销售和租赁活动,以及相关信息技术服务。 “十二五”期间,我国信息产业迅速壮大,信息技术快速发展,互联网经济日益繁荣,积累了丰富的数据资源,技术创新取得了明显突破,

应用势头良好,为“十三五”时期我国大数据产业加快发展奠定了坚实基础。 信息化积累了丰富的数据资源。我国信息化发展水平日益提高,对数据资源的采集、挖掘和应用水平不断深化。政务信息化水平不断提升,全国面向公众的政府网站达8.4万个。智慧城市建设全面展开,“十二五”期间近300个城市进行了智慧城市试点。两化融合发展进程不断深入,正进入向纵深发展的新阶段。信息消费蓬勃发展,网民数量超过7亿,移动电话用户规模已经突破13亿,均居世界第一。月度户均移动互联网接入流量达835M。政府部门、互联网企业、大型集团企业积累沉淀了大量的数据资源。我国已成为产生和积累数据量最大、数据类型最丰富的国家之一。 大数据技术创新取得明显突破。在软硬件方面,国内骨干软硬件企业陆续推出自主研发的大数据基础平台产品,一批信息服务企业面向特定领域研发数据分析工具,提供创新型数据服务。在平台建设方面,互联网龙头企业服务器单集群规模达到上万台,具备建设和运维超大规模大数据平台的技术实力。在智能分析方面,部分企业积极布局深度学习等人工智能前沿技术,在语音识别、图像理解、文本挖掘等方面抢占技术制高点。在开源技术方面,我国对国际大数据开源软件社区的贡献不断增大。

数据库新技术的发展综述

数据库新技术的发展综述

数据库技术的现状 及发展趋势 院系:数学科学学院 学号:20121014401 姓名:徐高扬 班级:统计122

数据库技术的现状与发展趋势 关键词:数据库;面向对象数据库;演绎面向对象数据库;数据仓库; 数据挖掘;发展;主流数据库新技术 1、引言 自从计算机问世以后,就有了处理数据、管理数据的需求,由此,计算机技术新的研究分支数据库技术应运而生。随着计算机应用领域的不断拓展和多媒体技术的发展,数据库已是计算机科学技术中发展最快、应用最广泛的重要分支之一。从20世纪60年代末开始,数据库系统已从第一代层次数据库、网状数据库,第二代的关系数据库系统,发展到第三代以面向对象模型为主要特征的数据库系统。关系数据库理论和技术在70~80年代得到长足的发展和广泛而有效地应用,80年代,关系数据库成为应用的主流,几乎所有新推出的数据库管理系统(DataBaseManagementSystem,DBMS)产品都是关系型的,他在计算机数据管理的发展史上是一个重要的里程碑,这种数据库具有数据结构化、最低冗余度、较高的程序与数据独立性、易于扩充、

易于编制应用程序等优点,目前较大的信息系统都是建立在关系数据库系统理论设计之上的。但是,这些数据库系统包括层次数据库、网状数据库和关系数据库,不论其模型和技术上有何差别,却主要是面向和支持商业和事务处理应用领域 的数据管理。然而,随着用户应用需求的提高、硬件技术的发展和InternetIntranet提供的丰 富多彩的多媒体交流方式,促进了数据库技术与网络通信技术、人工智能技术、面向对象程序设计技术、并行计算技术等相互渗透,互相结合, 成为当前数据库技术发展的主要特征,形成了数据库新技术。目前,数据库技术已相当成熟,被广泛应用于各行各业中,成为现代信息技术的重要组成部分,是现代计算机信息系统和计算机应用系统的基础和核心。 2、数据库技术的现状及发展趋势 1980年以前,数据库技术的发展,主要体现在数据库的模型设计上。进入90年代后,计算机领域中其它新兴技术的发展对数据库技术产生 了重大影响。数据库技术与网络通信技术、人工智能技术、多媒体技术等相互渗透,相互结合,使数据库技术的新内容层出不穷。数据库的许多

面向应用领域的数据库新技术

面向应用领域的数据库新技术数据库技术被应用到特定的领域中,出现了工程数据库,地理数据库,统计数据库、科学数据库、空间数据库等多种数据库,使数据库领域中新的技术内容层出不穷。 一、数据仓库 传统的数据库技术是以单一的数据资源为中心,进行各种操作型处理。操作型处理也叫事务处理,是指对数据库联机地日常操作,通常是对一个或一组记录的查询和修改,主要是为企业的特定应用服务的,人们关心的是响应时间,数据的安全性和完整性。分析型处理则用于管理人员的决策分析。例如:DSS,EIS和多维分析等,经常要访问大量的历史数据。于是,数据库由旧的操作型环境发展为一种新环境:体系化环境。体系化环境由操作型环境和分析型环境(数据仓库级,部门级,个人级)构成。 数据仓库是体系化环境的核心,它是建立决策支持系统(DSS)的基础。 1.从数据库到数据仓库 具体来说,有以下原因使得事务处理环境不适宜DSS应用 ⑴事务处理和分析处理的性能特性不同 在事务处理环境中,用户的行为特点是数据的存取操作频率高而每次操作处理的时间短,因此,系统可以允许多个用户按分时方式使用系统资源,同时保持较短的响应时间,OLTP (联机事务处理)是这种环境下的典型应用。 在分析处理环境中,某个DSS应用程序可能需要连续运行几个小时,从而消耗大量的系统资源。将具有如此不同处理性能的两种应用放在同一个环境中运行显然是不适当的。 ⑵数据集成问题 DSS需要集成的数据。全面而正确的数据是有效的分析和决策的首要前提,相关数据收集得越完整,得到的结果就越可靠。因此,DSS不仅需要整个企业内部各部门的相关数据,还需要企业外部、竞争对手等处的相关数据。 而事务处理的目的在于使业务处理自动化,一般只需要与本部门业务有关的当前数据,对整个企业范围内的集成应用考虑很少。 当前绝大部分企业内数据的真正状况是分散而非集成的,这些数据不能成为一个统一的整体。对于需要集成数据的DSS应用来说,必须自己在应用程序中对这些纷杂的数据进行集成。可是,数据集成是一项十分繁杂的工作,都交给应用程序完成会大大增加程序员的负担。并且,如果每做一次分析,都要进行一次这样的集成,将会导致极低的处理效率。DSS 对数据集成的迫切需要可能是数据仓库技术出现的最重要动因。 ⑴数据动态集成问题 由于每次分析都进行数据集成的开销太大,一些应用仅在开始对所需的数据进行了集成,以后就一直以这部分集成的数据作为分析的基础,不再与数据源发生联系,我们称这种方式的集成为静态集成。静态集成的最大缺点在于如果在数据集成后数据源中数据发生了改变,这些变化将不能反映给决策者,导致决策者使用的是过时的数据。对于决策者来说,虽然并不要求随时准确地探知系统内的任何数据变化,但也不希望他所分析的是几个月以前的情况。因此,集成数据必须以一定的周期(例如24小时)进行刷新,我们称其为动态集成。显然,事务处理系统不具备动态集成的能力。 ⑵历史数据问题 事务处理一般只需要当前数据,在数据库中一般也只存储短期数据。但对于决策分析而言,历史数据是相当重要的,许多分析方法必须以大量的历史数据为依托。没有对历史数据的详细分析,是难以把握企业的发展趋势的。

2019年中国大数据时代发展调查报告

2019年中国大数据时代发展调查报告 大数据产业有望成为拉动经济发展的“新风口”。工信部信息化和软件服务业司司长陈伟近日在媒体通气会上表示,目前包括北京、上海、贵州等先行先试的地方大数据产业和应用发展已初见成效。 工信部将出台促进大数据产业发展的推进计划,促进规划、标准、技术、产业、安全、应用协同发展。其中,在标准化方面,正在研制的10项国家标准中,8项已完成草案。下一步将重点开展数据格式接口、开放共享等标准体系建设。 “近日国务院印发《促进大数据发展行动纲要》,为我国大数据发展进行了顶层设计和统筹部署。工信部主要负责大数据产业发展以及应用示范相关工作。目前我们已支持和指导北京、上海、贵州、广州、陕西等地大数据产业和应用发展。”陈伟表示。他透露这些地方先行先试,主动探索,已初见成效。 数据显示,XX年我国软件和信息技术服务业实现软件业务收入3.7万亿元,同比增长超过20%。其中,贵州省电子信息产业规模总量1437亿元,比上年增长60.6%。 而中国信息通信研究院不久前发布的《XX年中国大数据发展调查报告》预测,XX年中国大数据市场规模将达到115.9亿元,增速达38%。未来随着应用效果的逐步显现,一些成功案例将产生示范效应,预计XX年至2018年中国大数据市场规模还将维持40%左右的高速增长。 不过,由于大数据产业和应用发展迅猛,亟需通过标准化的途径整合资源,固化现有成果,促进各方达成共识,形成统一的数据格式、接口、安全、开放等各类规范,为我国数据开放共享提供基础,为数据安全应用提供保障,促进数据交易等新兴服务模式规范发展。 围绕大数据标准化,下一步将重点开展以下工作:

相关文档
最新文档