科学大数据与数字地球
数字地球的概念

数字地球的概念
“数字地球”是一种概念,旨在通过数字技术和计算机科学等技术来改善地球上生活的质量。
这种概念最初由一些科学家和技术专家提出,目的是通过数字技术来解决地球上迫在眉睫的全球性问题,包括全球气候变暖、饮用水污染和自然资源枯竭等。
数字地球使用数字和网络技术来构建和应用全球性的实时监控
和数据分析系统,以便更好地了解和处理来自地球的问题,提高我们对大自然和我们自身的认识。
它可以通过现有的技术和未来的发展,收集、存储和传输在地球上发生的非常多的信息,包括人口分布、自然环境、社会结构和经济发展等。
数字地球使用这些信息来预测大规模可能出现的事件,进而更有效地解决可能出现的社会、经济和环境挑战。
为实现数字地球的概念,需要利用智能感知和计算技术,对地球进行高精度的实时监测。
它需要一种可以收集所有尺度和维度信息的数据平台,包括气象、海洋、矿产资源、土地利用、城市发展等。
然后,需要利用有效的信息处理技术,进行深入分析和模拟,有效地应用它们来识别和处理地球上可能出现的重大威胁。
此外,数字地球还将带来可视化技术,为全球社会提供友好的界面,帮助人们更好地理解和应对地球上发生的问题。
实现数字地球的概念的最终目的是改善全球气候变暖、饮用水污染和自然资源枯竭等问题,从而改善人类的生活质量。
但要实现这一目标,还需要各国政府的积极参与和投入。
科学家、工程师和技术专
家们正在全力以赴研究和开发新的技术,以支持数字地球的可持续发展和实施,并将我们带向一个更美好的未来。
数字地球的名词解释

数字地球的名词解释数字地球是指通过数字技术和地理信息系统,将地球上的各种信息数字化并进行整合和分析的一个概念。
数字地球是信息时代下地球科学发展的产物,它突破了传统地理学的局限性,为人类认识、掌握和利用地球提供了全新的方式和工具。
本文将从数字地球的定义、特点、应用以及未来发展等方面进行论述。
一、数字地球的定义数字地球是将地球信息数字化的过程和成果,它综合了地理信息系统、遥感、全球定位系统等多种地球科学技术的应用。
数字地球通过将地球上的各种现象、特征和过程数字化,形成一个基于计算机平台的三维虚拟地球模型,实现了地球的全球一体化管理和分析。
二、数字地球的特点1. 数据丰富:数字地球整合了各种地理信息数据,包括地图、卫星影像、气象数据、地质数据等,提供了海量而丰富的地球信息资源。
2. 互动性强:数字地球可以实现用户与地球信息之间的互动,用户可以根据自身需求对地球模型进行查询、分析和可视化操作,以满足不同的应用需求。
3. 跨领域应用:数字地球不仅应用于地理学领域,也广泛应用于气象、环境、地质、城市规划等多个领域,为相关领域研究和决策提供支持。
4. 时空维度:数字地球具有时空维度,可以实现对地球信息的时序变化和跨尺度观测,帮助人类了解地球变化的规律和趋势。
三、数字地球的应用1. 环境保护与管理:数字地球可以帮助监测和分析地球上的环境变化,例如气象预报、自然灾害监测等,为环境保护与管理提供科学依据。
2. 城市规划与管理:数字地球可以模拟城市发展、土地利用和交通规划等情景,帮助决策者做出科学决策,提高城市规划和管理的效率和精度。
3. 资源开发与管理:数字地球可以对能源、矿产、水资源等进行综合管理和优化利用,实现资源的可持续开发与管理。
4. 旅游与文化遗产保护:数字地球可以通过虚拟现实技术,为游客提供沉浸式的旅游体验,同时实现对文化遗产的保护和传承。
四、数字地球的未来发展数字地球的发展仍处于不断创新和拓展的阶段,未来将面临以下几个方向的发展:1. 数据开放共享:数字地球需要更多领域的数据支持,要实现数据的开放共享,促进不同领域数据的互联互通。
数字地球大数据在地理学研究中的应用

数字地球大数据在地理学研究中的应用近年来,随着科技的迅猛发展,数字地球大数据逐渐成为地理学研究中的重要工具。
数字地球大数据是指通过地理位置技术获取、管理和应用的大型数据集合,它包含了各种地理信息,如气候、地形、地貌、土地利用、人类活动等。
这些数据集合的广泛应用不仅帮助人们更好地理解地理现象和变化趋势,也在许多领域提供了可靠的决策依据。
首先,在城市规划中,数字地球大数据发挥了重要作用。
通过获取城市的人口密度、交通流量、土地利用等数据,研究人员可以模拟城市发展情况,预测未来的城市增长趋势,为城市规划和土地利用提供科学依据。
此外,数字地球大数据还可以帮助城市规划者确定交通网络、公共设施和基础设施建设的最佳位置,提高城市的生活质量和可持续发展水平。
其次,在自然资源管理中,数字地球大数据也起到了重要的作用。
通过获取土地利用、植被覆盖、水资源分布等数据,研究人员可以更好地理解自然资源的分布和利用情况,从而制定合理的资源管理计划。
例如,在森林资源管理领域,数字地球大数据可以帮助监测森林覆盖变化、评估森林健康状况并预测火灾风险,有助于保护森林资源及其生态系统。
此外,数字地球大数据在环境保护方面也发挥了积极的作用。
通过获取气象数据、空气质量信息和环境监测数据,研究人员可以识别和监测环境污染源,评估环境风险并采取相应的保护措施。
例如,在气候变化研究中,数字地球大数据可以帮助科学家分析气候模式和趋势,预测未来的气候变化,并为制定应对气候变化的政策提供支持。
此外,在灾害管理和应急响应方面,数字地球大数据也发挥着重要作用。
通过获取地震、洪水、台风等灾害数据,研究人员可以制定灾害风险评估模型,预测灾害发生的可能性和影响范围,为应急响应提供决策支持。
例如,在地震灾害管理中,数字地球大数据可以帮助科学家确定地震危险区域,预测地震可能的规模和破坏性,并为灾后救援和重建提供指导。
综上所述,数字地球大数据在地理学研究中拥有广泛的应用前景。
构建数字地球的关键技术与流程解析

构建数字地球的关键技术与流程解析近年来,信息技术的飞速发展催生了一个全新的概念——数字地球。
数字地球是一种通过将地球上所有的物理空间和信息空间进行数字化整合,从而实现全球的信息共享、智能决策和可持续发展的概念。
构建数字地球的实现离不开一系列关键技术和流程的支持。
一、地理信息系统(GIS)地理信息系统是数字地球的基础。
它是将地理空间数据与属性数据进行整合的一种信息处理系统。
通过GIS,我们可以将地球上的所有空间信息进行数字化,实现对地理现象的深入分析和管理。
GIS技术的关键是地理数据采集、处理和可视化。
通过现代测绘技术、无人机遥感技术和卫星遥感技术等手段,我们能够快速获取地理数据,然后通过空间数据分析、数据挖掘和数据可视化等技术手段,将这些数据以图形、表格等形式进行呈现,实现对地球上的各种地理现象的深入研究。
二、人工智能与大数据数字地球的建设需要处理和分析海量的数据。
而人工智能和大数据技术的发展为处理和分析数据提供了强有力的支持。
大数据技术能够帮助我们从海量数据中提取有价值的信息,进行数据建模和预测。
而人工智能技术则可以模拟人类的思维和决策过程,帮助我们做出智能化的决策。
例如,在数字地球中,我们可以通过大数据技术对全球气象数据进行收集和分析,进而实现对天气预测的精确度提升;同时,通过人工智能技术,我们能够模拟气象专家的决策过程,从而实现自动化的气象预测系统。
这使得气象预测能够更准确地为公众提供服务。
三、物联网技术数字地球离不开物联网技术的支持。
物联网是一种通过感知、传输、处理和交互技术连接地球上的一切物体,并通过网络进行信息通信的技术。
在数字地球中,通过物联网技术,我们能够实时获取各种设备传感器的数据,并将这些数据进行汇总和分析,从而实现对地球上的一切物体的智能监测和管理。
以智慧城市为例,通过在城市中布置传感器和终端设备,我们能够实现对城市交通、能源消耗、环境污染等各个方面的监测。
通过物联网技术,这些传感器将获取的数据传输到集中处理中心,然后通过数据分析和与人工智能算法结合,对城市的各方面进行实时分析和决策支持。
数字地球:地理信息系统与全球变化

GIS在全球土地利用变化研究中的应用
土地利用监测
• 通过GIS技术,对土地利用进行实时监测和评估,为
土地利用变化研究提供依据
• 为土地利用规划和管理提供科学支持
土地利用变化影响评估
• 通过GIS技术,对土地利用变化对农业、水资源等方
面的影响进行评估
• 为土地利用规划和管理策略制定提供科学依据
土地利用规划和管理策略制定
• 通过GIS技术,为政策制定者提供土地利用变化影响
的空间信息,辅助制定规划和管理策略
• 为实现土地资源可持续利用提供信息支持
05
数字地球与全球变化的未来发展趋势
数字地球技术的未来发展趋势
高性能计算技术
物联网技术
人工智能技术
• 随着计算机技术的发展,数
• 通过物联网技术,实现地球
• 将人工智能技术应用于数字
• 为生态系统保护和恢复提供科学支持
生态系统变化影响评估
• 通过GIS技术,对生态系统变化对农业生产、水资源等方面的影响进行评估
• 为生态系统保护和恢复策略制定提供科学依据
生态系统保护和恢复策略制定
• 通过GIS技术,为政策制定者提供生态系统变化影响的空间信息,辅助制定保护和恢复策略
• 为实现生态系统可持续发展提供信息支持
字地球技术将不断提高数据处
上各种信息的实时传输和共享
地球技术,提高数据处理和分
理和分析能力
• 为数字地球技术的发展提供
析的智能化水平
• 为数字地球技术的应用提供
新的机遇
• 为数字地球技术的发展提供
更强大的支持
新的思路
GIS在全球变化研究中的未来发展趋势
01
02
数字地球中的地球系统模型与空间数据分析

数字地球中的地球系统模型与空间数据分析数字地球是指基于计算机技术和大数据技术的地球之模型和地球的数值表达形式,它可以被看作是地球系统模型与空间数据分析的综合体。
数字地球的出现和发展,不仅仅是科学技术的进步,更是人类对地球认知的深化和对地球环境保护的需求。
在数字地球中,地球系统模型和空间数据分析技术共同构成了一个全新的地球科学研究范式。
地球系统模型是数字地球中重要的组成部分。
地球是一个复杂的系统,包括大气、海洋、陆地、生物等多个子系统,它们相互作用、相互影响。
地球系统模型是为了深入研究和模拟这些复杂的相互关系而建立的数学模型。
通过对地球系统模型的构建和模拟,科学家可以更好地理解地球上的自然过程和人类活动对地球环境的影响。
在数字地球中,空间数据分析是一项重要的技术。
空间数据分析是对地球上空间信息进行收集、整理、分析和应用的过程。
地球是一个相对宏观的空间系统,通过遥感技术和地理信息系统,可以获取地球各个部分的空间数据。
这些数据包括地形、地貌、气候、水文、生态等各个方面的信息。
通过对这些空间数据的分析,人们可以发现地球上的规律和变化,为地球环境的保护和可持续发展提供科学依据。
数字地球中的地球系统模型和空间数据分析技术相互依存,相互促进。
地球系统模型需要空间数据作为输入,通过分析这些数据,模型能够更准确地描述地球上的自然过程。
同时,空间数据分析也需要地球系统模型的支持,通过模型的建立和模拟,可以对收集到的数据进行验证和解释。
地球系统模型和空间数据分析的相互作用,不断推动着数字地球的发展和进步。
数字地球在多个领域具有广泛的应用前景。
在环境保护方面,数字地球可以模拟和预测自然灾害,提供科学决策支持。
在城市规划方面,数字地球可以模拟城市发展趋势,为城市规划和建设提供参考。
在农业和资源管理方面,数字地球可以分析土壤和水资源的分布和利用情况,优化农业生产和资源配置。
在气候变化研究方面,数字地球可以模拟地球上的能量循环和气候变化趋势,为全球气候治理提供指导。
数字地球与地理信息技术的发展趋势

数字地球与地理信息技术的发展趋势在数字时代,地球也不例外地进行数字化转型。
数字地球是利用高科技手段将地球表面的自然、人文、社会等多维信息进行数字化处理的一种全新概念,地理信息技术(Geographic Information Technology,简称GIT)是数字地球的关键技术之一。
地理信息技术在地球科学、环境科学、社会科学等领域得到了广泛应用,现在我们来探讨一下数字地球与地理信息技术的发展趋势。
一、数字地球的发展趋势1.3D地球可视化随着3D技术的不断发展,3D地球可视化技术也得到了广泛应用。
Google Earth、NASA World Wind等地球可视化软件已经成为了数字地球的代表作品。
未来,3D地球可视化技术将会更加成熟,能够呈现更加真实、细致、生动的地球模型。
同时,3D地球可视化技术也能够在城市规划、建筑设计、旅游等领域为我们带来更多的便利。
2.全球大数据研究大数据时代的到来,使得数字地球的研究也进入了全球大数据研究阶段。
大数据的出现为数字地球带来了更多的数据来源,这使得数字地球的数据处理和分析能力不断提高。
全球大数据研究让我们更加了解地球上的自然环境、人类文化、经济社会等方面,进而进行更为精细的研究和应用。
3.新增多元数据来源数字地球关注的主要是地球表面的多维信息,随着技术的不断发展,数字地球的数据来源也在不断增多。
相关部门和组织不断增加了对全球各地的数据采集,例如卫星遥感,天气气象预报等,这些丰富多样的数据来源呈现给我们更丰富、更真实的地球信息。
4.智慧城市与数字地球结合智慧城市是数字地球发展趋势中重要的应用场景之一。
数字地球的3D技术和GIS等技术有助于构建智慧城市的3D模型。
数字地球技术可以应用于城市规划、环境监测、交通管理等方面。
未来,数字地球和智慧城市的结合将会带来更多的科技创新和实际应用。
二、地理信息技术的发展趋势1.人工智能与GIS结合人工智能在无人驾驶、智能家居、医疗、金融等领域大放异彩,GIS也不例外。
数字地球的原理及应用

数字地球的原理及应用什么是数字地球?数字地球是指通过计算机和通信技术,将地球表面的各种地理信息以数字的形式进行呈现、管理和分析的一种技术和应用模式。
它是一种将地球表面的自然、人文、社会等多种地理信息进行整合、分析和展示的工具,能够为各行各业提供支持和决策的依据。
数字地球的原理数字地球的实现依赖于多种技术和数据源的集成,下面是数字地球实现的基本原理:1. 地理信息系统(GIS)地理信息系统(GIS)是数字地球的核心技术之一。
GIS能够将地理数据与属性数据进行关联、整合和分析,并以地图的形式进行可视化展示。
通过GIS技术,我们可以将地球表面的各种地理要素(如地形、水域、道路、建筑等)进行数字化处理,从而实现对地球的全方位、立体化描述。
2. 遥感技术遥感技术是数字地球数据源中的重要组成部分。
借助于卫星、飞机等遥感设备,我们可以获取大范围、高分辨率的地球表面图像数据。
这些图像数据可以用来提取地表特征、监测环境变化、进行地理分析等,为数字地球提供了丰富的地理数据资源。
3. 全球定位系统(GPS)全球定位系统(GPS)是数字地球的定位和导航基础设施。
通过接收来自卫星的定位信号,GPS能够准确地确定地球上任何一个点的位置坐标。
在数字地球中,GPS被广泛应用于位置服务、路径规划、车辆追踪等领域,为人们提供了准确定位和导航的功能。
4. 数据库技术数字地球需要处理大量的地理数据,因此数据库技术在数字地球的实现中起着重要的作用。
通过数据库技术,我们可以对地理数据进行存储、检索和管理,并实现数据的共享和集成。
数据库技术能够提高数据的处理效率和管理能力,为数字地球的应用提供强大的支持。
数字地球的应用数字地球在各个领域都有广泛的应用,下面列举了几个常见的应用场景:1. 城市规划与管理数字地球可以帮助城市规划师和管理者更好地了解城市的空间结构和发展趋势。
通过利用GIS技术和地理数据,可以进行城市土地利用分析、交通规划、设施布局等工作,为城市的规划和管理提供决策支持。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
引用格式: 郭华东, 王力哲, 陈方, 等. 科学大数据与数字地球. 科学通报, 2014, 59: 1047–1054
Guo H D, Wang L Z, Chen F, et al. Scientific big data and digital Earth (in Chinese). Chin Sci Bull (Chin Ver), 2014, 59: 1047–1054, doi: 10.1360/972013-1054
特邀进展
2014 年 第 59 卷 第 12 期:1047 ~ 1054
《中国科学》杂志社
SCIENCE CHINA PRESS
科学大数据与数字地球
郭华东*, 王力哲, 陈方, 梁栋
中国科学院遥感与数字地球研究所, 北京 100094 * 联系人, E-mail: hdguo@
小范围技术实践, 最终到广泛接受并成为一个新兴 研究方向的历程. 由图 2 所示, 2008 年 9 月, Nature 杂志率先出版了“大数据”专刊[7], 表明大数据的影响 已触及自然科学、社会科学、人文科学和工程学的各 个领域. 2009 年 10 月, The Fourth Paradigm: DataIntensive Scientific Discovery[8]一书的出版, 标志着与
复杂性、综合性、全球性和信息与通信技术高度集成 性等诸多特点融于一身, 其研究方法也正在从单一 学科向多学科、跨学科方向转变; 从自然科学向自然 科学与社会科学的充分融合方向过渡; 从个人或者 小型科研团体向国际科学组织方向发展. 科学家不 仅通过对广泛的数据实时、动态地监测与分析来解决 难以解决或不可触及的科学问题, 更是把数据作为 科学研究的对象和工具, 基于数据来思考、设计和实 施科学研究[8].
Hale Waihona Puke 10492014 年 4 月 第 59 卷 第 12 期
确定性[25]. 数据的不确定性与模型的不确定性给科 学大数据计算带来极大的挑战.
为了应对大数据, 尤其是科学大数据的挑战, (科学)大数据计算的可计算性及求解策略也需要进 行革命性的发展. 首先是大数据的近似性求解方法. 由于大数据体量巨大, 计算及其复杂, 因此精确求解 是无法实现的. 这时我们需要求解近似解、部分解, 来代替精确解. 在可容忍的求解精度范围内, 我们降 低求解方法的复杂度而提高大数据求解的效率是一 个 可 行 的 方 法 [26]. 其 次 是 大 数 据 的 精 简 求 解 方 法 . 基于同样的原因, 通过对大数据的稀疏表征和维度 约减, 把大数据集变为小数据集合, 从而获得大数据 求解方法. 传统的傅里叶变换和小波变换, 当前流行 的压缩感知[27,28]、字典学习[29]都是基于这样的思路.
2014 年 4 月 第 59 卷 第 12 期
大数据关系密切的数据密集型科学发现范式的确立 和广泛认可. 2010 年 2 月, Economist 杂志刊登的“Data, data everywhere” 一 文 将 大 数 据 理 念 进 一 步 深 化 [9]. 2011 年 2 月, Science 杂志推出“数据处理”专刊[10]; 同年 5 月, 麦肯锡全球研究院(McKinsey Global Institute, MGI)发布 Big Data: The Next Frontier for Innovation, Competition, and Productivity 报告[11], 标志着大数据 已成为社会科学研究热点问题之一. 2012 年 5 月, 联 合国发布大数据政务白皮书 Big Data for Development: Challenges & Opportunities[12], 标志着大数据领域的 研究计划已上升到国家战略层面; 同年 6 月, 高德纳 咨询公司(Gartner Group)提出大数据 4V 定义, 确立 了 大 数 据 研 究 的 基 础 概 念 [13]; 同 样 在 6 月 , “Next-generation Digital Earth”[14]在 Proceedings of the National Academy of Sciences 发表, 指出人类已进 入大数据时代, 这代表大数据将在新一代数字地球 发展中扮演重要角色. 2013 年 4 月, 在北京举行的第 35 届国际环境遥感大会专门召开了“大数据与数字地 球和未来地球”分会, 这标志着空间和地球科学领域 对大数据的广泛关注和认同.
纵观数据的生产方式, 其在经历了以被动式为 主的运营式系统阶段和以主动式为主的用户原创内 容阶段后, 现已步入了以自动式为主的感知式系统 阶段[6]. 数据生产方式的飞跃是大数据产生的主要因 素. 与其他研究方向一样, 大数据也经历着从概念到
图 1 2006~2020 年全球数据量增长趋势
据 IDC“2020 年的数字宇宙”数据制作
在科学研究数据与日俱增的今天, 我们把与科 学相关的大数据称之为科学大数据. 科学大数据将
1048
图 2 大数据发展趋势
据 Google Trend 数据制作, 数据获取时间 2013 年 8 月
特邀进展
图 3 世界不同国家大数据研究与发展热度图
据 Google Trend 数据制作, 数据获取时间 2013 年 8 月
2013-09-17 收稿, 2014-01-16 接受, 2014-04-09 网络版发表 国家自然科学基金重大国际合作项目(41120114001)资助
摘要 大数据研究正发展为科技、经济、社会等各领域的关注焦点, 诸多国家已将大数据研究 上升至国家战略层面. 本文从时空角度论述了大数据的缘起、内涵与发展势态, 分析了科学大 数据成为科学研究新途径的历程——科学范式开始从模型驱动向数据驱动发生转变. 给出了 科学大数据的定义及科学大数据计算的应对策略. 进一步地论述了数字地球学科的基本理论 框架和数字地球中的数据系统, 指出了数字地球学科具有大数据的鲜明特点. 最后以“胡焕庸线” 形成机理的空间认知研究为例, 具体阐述了数字地球学科中的大数据研究的理论和方法.
空防之后, 另一个大国博弈的空间. 大数据正在开启 一次重大的时代转型, 它将改变人类的生活以及理 解世界的方式[15~17].
1 科学大数据及其内涵
随着大数据时代的到来, 国内外学术界正在从 各种角度来分析和理解大数据的概念与内涵. 当前 的大数据定义主要通过两种不同的视角试图刻画大 数据的外部特征: 一种是相对特征, 即在用户可接受 的时间范围内, 使用普通设备不能获取、管理和处理 的数据集[18]; 另一种是绝对特征, 即大数据 4V 特性, 体量大(Volume)、类型多(Variety)、真实性(Veracity)、 变化速度快(Velocity)[13].
科学大数据正在使科学世界发生变化, 科学研 究 已 进 入 了 一 个 全 新 的 范 式 —— 数 据 密 集 型 科 学 范 式. 近年来, 美国国家科学基金会(National Science Foundation, United States, NSF)投入了大量资金支持 数据密集型科学计算. 其中, 由戴尔公司和德克萨斯 州立大学研发的超级计算机“Stampede”已正式服役, 其综合处理能力、高可用性和高性能能力超群. 美国 南加州地震中心利用 Stampede 预测了加州破坏性地 震的频率. 德州大学奥斯汀分校利用 Stampede, 通 过详细的数据建模更好地描述了从南极洲到海洋的 冰川流动[20].
高度计算复杂性(High Complexity): 科学大数据 应用的场景大多属于非线性复杂系统, 具有高度复 杂的数据模型. 因而科学大数据计算问题不仅仅是 一个数据处理与分析的问题, 还是一个复杂系统与 数据共同建模与计算的问题[23]. 这个问题需要复杂 系统理论、估计理论与本学科的机理模型相结合来探 索解决方法. 现代气候科学就是一个典型案例[24].
关键词
大数据 科学大数据 地球科学 数字地球
19 世纪 70 年代以来, 随着第二次工业革命的爆 发, 各种新技术、新发明层出不穷, 以文字为载体的 数据量大约每 10 年翻一番; 从工业化时代进入到信 息化时代后, 信息技术革命以前所未有的方式对社 会、科技、经济变革的发展起着决定作用, 数据量以 每 3 年翻一番的速度持续增长; 近 10 年来, 随着计算 机技术和互联网的快速发展, 音频、视频、文字、图 片等半结构化、非结构化的数据大量涌现, 社交网 络、物联网、云计算被广泛应用, 使得数据存储量、 规模、种类飞速增长, 大数据时代已悄然来临[1~4]. 2012 年 12 月, 互联网数据中心(Internet Data Center, IDC)发布的“2020 年的数字宇宙”报告中指出(图 1), 数据量将以每 2 年翻一番的速度骤增. 2011 年全球被 创建和被复制的数据总量约为 1.8 ZB; 预计到 2020 年全球数据总量将达到 40 ZB, 我国拥有的全球数据 量比例由 2012 年的 13%将提升到 21%[5].
虽然科学大数据已成为科学研究的重要途径, 数 据密集型科学范式也已逐渐被接受, 但是科学大数据 系统的机理模型及其在科学发现中的理论与方法仍有 待深入研究. 现阶段在大数据概念与应用实践中, 网 络大数据与商业大数据得到了广泛重视和快速发展.
与之相比, 科学大数据的理论研究与实践相对较少, 究其原因在于其本身具有的“3H”科学内涵.
高度不确定性(High Uncertainty): 我们注意到, 科学大数据的来源一般包括对自然过程的感知和科 学实验数据的获取. 这两种数据来源的特点决定了 科学大数据普遍具有一定的误差和不完备性, 从而 导致数据的高度不确定性. 一般而言, 科学大数据应 用的学科为非人工系统, 如气候变化与地学过程. 这 样的系统由近似的机理模型来表征, 具有高度的不
数据是一种资源, 也是一种财富. 在大数据时代, 庞大繁杂的数据对社会、科技、经济的发展将发挥支 撑促进作用. 一些国家和国际组织已将大数据研究 提升到国家和国际重大战略层面, 这势必对未来科 技与经济发展带来深远影响. 如图 3 所示, 美国、欧 盟、澳大利亚、日本、韩国等已在国家层面开展了大 数据研究和发展计划. 2013 年 7 月习近平总书记在中 国科学院考察时指出“大数据是工业社会的‘石油’资 源. 谁掌握了数据, 谁就掌握了主动权”. 大数据已 成为信息主权的一种表现形式, 将是继边防、海防、