数据论文的出现与发展

合集下载

数据集成:历史、现状、未来

数据集成:历史、现状、未来

WAMDM Technical Report (WAMDM-TR-2006-2)数据集成:历史、现状、未来艾静 (Web组)引言:本文主要部分是对论文《Data Integration: The Teenage Years》[1]的介绍,这篇论文是第32届VLDB会议(VLDB2006)上十年最佳论文的获奖发言,作者在文中总结了Data Integration这十几年来的发展成果,在商业领域的一些相关产品,并提出了目前数据集成系统普遍存在的问题以及未来面临的挑战。

本文还对数据集成领域中的一些重要思想和几个热点问题做了更加详细的介绍,力争将数据集成这十几年来的发展状况尽可能清晰地展现给读者。

一、背景介绍近几十年来,计算机网络的飞速发展和信息化的推进,使得人类社会所积累的数据量已经超过了过去5000年的总和。

数据的采集、存储、处理和传播的数量也与日俱增。

企业或社会组织实现数据共享,可以使更多的人更充分地利用已有的数据资源,减少资料收集、数据采集等重复劳动和相应费用。

然而,这些为不同应用服务的信息都存储在许多不同的数据源之中,其管理系统也各不相同。

为更有效地利用这些信息,需要从多个分布、异构和自治的数据源中集成数据,同时还需要保持数据在不同系统上的完整性和一致性。

另外,必须向用户隐藏这些差异,提供给用户一个统一和透明的数据访问接口。

研究的重点即在于确立一种具有普遍意义的、可操作性强的分布异构数据源的集成方法。

因此,如何对数据进行有效的集成管理已成为增强企业商业竞争力的必然选择,尤其是对于那些拥有多部门多数据源的大型企业来说,数据集成更是至关重要。

因为每一个部门都会拥有自己的数据库,这些数据库可能是独立、异构且自治的,为了各部门间更好的合作和数据共享,并且为用户提供更好的搜索查询质量,建立一个完善的数据集成系统是极有应用价值而且尤为重要的。

二、Information Manifold:具有统一的查询借口!1.背景1996年Alon Halevy、Anand Rajaraman、Joann Ordille三人合著的论文《Querying Heterogeneous Information Sources using Source Descriptions》[2]发表在VLDB国际会议上,2006年被评为VLDB十年最佳论文。

大数据论文3000字范文(精选5篇)

大数据论文3000字范文(精选5篇)

大数据论文3000字范文(精选5篇)第一篇:大数据论文3000字当人们还在津津乐道云计算、物联网等主题时, “大数据”一词已逐渐成为IT网络通信领域热门词汇。

争夺大数据发展先机俨然成为世界各国高度重视的问题, 其中不乏IBM、EMC.甲骨文、微软等在内的巨头厂商的强势介入, 纷纷跑马圈地, 它们投入巨额资金争相抢占该领域的主动权、话语权。

大数据时代的来临, 除了推动现有的信息技术产业的创新, 其对我们生产生活的方式也将产生重大影响。

从个人视角来看, 不管是日常工作中遇到的海量邮件或是从网上获取的社交、购物、娱乐、学习、理财等信息, 还是生活中最常见的手机存储, 大数据已经渗透到我们日常生活的方方面面, 极大地方便了我们的生活;对企业而言, 互联网公司已开始采用大数据来冲击传统行业, 精准营销与大数据驱动的产品快速迭代, 促进企业商业模式创新;在社会公共服务方面, 教育、医疗、交通等行业在大数据的影响下, 出现了各种新的应用, 数据化、社交化的新媒体平台、智能交通与城市数字监管系统, 以及病历存储调用的医疗云等, 此外, 政府还可以通过大数据来高效完成信息采集, 这样可优化升级管理运营。

然而大数据在给我们展示前所未有的发展机遇的同时, 也给国家信息安全、信息技术、人才等方面带来了很大的挑战。

不久前, 斯诺登披露了美国国家安全局(NSA)一直进行信息监视活动、已收集数以百万计的全球人的信息数据的消息, 在全球范围内掀起轩然大波。

该事件对“大数据”的信息安全敲响了警钟。

大数据让大规模生产、分享和应用数据成为可能, 将信息存储和管理集中化, 我们在百度上面的记录, 无意识阅读的产品广告、旅游信息, 习惯去哪个商场进行采购等这些痕迹, 却不知所有的关系和活动在数据化之后都被一些组织或商家公司掌控, 这也使得我们一方面享受了“大数据”带来的诸多便利, 但另一方面无处不在的“第三只眼”却在时刻监控着我们的行动。

大数据的发展历史论文

大数据的发展历史论文

大数据的发展历史论文大数据的发展历史可以追溯到20世纪初。

在过去的几十年里,随着信息技术的飞速发展,数据的数量也在持续增长。

大数据的发展历史主要可以分为三个阶段:早期阶段、中期阶段和现代阶段。

在早期阶段,大数据的概念并不被广泛认知。

20世纪初,数据收集和处理主要是依赖于人力手工操作。

随着电脑的普及和计算能力的提升,人们开始意识到数据处理的重要性。

但是由于技术限制和数据量较小,大数据的概念并未引起重视。

随着互联网的普及和计算机技术的发展,大数据进入了中期阶段。

互联网的出现使得用户可以轻松地产生大量数据,并通过网络进行传输和共享。

同时,企业和科研机构开始意识到数据对于决策和分析的重要性。

这一时期,数据仓库和数据挖掘等技术开始逐渐成熟,大数据分析的概念逐渐深入人们的意识。

进入21世纪,大数据进入了现代阶段。

随着社交网络、移动互联网、物联网等新兴技术的兴起,数据的来源变得更加多样化和复杂。

大数据分析技术也在不断更新和完善。

同时,人工智能、机器学习等技术的快速发展,也为大数据的处理和应用提供了新的思路和方法。

大数据已不再是一个单纯的概念,而是成为了企业决策、科学研究和社会管理的重要工具。

综上所述,大数据的发展历史可以看作是一个从无到有、从浅入深的过程。

随着技术的进步和社会的发展,大数据将会在更多领域得到应用,并且对我们的生活产生深远影响。

大数据的发展历史充满了挑战与机遇。

在过去的几十年里,大数据的发展一直处于不断变革和创新的过程中。

随着信息技术的不断进步,大数据的规模和复杂性也在不断增加。

在这一过程中,人们不断探索和发展各种大数据处理和分析技术,以应对不断涌现的新挑战。

大数据的发展历史也反映了技术和社会的相互影响。

在数据收集和存储技术不断进步的同时,大数据分析技术也在不断演进。

从最初简单的数据查询、统计分析到如今的数据挖掘、机器学习,大数据技术的进步使得我们能够更深入地挖掘数据的内在价值。

这些技术的发展不仅为企业提供了更好的决策支持,也为科学研究和社会管理提供了更多的可能性。

大数据行业现状及前景论文

大数据行业现状及前景论文

大数据行业现状及前景论文一、引言大数据是指规模巨大、种类繁多的数据集合,对数据的采集、存储、处理和分析提出了巨大挑战。

随着信息化和互联网的发展,大数据已经成为重要的资源和生产要素,其发展对于各行各业都具有重要意义。

二、大数据行业现状分析1. 大数据应用领域广泛大数据技术已经渗透到各行各业,包括金融、医疗、零售、制造等领域。

通过对海量数据的分析,企业可以发现市场趋势、优化产品设计、提高服务质量等。

2. 大数据技术不断创新随着人工智能、云计算等技术的不断发展,大数据技术也在不断创新。

包括数据挖掘、机器学习、自然语言处理等领域的技术不断推陈出新,为大数据行业的发展带来新的机遇。

3. 大数据行业竞争激烈随着越来越多的企业投入到大数据行业,市场竞争也变得日益激烈。

企业需要不断提升自身的数据分析能力和技术水平,才能在竞争中立于不败之地。

三、大数据行业未来发展趋势1.人工智能与大数据融合人工智能技术的发展对大数据行业产生了深远影响,人工智能算法的不断优化提升了大数据处理和分析的效率,为大数据技术的应用带来更广阔的空间。

2.数据安全与隐私保护随着数据泄露事件的不断发生,数据安全和隐私保护问题日益受到关注。

大数据行业需要加强数据安全技术的研发,建立完善的隐私保护机制,保障用户数据的安全和隐私。

3.大数据人才短缺问题随着大数据行业的快速发展,大数据人才短缺问题日益突出。

企业需要加大对数据分析、数据科学等专业领域人才的培养和引进,以满足行业发展的需求。

结论随着信息化和互联网的快速发展,大数据行业已经成为驱动经济增长和社会进步的重要力量。

未来,大数据行业将会在创新技术、优化服务、拓展应用等方面持续发展壮大,为各行各业的数字化转型提供强有力支持。

以上是大数据行业现状及前景的简要论述,希望能够对读者对大数据行业的发展趋势有所启发。

数据中心发展论文

数据中心发展论文

数据中心发展论文在当今数字化的时代,数据中心已成为支撑全球经济和社会运转的关键基础设施。

从大型企业的运营管理到普通人的日常生活,数据中心都在背后发挥着不可或缺的作用。

数据中心的定义与功能简单来说,数据中心是一个集中存放大量计算设备、存储设备以及网络设备的场所,其主要功能是对数据进行存储、处理和传输。

它就像是一个巨大的“信息仓库”,不仅要确保数据的安全可靠,还要能够快速高效地满足用户对数据的访问和处理需求。

随着信息技术的不断发展,数据中心所承担的任务也越来越复杂多样。

除了传统的数据存储和处理,如今的数据中心还需要支持云计算、大数据分析、人工智能等前沿技术的应用。

例如,云计算服务提供商依靠强大的数据中心基础设施,为用户提供灵活可扩展的计算资源;大数据分析则依赖数据中心的海量存储和高速处理能力,从海量数据中挖掘有价值的信息。

数据中心的发展历程回顾数据中心的发展历程,可以追溯到上世纪中叶计算机诞生之初。

当时,计算机体积庞大、性能有限,数据处理和存储主要在单个计算机内部进行。

随着计算机技术的进步,企业和机构开始建立专门的机房来集中管理和运行计算机系统,这便是早期的数据中心雏形。

进入 21 世纪,互联网的迅速普及推动了数据中心的快速发展。

为了满足日益增长的网络流量和数据处理需求,数据中心的规模不断扩大,技术不断升级。

从最初的小型机房到如今的大型数据中心园区,从传统的服务器架构到虚拟化和云计算技术的应用,数据中心在不断进化。

近年来,随着人工智能、物联网等新兴技术的兴起,数据中心面临着新的挑战和机遇。

数据量的爆炸式增长、对计算性能的更高要求以及对低延迟的追求,促使数据中心不断创新和变革。

数据中心的技术架构与关键技术数据中心的技术架构通常包括服务器、存储系统、网络设备、制冷系统和供电系统等多个部分。

服务器是数据处理的核心,其性能和数量直接影响数据中心的处理能力;存储系统用于保存数据,包括传统的硬盘存储和新兴的固态硬盘存储;网络设备负责数据的传输和交换,确保数据能够快速准确地到达目的地;制冷系统和供电系统则为数据中心的稳定运行提供保障。

大数据论文3000字

大数据论文3000字

大数据论文3000字篇一:大数据时代的机遇与挑战论文3000字大数据时代的机遇与挑战什么是大数据时代?“大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。

最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。

人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。

”大数据时代是怎样产生的?物联网、云计算、社交网络、社会媒体以及信息获取技术的飞速发展,数据正以前所未有的速度迅速增长和积累,数据是人类社会最重要的财富大数据时代的到来大数据时代的特点?1.数据量大(Volume)第一个特征是数据量大。

大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。

2.类型繁多(Variety)第二个特征是数据类型繁多。

包括网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。

3.价值密度低(Value)第三个特征是数据价值密度相对较低。

如随着物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何通过强大的机器算法更迅速地完成数据的价值“提纯”,是大数据时代亟待解决的难题。

4.速度快、时效高(Velocity)第四个特征是处理速度快,时效性要求高。

这是大数据区分于传统数据挖掘最显著的特征。

既有的技术架构和路线,已经无法高效处理如此海量的数据,而对于相关组织来说,如果投入巨大采集的信息无法通过及时处理反馈有效信息,那将是得不偿失的。

可以说,大数据时代对人类的数据驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。

大数据时代的机遇大数据技术通过对海量数据的快速收集与挖掘、及时研判与共享,成为支持社会治理科学决策和准确预判的有力手段,为社会转型期的社会治理创新带来了机遇。

大数据时代的机遇与挑战论文3000字

大数据时代的机遇与挑战论文3000字

大数据时代的机遇与挑战论文3000字大数据时代的机遇与挑战论文3000字随着信息时代的到来,大数据(Big Data)一词逐渐被人们认知和熟悉,其常被用于定义和描述“信息爆炸时代产生的海量数”。

随着“大数据”时代的来临,在商业、经济及其他领域中,人们做出决策不仅仅依靠经验和直觉,常以数据分析作为决策依据,这种方式大大提高了决策的科学性,最大限度避免决策失误。

用好大数据,必将对商业发展、科学研究和政府决策产生积极的影响。

1 大数据的基本概况大数据(Big Data)是指那些超过传统数据库系统处理能力的数据,其具有以下四个基本特性,即海量性、多样性、易变性、高速性。

同时数据类型繁多、数据价值密度相对较低、处理速度快、时效性要求高等也是其主要特征。

2 大数据的时代影响大数据,对经济、政治、文化等方面都具有较为深远的影响,其可帮助人们进行量化管理,更具科学性和针对性,得数据者得天下。

大数据对于时代的影响主要包括以下几个方面:(1)“大数据决策”更加科学有效。

如果人们以大数据分析作为基础进行决策,可全面获取相关决策信息,让数据主导决策,这种方法必将促进决策方式的创新和改变,彻底改变传统的决策方式,提高决策的科学性,并推动信息管理准则的重新定位。

2009 年爆发的甲型H1N1 流感就是利用大数据的一个成功范例,谷歌公司通过分析网上搜索的大量记录,判断流感的传播源地,公共卫生机构官员通过这些有价值的数据信息采取了有针对性的行动决策。

(2)“大数据应用”促进行业融合。

虽然大数据源于通信产业,但其影响绝不局限于通信产业,势必也将对其他产生较为深远的影响。

目前,大数据正逐渐广泛应用于各个行业和领域,越来越多的企业开始以数据分析为辅助手段加强公司的日常管理和运营管理,如麦当劳、肯德基、苹果公司等旗舰专卖店的位置都是基于大数据分析完成选址的,另外数据分析技术在零售业也应用越来越广泛。

(3)“大数据开发”推动技术变革。

大数据的应用需求,是大数据新技术开发的源泉。

大数据论文总结

大数据论文总结

大数据论文总结引言随着信息技术的迅速发展,大数据已经成为当今社会的热门话题。

大数据的涌现和应用给各行各业带来了巨大的挑战和机遇。

本文对几篇关于大数据的论文进行了分析和总结,并就这些论文中的重要观点和研究成果进行了概述和评价。

论文一:《大数据在金融行业的应用及挑战》本文着重研究了大数据在金融行业的应用和相关挑战。

作者认为,大数据分析可以帮助金融机构更好地了解客户需求、监控交易风险、优化营销策略等。

然而,与此同时,大数据引入也会面临一些挑战,如数据安全和隐私保护、技术和计算能力的要求等。

该论文对这些挑战进行了详细的分析,并提出了解决方案。

论文二:《基于大数据的智能交通管理研究》该论文讨论了大数据在智能交通管理领域的应用。

作者指出,通过对交通数据的收集、分析和挖掘,可以更好地进行交通流量预测、交通拥堵分析、交通事故预测等。

论文还探讨了大数据在交通管理中的一些挑战,如数据的获取和处理、算法和模型的选择等。

最后,作者提出了一种基于大数据的智能交通管理框架,并通过实验证明了其有效性。

论文三:《大数据在医疗领域的应用与未来发展》这篇论文研究了大数据在医疗领域的应用和未来发展。

作者认为,大数据分析可以帮助医疗机构进行疾病预测、个性化治疗、医疗管理等工作。

文章还讨论了大数据在医疗领域面临的一些挑战,如数据隐私和安全、法律和伦理问题等。

为解决这些问题,作者提出了加强数据保护和隐私保护、建立相应的法律和政策等建议。

论文四:《大数据在教育领域的应用与发展趋势》该论文分析了大数据在教育领域的应用和发展趋势。

作者提出,通过对学生学习情况、教学资源等数据的分析,可以更好地进行个性化教育、课程推荐等工作。

论文还探讨了大数据在教育领域中的一些挑战,如数据源的多样性、数据质量等。

同时,作者也提出了如何利用大数据提升教育质量和推动教育改革的建议。

结论综上所述,大数据在各个领域的应用和挑战如今已经引起了广泛的关注。

虽然大数据的引入给各行各业带来了很多机遇,但同时也面临一些挑战,如数据隐私和安全、算法和模型的选择等。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据论文的出现与发展作者:屈宝强王凯来源:《图书与情报》2015年第05期编者按:信息技术的快速发展和智能移动终端的普及应用催生了数据的指数级增长和多重化应用,使得数据已成为人们生活、工作、学习的重要组成部分,人类进入到了一个“数据为王”的大数据时代。

大数据时代的到来改变了人类生产和社会生活的诸多方面,也促成了数据密集型科学发现即科学研究第四范式的诞生,数据特别是科学数据科学已成为主要研究对象,因而对数据的共享需求日趋强烈。

在这种背景下,数据论文(data paper)、数据期刊(data journal)、数据出版(date publication)应运而生,并迅速受到了业界的关注与兴趣,如自然出版集团( Nature Publishing Group)于2014年5月推出了旨在帮助科研人员发布、发现和重用研究数据的开源数据期刊《科学数据》(Scientific Data)。

国内近一年来虽也有一些图书馆界、期刊界学者的研究成果,但总体而言研究还处于起步阶段,对其的概念与发展、管理政策与所带来的影响等还处于国外实践的介绍与交流探讨阶段。

为了对这一影响到未来学术出版与知识传播,乃至图书馆等信息服务机构业务转型发展的数据出版实践进行较为全面的介绍和研究,本刊特组织策划了这组“数据论文与数据出版”稿件,就业界较为关注的数据论文的诞生与发展、学术期刊的数据管理政策、劫持性期刊现象、数据出版环境下的信息交流与图书馆等主题进行了探讨,以期能为这一方富有实践发展和学术研究空间的沃土添水施肥,进而推动我国学术期刊数据出版的实践与研究发展。

摘要:数据论文是一种新型的学术出版物形式,它通过描述创建和处理数据方法的细节、数据的结构和格式、数据再利用的潜力等内容促进数据开发和利用。

文章对数据论文的概念内涵、基本特征、表现形式、主要内容以及出版流程等进行了介绍,以期推动我国数据论文出版的发展。

关键词:数据共享;数据论文;数据出版;数据期刊中图分类号: G237.9;G255.7 ;文献标识码: A ; DOI: 10.11968/tsyqb.1003-6938.2015099 Emergence and Development of the Data PaperAbstract Data paper is a new type of academic publication, which promotes the development and utilization of the data set by describing the details of creating and processing the data set, the structure and format of the data set, and the potential of using it. The paper introduces the concept,basic characteristics, forms of expression, main contents and publishing process of the data paper. The author expects to give some advice of development of data publication in our countries.Key words data sharing; data paper; data publication; data journal1 引言在数据密集型研究的“e-science”时代,科学家开展科学研究依赖于从实验、数据模拟和观测等手段获得的数据(集)。

在现代复杂科研环境下,单个科学家很难在兼顾科学研究的同时完成科学数据的采集、处理、加工、分析等全部工作,数据共享成为利用他人科学数据的重要手段,自20世纪80年代以来就一直是学术界讨论的热点话题[1-5]。

为使得科学研究过程可以重现,同时保护数据工作者的知识产权,可将数据以特定的形式“出版”,出版商支持数据出版的早期尝试包括:(a)数据作为文章的一个组成部分;(b)数据作为补充文件附在论文之后。

到2009年左右,大多数期刊接受数据(以及其他材料)作为补充文件,与研究文章的在线版本一同“发表”,但经常限制文件的规模和数量[6]。

这种出版模式的缺点是,出版商需要管理和保存这些文档,读者难以独立于主要出版物查找和链接数据。

但是Rees[7]指出,即使数据已被链接到一个同行评论文章,它仍然应该自由出版,从而表明“材料和方法”而不是使用数据产生的结论。

而且如果数据由不撰写学术论文的人员使用,这个数据则无法表现为传统期刊文章的补充,更需要作为有各种权利的出版物来描述数据。

在这种要求下,基于“数据论文(data paper)”概念的新数据出版模式开始被普遍认可[8-9],出现了同时发表学术论文和数据论文的重叠期刊(overlay journal)[10]、纯数据期刊(pure data journal)[10]等新的出版物形式,生物信息学、生态学、海洋、环境、医学等各个领域都出现了大量的数据期刊。

2014年5月,自然出版集团宣布推出出版有科学价值数据的开放存取期刊《科学数据》[12],将数据出版的研究和实践推向高潮。

在当前数据论文数量不断增长的情况下,本文对数据论文的概念内涵、基本特征以及出版流程等进行介绍,以期推动我国数据论文出版的发展。

2 数据论文及其特征2.1 概念与内涵数据论文是以标准的学术形式出版、可被查询的学术出版物,描述关于一个或一组数据的元数据文档。

“数据论文”对数据采集过程中数据收集、处理、内容、使用软件、文件格式等进行详细的描述,类似于传统研究文章中的“方法Methods”部分,但不提供任何分析,也没有新的结论产生,其内容只和数据有关,可以在数据制作完成后迅速发表[9,13-15]。

数据论文可以在传统学术期刊上与学术论文一起混合出版,也可以在专门数据期刊出版,其主要目的是描述数据,而不是研究 [9],不同的期刊用不同的方法实现数据论文的管理。

数据期刊发表数据论文,数据论文为该期刊关注的主要对象,数据被视为次要的对象,可由杂志社进行编辑或管理,但更多地是由专业的第三方数据仓储管理。

数据论文要求至少有两类具体的、可识别的信息对象:数据(数据论文的对象)和数据处理信息(描述数据产生的过程)。

数据论文与传统期刊文章相同,可以包括标题、作者、摘要、章节、和参考文献等内容。

无论是数据论文,还是数据都与其信息对象(元数据)相关联[16]。

可以说,数据论文已经存在相当长时间。

例如,美国物理学会杂志《The Journal of Physical and Chemical Reference Data》从20世纪70年代早期就开始描述物理和化学材料的一般特性,目前仍在出版。

美国生态学会2000年在《Ecological Archives》开始发表数据论文,地球系统科学数据《Earth System Science Data》[17],CMB数据论文《CMB data papers》[18],《BMC Data Notes》[19]和国际机器人研究《International Journal of Robotics Research》杂志[15]都有一些零星数据论文出版,这是一种新的出版形式,数据是开放获取的,可以阅读数据描述文件然后下载数据。

然而,从丰富的科学数据元数据生成数据论文手稿的机制以及相关工具还远远没有形成主流。

最近几年,出版商、期刊、科研基金资助机构等支持推广数据论文。

例如欧盟资助的项目ViBRANT(Virtual Biodiversity Research and Access Network for Taxonomy)和BioFresh(a program to support freshwater biodiversity)积极参与数据论文推广,还建立下一代生物多样性数据杂志《Biodiversity Data Journal》。

哥伦比亚的亚力山大洪堡特生物资源研究所(Colombia’s Alexander von Humboldt Biological Resources and Research Institute)也致力于出版数据论文[20]。

2014年5月,自然出版集团宣布推出出版有科学价值数据的开放存取期刊《科学数据》[21],将数据出版的研究和实践推向高潮。

数据论文中描述的数据大多存储在数据仓储或数据中心,如DAACs、Dryad、PANGAEA,通常被视为发表文章的次要部分或补充,数据论文的一个重要特点是,应该和他们所描述的数据相关联,而这个链接(例如URL,DOI)应该在发表的数据论文中公布以便读者可以发现和查找数据。

同样,存储该数据的数据仓储中的科学数据元数据也应包括这些内容。

2.2 特点数据论文和学术论文都可以视为科研成果出版的形式,与传统学术论文相比,数据论文存在以下特点:(1)数据论文包括利用所描述数据产品的相关信息(技术、公式、软件等等),它为传统期刊论文定义了使用数据的方法。

和传统期刊论文不一样,数据论文不包括结论,与学术论文隔离,可以作为学术论文的补充[22]。

(2)数据论文需要通过永久的超链接或数据标识体系连接到数据[8],在此过程中,数据仓储、机构知识库等数据存储机构承担了唯一标识(例如DOI)的创建和管理方面的工作。

(3)数据论文像期刊论文一样需要进行同行审查,而其描述的数据可以被同行审查或非同行审查,但必须声明这一状况。

如果进行数据的同行审查,必须详细描述该过程。

数据论文描述的数据可以在其进行同行审查之前或者同行审查完成之前就发布,因为对于科学数据来讲,只有发布后被广泛使用和注释才会更清晰地体现其价值。

从这点来讲,传统的预印本论文与数据论文有相似之处。

(4)为了更好地利用科学数据,可以在不影响数据完整性、准确性的情况下校正,但需要明确数据版本,需要清楚地在数据论文中说明修正后相应的数据版本,以便发现这样的数据[23]。

(5)同学术论文一样,数据论文也会受物理页码和格式限制。

同时,其描述的数据会有物理存储器大小的限制,获取数据时有特定硬件或软件方面的限制。

(6)数据论文不需要包含所有的数据描述,除论文内容之外的数据描述信息和处理信息分布在多个数据档案中心,可以通过引用或关联指向更详细的描述。

因此在撰写数据论文时,需要把与数据相关但是与数据查找和发现无关的内容区分出来,一般数据论文不需要这部分内容。

(7)经过同行审查的数据论文可以形成新的出版类型,从期刊的期(issue,连续的或不连续的)到编辑成卷(volume)。

相关文档
最新文档