科学数据共享关键问题探索

合集下载

探索不同性质图书馆之间资源共享存在的问题和对策

探索不同性质图书馆之间资源共享存在的问题和对策

探索不同性质图书馆之间资源共享存在的问题和对策摘要:为了探索不同性质图书馆之间资源共享的可能性和存在的问题以及找出对策,下面我们以公共图书馆和学校图书馆为例。

学校图书馆是教育发展的重要内容,是教师能力提升和学生课外阅读、知识积累的重要场所。

而当前我国多数区县级学校图书馆资源比较缺乏、投入不足、馆藏体系难以健全的现实,严重制约了学校教学工作的开展。

而地方公共图书馆作为国家重要的文化工程推进项目和免费开放资金的实施,近年来取得了巨大的发展,藏书体系日异丰富、完善。

资源共享成为新时期图书馆发展的必然,而加强不同类型图书馆的合作和资源共享是现代图书馆发展方向。

因此,文章就公共图书馆与学校图书馆实现资源共享的意义、存在的问题和解决的办法进行了探究,走出图书馆发展的一条新路。

促进不同类型图书馆之间合作,实现图书资源优化配置,是各级公共图书馆发展的趋势,而与学校校图书馆源整合是文化教育事业发展中的创新举措,是集约文化教育资源,提高文化教育资源利用水平的必然,是图书馆发挥自身优势,服务地方经济文化发展的一个重要途径。

因此,积极探究公共图书馆与学校图书馆资源共享的实现途径和对策,显得十分重要。

一、公共图书馆与学校图书馆实现资源共享的重要意义公共图书馆与学校图书馆资源共享,有利于集约资源,集中力量办好办强教育文化事业。

两种类型图书馆的资源共享,更好地贯彻执行了图书馆法规宣言,提高了建筑资源、文化资源的社会使用效率,扩大了图书馆的辐射范围,壮大了彼此的实力,增强了图书馆服务地方教育的能力,丰富了学生、教师的文化生活,进一步提升了公共图书馆的教育使命,为终身教育和继续教育提供了重要基地,社会效益显著。

二、公共图书馆与学校图书馆共享资源的必要性1.公共图书馆与学校图书馆共享资源共享体制的不足一直以来我国图书馆管理都是以行业属性划分进行分制而管理,虽然从纵向上看存在着隶属关系,但实际上馆与馆之间又各自为政,人才物与资源互不共享,从而造成图书馆资源的闲置和浪费,这就极大的违背了图书馆全面的、持续的、健康的发展要求。

生物信息学研究中常见问题及解决方案探析

生物信息学研究中常见问题及解决方案探析

生物信息学研究中常见问题及解决方案探析生物信息学作为一门融合了生物学、计算机科学和统计学的交叉学科,已经成为许多生命科学研究中不可或缺的一部分。

然而,在进行生物信息学研究时,研究人员经常面临各种各样的问题。

本文将探讨一些生物信息学研究中常见的问题,并提供相应的解决方案。

1. 数据质量问题生物信息学研究的基础是大量的生物数据。

然而,这些数据往往存在质量问题,例如测序错误、基因重复等。

这些问题可能导致研究结果的不准确性。

解决方案:- 数据预处理:在进行研究之前,对数据进行预处理是非常重要的。

这包括去除低质量的序列、纠正错误的测序结果等。

- 数据过滤:可以使用各种统计学方法和算法来过滤掉可能导致偏差和错误的数据。

- 数据校正:识别和校正测序错误可以提高数据的准确性。

校正方法包括错误校正和纠错。

2. 数据整合问题生物信息学研究通常需要整合来自不同来源的数据。

然而,不同来源的数据使用不同的格式和标准,导致数据整合非常具有挑战性。

解决方案:- 标准化:将不同来源的数据转换为统一的格式和标准。

例如,使用公共数据库中的统一标识符对基因和蛋白质进行命名。

- 数据库:使用生物信息学数据库来整合和存储数据。

例如,使用GenBank、UniProt和KEGG等数据库来存储基因和蛋白质序列、注释和路径信息。

- 数据集成工具:使用数据集成工具,如BioMart和Galaxy,可以帮助研究人员整合来自不同来源的数据。

3. 数据分析问题生物信息学研究需要进行各种数据分析,但是常常面临分析复杂、计算资源需求高的问题。

解决方案:- 算法选择:选择适当的算法非常重要。

根据研究问题的特点,选择合适的算法可以提高分析的效果和速度。

- 并行计算:利用并行计算技术可以加速数据分析过程。

例如,使用分布式计算平台,如Hadoop和Spark,可以加速数据处理和分析。

- 云计算:使用云计算平台可以提供弹性计算资源,满足生物信息学研究中的大规模计算需求。

公共数据授权运营:现实困境与纾解路径

公共数据授权运营:现实困境与纾解路径

公共数据授权运营:现实困境与纾解路径1. 公共数据授权运营概述随着信息技术的飞速发展,大数据已经成为了各行各业的重要资源。

公共数据的开放共享对于提高政府决策效率、促进经济发展和创新具有重要意义。

公共数据的开放共享也面临着诸多挑战,如数据安全、隐私保护、合规性等问题。

为了解决这些问题,公共数据授权运营应运而生。

公共数据授权运营是指在确保数据安全、隐私保护和合规性的前提下,通过授权方式实现公共数据的开放共享。

这种模式下,政府部门或企事业单位可以获得对公共数据的访问权限,以便进行数据分析、挖掘和应用。

公共数据授权运营有助于提高公共数据的利用价值,推动政府决策的科学化、民主化和精准化。

公共数据授权运营在实际操作中也面临着一些困境,数据安全问题是公共数据授权运营的核心挑战之一。

如何在保障数据安全的前提下实现数据的高效利用,是一个亟待解决的问题。

隐私保护问题也是公共数据授权运营需要关注的重要方面,如何在尊重个人隐私的前提下实现数据的共享,需要政府部门、企事业单位和社会各界共同努力。

合规性问题也是一个不容忽视的因素,在公共数据授权运营过程中,如何确保各方遵守相关法律法规,防止数据滥用和不当行为,也是需要重点关注的问题。

为了解决这些困境,政府、企事业单位和社会各界需要共同探索适合我国国情的公共数据授权运营纾解路径。

这包括完善相关法律法规体系,建立健全数据安全保护机制,加强数据管理和监督,推动技术创新和人才培养等方面的工作。

才能更好地发挥公共数据的价值,推动经济社会的可持续发展。

1.1 公共数据的定义与特点公共性:公共数据的来源是政府、企事业单位或其他组织,因此它们具有公共性质,可以被公众免费获取和使用。

开放性:公共数据的发布和传播应当遵循公开、透明的原则,以便公众能够充分了解和利用这些数据。

共享性:公共数据的使用者可以在遵守相关法律法规的前提下,将这些数据用于其他目的,如研究、创新等。

可比性:公共数据应当具有一定的质量和规范性,以便于不同部门、机构和个人之间进行有效的数据比较和分析。

试论财务共享中心存在的问题及运营建议

试论财务共享中心存在的问题及运营建议

试论财务共享中心存在的问题及运营建议摘要:尽管财务共享的未来一片美好,但美好的未来也面临着诸多的困难,大多数的公司都还在摸索之中,我国大多数的集团公司都没有充分地认识到这一点,所以这种模式的应用还处在一个比较低的水平。

本文试图通过对财务共享服务中心存在的运营问题进行归纳,并提出了相关的运营建议,希望能对我国公司在同类运营中有所帮助和借鉴。

关键词:财务共享中心;存在问题;运营建议1.财务共享的理论概述按照标准和正确的准则来执行财务工作,才能对工作人员的绩效做出一个科学的评价。

技术系统还可以使相关的流程标准化,提高内部控制的效率,优化资源配置。

在分享的同时,搭建一个沟通的平台,将各环节的财务资料汇集到一起,构成一个版本,为会计标准化处理和对比分析奠定了信息基础,所以,通过财务流程的统一,提高了财务处理效率,增强了可比性,节省了成本和相关费用,为财务数据及绩效考核的时候,提供了标准。

1.1规模经济理论所谓规模经济理论,就是企业在扩大经营范围后,形成了一定的规模,与此同时,企业的产品也会由于产量的增加,单位成本的下降,从而使企业的利润水平有所提高。

目前,公司业务已逐步扩展,业务范围已逐步向多元化发展。

大批量生产的实现,需要有一个合理的专业分工。

因此,规模经济的出现,为进一步深化劳动分工,提供了有利的条件。

1.2组织扁平化理论组织扁平化理论主要是指:公司的治理体系一般分为上,中,下三个层次,根据这个理论,中间管理层适度精简,可以使公司的决策权向下延伸,从而提高公司的效率。

在公司的规模不断增大的时候,传统的管理观念会增加公司的管理层次和人数。

由于财务职能部门的层次过多,决策机制过于僵硬,导致了纵向管理对企业的发展造成了负面的影响,例如,信息的传递速度较慢,不准确,并且会增加企业的有关成本。

所以,采取扁平化的模式,可以很好地解决以上问题,从而降低了行政审批的层级,精简了冗余的机构,减少了工作人员,使管理的节奏更加紧凑。

区块链技术在数据共享中的应用研究

区块链技术在数据共享中的应用研究

区块链技术在数据共享中的应用研究随着信息技术的快速发展,数据已成为经济社会发展的关键要素之一。

大数据时代的到来,促进了数据的产生、采集和存储,但数据管理及共享却面临着诸多挑战。

传统的数据管理和共享方式存在着数据安全、数据完整性、数据隐私和数据价值等问题。

区块链技术的出现为解决这些问题提供了新的思路。

一、区块链技术的基础原理区块链技术是一种基于密码学和去中心化设计的分布式数据库技术。

它将数据分割成若干个区块,每个区块包含了前一个区块的哈希值和当前的数据信息,不可被篡改。

所有参与者都可以参与区块链系统的网络,任何人都能够访问和验证区块链的内容。

由于数据和操作记录保存在多个节点上,不依赖于中心化的管理机构来维护,所以区块链技术具有去中心化、安全可靠、高可用性等特点。

二、区块链技术在数据共享中的应用场景1、金融领域:区块链技术可以用于实现资产证券化、信用证流转、汇款结算等金融业务,提高金融业务的效率和安全性。

2、供应链管理:区块链技术能够实现供应链的信息共享、物流跟踪、质量溯源等功能,提高供应链管理的透明度和信任度。

3、物联网:区块链技术可以用于实现物联网设备的身份标识、数据交换、智能合约等功能,增强物联网的安全性和数据隐私保护。

三、区块链技术在数据共享中的应用优势1、去中心化:区块链技术的去中心化设计使得数据可以在多个节点间互相传递,不依赖于中心化机构,从而提高了数据共享的效率和可靠性。

2、安全可靠:区块链技术确保数据不可篡改,分散存储在多个节点上,防止数据被攻击和篡改,提高数据安全性和完整性。

3、数据隐私保护:区块链技术可以实现基于身份的访问控制和数据删除,保护用户数据隐私,减少个人信息泄露的风险。

四、区块链技术在数据共享中的挑战和未来发展1、技术性挑战:目前区块链技术仍存在着性能瓶颈、扩展性问题、隐私保护等技术方面的挑战。

2、法律和监管问题: 由于区块链技术的去中心化和匿名特性,存在着一些法律和监管方面的问题。

测绘数据的管理与共享方法与技巧

测绘数据的管理与共享方法与技巧

测绘数据的管理与共享方法与技巧导言测绘数据是一种重要的地理信息资源,它对于城市规划、土地管理、资源开发以及环境保护等方面具有重要的应用价值。

然而,测绘数据的管理和共享一直是一个难题,如何高效、科学地管理和共享测绘数据是当前需要解决的关键问题。

本文将介绍一些测绘数据的管理与共享方法与技巧,旨在为相关人士提供一些参考。

一、测绘数据的管理方法1. 建立完善的数据管理体系为了高效地管理测绘数据,需要建立一个完善的数据管理体系。

首先,需要明确数据的分类和归档方式,将测绘数据按照不同的特征和用途进行分类存储,例如按照地理位置、数据类型、时间等进行分类。

其次,应建立数据的元数据管理系统,包括对数据来源、数据质量、数据更新等信息进行标注和记录。

最后,应确立数据的安全保密机制,确保敏感数据的保护。

2. 制定科学合理的数据采集规范数据采集是获取测绘数据的重要环节,需要制定科学合理的数据采集规范。

首先,对采集的数据类型和要求进行明确,明确需要采集的数据属性,以及采集的精度要求。

其次,确定采集的方法和设备,选择适合的测量仪器和技术手段。

最后,制定数据采集的流程和操作规范,确保采集的数据准确性和一致性。

3. 建立数据质量控制体系数据的质量是判断数据价值的重要因素,建立数据质量控制体系可以有效提高测绘数据的质量。

首先,建立数据质量评估标准,包括数据精度、一致性和完整性等方面的评估标准。

其次,进行数据质量检测和验证,及时发现和纠正数据错误和不一致现象。

最后,建立数据质量监控机制,监测数据的质量变化和趋势,进行及时的调整和优化。

二、测绘数据的共享方法1. 建立数据共享平台数据共享平台是实现测绘数据共享的重要手段,可以将测绘数据统一管理并提供给需要的用户。

建立数据共享平台的首要任务是确立数据共享的标准和规范,包括数据格式、数据交换协议等方面的规范。

其次,提供数据检索和下载功能,用户可以根据自己的需求搜索和获取所需的测绘数据。

最后,确保平台的安全性和可靠性,保护数据的安全和隐私。

如何应对多机协同工作的关键问题

如何应对多机协同工作的关键问题

如何应对多机协同工作的关键问题随着科技的不断发展,多机协同工作已经成为了现代工作方式中必不可少的一种。

然而,随之而来的是一系列的问题,需要我们不断探索和解决。

在本文中,我将会阐述如何应对多机协同工作的关键问题。

一、沟通和协作首先,多机协同工作最大的挑战就是沟通和协作。

在团队合作中,沟通和协作的成败直接影响了团队的效率和工作成果。

对于多机协同工作而言,这一点尤为重要。

为了有效地沟通和协作,我们可以运用一些工具和技巧。

例如,可以使用在线会议工具,如Zoom、微软Teams等,实现远程视频会议,让人们能够面对面地交流。

此外,还可以使用在线沟通工具,如Slack、WeChat等,用于日常的信息交流和沟通。

最后,为了确保所有人都能理解和掌握团队的目标和任务,可以编写详细的工作计划和进度表,并进行定期的汇报和更新。

二、数据共享和信息安全另外一个关键问题是数据共享和信息安全。

在多机协同工作中,团队成员需要共享大量的数据和文件,这就需要一个可靠的数据共享平台。

然而,数据的共享不仅仅是方便和高效,同时也增加了数据泄露和信息安全的风险。

为了保证数据的安全性,我们需要采取一些措施,如加密数据、限制数据访问权限、备份数据等。

此外,数据共享平台也需要定期更新和维护,以确保其能够抵御黑客攻击和病毒入侵。

三、时间管理和任务分配最后一个关键问题是时间管理和任务分配。

在多机协同工作中,团队成员通常都有不同的工作时间和工作地点,这就需要更加灵活和高效的时间管理和任务分配。

为了更好地管理时间,我们可以使用一些时间管理软件,如Trello、Asana等。

这些软件可以帮助我们更好地安排任务、统计时间、并进行任务分配。

同时,为了避免任务重复或者遗漏,我们还需要确立具体的工作流程和分工,从而确保团队成员都能有清晰的任务分配和角色定位。

综上所述,多机协同工作虽然带来了高效和灵活的工作方式,但是也有着一系列的挑战和问题。

针对这些问题,我们需要采取一系列的工具和技巧,如沟通和协作、数据共享和信息安全、以及时间管理和任务分配,从而最大化地提高工作效率和工作成果。

基于差分隐私的数据共享与隐私保护技术研究

基于差分隐私的数据共享与隐私保护技术研究

基于差分隐私的数据共享与隐私保护技术研究数据共享与隐私保护是当今科技与社会发展中的重要课题之一。

随着互联网技术的迅速发展和数据规模的爆炸性增长,个人隐私泄露的风险也日益增高。

同时,数据共享对于创新、科学研究和社会决策等方面具有重要意义。

为了在实现数据共享的同时保护个人隐私,差分隐私成为了一种被广泛研究和应用的隐私保护技术。

差分隐私的基本概念是通过添加噪音来保护个体的隐私。

简单来说,差分隐私是一种能够保证在查询数据时不会泄露个体身份信息的隐私保护技术。

差分隐私通过引入随机噪音,使得攻击者无法准确推断出某个个体的真实数据。

在具体应用中,差分隐私可以在数据发布、数据挖掘和机器学习等场景中起到有效的隐私保护作用。

差分隐私的研究与应用主要集中在下面几个方面。

首先,基于差分隐私的数据发布技术。

数据发布是指将原始数据进行处理后的共享,以支持数据分析和应用开发。

传统的数据发布方式,往往会涉及到隐私信息的泄露风险。

而差分隐私可以通过在发布的数据中加入噪音,使得攻击者无法推断出个体的真实数据,从而保护数据共享中的隐私。

其次,基于差分隐私的数据挖掘和分析技术。

数据挖掘和分析是在大规模数据集中发现规律、模式和关联性的过程。

然而,在进行数据挖掘和分析时,往往涉及到个体隐私信息的暴露。

差分隐私可以通过在查询的结果中添加随机噪音,确保个体隐私得到保护的同时,仍能提供有意义的数据分析结果。

同时,基于差分隐私的机器学习算法研究也备受关注。

机器学习算法使用大量数据进行训练,并通过学习得到模型,以应用于未知数据的预测或分类。

然而,传统的机器学习算法在数据共享时存在隐私泄露的风险。

基于差分隐私的机器学习算法能够在保护个体隐私的同时,有效地学习和更新模型。

此外,差分隐私的隐私预算分配和隐私度量也是相关研究的重要内容。

隐私预算分配是指在差分隐私机制中确定可接受的隐私泄露风险的值,并根据风险水平来安排隐私保护措施。

隐私度量则用于评估差分隐私机制的隐私保护效果,以衡量隐私泄露的可能性和程度。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第26卷第5期2007年9月地理科学进展PROGRESSINGEOGRAPHYVol.26,No.5Sept.,2007收稿日期:2007-06;修订日期:2007-07.基金项目:国家科技基础条件平台,地球系统科学数据共享网(2006DKA32300)。

作者简介:刘润达,男(1980-),河南许昌人,博士生。

研究方向:科学数据共享,网络信息资源整合技术等。

科学数据共享关键问题探索———以地球系统科学数据共享网为例刘润达1,2,诸云强1(1.中国科学院地理科学与资源研究所,北京100101;2.中国科学院研究生院,北京100039)摘要:作为科学基础设施,科学数据共享平台建设可促进科技原始性创新,提高国家科技竞争能力。

本文回顾我国近年推动科学数据共享方面的工作,指出科学数据共享实施过程中所遇到的主要问题;针对这些问题,在共享理念、数据资源整合和平台建设三个方面探索科学数据共享今后发展的重点和工作方法。

具体结合地球系统科学数据共享网建设实践,提出搭建科学数据交换平台,构建科学数据共享联盟;将科学数据共享与科研项目相结合,实行主动服务;建立强大的科学数据搜索引擎;重视文档、信息服务等。

关键词:数据共享;科学数据;数据联盟;数据中介1引言科学数据作为现代科学可持续发展的重要资源,与科技创新是密不可分的[1]。

为促进科学数据资源的共享和交换,许多发达国家和国际组织都开展了一系列的基于计算机网络的科学数据共享的研究和实践,目的是将长期积累的科学数据为本国以及全球的可持续发展等研究提供数据支撑服务。

例如世界数据中心(WDC,WorldDataCenter)等国际组织的成立,在世界范围内进行科学数据共享的工作[2,3];美国及欧洲的一些发达国家建立了国家级科学数据中心群和数据共享服务网络[4 ̄6],如NASA主持的DAACs,全球变化数据和信息系统,全球变化主目录(GCMD)等。

我国自上世纪80年代起就开始在多个层面上推动科学数据的共享。

1982年,中国科学院提出了“科学数据库及其信息系统”建设项目,经过20多年的发展已经成为综合性的科学信息服务系统;1989年,中国科学院联合有关部门和科研机构,组建了世界数据中心中国中心(WDC-D)和国际科技数据委员会中国委员会;1999年,科技部在科技基础性工作专项中陆续启动了一批数据资源建设,同时还就数据共享中的若干技术问题委托WDC-D开展研究;2001年,科技部主持完成了《实施科学数据共享工程,增强国家科技创新能力》的调研报告,对我国目前科学数据共享存在的主要问题和可能解决的办法等一系列问题进行了详细的调查研究。

同年年底,科技部和中国气象局联合召开新闻发布会,宣布气象数据共享试点正式启动,从而在国家层面上,翻开了我国科学数据共享新的一页;2002年6月,科技部向国务院提出了关于启动科技基础条件平台建设的建议,把建立科1195期刘润达等:科学数据共享关键问题探索———以地球系统科学数据共享网为例学数据共享机制作为增强原始性创新能力的重要环节;2003年,科学数据共享工程3个数据网(可持续发展科学数据共享网、地球系统科学数据共享网、医药卫生科学数据共享网)和6个数据中心(气象科学数据中心、测绘科学数据中心、林业科学数据中心、地震科学数据中心、水文水资源科学数据中心、农业科学数据中心)试点工作全面启动[7]。

经过20年共享活动的开展,我国整个科学数据共享工作取得了一系列的成果:科学数据共享理念逐渐普及,人们已经意识到科学数据共享的深远意义及其重要性;整合集成了一批分散的数据资源,特别是抢救了一批珍贵的数据资源;为国家重大战略需求、科研计划、高等教育和生产应用提供了很好的数据支撑等。

然而,与发达国家相比,我国科学数据共享仍然处在较低的发展阶段,还普遍存在一些突出问题:1)共享理念还不普及:目前我国的科学数据共享主要是政府行为,大部分的数据共享活动是通过政府投资、项目驱动的形式进行,经常出现科学家“各自为战”,科学研究项目“各项目组为战”的情况[8]。

对于数据共享的重要性认识不充分,主动汇交共享科学数据的研究单位和个人还比较少。

2)共享机制不健全:虽然目前有些行业和部门已经出台有关数据共享的政策和条例,鼓励和推动行业或部门数据的共享。

然而,这些政策和条例都有这样或那样的限制,很多数据库只能限于部门和行业内部使用。

同时,国家层面完善的共享机制并未形成。

到目前为此,尚未形成完全开放的数据共享局面。

3)共享平台和技术规范发展慢:数据共享的技术标准与国外主流平台兼容性差,数据交换和汇交存在障碍;平台功能与用户群体需求不匹配,造成一些亟需的科学数据资源依然不能依赖互联网方便获取。

4)数据共享服务效果不明显:长期以来各单位数据资源本身并不规范,短时间内对汇交的数据进行规范化整合很困难,出现元数据或原始数据很多,真正有价值、高质量的能为用户直接使用的数据产品并不多。

另外,由于缺乏配套的数据使用文档、数据来源及处理说明,用户很难放心地去使用这些数据。

因此,从总体上看,数据共享服务效果并不明显。

科学数据共享作为国家的科学基础设施,其发展不是一项短期行为,其目标应该是实现科学数据资源的开放与共用[9],需要科学界广大工作者长时间共同努力才能实现。

本文针对当前科学数据共享中存在的问题,结合地球系统科学数据共享网*(以下简称共享网)五年的建设实践,深入剖析和探索我国当前科学数据共享网和科学数据中心所要关注的问题。

2科学数据共享理念2.1倡导共建、共享,构建科学数据共享联盟据了解,目前许多国家都是在以政府行为来推动数据和信息的共享[10],然而政府单方面的力量毕竟有限,开放和共用的数据共享环境需要研究院所、高等院校、企业、科学界的共同主动参与;另一方面,以数据信息为基础的经济、社会、科学发展中,没有哪一个部门能够拥有科研活动需要的所有数据产品;因此,实践中,只有联合开发,联网发布,构建科学数据共享联盟,才能提升数据的价值,创造更多的财富。

*www.geodata.cn120地理科学进展26卷以地学领域的科学数据共享为例,近年来,对地球系统的整体性研究已经成为人类社会可持续发展的科学支柱[11]。

然而,对数据资源使用情况的调查发现,地球系统是一个巨系统,地学数据具有分散性和异构性的特点,研究人员在对它的研究过程中往往需要来自多家数据生产部门的不同区域、不同时期、不同尺度、不同学科的数据资源。

仅仅依靠一个数据中心、机构掌握的数据资源很难满足研究人员的需求。

因此,地球系统科学数据共享网在实践过程中,不是只靠一家单位或机构的力量来进行数据资源建设,而是倡导共建、共享,构建科学数据共享联盟的理念。

通过这一理念,联合全国各个数据资源生产、存档、管理机构共同参与科学数据共享网的建设;引导数据集的生产者和使用者加入到共享实践当中。

实际操作中,我们通过下面的两种方式进行*(图1):1)构建了以中科院地球系统领域的科研院所、长期野外监测台站、世界数据中心为核心的数据资源保障体系;2)联盟国内高等院校、部门科研单位、国际机构以及科学家,形成一个庞大的数据资源支撑网络。

通过一系列的努力,到2007年已经有35家单位作为数据资源提供点或分中心的角色加入共享网,其中科研院所16家,高等院校8个,其他11个。

一个以地球系统科学数据共享网项目为核心的地球系统科学数据共享联盟初步形成。

在数据联盟内,采用统一的技术标准与软件,开发的平台软件已经在加盟单位部署并运行,实现了数据的发布、实时收割与一站式数据共享服务。

图1地球系统科学数据共享网数据资源保障体系Fig.1Theorganizationstructureforcollectingdataresources科学数据共享联盟不仅仅是数据中心以及数据拥有机构的联盟,更是科研人员的联盟。

如何在联盟内部最大限度地调动科研人员的积极性,挖掘、整合、集成分散异构的数据资源,为我国科学研究人员提供优质的数据共享服务,应当是我国科学数据共享致力探索、研究的一个问题。

*诸云强.地球系统科学数据.中国科学院地理科学与资源研究所,2007.1215期刘润达等:科学数据共享关键问题探索———以地球系统科学数据共享网为例2.2主动服务,逐步吸纳科研项目参与数据共享科学数据共享联盟可以扩展科学数据共享的数据来源,然而,联盟内部的大部分数据中心或数据资源点来自科研院所和高等院校,完全不同于行业部门的数据共享平台。

因此,科学数据共享的建设和发展必须开辟新的数据资源整合和共享服务途径。

其中一个值得考虑的做法是通过主动服务来逐步吸纳科研项目参与数据共享。

任何花费大量资金对我们的地球进行信息采集的科研计划都不能认为是成功的[12]。

对于国家级的科研项目来说,如果最后没有对产生的数据进行有效的管理,将是一种很大的浪费,而科学数据中心或共享平台的数据来源和流向往往与具体的科研计划有着一定的关系,因此除了进行联盟共建以外,可以在数据资源整合和汇交策略上将从国家重大科研项目中获取数据资源作为一个重要的途径。

通过架起数据和数据活动参与者之间的桥梁,主动与科研人员接触,了解他们的需求,并提供数据集产品,而用户在获利以后也会主动的将自己的数据提交共享。

通过互动的方式逐步吸纳用户参与数据共享活动中来,由此建立一种良性循环机制,使得数据共享工作不断深入。

地球系统科学数据共享网在实践中,一方面,积极和当前地学领域内的科研项目联络,为他们提供数据资源的收集、处理服务,通过主动服务来推进科学数据共享的深入。

另一方面,共享网希望数据的汇交成为科学研究的一部分,科学研究项目所产生的数据都能放到共享网来提供共享。

在以往的实践中,共享网和科学研究项目的具体承担人员进行交流和合作,为他们提供科学研究所需要的数据资源,同时项目承担单位和个人也将他们的研究成果和数据提供给共享网,从而达到一个共赢的效果。

这种通过主动服务实现科研与数据生产工作相结合的方法,是科学数据共享网与一般的数据共享网络的一个很大的不同点。

在这一环节中,国家应当采取一定的措施,例如,设置科学数据汇交制度,规定凡是国家经费资助的科研项目,项目所产生的数据必须集中提交到指定的科学数据中心。

另外,共享网与数据提交方必须要相互信任,共享网必须确保数据产权人的知识产权和利益,同时项目主持人和数据提交者必须保证所提交数据的完整性和可用性。

这一切都需要通过一些指导条例和数据政策来进行保障。

通过主动为科研项目提供数据源并同时将项目产生的数据资源纳入共享网中是地球系统科学数据共享网在共享理念上的又一大突破和长期可持续发展的根本。

3数据资源建设关键问题3.1发挥数据交换平台的作用,拓展数据资源数据资源建设是一个数据中心或数据共享网络最根本的问题,整合数据资源是科学数据共享平台的一项基本任务。

相关文档
最新文档