美国政府大数据的研究和发展计划(中文译版)

美国政府大数据的研究和发展计划(中文译版)
美国政府大数据的研究和发展计划(中文译版)

美国政府大数据计划的中文译稿

奥巴马政府宣布“大数据的研究和发展计划。”通过提高我们从大型复杂的数字数据集中提取知识和观点的能力,承诺帮助加快在科学与工程中的步伐,加强国家安全,并改变教学研究。

这个计划里,六个联邦政府的部门和机构宣布新的2亿美元的投资,提高从大量数字数据中访问、组织、收集发现信息的工具和技术水平。了解更多正在进行的联邦政府的计划,解决所大数据所带来的机遇和挑战,可通过大数据表来了解大数据革命。

我们还计划与工业界、大学研究界、非营利性机构与管理者一起利用大数据所创造的机会。显然,不能单单依靠政府,需要我们总统所呼吁的“众人拾柴火焰高”这样的努力。

一些相关的公司已经赞助大数据相关的比赛,并给大学提供这方面的研究资助。大学里也开始开设一门全新的研究型课程,培养下一代的“数据科学家”。一些无国界的组织帮助非营利性机构对公益性服务的数据进行采取、分析和可视化处理。白宫科技政策办公室将会非常有兴趣支持建立一个跟大数据相关论坛,包括最新的公私组织之间的合作。

美国政府的大数据计划

亮点:为应对大数据革命带来的机遇,联邦政府制定计划,推进相关研究机构进一步进行科学发现和创新研究。

国防部高级研究计划局(DARPA)

多尺度异常检测(ADAMS)项目解决大规模数据集的异常检测和特征化。项目中对异常数据的检测指对现实世界环境中各种可操作的信息数据及线索的收集。最初的ADAMS应用程序进行内部威胁检测,在日常网络活动环境中,检测单独的异常行动。

网络内部威胁(CINDER)计划,旨在开发新的方法来检测军事计算机网络与网络间谍活动。作为一种揭露隐藏操作的手段,CINDER将适用于将对不同类型对手的活动统一成“规范”的内部网络活动,并旨在提高对网络威胁检测的准确性、和速度。

Insight计划主要解决目前情报,监视和侦察系统的不足,进行自动化和人机集成推理,使得能够提前对时间敏感的更大潜在威胁进行分析。该计划旨在开发出资源管理系统,通过分析图像和非图像的传感器信

息和其他来源的信息,进行网络威胁的自动识别和非常规的战争行为。

Machine Reading 项目,旨在实现人工智能的应用和发展学习系统的过程中对自然文本进行知识插入,而不是依靠昂贵和费时的知识表示目前的进程,并需要专家和相关知识工程师所给出的语义表示信息。

Mind's Eye 项目,旨在为机器建立视觉的智能。传统的机器视觉研究的对象选取广泛的物体来描述一个场景的属性名词,而Mind's Eye旨在增加在这些场景的动作认识和推理需要的知觉认知基础。总之,这些技术可以建立一个更完整的视觉智能效果。

Mission-oriented Resilient Clouds 项目通过技术进行检测,诊断并对攻击作出响应,有效地建立了“社区卫生服务系统”的云,以解决云计算固有的安全挑战。该方案还旨在开发新技术,使云应用和基础设施受到攻击时能够继续运行。只要整体能够有效的运行和保存,可以允许个别主机和任务损失。

对加密数据的编程计算(PROCEED)的研究工作旨在开发实用的方法,相关现代化计算编程语言,使数据加密时仍然能使用云计算环境,以克服信息安全的重大挑战。使用户能够不需首次解密的情况下能够操纵加密的数据,它将使得对手拦截信息更加困难。

在视频和图像的检索和分析工具(VIRAT)计划旨在开发一个系统能够利用军事图像分析员收集的数据进行大规模的军事图像分析。VIRAT如果成功,将使分析师能够在相关活动发生时建立警报。VIRAT还计划开发工具,能够以更加准确率和召回率的去从大量视频库里进行视频内容的检索。

XDATA项目计划旨在开发用于分析大量的半结构化和非结构化数据的计算技术和软件工具。最核心的挑战是,可伸缩的算法在分布式数据存储应用、如何使人机交互工具能够有效的迅速定制不同的任务,以方便对不同数据进行视觉化处理。对开源软件工具包的灵活使用,使得能够处理大量国防应用中的数据。

国土安全部(DHS)

卓越研究中心和可视化数据分析(CVADA),罗格斯大学和普渡大学(以及另外三个伙伴大学)的研究人员之间进行协作,通过对大量的异构数据进行研究,使得急救员可以发现人为或自然灾害、恐怖事件,需要执法的边境安全问题,网络威胁的爆炸物。

能源部(DOE)科学办公室

高级科学计算研究办公室(ASCR)提供数据管理,可视化和数据分析的社区,包括数字化保存和社区访问。套件程序里包括广泛使用数据管理的技术,如开普勒科学的工作流程系统;存储资源管理标准;各种数据存储管理技术,如BeSTman,大容量数据移动器和适应式的IO系统(ADIOS); FastBit数据索引技术(雅虎

使用)和两个主要的科学可视化工具,ParaView 和VisIt。

高性能存储系统(HPSS)是对磁盘和磁带系统上PB级数据进行管理的数据管理软件。由美国能源部和IBM开发的HPSS在世界各地的大学和实验室的使用,用在数字图书馆,国防应用和包括纳米技术,基因组学,化学,磁共振成像,核物理,计算流体力学,气候在内的一系列学科,以及诺斯罗普·格鲁门公司,美国国家航空航天局(NASA)和美国国会图书馆。

对千万亿次的数据分析处理从庞大的科学数据集提取信息,发现其主要特征,并理解其间的关系。研究领域包括机器学习,数据流的实时分析,非线性随机的数据缩减技术和可扩展的统计分析技术,广泛适应于从能源部到电网,包括宇宙学和天气数据,传感器数据等。

下一代网络方案支持工具,使得合作研究在能够进行重大发现,包括2001年的Globus中间件项目大量数据的移动和使用,2003年的GridFTP的数据传输协议,2007年的地球系统网格(ESG)的工具。今天的GridFTP的服务器开放科学网格,ESG,和生物社区的科学数据每月超过1 PB的移动。Globus中间件也被得克萨斯大学,软件公司,石油公司利用并一起合作,培养学生能够使用先进的石油工程方法和集成的工作流程。

基础能源科学办公室(BES)

BES的科学用户设施支持旨在协助用户数据管理和分析大数据,可每天从一个单一的实验数据大容量化(1012字节)努力。例如,加速数据采集,处理和分析(ADARA)项目解决了数据的散裂中子源(SNS)的数据系统提供实时分析,实验控制的工作流程需要,以及已经建立X射线影像资料库,以最大限度地提高数据的可用性和更有效地利用同步加速器光源。

在2011年10月,由生物工程学会和ASCR的基础能源科学的数据和通信研讨会将确定实验数据的需求,这可能会影响的科学发现。

生物和环境研究计划(BER)大气辐射测量(ARM)气候研究设施是一个多平台的科学用户设施,提供重要的大气现象的精确观测研究,大气过程的认识的进步需要国际社会的基础设施和气候模型。ARM的数据是可以进行应用的,并以其作为文章发表在一个超过100年历史的杂志。正在处理收集和展示的高时间分辨率和光谱信息,从数百文书相关的挑战,以满足用户的需求。

系统生物学知识库(Kbase)是一个社区驱动的软件框架,对微生物,植物和环境条件下的生物群落功能的数据驱动的预测。kbase是一个开放式的设计与开发,以提高算法的开发和部署效率,并增加从异构数据源的实验数据的获取和集成。kbase是不是一个典型的数据库,而是一种手段,以解释缺少的信息成为

实验设计预测工具。

聚变能源科学办公室(FES)

通过FES和高级科学计算研究(ASCR)办公室高级计算合作的(SciDAC)科学发现在在聚变能的科学计算和实验研究大数据存在的挑战。ASCR-FES开发的数据管理技术,包括高性能的输入/输出系统,先进的科学的工作流程和出处框架,可视化技术解决独特的融合需求,已经吸引了欧洲一体化建模的努力和国际热核实验堆,一个国际核核聚变研究和工程项目的关注。

高能物理办公室(HEP)

高能物理计算计划经过了全球数百名科学家的努力,支持大量的分析研究,复杂的实验数据集,以及大量的模拟数据。协作企业进行大数据管理,包括生产和分布式分析PanDA(产品分布式分析)工作量管理系统和XRootD,一种高性能,快速,可扩展访问多种数据存储库的容错软件。

核物理办公室(NP)

美国核数据计划(USNDP)是一个多方面努力,涉及7个国家实验室和两所大学的项目,提供跨越多个领域,核物理,编译和交叉检查,对所有原子核的重要性质的相关实验结果,维护和广泛使用的专用数据库。

科学和技术信息办公室(OSTI)

OSTI,唯一的DataCite美国联邦机构成员(全球领先的财团科学和技术信息的组织)中发挥了关键作用,在塑造实践的政策和技术实现数据的引用,这使得可以跟踪数据的影响,使有效的重用和数据核查和学术结构的表彰和奖励数据生产商可设立。

退伍军人管理部(VA)

医疗保健信息研究所(CHIR)开发自然语言处理(NPL)工具,能够对在VA以文本形式存储的大量数据进行信息解锁。

VA正在努力通过保护作战人员使用文字处理算法捕获公共卫生事件(ProWatch),正在开发一个的生产透明,重复性好,可重复使用的各种安全相关的事件监控软件探测,以研究为基础的监控程序,能够跟踪,测量与军事部署相关的健康条件。

AViVA是VA的下一代就业人力资源系统,将业务应用程序和基于浏览器的用户界面分开的数据库。分析工具已经被建立在此基础上研究,最终决定在对病人进行支持。

医学成果观察项目设计用来比较各种安全监测分析方法的有效性,可行性和性能。

企业数据仓库(CDW)是VA的项目,组织和管理从各种渠道传递的个人和群体的疾病和??治疗的完整视图的数据。

健康资料库是卫生保健提供者的数据格式规范的数据,尤其是VA和国防部之间,让CDW集成的数据。

基因组信息系统综合科学(GenISIS)计划,通过个性化医疗,提高退伍军人的医疗保健。GenISIS通过接触获得电子健康记录和遗传数据,可以跨VA进行的临床试验,基因试验和成果研究的临床研究。

VA的信息和计算基础设施提供的分析大型数据集,现在在VA,促进合作研究,在VA的网络上的任何地方,分析工作区和工具。

卫生和人类服务部(HHS)

疾病控制和预防中心(CDC)

生物传感2.0是第一个考虑到区域和国家协调的情况下,通过互操作的网络系统对公众健康意识的可行性分析的系统,其建立在现有的国家和地方的能力之上。生物传感2.0移除许多单片物理结构相关的成本,同时还对最终用户透明的分布式系统方面,以及作出适当的分析和报告的数据访问。

疾病预防控制中心的特别细菌学参考实验室(SBRL)的使用细菌和疫情ID网络生物学技术从有效,迅速爆发中检测未知的细菌病原体。谱系基因组学,比较整个基因组DNA序列的系统发育分析,将带来基于序列识别的概念,以全新的水平,在不久的将来对公众健康产生深远的影响。发展一个新的物种鉴定SBRL基因组管道将允许多个分析一个新的或迅速崛起的病原体在几小时内进行,而不是数天或数周。

医疗保险和医疗补助服务中心(CMS)

正在开发的基于Hadoop的一个数据仓库将支持对医疗保险和医疗补助要求的分析和报告。一个主要目标是建立一个支持,可持续的,可扩展的设计,可容纳在数据仓库中进行积累,并补充现有的技术。

正在评估使用XML数据库技术,支持保险交流事务密集型环境,并且支持对应资格及报名流程。XML 数据库可能可以容纳大表规模的数据,事务的性能进行了优化。

医疗保险和医疗补助服务中心CMS具有当前设置与橡树岭国家实验室,涉及的数据可视化工具,平台技术,用户界面选项和高性能计算技术的评估试点项目- 旨在使用行政索赔数据(医疗保险)来创建有用的信息产品引导和支持各种CMS高优先方案改进决策。

食品与药物管理局(FDA)

虚拟实验室环境(VLE),将结合现有的资源和能力,使虚拟实验室数据网络,先进的分析和统计工具和功能,在人群中分析,预测和促进公众健康的文档管理支持技术,使临场感能力在世界范围内的合作,使任何地点在一小时内就同一个虚拟实验室的功能。

国家档案和记录管理(NARA)

为十亿电子记录(CI-BER)的网络基础设施是一个联合机构主办的测试平台,这个多机构主办的网络基础设施,对国家档案馆87万多样化的数字记录的文件和信息的收集,可称为计算研究所的文艺复兴。这个试验台将评估技术和方法,超大规模数据收集,以支持可持续的访问。

国家航空和航天局(NASA)

美国宇航局的先进的信息系统技术(AIST)奖,旨在降低美国宇航局信息系统的风险和成本,以支持未来的地球观测任务,并转化成美国航空航天局气候中心的地理信息。一些AIST的方案寻求成熟的大数据的能力,以减少地球科学部空基和陆基信息系统的风险,成本,规模和开发时间,提高科学数据的获取和实用。

美国国家航空航天局的地球科学数据和信息系统(ESDIS)项目,持续超过15年,曾处理,归档和分发地球科学卫星数据和数据从空中和现场活动。注意用户满意度,努力确保科学家和公众对数据的访问,以便从太空对地球的研究,推动地球系统科学,以满足气候和环境变化的挑战。

全球地球观测系统(GEOSS)通过国际之间努力合作进行地球观测数据共享和整合。美国宇航局已经与美国环境保护署(EPA),美国国家海洋和大气管理局(NOAA),其他机构和国家的力量强强联手,整合卫星、地面监测和建模系统,评估环境条件和预测包括人为和自然的森林火灾,人口增长和其他方面的结果。研究人员将在短期内,整合了各种复杂的空气质量信息,更好地了解和解决空气质量对环境和人体健康的影响。

由美国宇航局和Cray公司订立的太空行动协议,让“大数据”系统的发展和低延迟的应用为中心的一个或多个项目上进行合作。特别是,该项目测试的混合计算机系统的实用程序,使用一个高度集成的非SQL 数据库作为数据传输的一种手段,以加速执行建模和分析软件。

美国宇航局的行星数据系统(PDS)是美国宇航局行星的任务,这已经成为了世界各地的科学家的基本资源档案数据产品。所有的PDS生产的产品通过同行评审,进行归档,并很容易通过一个由行星学科举办的在线目录系统进行访问。

太空望远镜科学研究所(MAST),美国宇航局的分布式空间科学数据服务的一个组成部分,提供多任务存

档的支持,各种天文数据档案,和相关的科学数据,包括光学、紫外线、近红外光谱等光学相关的科学数据。MAST支持多种工具,对各种光谱图像数据进行访问。

地球系统电网联邦公共档案,是一个公共的数据存档,预计将支持由国际小组的研究将在2014年完成基础对气候变化的第五次评估报告(如同第四次评估报告的存档一样)。美国宇航局联合会通过与美国能源部合作,促进观测数据和模型的输出。

国家人文基金会(NEH)

数据挖掘的挑战旨分析大数据的变化对人文社会科学的影响,在这种新的计算为基础的研究方法都需要搜索,分析和理解大量的材料,如数字化的书籍和报纸数据库,从网络搜索,传感器和手机记录交易数据。在NEH的领导下,这个挑战是由美国和8个国际组织在四个国家中进行。

国家卫生研究院(NIH)

美国国家癌症研究所(NCI)

癌症成像存档(TCIA)是一个图像数据共享服务,促进在医疗成像领域科学的开放。TCIA的目的,提高了效率和成像癌症的检测和诊断的重复性,利用影像,提供治疗反应的客观评估,并最终进行影像资源的开发,从而提高成像的使用,并对今天的癌症研究和临床实践提供决策支持。

癌症基因组图谱(TCGA)项目进行全面和协调努力,通过包括大规模基因组测序基因组分析技术的应用,以加速癌症的分子基础的认识。TCGA项目将随着大规模基因组技术的快速发展,到2014年将积累的几个PB的原始数据。

国家心肺和血液研究所(NHLBI)

心血管病研究所的网格(CVRG)和集成数据的分析,匿名共享(iDASH)是两个由NHLBI提供的安全数据存储,整合,资源分析信息源,在尽量减少对用户的负担下,协作支持信息资源共享。CVRG提供心血管研究社区资源共享的数据和分析工具。iDASH产生隐私保护技术,发展和培养一个综合的数据共享和分析环境。

国家生物医学成像和生物工程研究所(NIBIB)

由NIBIB研究所主导的互操作性和策划的纳米材料登记的发展和计划,旨在建立纳米材料的注册表,其主要功能是提供表征生物纳米材料、相互作用的环境,以及相关出版物的链接,建模工具,计算结果和对生产指导的一致策划信息。注册表有利于对表征纳米材料,以及生物相互作用的信息建设一致的标准。

为基于互联网的网络控制病人的医学图像分成合同,解决了通过图像共享模型,测试医院、影像中心和医生行为怎样进行跨企业的文件共享、图像传输和图像报告的可能性。

作为一个复杂的生理信号的研究资源,PhysioNet 提供免费网页访问记录生理信号(PhysioBank)和相关的开源软件(PhysioToolkit)大集合。每个月,全世界约45000游客使用PhysioNet,留下约4 TB的数据检索。

影像学信息工具和资源信息中心(NITRC)是NIH的蓝图项目,促使影像信息工具的传播,共享,和演化,通过提供访问、信息和社区互动的论坛数据,提供影像学数据。。超过450名的软件工具和数据集上NITRC 注册;该网站自2007年推出已经有超过30.1万的点击率。

扩展影像学档案工具箱(XNAT)的是一个开放源码的影像信息平台,由华盛顿大学神经信息学研究组开发,并广泛应用于世界各地的研究机构。XNAT促进共同管理,生产力及品质保证任务的影像和相关数据。

计算解剖学和多维建模的资源有几部分组成。洛杉矶神经影像实验室(LONI)设有数据库包含从从MR、PET、遗传学、行为学、人口统计其其他数据形式的图像数据。阿尔茨海默氏病影像学倡议(ADNI)是一个收集来自美国各地的收购站点的项目数据的很好的例子,它使得数据匿名,隔离,待质量控制(经常做立即)和使得它的下载提供世界各地的用户在各种不同的格式。

电脑辅助的功能性神经外科数据库通过方法和技巧,以协助安置和用于治疗帕金森氏症和其他运动障碍的脑深部电刺激器(DBSs)。范德比尔特大学(VU)与俄亥俄州立大学和维克森林大学合作,通过多个站点的数据,开发了中央数据库。由于不同医院的临床工作流程和立体框架可以有改变,手术规划软件已经更新并测试成功。

经过十年,国立卫生研究院生物信息科学与技术倡议(BISTI)的联盟已经加入美国国立卫生研究院研究所和中心,以促进在生物信息学和计算生物学(BICB)的研究,促进了程序发布,并资助了超过十亿美元的研究。此外,NIH促进的合作活动,包括采用现代的数据和软件共享,使研究成果在研究界得到很好的传播。

国家卫生研究所蓝图

神经科学信息框架(NIF)是一个基于Web的动态库存神经科学的资源:数据,材料和任何连接到互联网上可以访问的工具。由国家卫生研究院(NIH)倡议了神经科学研究的蓝图,即NIF主导的进步神经科学研究,通过开源资料、网络环境,使得能够在世界范围内发现和访问公共研究数据和工具。

美国国立卫生研究院的人力Connectome项目雄心勃勃,通过努力,计划在人类大脑功能的基础,并分享有关人类大脑的结构和功能连接的数据映射神经通路。该项目将使我们理解是什么使我们人类能创造出重大进展,并会为未来在许多神经和精神疾病的异常脑回路研究建立一个新阶段。

国家卫生研究所共同基金

国家生物医学计算中心(NCBC)的计划在生物信息学和计算生物学上成为国家基础设施的一部分。这八个中心创建创新的软件程序和其他工具,使生物医学界能够整合,分析,建模,模拟和共享对人类健康和疾病的数据。

病人报告结果测量信息系统(PROMIS)是一个高度可靠,有效,灵活,准确,反应迅速,措施病人报告健康状况的评估工具系统。核心资源是评估中心,它提供的工具和数据库,以帮助研究人员收集,存储,分析病人的健康状况有关的数据。

全国全科医学科学研究所:

传染病代理研究模型(MIDAS)是一个努力开发计算和分析快速逐渐增长传染病信息的方法,并提供在地方上、州上、国家层面上进行政策模拟的建模结果。而需要在全球范围内收集和整合细粒度的信息,因为公共卫生政策在本地实施,需要进行数据访问、管理、分析和存档。

结构基因组计划通过发现,分析和传播的蛋白质的三维结构,RNA和其他生物大分子结构,展现自然界的多样性,以促进在生物学,农业和医药的基本认识和应用。全球性的努力,包括美国国立卫生研究院资助的蛋白质结构倡议,传染病结构基因组学中心,在斯德哥尔摩的结构基因组学协会和在日本的理化学研究所系统结构生物学中心。通过努力,由结构生物学知识库在TargetDB主办的中心数据库,协调他们的顺序目标选择。

全球蛋白质数据银行(wwPDB),是一个收集,归档和高品质的大分子结构数据的库,在这个基础上能及时进行科学界的自由分配,代表在生物学方面的研究和教学实验测定大分子结构信息,和进行生物、生物化工,医药教学的卓越数据源。美国部分的项目(RCSB PDB)由能源部的五个研究院,NIH/ BER和NSF联合英国和日本的参与者共同出资。单一数据库现在包含为80,000大分子结构的实验结构和相关的注释。该网站收到来自140个不同国家每月211000个的独立访问者。网站每月大约有1 TB的数据转移。

生物医学信息研究网(BIRN),属国内首创,通过数据共享和协作推进生物医学研究,提供了一个用户驱动软件为基础的框架,研究团队之间能够在不同地理和不同类型计算机系统上快速、安全的共享数据,给不同的研究团队服务。

美国国家医学图书馆

集成生物学及内部的信息(i2b2),旨在创造能够整合和交换医疗保健和生物医学研究数据的方法和工具。通过i2b2开发的软件工具整合、挖掘和表示的数据,能够通过共享开源和开源管理下,在全球50多个组织进行使用。

行为与社会科学办公室(OBSSR)

国家老化计算机化数据存档(NACDA) 通过在老龄上的研究,帮助研究人员从有开发潜力广泛数据集上获得利润。NACD保存和提供美国老龄最大的电子图书数据。

人口研究的数据共享(DSDR)提供的数据归档,保存,传播和其他数据的基础设施服务。DSDR朝着一个统一的法律,技术和实质性框架工作,在其中分享人口科学的研究数据。

NIH –NSF联合项目

在计算神经科学的合作研究(CRCNS)是一个NIH-NSF联合支持的项目,帮助合作研究项目之间的计算科学家和神经科学家促进对神经系统的结构和功能,神经系统紊乱机制和神经系统所使用的计算战略机制的认识。近年来,德国联邦教育和研究部还加入了在德国的方案,并支持研究。

美国国家科学基金会(NSF)

推进大数据科学与工程的核心技术(BIGDATA)是一个NSF和NIH之间新的联合招标项目,旨在促进管理、分析、可视化和从大量多样分散异构的数据集中提取有用信息的核心技术。具体来说,将会支持对数据的管理、数据分析、与电子科学的合作,帮助在科学、工程、医学技术和工具的开发和评估方面取得突破性的研究和创新,使美国在基础技术上未来保持几十年的竞争力。

用于21世纪科学与工程学的网络基础设施框架(CIF21)开发,整合,协调,充分利用了一套先进的网络基础设施方案,通过整个国家科学基金会的努力,创造有意义的网络基础设施,以及一体化水平的数据和工具,以支持科学和教育。

NSF通过联合计划,建立一个新的CIF21对综合研究生教育和研究培训实习生的跟踪计划(IGERT)。目的是新一代的研究人员能够解决基本的大数据有关的核心技术和技术的挑战,能够在跨学科进行网络基础设施的教育和支持。

引文数据,能够提供透明和可持续使用和引用的数据集,由一封联邦政府工作人员发起的信中开始进行资助,反映了联邦政府在基金资助研究数据的管理和可持续发展。

数据和软件保护的开放科学(DASPOS)第一次尝试建立一个来自大型强子对接机和费米实验室的理学家与,数字保管、异构存储系统、大规模计算机系统方面专家之间的正式合作。其目的是制定和执行紧集的定义,参赛者大型活动所依据的大规模,长期的计划,以及各学科之间的共性指标。EarthCube支持引导社区网络基础设施的发展,将数据集成到一个框架,加快地质科学知识的传递。NSF的刚刚宣布CIF21框架内第一轮EarthCube奖项,通过探索性研究(EAGER的)机制的早期概念资助,第一步是在地学行为研究上打下基础。

计算先行者已经资助在加州大学伯克利分校的一个研究小组,深入整合算法,机器和人,以解决大数据的研究挑战。在分析,新系统的基础设施基本创新的结合有利于从云和集群计算和采购人群的可扩展性的资源,人类活动和情报将没有今天的自动化的数据分析技术,提供可以解决问题的方案。

随机网络模型的重点研究组的研究人员正在开发一种统一的理论框架为原则的统计方法,可伸缩的网络模型算法,以区别随机性的网络知识。生物学和数据的合作者们通过学习大量报纸数据中单词和短语之间的关系,提供自动化和可扩展性的媒体分析工具。

国家科学基金会发布一封给同事的信,宣布成立一个思想实验室,将征求跨学科参与,产生变革的想法,使用大型数据集,以提高教学和学习环境的成效。

信息集成和信息处理解决可伸缩的问题和挑战,涉及到传统科学研究数据的移动,到非常大的异构数据,比如新数据类型模型的整合和表示,以及相关的数据路径、信息生命周期管理和新平台的数据。

计算和数据处理的科学和工程(CDS&E)和数学和统计科学(CDS&E-MSS),由美国国家科学基金会的数学部门(DMS)和基础设施办事处(OCI)设立,成为一个独特的学科包括数学和统计基础和计算算法。目前这个项目的建议正在审查中,将在2012年7月颁布新的奖项。

一些研究训练组(RTG)和通过转型的关键点的指导(MCTP)涉及到大数据。在加州大学戴维斯分校的RTG的项目涉及对从天文学、计算机科学、神经科学等领域多种形式的图像、函数、图表和树型的对象数据进行分析。大学生将通过图像和可视化技术的培训,处理复杂的数据、软件包、和计算机模拟来评估模型的有效性。与大气、图像重建、网络安全和癌症相关的学生网站也在发展当中。

激光引力波干涉观测站(LIGO)通过以前不能观察形式的辐射,在宇宙中打开一个可以进行引力波探测的窗口。只有通过利用世界各地大型计算设施、和77家机构超过870名研究人员,和Einstein@Home项目,才能对这些大量涌现的数据进行处理。

开放科学网格(OSG),使得全世界超过8000名的科学家合作进行发现,包括寻找希格斯玻色子。在瑞

士的欧洲核子研究中心(CERN)的大型强子对撞机,超过100计算设施,每年通过高速网络散布超过15 PB 的实时数据。美国计算机领域的科学家和电脑设施提供数据传输分析服务、工作规范和执行、安全和管理、在物理、生物、纳米技术、天体物理学等学科进行数据共享。

理论和计算天体物理学网络(TCAN)计划,旨在最大限度地发现潜在的大规模的天文数据集,通过推进解释这些数据所需要的基本理论和计算方法,团结协作网络跨越体制和地域的研究划分,培训未来理论和计算的科学家。

美国国家安全局(NSA)

警惕网络:竞争网络防御规模的情境意识的培养和测试将探索数据可视化的网上竞赛,从开始与识别此类事件设计与最佳执行方法上,进行庞大计算机网络防御上的数据可视化开发。

情报共同体(IC),通过与整个美国政府、学术界和工业界各种各样的合作伙伴确定了一套协调、宣传和活动方案。将网络安全与大数据相结合,使其学术界了解其观点。

NSA/ CSS的商业解决方案中心(NCSC)通过供应商的能力演示,展示了新的商业技术的发展,满足NSA/ CSS的战略需求和国家安全社区。

美国地质调查局(USGS)

USGS约翰韦斯利鲍威尔分析及合成中心刚刚宣布了传输大数据集和为科学发现有关的地球科学理论有关的八项新的研究项目。中心的科学家合作利用全面、长期的数据来进行最先进的合成。

关于技术成果网https://www.360docs.net/doc/01752868.html,

技术成果网Tech360是国内首家科技服务业门户网站,是基于国标《科学技术研究项目评价通则》理论体系,结合WBS与TRL等国际技术管理方法,为国内集团企业、科研院所、技术中介、风险投资等相关机构提供研发过程管理、成果评价管理、成果转化管理、成果产业化推广、成果资本对接等专业解决方案与门户平台信息服务。

美国政府大数据的研究和发展计划(中文译版)

美国政府大数据计划的中文译稿 奥巴马政府宣布“大数据的研究和发展计划。”通过提高我们从大型复杂的数字数据集中提取知识和观点的能力,承诺帮助加快在科学与工程中的步伐,加强国家安全,并改变教学研究。 这个计划里,六个联邦政府的部门和机构宣布新的2亿美元的投资,提高从大量数字数据中访问、组织、收集发现信息的工具和技术水平。了解更多正在进行的联邦政府的计划,解决所大数据所带来的机遇和挑战,可通过大数据表来了解大数据革命。 我们还计划与工业界、大学研究界、非营利性机构与管理者一起利用大数据所创造的机会。显然,不能单单依靠政府,需要我们总统所呼吁的“众人拾柴火焰高”这样的努力。 一些相关的公司已经赞助大数据相关的比赛,并给大学提供这方面的研究资助。大学里也开始开设一门全新的研究型课程,培养下一代的“数据科学家”。一些无国界的组织帮助非营利性机构对公益性服务的数据进行采取、分析和可视化处理。白宫科技政策办公室将会非常有兴趣支持建立一个跟大数据相关论坛,包括最新的公私组织之间的合作。 美国政府的大数据计划 亮点:为应对大数据革命带来的机遇,联邦政府制定计划,推进相关研究机构进一步进行科学发现和创新研究。 国防部高级研究计划局(DARPA) 多尺度异常检测(ADAMS)项目解决大规模数据集的异常检测和特征化。项目中对异常数据的检测指对现实世界环境中各种可操作的信息数据及线索的收集。最初的ADAMS应用程序进行内部威胁检测,在日常网络活动环境中,检测单独的异常行动。 网络内部威胁(CINDER)计划,旨在开发新的方法来检测军事计算机网络与网络间谍活动。作为一种揭露隐藏操作的手段,CINDER将适用于将对不同类型对手的活动统一成“规范”的内部网络活动,并旨在提高对网络威胁检测的准确性、和速度。 Insight计划主要解决目前情报,监视和侦察系统的不足,进行自动化和人机集成推理,使得能够提前对时间敏感的更大潜在威胁进行分析。该计划旨在开发出资源管理系统,通过分析图像和非图像的传感器信

美国政府机构设置

美国政府机构设置 美国政府的机构设置框架,源于美国联邦宪法。政府三个部门——立法、行政和司法三权分立,各自行使特定的职责,同时相互制约。 一、立法机关(美国国会) 联邦政府的所有立法权力被赋予由两院(众议院和参议院)组成的国会。参议院由每州出两名参议员组成,共100人。参议员任期六年,每逢双数年便举行选举,改选参议员的三分之一。参议院主席由副总统担任,但除了在表决相持不下时,副总统并是没有表决权。众议院由各州按人口比例分配名额选出,共435名众议员。美国国会设置的其他重要机构,还包括总审计署和国会预算办公室。 二、司法机关 美国的司法机关主要由最高法院、11个上诉法院、91个地方法院、以及三个有特别裁判权的法院以及联邦司法中心等机构组成。 最高法院和联邦法院的院长和法官由总统提名,由参议院批准任命。最高法院是美国最高一级法院,也是联邦宪法特别设立的唯一法院。最高法院由一位首席大法官和8位大法官组成。 每个上诉法院有3-15名上诉法官。 地区法院是联邦法院系统的基层法院,每一地区法院有1-

27 个法官。 三、行政部门机构设置 美国总统领导的行政部门分为两部分:总统的办事机构和联邦政府的各部。 (一)总统和白宫 1、总统 2、总统内阁 内阁成员由处理具体的国家及国际事务各部部长和总统指定的其他官员组成。除副总统和国务卿外,还包括13个部的部长 3、白宫“政研室” 1)国家安全委员会 主席由总统担任,其他法定成员包括副总统、国务卿和国防部长。国家安全委员会帮助总统制定有关国家安全的国内外军事、情报和经济政策。 2)总统经济顾问委员会 委员会由主席1人和委员2人组成。委员会主席也称为总统首席经济顾问。委员会的三名成员都由美国总统任命,并经参议院同意。委员会有专业工作人员19名,任期1-2年。其任务是:为总统分析全国经济情况,为制定国内外经济政策提供建议,协助总统准备提交国会的年度经济报告,为总统收集经济发展和动向的情报,评价联邦政府的各项经济政

大数据中心基础建设的发展及应用

大数据中心基础建设的发展及应用 在全球新冠肺炎疫情不断蔓延下,中央不断出台逆周期调节政策,其中加快5G网络、数据中心等新型基础设施建设进度,备受市场关注。 移动互联网时代,数据流量不断增加。据统计2019年我国移动互联网用户每户平均月流量为7.82GB,是2018年的1.69倍,企业数据也呈现爆发式增长。不过,目前只有不到2%的企业数据被存储下来,其中只有10%被用于数据分析。这说明,我国数据存储利用能力存在很大缺口。在这样的背景下,大数据中心也就是IDC的重要性日益凸显。大数据中心是数据存储、处理和交互的中心,被认为是当前的新型基础设施之一。 本文将重点针对大数据中心在未来市场的前景及应用作出分析。 一、大数据中心的概念 在了解大数据中心之前首先要了解什么是大数据。大数据(big data),指常规的数据库技术难以完成捕捉、存储、管理和分析的数据集合。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。 而大数据中心就是完成数据的捕捉、存储、管理和分析的基础设施。它不仅仅包括计算机系统和其它与之配套的设备(例如通信和存储系统),还包含冗余的数据通信连接、环境控制设备、监控设备以及各种安全装置。它的特色在于对海量数据进行分布式数据挖掘,但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。 二、大数据中心的发展 数据中心(IDC)的发展历史: 数据中心历经了多年的发展,目前已处于超融合架构阶段。数据中心最初出现在20世纪60年代,主要用来容纳计算机系统、存储系统、电力设备等相关组件。20世纪90年代初,“数据中心”一词开始流行,主要是指将服务器单独放在一个房间,并将设备进行布线和链接。2000年前后,互联网爆发式增

美国政府机构

U.S. Institutions 美国行政机构 总统办事机构:(Executive Office of the President) 白宫办公厅 (The White House Office) 副总统办公厅 (Office of the Vice President of the United States) 行政管理和预算局 (Office of Management and Budget) 经济顾问委员会 (Council of Economic Advisers) 国家安全委员会 (National Security Council) 美国贸易代表办公室(Office of United States Trade Representatives) 政策制定办公室 (Office of Policy Development) 科学和技术政策办公室 (Office of Science and Technology Policy) 改善环境质量委员会 (Council on Environmental Quality) 国家麻醉品控制政策办公室 (Office of National Drug Control Policy) 行政办公室 (Office of Administration) 政府各部:(Cabinet Department) 国务院 (Department of State) 财政部 (Department of Treasury) 国防部 (Department of Defense) 司法部 (Department of Justice) 商务部 (Department of Commerce) 能源部 (Department of Energy) 内政部 (Department of Interior) 农业部 (Department of Agriculture) 教育部 (Department of Education) 运输部 (Department of Transportation) 劳工部 (Department of Labor) 卫生与公众服务部 (Department of Health and Human services) 住房和城市发展部 (Department of Housing and Urban Development) 退伍军人事务部 (Department of Veterans Affairs) 军事机构:(Military Bodies) 国防部 (Department of Defense) 参谋长联席会议 (Joint Chiefs of Staff) 陆军 (Army) 空军 (Airforce) 海军 (Navy) 海军陆战队 (Marine Corps) 海岸警卫队 (Coast Guard) 后备役部队 (Reserves) 联合作战司令部 (United Combatant Commands)

美国推动大数据技术发展的战略价值及启示

只能在教学质量差条件差的民工子弟学校就读;看病只能自费而在农村老家购买的新型农村合作医疗基本用不上;就业很难享受到与城市市民一样的服务而只能选择脏苦累的工作,等等。对于不流动只生活在农村老家的农民,户籍制度对他们而言更大的意义在于对土地的留守和作为享受中央惠农政策温暖阳光的依据。然而对于流动在外的农民,户籍制度对他们日常生活的约束仍然是明显的,问题恰恰在于,像在遵义这样的西部欠发达地区,跨省流动是农民外出务工的主要特征。以该市汇川区为例,现在汇川区跨省转移就业人数占已转移就业人数的60.2%,其中转移到东部沿海地区的上海、江苏、浙江、广东、福建等省(市)就业的占跨省转移就业人数的85.2%;在遵义市和贵州省其他地区(州、市)县内就业,就业比重占已转移就业人数的39.8%。 遵义市的户籍制度改革,只能在本乡镇范围内实现农转居民,这样的改革与农民的需求是不匹配的,因为对他们跨省流动并享受相应的公共服务没有任何作用。户籍制度的统筹,农民期待的是不管走到哪儿,都是中华人民共和国公民,能享受与当地人一样的公共服务。显然,这样的户籍制度,也就不是遵义一个市级政府所能统筹的。换句话说,户籍制度改革属于顶层设计的范畴。中央政府应及时总结各地户改的经验教训及农民本身的实际需求,在推动城乡基本公共服务均等化、抹平城乡户籍利益差异鸿沟的基础上,规范进城农民承包地和宅基地处置办法并探索实行农地退出机制与城市用地在省际之间的增减挂钩,增加流入地接纳农民入户的积极性,进而推动在全国层面的户籍制度改革。 作者单位:贵州省社会科学院社会学研究所美国推动大数据技术发展的战略价值及启示 ◎王忠 借西风 3月29日,奥巴马政府在白宫网站发布了《大数据研究和发展倡议》(Big Data Research and Development Initiative),旨在提升利用大量复杂数据集合获取知识和洞见的能力,并将为此投入两亿美元以上资金。近年来,大数据对社会经济发展的预测能力已经崭露头角。例如,利用谷歌住房搜索查询量变化对住房市场发展趋势进行预测,明显比不动产经济学家的预测更准确。因此,奥巴马政府发布研发倡议,并公布了相关部门的在研项目。我国应充分意识到大数据技术的重要战略价值,尽快开展战略性研究,加大研发支持力度,加快推进应用以及加强基础大数据集建设。 大数据研究和发展倡议的主要内容 2011年,总统科学技术顾问委员会(P r e s i d e n t’s C o u n c i l o f A d v i s o r s o n S c i e n c e a n d Technology)曾提出一份建议,认为大数据相关技术具有重要战略价值,而联邦政府对其研发投资不足。作为建议的反馈,白宫科技政策办公室发布了《大数据研究和发展倡议》,并组织了大数据高级监督小组(Senior Steering Group on Big Data)协调和拓展政府在这一重要领域的投资。 《大数据研究和发展倡议》提出,将提升美国利用收集的庞大而复杂的数字资料提炼真知灼见的能力,协助加速科学、工程领域创新步伐,强化美国国土安全,转变教育和学习模式。《大数据研究和发展倡议》还承诺将在科学研究、环境保护、生物医药研究、教育以及国家安全等领域利用大数据技术进行突破。 在白宫科技政策办公室(OSTP)发布大数据研发倡议时,美国国家科学基金会(NSF)、国家卫生研究院(N I H)、国防部(D O D)、能源部(D O E)、国防部高级研究局(DARPA)、地质勘探局(USGS)等六个联邦部门和机构承诺,将投入超过2亿美元资金用于研发“从海量数据信息中获取知识所必需的工具和技能”,并披露了多项正在进行中的联邦政府计划,主要内容如下:美国国家科学基金和美国国家卫生研究院主要推进大数据科学和工程的核心方法及技术研究,项目包括管理、分析、可视化、以及从大量的多样化数据集中提取有用信息的核心科学技术;国防部高级研究局项目主要推进大数据辅助决策,集中在情报、侦查、网络间谍等方面,汇集传感器、感知能力和决策支持建立真正的自治系统,实现操作和决策的自动化;美国能源部试图通过先进的计算进行科学发现,提供2500万美元基金来建立可扩展的数据管理、分析和可视化研究所;美国 O44中国发展观察

数据中心发展趋势综述

数据中心发展趋势综述 胡经国 本文作者的话 本文是根据有关文献和资料编写的《漫话云计算》系列文稿之一。现作为云计算学习笔录,奉献给云计算业外读者,作为进一步学习和研究的参考。希望能够得到大家的指教和喜欢! 下面是正文 一、影响数据中心基础设施的八大新趋势 数据中心基础设施正在发生巨大的变化。一系列包括开放式标准和DCIM (Data Center Infrastructure Management,数据中心基础设施管理)在内的新趋势和新技术的蓬勃发展,推动数据中心突破了密度和功率的限制。 在未来,大多数数据中心将能够减少至少30%的物理空间;而这也是直到2020年新兴的数据中心的发展趋势之一。 密度的增加、虚拟化的部署、迁移到托管设施和云计算等一系列新的发展趋势,都在影响着数据中心内部的所有操作和运营。 数据中心管理者们必须走出他们的舒适区,并且考虑更高的密度及其对于电力消费、冷却资源和数据中心物理空间的影响,以及对于数据中心运营安全的影响。 数据中心管理者们应该制定出更好的基础设施计划,了解物联网(IoT)将带来的潜在影响,并为物联网的广泛采用做好充分准备。 即使伴随着所有这些变化,数据中心的相关基础设施仍将继续存在许多年。基于这样的理念和想法,有关专家总结出了或将影响数据中心基础设施的八大新趋势。 1、下一代数据中心设计 今天的数据中心,比以往任何时候,都更多地使用每机架千瓦(kW)或每平方英尺千瓦的概念。例如,几年前,数据中心往往被设计为每台机架4~5千瓦;而到现在,通常则可以高达每台机架8~12千瓦,甚至更高。 我们在每平方英尺的物理空间,拥有了更高的计算能力。 诸如超融合基础设施、微服务和容器等新兴技术,使得每台机架需要消耗更多的能量;而反过来,则需要新的配置和设计。 新的温度和湿度指导,已开始帮助人们重新考虑数据中心的设计。因此,数据中心可以被设计成拥有不同的限制。这导致了越来越多的数据中心的设计

世界主要国家的大数据战略和行动

世界主要国家的大数据战略和行动 美国将大数据视为强化美国竞争力的关键因素之一,把大数据研究和生产计划提高到国家战略层面,并大力发展相关信息网络安全项目。 2009年,美国政府推出https://www.360docs.net/doc/01752868.html,,这是为了增加政府资料透明度而设立的一系列网站。 该网站依照原始、地理数据和数据工具三个门类,截至2012年11月,https://www.360docs.net/doc/01752868.html, 共开放出了超过40万项原始数据和地理数据,涵盖大约50个细分门类。为方便公众使用和分析,https://www.360docs.net/doc/01752868.html,平台还加入了数据的分级评定、高级搜索、用户交流以及和社交网站互动等新功能,汇集了1264个应用程序和软件工具、103个手机应用插件。通过开放API接口,https://www.360docs.net/doc/01752868.html,使得私人领域的开发者能够利用那些政府采集但未经梳理的各类信息,开发应用来提供公共服务或者进行盈利。但随着近年美国政府陷入财政困局,白宫于2011年4月宣布这些网站将终止营运,但会将它们开源化,以供各国的开发者使用或者根据需要修改。 2012年3月29日,美国白宫科技政策办公室发布《大数据研究和发展计划》,成立“大数据高级指导小组”。 该计划旨在通过对海量和复杂的数字资料进行收集、整理,以增强联邦政府收集海量数据、分析萃取信息的能力,提升对社会经济发展的预测能力。美国国家科学基金会、国家卫生研究院、国防部、能源部、国防部高级研究局、地质勘探局等6个联邦部门和机构宣布将进行2亿美元的投资,提高从大量数据中访问、组织、收集发现信息的工具和技术水平。同时,奥巴马政府还计划与工业界、大学研究界、非营利性机构与管理者一起利用大数据所创造的机会。这是美国政府在政策层面上将“大数据”上升到国家意志的重要举措,其影响极为深远。

关于数据中心建设布局的指导意见

工业和信息化部发展改革委国土资源部电监会能源局 关于数据中心建设布局的指导意见 https://www.360docs.net/doc/01752868.html,/n11293472/n11293832/n12843926/n13917072/15121870.html 日前,工业和信息化部、国家发展改革委、国土资源部、电监会、能源局等五部委联合发布了《关于数据中心建设布局的指导意见》(以下简称《指导意见》)。《指导意见》指出数据中心的建设和布局应以科学发展为主题,以加快转变发展方式为主线,以提升可持续发展能力为目标,以市场为导向,以节约资源和保障安全为着力点,遵循产业发展规律,发挥区域比较优势,引导市场主体合理选址、长远规划、按需设计、按标建设,逐渐形成技术先进、结构合理、协调发展的数据中心新格局。 《关于数据中心建设布局的指导意见》: 各省、自治区、直辖市通信管理局,各省、自治区、直辖市及计划单列市、新疆建设兵团工业和信息化主管部门、发展改革委、国土资源主管部门、能源局,各派驻地方的国家土地督察局,各电力监管派出机构,有关企业和协会: 为落实《国务院关于加快培育和发展战略性新兴产业的决定》,满足社会信息化水平不断提高的要求,促进我国数据中心,特别是大型数据中心的合理布局和健康发展,现提出如下指导意见: 一、指导思想 数据中心的建设和布局应以科学发展为主题,以加快转变发展方式为主线,以提升可持续发展能力为目标,以市场为导向,以节约资源和保障安全为着力点,遵循产业发展规律,发挥区域比较优势,引导市场主体合理选址、长远规划、按需设计、按标建设,逐渐形成技术先进、结构合理、协调发展的数据中心新格局。 二、基本原则 (一)市场需求导向原则:以应用为牵引,从市场需求出发,合理规划建设数据中心。 (二)资源环境优先原则:充分考虑资源环境条件,引导大型数据中心优先在能源相对富集、气候条件良好、自然灾害较少的地区建设,推进“绿色数据中心”建设。 (三)区域统筹协调原则:统筹考虑建设规模和应用定位,结合不同区域优势,分工协调、因地制宜建设各类型数据中心。

美国政府结构

Structure of U.S Government—美国政府的结构 The United States is a republic which operates under federalist system. The national government has specific, enumerated powers, and the fifty sovereign states retain substantial autonomy and authority over their respective citizens and residents. Both the national government and each state government are divided into executive, legislative, and judicial branches. Written constitutions, both federal and state, form a system of separated powers, checksand balances among the branches. 美国是一个在联邦体系运转下的共和国。联邦政府有列举的、具体的权利,而五十个自治州保留了对自己公民和居民的实质主权和职权。联邦政府和州政府都被划分为行政、立法、司法机构。无论联邦抑或州,成文宪法形成了这些机构间相互制衡的分权体系。 National-Subnational Relations 国家与州的关系 Any powers not delegated to the federal government in the U.S. Constitution, nor prohibited by it to the states, are reserved to the states or to the people. (U.S. Const. amend. X. )Nonetheless, the powers of the federal government are extensive. The federal government's authority to regulate interstate commerce (U.S. Const. art. I, sec. 8, cl. 3)makes it the predominant force in environmental regulation. The states, under their general police powers to protect the public health, safety and welfare, also retain substantial independent authority to issue environmental protection laws applicable to their citizens and residents. 任何既没有在美国宪法中授权给联邦政府、也没有被宪法禁止授权给各州的权力,是保留给各州或人民的。(美国宪法第五修正案)尽管如此,联邦政府的权力仍是广泛的。规范州际贸易的职权使得联邦政府在环境规制方面有着突出的影响力。各州在他们的普通警力之下保护公众的健康、安全和福利,同时也保留了发布适用于本州公民和居民的环境保护法律方向的独立的、实质上的职权。 Potential conflicts between state and federal regulation in all areas, including environmental protection, are governed by the Supremacy Clause of the United States Constitution. (U.S. Const. art. VI. )The federal Constitution, federal laws, and international treaties are supreme to state or local law; state and local laws that contradict federal laws or treaties are thus preempted and can be declared unconstitutional by a federal court.

美国的大数据研发计划及对我国的启示20130105

美国的大数据研发计划及对我国的启示 李健王丽萍2刘瑞1 (1.国家科技基础条件平台信息技术中心,北京100191;2.上海研发公共服务平台,上海200235) 摘 要:2012年3月美国政府公布了大数据研发计划。这项计划重点是增强美国联邦政府收集海量数据,分析萃取信息的能力。美国科学基金会等6个联邦部门为此宣布投资2亿美元,主要用于提前获取、处理、共享海量数据的工具和技术,文章在重点分析美国政府大数据研发计划背景的基础上,结合我国科技平台资源共享现状,借鉴美国经验,提出制定科技平台大数据发展计划,促进资源共享的必要性以及相关具体措施建议。 关键词:大数据;科技平台;资源共享;大数据研发计划;美国 中图分类号为:G203 文献标识码:A DOI:10.3772/j.issn.1674-1544.2013.01.004 Revelation of US Government “Big Data Research and Development Initia-Li Jian1, Wang Liping2, Liu Rui1 (1. Information Technology Center for National Science &Technology Infrastructure (ITC-NSTI), BeiJing 100191; 2. Shanghai R & D Public Service Platform (https://www.360docs.net/doc/01752868.html,),Shanghai 200235) Abstract: In March 2012, the U.S. government announced “Big Data Research and Development Initiative”. e program is focused on improving the U.S. Federal government’s ability to extract knowledge and insights from large and complex collections of digital data, the initiative promises to help solve some of the Nation’s most pressing challenges. e program includes several federal agencies including NSF, HHS/NIH, DOE, DOD, DARPA and USGS who pledge more than $200 million in new commitments that they promise will greatly improve the tools focus on analyzing the background of the Big Data program, combined with current situation of china’s science & technology platforms and resource sharing, proposed technology platform learn from American experience to Keywords: big data, S&T platform, resource share, revelation, Big Date Research and Development Initiative, USA 1 1 引言 随着互联网、物联网、云计算等的快速兴起和普及,当前人类社会的数据增长比以往任何一个时期都要快,数据的规模越来越大,数据变得越来越多样化,也变得越来越复杂。在这种情形下,“大数据”这一全新的概念应运而生。大数据时代已经到来。为了在大数据时代抢得先机,保持自己在科技、经济等多个方面的领先地位。2012年3月29日,奥巴马政府公布了“大数据研发计划”(Big Data Research and Development Initiative),以增强联邦政府收集海量数据、分析萃取信息的能力,迎接新的挑战。美国科学基金会、卫生福利部/国立卫生研究所、能源部、国防部、国防部高级研究计划局、美国地质调查局等6个联邦部门为此宣布投资2亿美元[1-2],以提高收集、储存、保留、管理、 第一作者简介:李健(1983-),女,数据工程师,主要研究方向:科技资源共享。 收稿日期:2012年10月18日。 ─17─

数据中心在全国布局及建设情况

数据中心在全国分布及建设情况 一、国内数据中心都建在哪里 1.“北上广”及周边地区机架规模仍领跑全国 受5G、人工智能、大数据、云计算、移动互联网等技术发展以及在边缘计算、工业互联网、超高清视频、VR/AR等场景应用的推动,我国数据中心数量和规模呈现平稳增长。截至2019年底,我国在用数据中心机架数265.8万架,同比增长28.7%。在建数据中心规模约185万架,与2018年相比增加约43万架。 截至2019年底,北京、上海、广东三个数据中心聚集区的在用机架数的全国占比为31.3%,与国内其他任意三个省(区、市)相比,北上广还是在我国数据中心规模分布上占据了相当大的比重。此外,若将河北、天津、内蒙古、江苏、浙江、福建、海南等北上广周边地区加上,这一比重会提升至60%以上。 图1 2019年中国数据中心在用机架数分布(仅“北上广”)

图2 2018-2019年中国分区域数据中心机架数 2.总体布局日趋合理,数据中心逐渐向中西部、一线周边城市转移 自2013年工业和信息化部联合四部门发布《关于数据中心建设布局的指导意见》,工业和信息化部信息通信发展司发布《全国数据中心应用发展指引(2018)》以来,加之北京、上海等地围绕严格控制新建、扩建数据中心数量及规模等发布了相关文件,我国数据中心布局渐趋合理。与2018年相比,2019年北京、上海、广东3个省(市)在用机架数在全国占比下降了4.2%。但在数据流量呈现指数级增长、移动互联网、工业计算、超高清视频、VR/AR等应用铺开的背景下,一线城市仍然存在较高的数据中心建设需求。在此背景下,阿里、腾讯、今日头条、百度等科技巨头对数据中心的布局渐向河北、内蒙古、江苏、浙江、福建等一线周边城市扩散,这些地区数据中心建设等级通常较高,依托自身网络基础,大部分直连或经一次跳转到一线城市节点,在规模和能力上具备承接一线城市外溢需求的条件。

《美国联邦政府的建立》教学设计

第8课美国联邦政府的建立 一、三维目标 1、知识与能力 (1)掌握美国1787年宪法的主要内容和权力结构,联邦制产生发展的历史条件。 (2)理解“分权与制衡”原则,培养学生在独立思考的基础从对所学的内容进行较为全面分析、概括和理解的能力。提高阅读和通过多种途径获取历史信息的能力。 2、过程与方法 (1)结合美国现状讲述美国联邦制发展的历史,通过学习,体会现实、反思历史探究学习,发现问题。 (2)指导学生联系时代背景,从美国联邦制的内容中分析其积极作用与局限性,使学生掌握分步骤、分层次掌握运用唯物史观分析历史现象的方法。 3、情感态度与价值观 使学生认识到政治制度的发展完善是人类历史进步地宝贵遗产,进一步形成开放的世界观。 二、教学重点和难点 重点:正确评价1787年宪法;“分权与制衡” 难点:理解“分权与制衡” 三、教学过程 师:图片上显示的两个人是谁?(打出幻灯片:导入) 生:克林顿和布什 师:对了,他们这是在干什么呢?(左手放在一本敞开的《圣经》上,右手高举,向美国最高法院院长宣誓,宣誓词节录自美国宪法第二章第一节) 生:他们在就职宣誓 师:不错,哪位同学愿意来过把总统瘾,宣誓一下。(幻灯片打出材料) 生1:“我庄严宣誓我一定忠实执行合众国总统职务,竭尽全力维护、保护合捍卫合众国宪法”。 师:恩,如果美国有我们××先生做总统的话,中美关系将会有突破性的进展,台湾问题将不再是问题了。(生笑)那么刚才提到的“合众国宪法”指的是哪部宪法呢?(由次导入

新课) (一)、1787年宪法的背景 问题探究让学生带着悬念和兴趣自主学习1787年宪法产生地背景和理论来源 师:美国为什么要制定《1787年宪法》? 生2:从17世纪起英国就在北美进行殖民扩张,实行残酷的殖民统治,激起北美人民的反抗,于1775年北美13州的人民发动起义,历史上称为独立战争,美国独立后,只是一个松散的联邦,13个州各自为政,使美国面临许多内外矛盾。 生3:1786年谢司领导的农民起义,震撼了邦联统治者。 师:两位同学回答的非常好,那么这里面有一个概念大家可能有些混淆,就是邦联制和联邦制的区别。美国现在是联邦制国家,但刚成立的时候只是一个邦联制国家,那邦联制和联邦制有什么区别呢?(打出幻灯片、实物演示)我把“邦联”比作是“一根用沙土做成的绳”,“联邦”比作是凉衣服的衣架,直观形象的解决了不是重点的难点。(形象变得比喻和实物演示是为了深入浅出的用形象生动的方法加深学生对难点的理解)。 (多媒体课件打出区别) 邦联制与联邦制的区别 ?邦联制:是国家的联合,各州的结合只是一根“沙土作成的绳子”,没有一个全国性的政府. ?联邦制:是联合的国家,好比是一个凉衣服的衣架, “既像小国那样自由和幸福,又像一个大国那样光荣和强大”,联邦实现了自由与力量的统一. (二)分权与制衡 (多媒体课件打出材料) 理论来源 ——欧洲启蒙思想的精华 ?孟德斯鸠是18世纪法国著名的启蒙思想家,著有《论法的精神》,他的立法﹑行政﹑司法三权分立学说,对美国1787年宪法的制定产生了重要影响.用一个形象的比喻就是:照着食谱做菜。 师:分权制衡的精神在于平衡,那么美国联邦政府是如何组成的呢?

美国政治制度的衰败

美国政治制度的衰败 (作者美国政治学家弗朗西斯·福山《美国利益》双月刊1-2月号) 美国有很多政治制度当前都日渐衰败。这与更为广泛的社会或文明衰落现象并不是一回事儿。这里讲的政治衰败其实是说,一项特定的政治进程——有时是一家政府机构——已出现机能障碍。导致这种局面的原因是:思维僵化;地位稳固的政治行为方对改革和再平衡起到了阻碍作用,而他们的实力在不断壮大。这并不意味着美国已走上永久性的衰退之路,也不意味着美国相对他国所具备的实力肯定会下降。但制度改革极难实现。在政治秩序不发生重大混乱的情况下,根本不能确保可实现制度改革。因此说,虽然衰败和衰退不是一回事儿,但对这两个问题的讨论并非没有关联。 三大结构特征都有问题 人们对美国当前的困局作出了多种诊断。在我看来,制度衰败——或者说衰落这个范围更广泛的观念——绝非“一蹴而就”。但总体来讲,美国政治发展的历史背景基本上总是会被忽视。 如果我们更仔细地审视美国相对于其他自由民主国家所走过的历程,我们就会发现,美国政治文化有三个主要的结构性特征。不论它们如何演进,也不论它们在过去发挥过多大效力,这三个特征当前都出了问题。 第一,相对于其他自由民主国家而言,司法和立法部门(也包括两大政党所发挥的作用)在美国政府中的影响力过大,而受损的是行政部门。美国人一贯信不过政府,由此就催生了立法部门解决行政问题的局面。久而久之,这种处理行政需求的方式变得成本极高、且效率低下。 第二,利益集团和游说团体的影响力在增加,这不仅扭曲了民主进程,也侵蚀了政府有效运作的能力。生物学家们所称的亲缘选择和互利主义是人类社交的两种自然模式。当与个人无关的当代政府失效时,人们就会回归到上述关系中。 第三,由于联邦政府管理结构在意识形态上出现两极分化,美国的制衡制度——其设计初衷是防止出现过于强大的行政部门——也就变成了否决制。往好了讲,决策机制变得过于松懈——也就是说太过民主了,有太多的行为方由此得以阻止政府去调整公共政策。我们当前需要更强大的机制,以力促实现集体决策。但由于政府的司法化以及利益集团影响力过大,在不发生系统性危机的情况下,我们不太可能建成此类机制。 由此说来,这三个结构性特征已呈盘根错节之势。 直接引发代议制度危机 在当代自由民主国家里,政治制度的三个核心范畴——政府、法治和追责能力——具体表现为政府三权分立:即分为行政部门、司法部门和立法部门。

大数据在国内外政府决策中应用的领域

大数据在国内外政府决策中应用的领域 一、大数据在国内外政府决策中应用的领域与案例 (一)大数据在国内外政府决策中的典型应用案例 1.智慧政府。智慧政府领域是指通过大数据运用提高政府行政能力,降低运行成本,提高对政府的管理绩效、支持决策等,以数据为中心构建智慧政府。案例一:大数据应用于政府的经济统计。美国麻省理工学院的“10亿价格项目”,通过“网络抓取技术”,利用网上购物交易数据计算日常通胀指数,收集70个国家300个零售商共500万种在线商品的价格,建立了通胀指数的日发布系统。相比传统CPI的月发布机制,“10亿价格项目”仅有3天的滞后期,几乎实现了通货膨胀的实时预测。同时,充分利用在线交易市场互联网数据作为补充,能够精准反映市场价格情况。案例二:促进政府机构中跨层级的“智能中心”建立。美国在“9·11事件”后,借国家安全之名,政府开始强力推进跨部门电子数据共享。美国国土安全部高度强调跨部门数据的互操作性,并应用多种技术手段促进数据在市政部门、社区、医院、供血站、避难所等机构间的顺畅流动。 2.市场监管。市场监管是政府的主要职能之一,为加强对市场主体的服务和监管,推进简政放权和政府职能转变,大数据的先进理念、技术和资源提供了很好契机,推动市场监管从“园丁式监管”走向“大数据监管”。案例一:基于大数据的宏观审慎监管方法。2012年以来,美国财政部为金融市场构建了一个基于标准化的法人实体识别码的身份信息报送、识别和共享系统即LEI系统。该系统作为一个真正意义上的全球金融信息收集和分享平台,涵盖了参与金融市场交易的全部法人实体,从而打破了银行、证券、基金以及保险等传统金融行业之间的界限。该系统向任何获得LEI编码的法人机构开放,因而具有显著的公开性和透明度。通过建立金融机构和金融产品编码系统,描绘出金融机构之间相互联系的网络,从而在极其复杂的衍生金融链条中,追踪衍生金融产品的原生资产,实现对金融风险的跨行业乃至跨国的监控和动态管理。案例二:食品安全监察。美国联邦政府有农业部、食品药品监督管理局、消费者利益委员会等6个部门涉及

数据中心建设整体方案

数据中心建设整体方案二XX四年六月

第一章概述 1.1 项目概述 为适应XX集团各项事业快速发展的需求,现对XX中心数据机房进行统筹规划。 本工程在XX中心七楼核心机房内部建设1个新的机房。作为XX集团的核心数据机房、综合软件控制平台,为信息系统运行提供必要的软件环境和信息支持。数据机房建设包含机房装饰系统、供配电系统、空调及新风系统、机房消防系统、防雷接地系统、综合布线及KVM系统、动力环境监控系统。 数据机房是整个集团数据与资讯系统的存储存放地,对温度、湿度、空气洁净度等环境参数以及供电质量、防雷接地、环境监控等都有严格的要求,必须严格按照国家有关电子计算机场地通用要求和电子计算机机房的要求进行设计和建设,建设一整套完善的机房环境,包括电力供应、温湿度环境、通信线路以及照明、消防等,为XX集团系统提供一个安全、可靠的数据集中和信息交换平台,进一步提高办公效率,提升XX集团整体形象。 1.2 设计依据 本项目系统实施所涉及的技术标准和规范,产品标准和规范,工程标准和规范,验收标准和规范等必须符合国际、国家和省有关条例及规范: ●《电子计算机房设计规范》 GB 50174-2008 ●《电子计算机场地通用规范》 GB_T 2887-2011 ●《智能建筑设计标准》 GB/T 50314-2006 ●《民用建筑工程室内环境污染控制规范》 GB50325-2010 ●《民用建筑电气设计规范》 JGJ16-2008 ●《建筑设计防火规范》 GB50016-2006 ●《火灾自动报警系统设计规范》 GB 50116-2013 ●《大楼通信综合布线系统》 YD/T 926.1-2009 ●《建筑与建筑群综合布线系统工程设计规范》 GB 50312-2007 ●《视频安防监控系统技术要求》 (GB-T367-2001)

美国政府机构组织名称翻译词汇

美国政府机构组织名称翻译词汇 U.S. Institutions 美国行政机构 总统办事机构:(Executive Office of the President) 白宫办公厅(The White House Office) 副总统办公厅(Office of the Vice President of the United States) 行政管理和预算办公室(Office of Management and Budget) 经济顾问委员会(Council of Economic Advisers) 国家安全委员会(National Security Council) 美国贸易代表办公室(Office of United States Trade Representatives) 政策制定办公室(Office of Policy Development) 科学和技术政策办公室(Office of Science and Technology Policy) 改善环境质量委员会(Council on Environmental Quality) 国家麻醉品控制政策办公室(Office of National Drug Control Policy) 行政办公室(Office of Administration) https://www.360docs.net/doc/01752868.html, 政府各部:(Cabinet Department) 国务院(Department of State) 财政部(Department of Treasury) 国防部(Department of Defense) 司法部(Department of Justice) 商务部(Department of Commerce) 能源部(Department of Energy) 内政部(Department of Interior) 农业部(Department of Agriculture) 教育部(Department of Education) 运输部(Department of Transportation) 劳工部(Department of Labor) 卫生与公众服务部(Department of Health and Human services) 住房和城市发展部(Department of Housing and Urban Development) 退伍军人事务部(Department of Veterans Affairs) 军事机构:(Military Bodies) 国防部(Department of Defense) 参谋长联席会议(Joint Chiefs of Staff) 陆军(Army) 空军(Airforce) 海军(Navy) 海军陆战队(Marine Corps) 海岸警卫队(Coast Guard) 后备役部队(Reserves) 联合作战司令部(United Combatant Commands)

美国政府的大数据计划

美国政府的大数据计划 2013/5/23 10:08:00来源:中国电子政务网【大中小】查看评论(0) 核心提示:近日,奥巴马政府宣布“大数据的研究和发展计划。”通过提高我们从大型复杂的数字数据集中提取知识和观点的能力,承诺帮助加快在科学与工程中的步伐,加强国家安全,并改变教学研究。 美国国家医学图书馆 集成生物学及内部的信息(i2b2),旨在创造能够整合和交换医疗保健和生物医学研究数据的方法和工具。通过i2b2开发的软件工具整合、挖掘和表示的数据,能够通过共享开源和开源管理下,在全球50多个组织进行使用。 行为与社会科学办公室(OBSSR) 国家老化计算机化数据存档(NACDA) 通过在老龄上的研究,帮助研究人员从有开发潜力广泛数据集上获得利润。NACD保存和提供美国老龄最大的电子图书数据。 人口研究的数据共享(DSDR)提供的数据归档,保存,传播和其他数据的基础设施服务。 DSDR朝着一个统一的法律,技术和实质性框架工作,在其中分享人口科学的研究数据。 NIH – NSF联合项目 在计算神经科学的合作研究(CRCNS)是一个NIH-NSF联合支持的项目,帮助合作研究项目之间的计算科学家和神经科学家促进对神经系统的结构和功能,神经系统紊乱机制和神经系统所使用的计算战略机制的认识。近年来,德国联邦教育和研究部还加入了在德国的方案,并支持研究。 美国国家科学基金会(NSF) 推进大数据科学与工程的核心技术(BIGDATA)是一个NSF和NIH之间新的联合招标项目,旨在促进管理、分析、可视化和从大量多样分散异构的数据集中提取有用信息的核心技术。具体来说,将会支持对数据的管理、数据分析、与电子科学的合作,帮助在科学、工程、医学技术和工具的开发和评估方面取得突破性的研究和创新,使美国在基础技术上未来保持几十年的竞争力。 用于21世纪科学与工程学的网络基础设施框架(CIF21)开发,整合,协调,充分利用了一套先进的网络基础设施方案,通过整个国家科学基金会的努力,创造有意义的网络基础设施,以及一体化水平的数据和工具,以支持科学和教育。

相关文档
最新文档