美国政府大数据的研究和发展计划(中文译版)
美国政府Datagov和Appsgov的经验与启示

美国政府和的经验与启示2011/6/13 14:07:00 来源:电子政务2011年第4期核心提示:通过介绍美国政府“一站式数据下载网站”和“一站式云计算服务门户”,系统梳理了美国政府基于数据采集、发布和第三方应用开发的信息资源利用机制;研究了基于政府公用云的服务门户和采用云技术的应用程序商店建设模式;探讨了美国政府在增强政府责任、提升政府信息服务能力方面所进行的持续不断的努力以及采取的科学务实的态度;指出了其对我国电子政务公用基础设施平台建设,特别是政府信息资源公共获取与应用开发再利用的启示和借鉴意义。
一、美国政府信息化发展趋势了解世界信息化发展趋势,研究政府信息化发展走向,总结政府信息资源开发利用机制以及应用建设模式,是我国电子政务建设过程中必须要解决的重要课题。
美国政府的大型IT项目在设计与实施过程中,以用户为中心,大多围绕用户的实际需求,在资源利用以及“一站式”服务方面有着领先的设计和实践,在某种程度上代表着政府信息化的发展潮流。
同时,采用了“云计算”、“虚拟化”等新兴技术,助力政府信息化从条块分割走向协同、合作,从封闭迈向开放,即通过构建整体、开放的平台,与公众进行直接的互动和沟通,从而推动政府行政管理发生根本性变革。
美国政府信息化发展呈现出独具特色的趋势。
(一)基于“云技术”实现的共享方案,保障政府IT项目高效运营“云技术”的广泛运用,能够有效整合资源,使美国政府各部门共享各种IT公用基础设施和相关服务资源,减少IT管理与运行成本,协助各部门快速地部署各种应用。
因此,联邦CIO委员会近期发布了“云优先”战略,开始建立安全的政府云计算平台,鼓励政府业务逐渐迁移到公用云平台上,以提高行政效率,优化开支。
美国行政管理和预算办公室(OMB)评估新的IT部署时,要求各部门将基于政府云的解决方案作为首要选项,促进政府IT项目全力向云平台迁移,同时鼓励企业参与政府IT项目的云解决方案,减少总体运营成本。
大数据--下一个创新、竞争和生产力的前沿

低I类型(误报)和II
类型(假阴性)错误
的可能性。
从一组训练数据集推
断一个函数或关系的
分类和支持向量机。
机器学习技术。
用于找到未标记数据 中的隐形结构的机器 学习技术。
聚类分析属于无监督 式学习。
‐ 10 ‐
名称
定义
示例
备注
模拟
例如,蒙特卡罗模拟,
为复杂系统的行为建 估计不同措施在不确 是一类依赖重复随机
成一系列的趋势,季
系列的时间序列值来 预测未来的模型。
预测销售规模或传染 性病人就诊的数量。
节性和剩余组件,可 以用于识别数据的周
这些技术被经常描述 为监督式学习,因为
上,识别新的数据点 属于哪种类别的一组
测(例如购买决策、流 失率、消费率等),有 一个明确的假设或客
有一个训练集的存 在,他们与聚类分析
技术。
观的结果。
形成对比,聚类分析 是一类无监督学习。
数据聚类
划分对象的统计学方
法,将不同的集群划 分成有相似属性的小 群体,而这些相似属
(三)现有趋势将继续推动数据增长 在各部门和地区之间,企业正在加快收集数据的步 伐,推动了传统的事务数据库的增长;医疗卫生等面向消 费者的行业中,多媒体的广泛使用刺激了大数据的持续扩 张;社交媒体的广泛普及以及物联网中应用的不断创新都 进一步推动了大数据不断增长……这些相互交叉的动力 刺激了数据的增长,并将继续推动数据池的迅速扩张。
网 络与 不同的 地理 位 址或纬度/经度坐标。
置结合起来)。
统计技术经常用于判
断变量之间发生关系
的概率(“零假设”),
收集、组织和说明数 据的科学,包括设计
通过A/B测试判断哪种 类型的营销材料会最
美国推动大数据发展的做法及启示

三 、美 国推动大数据发展的主要做法
美 国在 战 略 层 面 重 视 和 布 局 大 数 据 。并 积 极 支 持 相 关
C o v 封 e r 面 S 专 t o 题 r y I
层 面 ,形 成 了 全 体 动 员 格 局 。
《 大 数 据 研 究和 发 展 倡 议 》提 出 ,应 当 通 过 对 海 量 和 复
杂 的 数 字 资料 进 行 收 集 、整 理 ,从 中 获 得 有 用 的 信 息 资 源 。 协 助 加 速 科 学 、工 程 领 域 创 新 步 伐 , 强 化 美 国 国 土 安 全 , 转变 教 育 和 学 习模 式 ,以 提 升 对 社 会 经 济 发 展 的 预 测 能 力 。 根 据 这 一 计 划 , 美 国 希 望 利 用 大 数 据 技 术 在 多 个 领 域 实 现 突 破 ,包 括 科 研 教 学 、 环 境 保 护 、工 程 技 术 、 国 土 安 全 、
报 告 ,大 数 据 市 场 正 处 在 井 喷 式增 长 的 前 夕 。2 0 1 2年 大 数
供2 5 0 0万 美元 基 金 来 建 立 可 扩 展 的 数 据 管 理 、分 析 和 可 视 化研 究所 ; 美 国 地 质 勘 探 局 通 过 给 科 学 家 提 供 深 入 分 析 的 场所 和时 间、最高水 平的计算 能力和 理解大 数据集 的协作
中 在 情 报 、侦 查 、 网络 间 谍 等 方 面 , 汇 集 传 感 器 、 感 知 能
1 0余篇 ,出版 专著 《 我 国软件产业发展的财税政策研究 》 。
世界各国的大数据发展战略(美国篇)

世界各国的大数据发展战略(美国篇)当前大数据应用的成功案例主要集中在欧美发达国家,除技术突破和应用创新之外,大数据正逐渐引起公众意识形态的变革甚至社会结构的深层调整.受到世界各主要国家和地区的广泛关注,纷纷从国家层面提出具体的大数据发展战略。
由于大数据自身内涵发展迅速,随着存储设备、记录工具和分析技术的不断发展,其应用的深度与影响力也日新月异,各国在大数据战略也是基于国家整体发展趋势进行布局。
美国:2012年3月美国联邦政府推出“大数据研究和发展倡议”,其中对于国家大数据战略的表述如下:“通过收集、处理庞大而复杂的数据信息,从中获得知识和洞见,提升能力,加快科学、工程领域的创新步伐,强化美国国土安全,转变教育和学习模式”。
作为响应,同年5月,奥巴马政府发布了“构建21世纪数字政府"战略规划,通过Data。
gov平台的建设吸引更多参与者加入,同时以行政管理和预算局牵头推进政府自身的公共数据开放,2015年3月,联邦总务管理局公民服务与科技创新办公室旗下的18F创新小组,会同联邦数字服务中心、白宫科技政策办公室联名发布了关于政府网站的数字化分析仪表盘,协助公众实时、便捷地了解美国联邦政府网站提供的社会公共服务。
2009年,美国政府推出,这是为了增加政府资料透明度而设立的一系列网站.该网站依照原始、地理数据和数据工具三个门类,截至2012年11月,共开放出了超过40万项原始数据和地理数据,涵盖大约50个细分门类。
为方便公众使用和分析,Data。
gov平台还加入了数据的分级评定、高级搜索、用户交流以及和社交网站互动等新功能,汇集了1264个应用程序和软件工具、103个手机应用插件。
通过开放API接口,使得私人领域的开发者能够利用那些政府采集但未经梳理的各类信息,开发应用来提供公共服务或者进行盈利。
但随着近年美国政府陷入财政困局,白宫于2011年4月宣布这些网站将终止营运,但会将它们开源化,以供各国的开发者使用或者根据需要修改。
大数据的发展背景和研究意义

大数据的发展背景和研究意义近几年来,随着计算机和信息技术的迅猛发展和普及应用,行业应用系统的规模迅速扩大,行业应用所产生的数据呈爆炸性增长。
动辄达到数百TB甚至数十至数百PB规模的行业/企业大数据已远远超出了现有传统的计算技术和信息系统的处理能力,因此,寻求有效的大数据处理技术、方法和手段已经成为现实世界的迫切需求。
百度目前的总数据量已超过1000PB,每天需要处理的网页数据达到10PB~100PB;淘宝累计的交易数据量高达100PB;Twitter每天发布超过2亿条消息,新浪微博每天发帖量达到8000万条;中国移动一个省的电话通联记录数据每月可达0.5PB~1PB;一个省会城市公安局道路车辆监控数据三年可达200亿条、总量120TB。
据世界权威IT信息咨询分析公司IDC研究报告预测:全世界数据量未来将从的0.8ZB增长到的35ZB(1ZB=1000EB=),将增长44倍,年均增长40%。
早几年人们把大规模数据称为“海量数据”,但实际上,大数据(BigData)这个概念早在就已被提出。
,在Google成立10周年之际,著名的《自然》杂志出版了一期专刊,专门讨论未来的大数据处理相关的一系列技术问题和挑战,其中就提出了“BigData”的概念。
随着大数据概念的普及,人们常常会问,多大的数据才叫大数据其实,关于大数据,难以有一个非常定量的定义。
维基百科给出了一个定性的描述:大数据是指无法使用传统和常用的软件技术和工具在一定时间内完成获取、管理和处理的数据集。
进一步,当今“大数据”一词的重点其实已经不仅在于数据规模的定义,它更代表着信息技术发展进入了一个新的时代,代表着爆炸性的数据信息给传统的计算技术和信息技术带来的技术挑战和困难,代表着大数据处理所需的新的技术和方法,也代表着大数据分析和应用所带来的新发明、新服务和新的发展机遇。
由于大数据处理需求的迫切性和重要性,近年来大数据技术已经在全球学术界、工业界和各国政府得到高度关注和重视,全球掀起了一个可与20世纪代的信息高速公路相提并论的研究热潮。
【独家原文翻译56页版】麦肯锡大数据:创新、竞争和生产力的下一个前沿(原文翻译)

大数据:创新、竞争和生产力的下一个前沿(原文翻译)麦肯锡在2011年5月发布了一个关于大数据方面的报告:《Big data: The next frontier for innovation, competition, and productivity》,虽然是6年前的报告,但是今天读来,还是非常用指导意义。
报告分为两个版本,一个是概要版20页,一个是完整版156页。
正好最近看了一遍概要版,觉得收益甚大。
所以试着翻译一下,仅供参考。
标题:Big data: The next frontier for innovation, competition, and productivity译文:大数据:创新、竞争和生产力的下一个前沿第二页是关于MGI(麦肯锡全球研究院)的介绍,就不翻译了。
略。
Data have become a torrent flowing into every area of the global economy. 1 Companies churn out a burgeoning volume of transactional data, capturing trillions of bytes of information about their customers, suppliers, and operations. millions of networked sensors are being embedded in the physical world in devices such as mobile phones, smart energy meters, automobiles, and industrial machines that sense, create, and communicate data in the age of the Internet of Things. 2 Indeed, as companies and organizations go about their business and interact with individuals, they are generating a tremendous amount of digital“exhaust data,”i.e., data that are created as a by-product of other activities. Social media sites, smartphones, and other consumer devices including PCs and laptops have allowed billions of individuals around the world to contribute to the amount of big data available. And the growing volume of multimedia content has played a major role in the exponential growth in the amount of big data (see Box 1, “What do we mean by ‘big data’?”). Each second of high-definition video, for example, generates more than 2,000 times as many bytes as required to store a single page of text. In a digitized world, consumers going about their day—communicating, browsing, buying, sharing, searching—create their own enormous trails of data.译文:数据已成为流入全球经济各个领域的激流。
从战略规划来看美军大数据发展动向

从战略规划来看美军大数据发展动向发布时间:2023-01-15T00:48:36.080Z 来源:《中国科技信息》2022年16期第8月作者:廖咏一冯研艳严登超[导读] 2012年以来美军全面规划布局与推动大数据发展,顶层牵引和带动美军获取以数据为中心的军事优势。
廖咏一冯研艳严登超江南机电设计研究所贵州贵阳 550027摘要:2012年以来美军全面规划布局与推动大数据发展,顶层牵引和带动美军获取以数据为中心的军事优势。
本文对美军大数据与云环境相关战略规划进行系统梳理与分析,结合规划动向从数据平台建设、数据应用等方面分析了美军大数据发展趋势,并提出了数据作战应用发展建议。
关键词:规划军事大数据作战应用1.概述美国从2012年发布全球首个国家层面的大数据战略《大数据研究与发展计划倡议》将大数据研发上升到国家战略层面以来,从国家、军兵种层面发布一系列顶层战略规划,积极牵引大数据技术发展、数据中心建设与作战应用,大力推动以数据为中心的军事优势构建,推动大数据在作战领域中应用。
2.美军大数据相关发展规划动向在美国联邦政府先后于2012年和2016年发布《大数据研究与发展倡议》、《联邦大数据研究与发展战略规划》构建大数据驱动的战略体系的大背景下,美国防部积极响应联邦政府大数据战略,聚焦军队数字化转型和国防现代化建设,2018年发布《国防部数字工程战略》推动数字工程转型,2019年发布《国防部数字现代化战略》明确指出“数据是战略资产”,并提出数据从“情报是决策之源”的传统运用变成“利用大数据技术提供辅助决策”的新要求;2020年发布《国防部数据战略》提出了“通过大规模地使用数据提高作战优势和效率”的发展愿景,旨在通过数据融合实现军种联合,明确了数据在联合全域作战、业务分析和高级领导决策支持三个重点领域的应用,积极从顶层牵引抢占军事数据利用制高点。
图1 近年来美国发布的大数据相关战略各军兵种以国防部提出的顶层数据战略文件为指导,发布各军兵种数据战略,一方面围绕军兵种数字化转型,牵引数字生态环境构建;另一方面围绕联合作战与装备作战能力增强,牵引数据治理与数据作战应用转化。
中美两国在大数据政策领域的对比研究

中美两国在大数据政策领域的对比研究【摘要】本文通过对中美两国大数据政策领域的对比研究,分析了两国在大数据政策制定和执行方面的背景和现状。
通过对比分析中美大数据法律法规、个人数据隐私保护、大数据产业发展和大数据安全管理的政策差异,发现了两国在政策制定和执行方面的异同点。
在总结了中美大数据政策的异同点,并提出了对未来发展的启示和建议。
研究发现,中美在大数据政策方面存在一些差异,但也有共同点。
对此,本文从政策层面提出了一些建议,以促进中美大数据政策的发展和合作。
通过本文研究,可以更好地了解中美两国在大数据政策领域的差异和共同点,为未来的政策制定和执行提供参考和借鉴。
【关键词】中美大数据政策,对比研究,背景现状,法律法规,个人数据隐私保护,产业发展,安全管理,异同点总结,未来发展,建议。
1. 引言1.1 中美两国在大数据政策领域的对比研究随着信息技术的快速发展和大数据时代的到来,大数据已经成为世界各国经济社会发展的重要驱动力。
中美作为世界上最大的两个经济体,在大数据政策领域备受关注。
中美两国在大数据政策方面有许多相似之处,同时也存在一些明显的差异。
中美大数据政策的对比研究可以帮助我们更好地了解两国在这一领域的立法、监管和发展方向,为未来制定更加科学有效的政策提供参考。
本文将从中美大数据政策的背景和现状、大数据法律法规的对比分析、个人数据隐私保护政策差异、大数据产业发展政策对比以及大数据安全管理政策比较等方面展开讨论,旨在深入挖掘中美两国在大数据领域的共同点和差异点,总结中美大数据政策的异同,探讨对未来发展的启示,并提出对中美大数据政策的建议。
通过这些研究,我们可以更好地促进中美在大数据领域的合作与交流,推动全球大数据产业的发展。
2. 正文2.1 中美大数据政策的背景和现状在当今信息化时代,大数据已经成为各国经济和社会发展的重要驱动力之一。
中美作为世界上两大经济体,在大数据政策领域也有各自的背景和现状。
从背景来看,中国作为全球最大的互联网市场之一,拥有庞大的数据资源和庞大的互联网用户群体。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
美国政府大数据计划的中文译稿奥巴马政府宣布“大数据的研究和发展计划。
”通过提高我们从大型复杂的数字数据集中提取知识和观点的能力,承诺帮助加快在科学与工程中的步伐,加强国家安全,并改变教学研究。
这个计划里,六个联邦政府的部门和机构宣布新的2亿美元的投资,提高从大量数字数据中访问、组织、收集发现信息的工具和技术水平。
了解更多正在进行的联邦政府的计划,解决所大数据所带来的机遇和挑战,可通过大数据表来了解大数据革命。
我们还计划与工业界、大学研究界、非营利性机构与管理者一起利用大数据所创造的机会。
显然,不能单单依靠政府,需要我们总统所呼吁的“众人拾柴火焰高”这样的努力。
一些相关的公司已经赞助大数据相关的比赛,并给大学提供这方面的研究资助。
大学里也开始开设一门全新的研究型课程,培养下一代的“数据科学家”。
一些无国界的组织帮助非营利性机构对公益性服务的数据进行采取、分析和可视化处理。
白宫科技政策办公室将会非常有兴趣支持建立一个跟大数据相关论坛,包括最新的公私组织之间的合作。
美国政府的大数据计划亮点:为应对大数据革命带来的机遇,联邦政府制定计划,推进相关研究机构进一步进行科学发现和创新研究。
国防部高级研究计划局(DARPA)多尺度异常检测(ADAMS)项目解决大规模数据集的异常检测和特征化。
项目中对异常数据的检测指对现实世界环境中各种可操作的信息数据及线索的收集。
最初的ADAMS应用程序进行内部威胁检测,在日常网络活动环境中,检测单独的异常行动。
网络内部威胁(CINDER)计划,旨在开发新的方法来检测军事计算机网络与网络间谍活动。
作为一种揭露隐藏操作的手段,CINDER将适用于将对不同类型对手的活动统一成“规范”的内部网络活动,并旨在提高对网络威胁检测的准确性、和速度。
Insight计划主要解决目前情报,监视和侦察系统的不足,进行自动化和人机集成推理,使得能够提前对时间敏感的更大潜在威胁进行分析。
该计划旨在开发出资源管理系统,通过分析图像和非图像的传感器信息和其他来源的信息,进行网络威胁的自动识别和非常规的战争行为。
Machine Reading 项目,旨在实现人工智能的应用和发展学习系统的过程中对自然文本进行知识插入,而不是依靠昂贵和费时的知识表示目前的进程,并需要专家和相关知识工程师所给出的语义表示信息。
Mind's Eye 项目,旨在为机器建立视觉的智能。
传统的机器视觉研究的对象选取广泛的物体来描述一个场景的属性名词,而Mind's Eye旨在增加在这些场景的动作认识和推理需要的知觉认知基础。
总之,这些技术可以建立一个更完整的视觉智能效果。
Mission-oriented Resilient Clouds 项目通过技术进行检测,诊断并对攻击作出响应,有效地建立了“社区卫生服务系统”的云,以解决云计算固有的安全挑战。
该方案还旨在开发新技术,使云应用和基础设施受到攻击时能够继续运行。
只要整体能够有效的运行和保存,可以允许个别主机和任务损失。
对加密数据的编程计算(PROCEED)的研究工作旨在开发实用的方法,相关现代化计算编程语言,使数据加密时仍然能使用云计算环境,以克服信息安全的重大挑战。
使用户能够不需首次解密的情况下能够操纵加密的数据,它将使得对手拦截信息更加困难。
在视频和图像的检索和分析工具(VIRAT)计划旨在开发一个系统能够利用军事图像分析员收集的数据进行大规模的军事图像分析。
VIRAT如果成功,将使分析师能够在相关活动发生时建立警报。
VIRAT还计划开发工具,能够以更加准确率和召回率的去从大量视频库里进行视频内容的检索。
XDATA项目计划旨在开发用于分析大量的半结构化和非结构化数据的计算技术和软件工具。
最核心的挑战是,可伸缩的算法在分布式数据存储应用、如何使人机交互工具能够有效的迅速定制不同的任务,以方便对不同数据进行视觉化处理。
对开源软件工具包的灵活使用,使得能够处理大量国防应用中的数据。
国土安全部(DHS)卓越研究中心和可视化数据分析(CVADA),罗格斯大学和普渡大学(以及另外三个伙伴大学)的研究人员之间进行协作,通过对大量的异构数据进行研究,使得急救员可以发现人为或自然灾害、恐怖事件,需要执法的边境安全问题,网络威胁的爆炸物。
能源部(DOE)科学办公室高级科学计算研究办公室(ASCR)提供数据管理,可视化和数据分析的社区,包括数字化保存和社区访问。
套件程序里包括广泛使用数据管理的技术,如开普勒科学的工作流程系统;存储资源管理标准;各种数据存储管理技术,如BeSTman,大容量数据移动器和适应式的IO系统(ADIOS); FastBit数据索引技术(雅虎使用)和两个主要的科学可视化工具,ParaView 和VisIt。
高性能存储系统(HPSS)是对磁盘和磁带系统上PB级数据进行管理的数据管理软件。
由美国能源部和IBM开发的HPSS在世界各地的大学和实验室的使用,用在数字图书馆,国防应用和包括纳米技术,基因组学,化学,磁共振成像,核物理,计算流体力学,气候在内的一系列学科,以及诺斯罗普·格鲁门公司,美国国家航空航天局(NASA)和美国国会图书馆。
对千万亿次的数据分析处理从庞大的科学数据集提取信息,发现其主要特征,并理解其间的关系。
研究领域包括机器学习,数据流的实时分析,非线性随机的数据缩减技术和可扩展的统计分析技术,广泛适应于从能源部到电网,包括宇宙学和天气数据,传感器数据等。
下一代网络方案支持工具,使得合作研究在能够进行重大发现,包括2001年的Globus中间件项目大量数据的移动和使用,2003年的GridFTP的数据传输协议,2007年的地球系统网格(ESG)的工具。
今天的GridFTP的服务器开放科学网格,ESG,和生物社区的科学数据每月超过1 PB的移动。
Globus中间件也被得克萨斯大学,软件公司,石油公司利用并一起合作,培养学生能够使用先进的石油工程方法和集成的工作流程。
基础能源科学办公室(BES)BES的科学用户设施支持旨在协助用户数据管理和分析大数据,可每天从一个单一的实验数据大容量化(1012字节)努力。
例如,加速数据采集,处理和分析(ADARA)项目解决了数据的散裂中子源(SNS)的数据系统提供实时分析,实验控制的工作流程需要,以及已经建立X射线影像资料库,以最大限度地提高数据的可用性和更有效地利用同步加速器光源。
在2011年10月,由生物工程学会和ASCR的基础能源科学的数据和通信研讨会将确定实验数据的需求,这可能会影响的科学发现。
生物和环境研究计划(BER)大气辐射测量(ARM)气候研究设施是一个多平台的科学用户设施,提供重要的大气现象的精确观测研究,大气过程的认识的进步需要国际社会的基础设施和气候模型。
ARM的数据是可以进行应用的,并以其作为文章发表在一个超过100年历史的杂志。
正在处理收集和展示的高时间分辨率和光谱信息,从数百文书相关的挑战,以满足用户的需求。
系统生物学知识库(Kbase)是一个社区驱动的软件框架,对微生物,植物和环境条件下的生物群落功能的数据驱动的预测。
kbase是一个开放式的设计与开发,以提高算法的开发和部署效率,并增加从异构数据源的实验数据的获取和集成。
kbase是不是一个典型的数据库,而是一种手段,以解释缺少的信息成为实验设计预测工具。
聚变能源科学办公室(FES)通过FES和高级科学计算研究(ASCR)办公室高级计算合作的(SciDAC)科学发现在在聚变能的科学计算和实验研究大数据存在的挑战。
ASCR-FES开发的数据管理技术,包括高性能的输入/输出系统,先进的科学的工作流程和出处框架,可视化技术解决独特的融合需求,已经吸引了欧洲一体化建模的努力和国际热核实验堆,一个国际核核聚变研究和工程项目的关注。
高能物理办公室(HEP)高能物理计算计划经过了全球数百名科学家的努力,支持大量的分析研究,复杂的实验数据集,以及大量的模拟数据。
协作企业进行大数据管理,包括生产和分布式分析PanDA(产品分布式分析)工作量管理系统和XRootD,一种高性能,快速,可扩展访问多种数据存储库的容错软件。
核物理办公室(NP)美国核数据计划(USNDP)是一个多方面努力,涉及7个国家实验室和两所大学的项目,提供跨越多个领域,核物理,编译和交叉检查,对所有原子核的重要性质的相关实验结果,维护和广泛使用的专用数据库。
科学和技术信息办公室(OSTI)OSTI,唯一的DataCite美国联邦机构成员(全球领先的财团科学和技术信息的组织)中发挥了关键作用,在塑造实践的政策和技术实现数据的引用,这使得可以跟踪数据的影响,使有效的重用和数据核查和学术结构的表彰和奖励数据生产商可设立。
退伍军人管理部(VA)医疗保健信息研究所(CHIR)开发自然语言处理(NPL)工具,能够对在VA以文本形式存储的大量数据进行信息解锁。
VA正在努力通过保护作战人员使用文字处理算法捕获公共卫生事件(ProWatch),正在开发一个的生产透明,重复性好,可重复使用的各种安全相关的事件监控软件探测,以研究为基础的监控程序,能够跟踪,测量与军事部署相关的健康条件。
AViVA是VA的下一代就业人力资源系统,将业务应用程序和基于浏览器的用户界面分开的数据库。
分析工具已经被建立在此基础上研究,最终决定在对病人进行支持。
医学成果观察项目设计用来比较各种安全监测分析方法的有效性,可行性和性能。
企业数据仓库(CDW)是VA的项目,组织和管理从各种渠道传递的个人和群体的疾病和??治疗的完整视图的数据。
健康资料库是卫生保健提供者的数据格式规范的数据,尤其是VA和国防部之间,让CDW集成的数据。
基因组信息系统综合科学(GenISIS)计划,通过个性化医疗,提高退伍军人的医疗保健。
GenISIS通过接触获得电子健康记录和遗传数据,可以跨VA进行的临床试验,基因试验和成果研究的临床研究。
VA的信息和计算基础设施提供的分析大型数据集,现在在VA,促进合作研究,在VA的网络上的任何地方,分析工作区和工具。
卫生和人类服务部(HHS)疾病控制和预防中心(CDC)生物传感2.0是第一个考虑到区域和国家协调的情况下,通过互操作的网络系统对公众健康意识的可行性分析的系统,其建立在现有的国家和地方的能力之上。
生物传感2.0移除许多单片物理结构相关的成本,同时还对最终用户透明的分布式系统方面,以及作出适当的分析和报告的数据访问。
疾病预防控制中心的特别细菌学参考实验室(SBRL)的使用细菌和疫情ID网络生物学技术从有效,迅速爆发中检测未知的细菌病原体。
谱系基因组学,比较整个基因组DNA序列的系统发育分析,将带来基于序列识别的概念,以全新的水平,在不久的将来对公众健康产生深远的影响。