云计算和大数据
大数据与云计算有什么关系?

要说时下热度比较高的关键词有哪些,大数据和云计算一定在其中。
大数据和云计算都属于新兴的行业或技术,因为和互联网的种种联系,因此薪水一般都比较高。
所以,很多人对于大数据和云计算都是趋之若鹜。
可以说,大数据的发展是离不开云计算的,然而很多的人并不了解大数据和云计算之间的关系,接下来,小编就为大家讲解一下大数据和云计算之间的关系。
1.什么是大数据?大数据就是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
同样也是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
那么大数据的技术有什么意义呢?大数据的意义并不是在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。
换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的优化能力,通过优化实现数据的增值。
2.大数据和云计算的密切关系而大数据与云计算的关系在技术上的联系也是密不可分。
大数据必然无法用单台的计算机进行处理,必须采用分布式架构。
它的特色在于对海量数据进行分布式数据挖掘。
但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。
随着云时代的来临,大数据也吸引了越来越多的关注。
分析师团队认为,大数据通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费很多的财力和物力。
大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要框架来向数十、数百或甚至数千的电脑分配工作。
并且,大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。
适用于大数据的技术,包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
通过本文的介绍,相信大家对于大数据和云计算之间的关系一定了解得更加全面清楚了。
物联网、大数据、云计算的区别与联系

物联⽹、⼤数据、云计算的区别与联系⼀、定义名称定义对应技术关键词物联⽹所有的设备都配上操作系统接⼊互联⽹形成的新⽹络。
物联⽹包含当前的互联⽹。
⽆线电、RFID万物互联⼤数据记录下每天各种信息的数据的集合。
旨在存储和计算⼤量数据(最终完成⽤户画像)。
Hadoop、Spark海量数据云计算将计算资源虚拟化并按需卖给⽤户。
⽅便计算资源的管理提⾼计算资源利⽤率。
openstack、docker虚拟化⼆、相互关系粗略地看,可以认为物联⽹产⽣了⼤数据,⼤数据需要借助云计算,云计算⽀持了物联⽹的发展。
但从技术上看这三个概念在技术上并没有那么⼤的关联,甚⾄可以完全不相⼲。
2.1 物联⽹和⼤数据的关系物联⽹确实是产⽣了⼤量数据,但其实更多的数据并不是来源于物联⽹⽽是来源于⼈们开始认识到了各种信息的重要性⽽将之以数据形式记录下来。
2.2 ⼤数据和云计算的关系⼤数据的主要技术Hadoop确实会⽤许多计算结点,这些计算结点可以是虚拟机但也完全可以是物理机。
⼤数据有时容易让⼈混淆是因为总说其数据处理能⼒,但⼤数据重点在于处理数据⽽不是并⾏计算,其替代的是数据库⽽不是计算机。
(由于⼤数据看似是计算但其实不是计算让⼈迷惑,)2.3 云计算和物联⽹的关系云计算⽀持物联⽹这三者关系中看似最理所当然的关系,在实际中最没关系;做物联⽹的,⼀般不会把⾃⼰的东西放公有云上,对中⼼计算能⼒的要求也不是很⼤也没强烈必要搭建私有云。
三、发展展望资本总是热衷于炒作新概念,当⼀个名词从资本热捧的“新概念”变成置之不理的“旧概念”,才容易看清概念是否名副其实到底有⼤多的⽤武之地。
3.1 物联⽹发展展望趋势----物联⽹基本是⼀个不可逆的过程了,待商量的只是速度快⼀点慢⼀点的问题。
技术----物联⽹芯⽚向arm架构靠拢、操作系统向基于linux的嵌⼊式系统靠拢、⽹络向tcp/ip靠拢。
市场----个⼈觉得物联⽹不过就是原先的不联⽹的设备联⽹罢了,⼜不是出现什么新市场,不知道资本⿎吹的是什么。
云计算与大数据精品PPT课件

• 云计算身边案例
我们常用的云盘
金山快盘、联想网盘、华为网盘 (原DBanT盘(金山网络出品)、 云诺(YUNIO)、 EverBox(盛大网盘)、微软skydrive、迅载网盘、网丫场 、PocketDisk启明网盘、抽屉网盘、 网易网盘、iBoxFile、WebDisk、126网 盘、139邮箱网盘、网盘卡卡网盘、16密盘、永硕E盘、 QQ随身盘、265网 络硬盘vdisk、纳米盘、同步盘、TOM网盘、uc网盘、51网盘、99盘、速度盘 、 凯备份等。 有些是完全免费的,有些是收费兼免费的,用户可根据需要选用。提供下载 收益 的:珍宝网盘,千军万马网盘、城通网盘。用户在选用网盘时应当慎重 ,因为一些免费网盘的存活期比较短。用户重要的文件资料最好不要放在网 盘里,以免网盘提供商停止服务后,造成用户文件永久性的丢失。
云计算和大数据
云计算
• 什么是云计算
云计算(英语:Cloud Computing),是一种基于互联网的计算方式,通过这种方 式,共享的软硬件资源和信息可以按需求提供给计算机和其他设备。 云是网络、互联网的一种比喻说法。过去在图中往往用云来表示电信网,后来也用 来表示互联网和底层基础设施的抽象。云计算是继1980年代大型计算机到客户端服务器的大转变之后的又一种巨变。用户不再需要了解“云”中基础设施的细节,不 必具有相应的专业知识,也无需直接进行控制。 云计算描述了一种基于互联网的新的IT服务增加、使用和交付模式,通常涉及通过 互联网来提供动态易扩展而且经常是虚拟化的资源,它意味着计算能力也可作为一 种商品通过互联网进行流通。
云计算和大数据
大数据
• 什么是大数据
大数据(Big Data)又称为巨量资料,指需要新处理模式才能具有更强的决策力、洞察力 和流程优化能力的海量、高增长率和多样化的信息资产。“大数据”概念最早由维克托·迈尔· 舍恩伯格和肯尼斯·库克耶在编写《大数据时代》中提出,指不用随机分析法(抽样调查) 的捷径,而是采用所有数据进行分析处理。大数据有4V特点,即Volume(大量)、 Velocity(高速)、Variety(多样)、Value(价值)。
云计算与大数据技术结合的应用场景

云计算与大数据技术结合的应用场景随着信息技术的不断发展和普及,云计算和大数据技术成为当今社会中广泛应用的重要工具。
云计算提供了高效和可靠的计算资源,而大数据技术则致力于处理和分析海量的数据。
将这两种技术相结合,可以创造出许多强大的应用场景,其中包括但不限于以下几个方面。
1. 云存储与大数据分析云存储使得用户可以将数据存储在云平台上,而不需要自建大型的物理服务器。
结合大数据分析技术,这些存储数据可以被有效地处理和分析。
例如,在电商领域,企业可以将海量的用户购买数据存储在云端,并利用大数据技术进行分析,以了解用户的消费偏好和行为模式,从而提供个性化的推荐服务。
2. 云计算与大数据的协同处理云计算提供了高度可扩展的计算资源,使得大数据的处理变得更加高效。
通过云计算平台的弹性资源分配,大数据任务可以在短时间内得到快速处理。
例如,在科学研究中,大量的实验数据可以通过云计算平台上传并进行高速的并行计算,从而加快研究进度和提高研究成果的准确性。
3. 云端智能服务结合云计算和大数据技术,可以提供各种智能化的云端服务。
例如,基于大数据分析的人工智能算法可以实现智能推荐、语音识别和图像识别等功能。
这些云端智能服务可以广泛应用于各个领域,包括医疗保健、金融、交通等,提升工作效率和用户体验。
4. 云安全与大数据分析随着云计算和大数据技术的普及,数据安全和隐私保护成为一个重要的问题。
通过结合云安全技术和大数据分析技术,可以实现对云端数据的异常检测和威胁分析。
例如,在网络安全领域,通过分析用户的行为模式和异常活动,可以及时发现并应对潜在的安全威胁。
5. 云辅助决策分析大数据技术的强大处理能力和云计算的高效计算资源为决策分析提供了新的可能性。
通过结合云计算和大数据分析技术,可以对大量的数据进行综合分析,提供决策者所需的信息支持。
这种云辅助决策分析可以应用于各种领域,如企业管理、市场预测和政策制定等,为决策者提供准确、快速和可靠的决策依据。
云计算与大数据的关系

云计算与大数据的关系云计算与大数据的关系一、引言云计算和大数据是当前信息技术领域的两个热门话题,它们对于企业和个人来说都具有重要意义。
本文将介绍云计算和大数据的关系,详细分析它们之间的相互影响和互为支撑的关系。
二、云计算和大数据的基础概念1、云计算的定义与特点a:云计算的定义:云计算是一种基于网络的计算模式,通过互联网提供按需可扩展的计算资源。
b:云计算的特点:弹性扩展、按需分配、虚拟化、自助服务、网络访问等。
2、大数据的定义与特点a:大数据的定义:大数据是指大量、高速产生的结构化和非结构化数据,需要特殊处理以提取价值信息。
b:大数据的特点:数据量大、速度快、多样性强、价值密度低、复杂性高等。
三、云计算与大数据的相互关系1、云计算对大数据的影响a:大数据存储和处理能力的增强:云计算提供了高性能的计算和存储资源,为大数据的存储和处理提供了强大支持。
b:弹性和灵活性:云计算可以根据大数据的需求,提供弹性和灵活的计算资源,满足大数据处理的高效性和灵活性要求。
c:节约成本:云计算的共享资源模式可以减少大数据处理过程中的硬件和软件成本。
d:安全性和隐私保护:云计算提供了安全可靠的计算环境,保护大数据的安全性和隐私。
2、大数据对云计算的影响a:数据驱动的云计算应用:大数据分析可以为云计算提供更深入的洞察和决策支持,推动云计算应用的创新和发展。
b:弹性和智能化:大数据分析可以帮助云计算平台实现智能化的资源调度和管理,提高资源利用率和性能。
c:安全性和隐私保护:大数据分析可以提供更强大的安全和隐私保护机制,保障云计算中的数据安全性。
四、云计算与大数据的应用场景1、企业级应用a:数据分析与挖掘:利用云计算和大数据技术,对企业内部和外部的数据进行分析和挖掘,发掘商业价值。
b:业务流程优化:通过云计算和大数据分析,优化企业的业务流程,提高效率和竞争力。
2、与公共服务a:智慧城市建设:利用云计算和大数据分析,优化城市管理和公共服务,实现智慧城市建设。
云计算与大数据岗位工作任务

云计算与大数据岗位工作任务云计算和大数据是现代信息技术的重要领域,随着技术的发展和企业对数据的需求增加,云计算与大数据岗位的需求也越来越大。
下面我将为大家详细介绍云计算与大数据岗位的工作任务。
一、云计算岗位的工作任务1. 设计、搭建和维护云计算平台:云计算工程师需要根据企业的需求,设计和搭建适合企业的云计算平台。
他们负责部署和维护云计算的基础设施,包括服务器、存储、网络等。
2. 负责云计算平台的安全和性能优化:云计算工程师需要确保云计算平台的安全性,包括数据的加密和访问权限的管理。
同时,他们也需要对云计算平台的性能进行优化,提高系统的响应速度和稳定性。
3. 进行云计算平台的监控和故障处理:云计算平台是一个复杂的系统,可能会出现各种故障。
云计算工程师需要进行系统的监控和故障处理,及时发现和解决问题,确保系统的正常运行。
4. 提供云计算服务和支持:云计算工程师需要与用户沟通,了解他们的需求,并根据需求提供云计算服务和支持。
他们需要解答用户的问题,协助用户使用云计算平台,并及时解决用户遇到的问题。
5. 进行云计算技术的研究和开发:云计算是一个不断发展的领域,云计算工程师需要进行技术的研究和开发,跟踪云计算技术的最新进展,并在实际应用中进行创新和优化。
二、大数据岗位的工作任务1. 大数据的采集和清洗:大数据工程师需要从各种数据源中采集数据,并进行清洗和预处理,确保数据的质量和准确性。
他们需要使用各种数据采集工具和技术,包括爬虫、ETL等。
2. 大数据的存储和管理:大数据工程师需要设计和实现大数据的存储和管理系统,包括数据仓库、分布式存储系统等。
他们需要选择适合企业需求的存储和管理方案,并进行系统的部署和维护。
3. 大数据的分析和挖掘:大数据工程师需要运用各种数据分析和挖掘技术,对大数据进行分析和挖掘,提取有价值的信息和知识。
他们需要使用机器学习、数据挖掘等技术,对数据进行模型建立和预测。
4. 提供大数据服务和支持:大数据工程师需要与用户沟通,了解他们的需求,并根据需求提供大数据服务和支持。
云计算与大数据的关系

云计算与大数据的关系云计算和大数据是当今IT领域中最受关注的两个技术,它们的发展离不开彼此。
云计算是一种基于网络的计算模型,可以通过互联网提供各种计算服务,包括存储、处理和管理数据。
而大数据则是指以巨大的数据集为研究对象,将这些数据用于挖掘信息和发现规律以支持决策。
云计算和大数据之间的关系是相互促进的。
云计算提供了大数据处理的基础设施和资源,大数据则为云计算提供了应用场景和需求驱动。
云计算可以处理大规模的数据集,提供强大的计算能力和存储容量,大数据也为云计算打开了一个广阔的市场空间。
云计算的发展为大数据应用提供了支撑。
在过去,大数据的应用难以推广,因为需要巨大的计算资源和存储设备。
然而,云计算改变了这种情况。
通过云计算,企业和个人可以轻松地使用强大的数据处理和存储服务,不需要额外投资硬件设备。
同时,云计算的灵活性和可扩展性也让大数据应用变得更加容易。
同时,大数据的应用也为云计算带来了新的需求和挑战。
大数据应用需要处理大量的数据和信息,需要高度的性能和可靠性。
为了满足这些需求,云计算提供了各种类型的服务,如大数据分析、数据存储和计算能力的提供等。
云计算的服务可以按需调节,使得大数据应用可以更轻松地管理和处理海量的数据。
不仅如此,云计算也推动了大数据应用的发展。
云计算提供了更多的数据分析和存储工具,如分布式数据存储系统、实时数据处理和流媒体服务等。
这些工具可以帮助企业和研究机构更高效地处理大数据,发现数据中的价值和洞见。
总的来说,云计算和大数据是很好的伙伴,它们的合作促进了各自的发展和应用。
云计算和大数据的结合,将会催生更多的新型应用、新业态和新的商业模式。
云计算大数据毕业设计作品

云计算大数据毕业设计作品
云计算和大数据是当今信息技术领域的热门话题,毕业设计作品可以结合这两个领域,进行深入研究和实践。
以下是一些可能的毕业设计作品主题和方向:
1. 云计算平台的设计与实现,可以选择一种主流的云计算平台(如AWS、Azure、Google Cloud等),深入研究其架构、功能和特点,然后设计并实现一个简化版的云计算平台,包括虚拟化、资源调度、安全性等方面的功能。
2. 大数据处理与分析平台,结合云计算技术,设计并实现一个大数据处理与分析平台,可以包括数据采集、存储、处理和可视化分析等功能,可以选择Hadoop、Spark等开源框架进行深入研究和应用。
3. 云计算与大数据在特定领域的应用,选择某一特定领域(如医疗、金融、物联网等),结合云计算和大数据技术,设计并实现一个应用系统,用于解决该领域的实际问题,例如基于大数据的疾病预测系统、基于云计算的智能交通管理系统等。
4. 云计算与大数据安全性研究,针对云计算和大数据领域的安
全性问题,进行深入研究和分析,设计并实现一种安全性解决方案,可以包括数据加密、访问控制、安全监控等方面的内容。
5. 云计算与大数据性能优化,针对云计算和大数据系统的性能
问题,进行调研和实验,设计并实现一种性能优化方案,可以包括
资源调度算法、并行计算优化、数据压缩等方面的内容。
以上是一些可能的毕业设计作品主题和方向,希望能够给你一
些启发。
针对不同的主题,可以选择合适的研究方法和技术工具,
进行深入的研究和实践。
祝你的毕业设计顺利完成!。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
. . . . . . . . 附件7 “云计算和大数据”重点专项 2016年度项目申报指南
依据《国家中长期科学和技术发展规划纲要(2006-2020年)》、《关于促进云计算创新发展,培育信息产业新业态的意见》、《国务院关于印发促进大数据发展行动纲要的通知》等文件,科技部会同相关部门组织开展了《云计算和大数据重点专项实施方案》编制工作,在此基础上启动“云计算和大数据重点专项”2016年度项目,并发布本指南。 云计算和大数据专项总体目标是:形成自主可控的云计算和大数据系统解决方案、技术体系和标准规;在云计算与大数据的重大设备、核心软件、支撑平台等方面突破一批关键技术;基本形成以自主云计算与大数据骨干企业为主体的产业生态体系和具有全球竞争优势的云计算与大数据产业集群;提升资源汇聚、数据收集、存储管理、分析挖掘、安全保障、按需服务等能力,实现核心关键技术自主可控,促进我国云计算和大数据技术的研究与应用达到国际领先水平,加快建成信息强国。 专项围绕云计算和大数据基础设施、基于云模式和数据驱动的新型软件、大数据分析应用与类人智能、云端融合的感知认知 — 2 —
与人机交互4个创新链(技术方向)部署31项研究任务,专项实施周期为2016年-2020年。 按照分步实施、重点突出原则,2016年首批在4个技术方向启动12个任务。 针对任务中的研究容,以项目为单位进行整体申报,研究容需覆盖相应指南方向的全部考核指标。项目设1名项目负责人,项目下设课题数原则上不超过5个,每个课题设1名课题负责人,每个课题牵头单位及参与单位原则上不超过5个。 1.云计算和大数据基础设施 1.1 软件定义的云计算基础理论和方法(前沿基础类) 研究容:软件定义的云计算基础理论;能效优化的分布存储和处理的硬件及软件系统架构;大数据的复杂性、可计算性与云平台处理效率的关系;混合云中面向软件定义的虚拟专用云的动态构建理论与方法以及应用运行机理;资源聚合与解耦的模型与构建方法;软件定义云平台的可用性、可审计性等度量与测评方法;软件定义的云计算原型系统。 考核指标:建立软件定义的云计算基础理论,设计一组有效的模型与方法并在云计算原型系统中予以验证;形成软件定义云计算的可用性、可审计性与性能的度量模型与评测方法;形成一批高水平、有国际高影响力的成果;形成一组软件定义的云计算相关规和标准(送审稿)。 . . . . . . . . 支持年限:不超过5年。 拟支持项目数:1-2项。 1.2 新型大数据存储技术与平台(共性关键技术类) 研究容:大数据环境下基于新型存储器件的存储体系架构及控制方法,以及与之对应的持久存管理和数据组织方法。在此基础上形成基于非易失存储器件的新设备、驱动软件、专用高效持久存管理和文件系统;异构存储介质高效融合的高并发低延迟的万亿文件级大数据存储系统;新型数据冗余技术,数据冗余的高效转化与高效重构技术;数据保存50年以上的方法和技术,以保障信息不丢失、能再现;大数据存储系统的评估理论、方法及其工具软件。 考核指标:(1)研制有自主知识产权的高速低耗存储控制器及设备、驱动软件、专用高效持久存管理和文件系统;容量型设备容量≥10TB,性能型设备IOPS≥100万、带宽≥10GB/s,能耗最低可达10瓦/TB;节点可扩展;(2)系统支持多存储介质设备异构融合,支持高密低耗、系列化的存储节点,节点容量达PB级;(3)系统支持万亿文件;在万级并发访问下,巨量小文件平均访问延迟低于10ms;(4)在EB级大数据场景下应用于1-3个典型领域;(5)申请一批本领域的知识产权。 支持年限:不超过4年。 拟支持项目数:1-2项。 — 2 —
1.3基于数据流的大数据分析系统(共性关键技术类) 研究容:研究用于大数据分析的数据流加速器系统,包括数据流加速器硬件、数据流编程模型及优化编译器以及运行时系统等。(1)数据流加速器硬件;(2)面向数据流加速器的编程模型及优化编译器,提出能充分发挥数据流在并行性和同步方面的优势的编程模型;研究数据流的无编程动态模型定制与生成方法;(3)面向数据流加速器的运行时系统,包括加速器资源的分配与回收、动态重构、通信管理、存管理等,支持基于数据流编程模型的在线计算和实时计算;支持对基于不同硬件架构的异构计算资源的统一抽象和一致高效管理;(4)数据流处理分析的可视化展示和监控管理工具。 考核指标:(1)在加速器上完成不少于三个典型大数据应用的加速;在不少于5个领域进行成功应用示;(2)在典型大数据应用上的性能功耗比是通用CPU平台的10倍以上;(3)单块加速器卡上存不少于256GB,单台服务器可支持4块加速卡,加速器之间可以高速互连,互连理论带宽≥100Gbps,实测带宽≥80Gbps;(4)系统可通过多机互连扩展,可处理PB量级的大数据;(5)针对高并发的数据流实时分析,单物理节点(普通PC服务器)流式数据处理吞吐量不小于3万笔/秒,集群数据处理吞吐量不小于100万笔/秒,单笔请求处理平均延时小于10毫秒。 支持年限:不超过3年。 . . . . . . . . 拟支持项目数:1-2项。 1.4 面向云计算的网络化操作系统(共性关键技术类) 研究容:软件定义的新一代ICT系统体系结构,重新界定软硬件的功能划分以及面向应用的配置方法与机制;超大规模资源管理和调度核心技术和基础平台;研制新一代云操作系统、云组件、数据中心操作系统等基础核心软件;研究硬件元素管理的合理粒度并提供应用编程接口,通过软件方式实现高效资源整合、调度、自适应与自动化协同;突破支撑大规模数据处理、存计算、科学计算等具有海量资源需求的巨型虚拟机支撑方法,支持新型异构设备的巨型虚拟机;研究基于容器的虚拟化方法,在提升效率的同时显著提升容器的隔离性;研究面向领域需求的快速领域虚拟机定制方法,建立领域虚拟化组件库,集成面向领域的虚拟机仓库;研究管理灵活性、能耗和性能损耗之间的合理平衡,降低软件定义系统的复杂性和故障率,通过软件管理降低系统能耗,研究评估理论、方法及其工具软件。 考核指标:研发具有自主知识产权的网络化操作系统;显著提升现有虚拟化方法的资源整合能力与管理效率,云系统整体资源利用率比现有世界先进水平提高1倍;支持包括FPGA、GPU、RDMA与非易失存等设备虚拟化,单个巨型虚拟机支持各类存超过2TB,虚拟处理核数目超过500个,性能相对当前主流虚拟化平台提升30%以上;建立面向专业领域的虚拟机示仓库,支撑不少于5 — 2 —
个领域的应用,可定制的虚拟机类型超过100种;研发新一代云计算核心软件,形成软件定义的技术体系、方法、工具、环境和最佳实践,初步形成支持软件定义的一体化硬件架构、基础软件,并在2个或者2个以上的重点领域进行应用验证与推广。 支持年限:不超过4年。 拟支持项目数:1-2项。 1.5面向特定领域的大数据管理系统(共性关键技术类) 研究容:支持典型应用场景的开放架构大数据管理系统的设计,以及大数据管理系统标准和规、系统评测基准的研制;面向关系数据、图数据、键-值对数据、非结构化数据等不同数据模型的大数据管理关键技术研究与相应大数据管理系统研制;数据驱动的大数据管理系统的监控、运维与调优工具研制。 考核指标:设计开放式架构大数据管理系统架构,形成大数据管理系统的系列国家标准和规,提出针对至少3种数据模型的大数据管理系统评测基准和测试工具。研制针对不同数据模型的具备高扩展性、高可用性、高性能的数据管理系统及其关键技术,在基准测试上的指标与国际主流产品可比。研制大数据应用所急需的、可独立部署的系统管理工具不少于5个。开展2-3个示应用,数据规模达到EB级别。申请一批本领域的知识产权。 支持年限:不超过3年。 拟支持项目数:1-3项。 . . . . . . . . 2.基于云模式和数据驱动的新型软件 2.1基于大数据的软件智能开发方法和环境(共性关键技术类) 研究容:研究软件开发相关大数据的收集、整理、存储、检索等关键技术;围绕知识获取、管理和利用形成知识驱动的软件开发方法,提升传统软件工具的知识处理机制,为软件建模、编码、程序理解、测试等工具建立起基于知识的处理架构,形成知识驱动的功能支撑,为开发人员提供基于问答(QA:Question-Answer)的开发环境,面向特定领域建立软件知识图谱,实现基于大数据的软件智能开发环境。 考核指标:产出基于大数据的软件智能开发关键模型、算法、技术、工具和系统,形成PB级的软件工程大数据资源,问答系统覆盖10个领域或行业的软件开发,问题回答性能与效果均优于通用中文搜索引擎,在5个大型软件企业进行应用推广,申请一批本领域的知识产权。 支持年限:不超过3年。 拟支持项目数:1-2项。 3.大数据分析应用与类人智能 3.1 大数据知识工程基础理论及其应用研究(前沿基础类+共性关键技术类) 研究容:针对大数据异构、自治、复杂、演化的网络环境, — 2 —
研究多源、动态、异质碎片化知识/知识簇的表示模型与在线挖掘方法,揭示碎片化知识的时空特性和演化机理;研究碎片化知识间语义关联与涌现特性,探寻其动态挖掘与拓扑融合机理;设计多粒度情景感知与知识寻径模型,研究交互式个性化服务的知识适配机理。 考核指标:建立大数据知识工程基础理论,针对目前大数据向大知识转化过程中困惑人们的难题,设计出一组有效的算法并在实际应用中得到验证;研究和形成利用海量、低质碎片化知识构建新型多通道知识服务平台的方法学体系,在此基础上融合10个以上领域的碎片化知识,建立PB级别的网上知识服务中心;选择既能体现国家重大需求又具有知识密集型应用特点的应用领域(如普适医疗、远程教育、互联网创业等),开展示应用,用户规模超过100万人。 支持年限:不超过5年。 拟支持项目数:1-2项。 3.2面向大围场景透彻感知的视觉大数据智能分析关键技术(共性关键技术类) 研究容:从个体、群体和场景三个方面研究大围场景视觉感知大数据的智能分析关键技术。在个体信息感知方面研究多模态高通量生物特征获取与身份识别技术、个体属性特征与动作行为识别技术、行人重识别技术;在群体信息感知方面研究人群流量