2020年(发展战略)数据库新技术及其发展方向
精编2020年最新公需科目《大数据》完整题库(含答案)

2020年最新公需科目《大数据》考试题(含答案)一、单选题1.根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( C)。
(单选题)A.数据管理人员B.数据分析员C.研究科学家D.软件开发工程师2.下列关于大数据的分析理念的说法中,错误的是(D )。
(单选题)A.在数据基础上倾向于全体数据而不是抽样数据B.在分析方法上更注重相关分析而不是因果分析C.在分析效果上更追究效率而不是绝对精确D.在数据规模上强调相对数据而不是绝对数据二、多选题3.根据周琦老师所讲,高德交通信息服务覆盖全国主干道路及其它()以上。
A.70%B.50%C.90%D.30%4.根据周琦老师所讲,大数据加速道路网络快速更新,高德()完成全国10万公里15万处更新。
A.2010年B.2006年C.2014年D.2008年5.2015年8月31日,国务院印发了《促进大数据发展行动纲要》。
正确错误6.2012年《全国现代农业发展规划(2011-2015年)》对“农业信息化”作了比较全面的阐述。
正确错误7.大数据能帮助教师改进教学。
利用大数据方法,教师通过学生反馈回来的作业,就可以发现到底是哪些学生并没有真正听懂,进而有针对性地加以辅导。
对8.2011年,()发布《大数据.创新.竞争和生产力的下一个新领域》报告,大数据开始备受关注。
CA.微软公司B.百度公司C.麦肯锡公司D.阿里巴巴公司9.国务院办公厅是在哪一年印发的《关于促进和规范健康医疗大数据应用发展的指导意见》?DA.2014年B.2015年C.2013年D.2016年10.对于大数据而言,最基本.最重要的要求就是减少错误.保证质量。
因此,大数据收集的信息量要尽量精确。
( F)(判断题)是否11.统筹城乡发展,就是要求公共财政向农村倾斜.公共服务向农村覆盖.公共设施向农村延伸。
对12.2015 年,阿里平台完成农产品销售达到 6000 多亿元。
最新2020年最新公需科目:《大数据》模拟题库(含答案)

2020年最新公需科目《大数据》考试题(含答案)一、选择题1.内存够大,所以集群的瓶颈不可能是 a 和 d二、单选题2.在数据生命周期管理实践中,( B)是执行方法。
(单选题) A.数据存储和备份规范B.数据管理和维护C.数据价值发觉和利用D.数据应用开发和管理3.数据仓库的最终目的是(D )。
(单选题)A.收集业务需求建立数据仓库逻辑模型C.开发数据仓库的应用分析D.为用户和业务部门提供决策支持4.(D )反映数据的精细化程度,越细化的数据,价值越高。
(单选题)A.规模B.活性C.关联度D.颗粒度5.下列国家的大数据发展行动中,集中体现“重视基础.首都先行”的国家是( D)。
(单选题)A.美国B.日本C.中国D.韩国6.下列论据中,能够支撑“大数据无所不能”的观点的是( A)。
(单选题)A.互联网金融打破了传统的观念和行为B.大数据存在泡沫C.大数据具有非常高的成本D.个人隐私泄露与信息安全担忧三、多选题7.根据周琦老师所讲,高德交通报告针对全国38个城市交通状态进行挖掘分析。
√正确错误8.2012年《全国现代农业发展规划(2011-2015年)》对“农业信息化”作了比较全面的阐述。
正确错误9.2012年全国各城市支付宝人均支出排名中,位居第一位的是()CA.嘉兴市B.杭州市C.嘉义市D.高雄市10.根据周琦老师所讲,以下哪些属于数据挖掘的内容?ABC分A.补充与完善路网属性B.建立道路拥堵概率与拥堵趋势变化模型C.多维分析统计用户出行规律D.高德地图导航有躲避拥堵功能11.根据涂子沛先生所讲,以下说法正确的有哪些?ABCD分A.数据垃圾对商业公司是一个挑战B.个人要把数据当做自己的遗产C.中国社会迟早要面临数据遗产问题D.国家要制定合适的法律来规范数据遗产继承的问题12.贵州发展大数据带动的衍生业态包括()。
ABCD分A.智慧教育B.创客小镇C.智慧旅游D.智慧健康13.传统的“统治”或“管理”观念认为,公共事务的管理权只属于政府对14.依据黑龙江大农场的应用,精准农业技术能够将总成本降低15%-20%。
湖北省经济和信息化厅关于印发湖北省大数据产业“十四五”发展规划的通知

湖北省经济和信息化厅关于印发湖北省大数据产业“十四五”发展规划的通知文章属性•【制定机关】湖北省经济和信息化厅•【公布日期】2021.12.31•【字号】鄂经信规划〔2021〕204号•【施行日期】2021.12.31•【效力等级】地方规范性文件•【时效性】现行有效•【主题分类】发展规划正文湖北省经济和信息化厅关于印发湖北省大数据产业“十四五”发展规划的通知各市、州、县经信局,省直相关部门:现将《湖北省大数据产业“十四五”发展规划》印发给你们,请结合工作实际,认真贯彻执行。
湖北省经济和信息化厅2021年12月31日湖北省大数据产业“十四五”发展规划信息技术与经济社会的交汇融合引发了数据迅猛增长,数据正在成为与物质、能源同等重要的基础性战略资源。
立足湖北通信枢纽、信息产业基础和人才资源优势,推动大数据产业发展,对促进经济转型和创新发展、提升政府治理能力、优化民生公共服务等具有重大意义。
为贯彻落实国家大数据发展战略,促进大数据产业快速健康发展,依据《“十四五”大数据产业发展规划》和《湖北省国民经济和社会发展第十四个五年规划和二〇三五年远景目标纲要》,特编制本规划。
一、发展基础(一)发展现状一是基础设施建设有序推进。
全省在用数据中心超过80个,机架数量超过10.8万架,武钢大数据中心、国家网安基地中金大数据中心、襄阳云计算基地和宜昌三峡大数据中心等项目加快建设,初步形成了“一主两翼”的数据中心集群。
截至2020年,全省5G宏基站累计超3.6万个,百兆及以上宽带接入用户累计达到1624万户,互联网出省带宽达36.6Tbps;武汉顶级节点已接入二级节点17个,标识注册量超过48亿。
二是大数据应用领域不断拓宽。
省内龙头企业积极开展大数据应用探索,在装备、汽车、电子、化工等行业建成15个重点工业互联网平台,长飞、武重等龙头企业获得全国工业互联网试点示范。
湖北省政务大数据能力平台入库数据达172亿条,对接完成179个重点信息系统,省政务办“破信息共享藩篱筑政务一窗底座”实践案例荣获政务服务创新奖。
大数据产业十三五发展规划

大数据产业十三五发展规划(2016-2020年)2018年8月前言 (3)一、我国发展大数据产业的基础 (4)二、“十三五”时期面临的形势 (6)三、指导思想和发展目标 (8)(一)指导思想 (8)(二)发展原则 (8)(三)发展目标 (9)四、重点任务和重大工程 (11)(一)强化大数据技术产品研发 (11)(二)深化工业大数据创新应用 (13)(三)促进行业大数据应用发展 (15)(四)加快大数据产业主体培育 (17)(五)完善大数据产业支撑体系 (20)(六)提升大数据安全保障能力 (22)五、保障措施 (24)(一)推进体制机制创新 (24)(二)健全相关政策法规制度 (24)(三)加大政策扶持力度 (25)(四)建设多层次人才队伍 (25)(五)推动国际化发展 (26)今日,工信部官网正式发布大数据产业”十三五“发展规划,随着产业纲领性文件的发布,将积极推动大数据产业健康快速发展。
数据是国家基础性战略资源,是21世纪的“钻石矿”。
党中央、国务院高度重视大数据在经济社会发展中的作用,党的十八届五中全会提出“实施国家大数据战略”,国务院印发《促进大数据发展行动纲要》,全面推进大数据发展,加快建设数据强国。
“十三五”时期是我国全面建成小康社会的决胜阶段,是新旧动能接续转换的关键时期,全球新一代信息产业处于加速变革期,大数据技术和应用处于创新突破期,国内市场需求处于爆发期,我国大数据产业面临重要的发展机遇。
抢抓机遇,推动大数据产业发展,对提升政府治理能力、优化民生公共服务、促进经济转型和创新发展有重大意义。
为推动我国大数据产业持续健康发展,深入贯彻十八届五中全会精神,实施国家大数据战略,落实国务院《促进大数据发展行动纲要》,按照《国民经济和社会发展第十三个五年规划纲要》的总体部署,编制本规划。
一、我国发展大数据产业的基础大数据产业指以数据生产、采集、存储、加工、分析、服务为主的相关经济活动,包括数据资源建设、大数据软硬件产品的开发、销售和租赁活动,以及相关信息技术服务。
最新2020年最新公需科目《大数据》完整题库(含答案)

2020年最新公需科目《大数据》考试题(含答案)一、单选题1.智能健康手环的应用开发,体现了( D)的数据采集技术的应用。
(单选题)A.统计报表B.网络爬虫C.API接口D.传感器2.当前社会中,最为突出的大数据环境是(A )。
(单选题) A.互联网B.物联网C.综合国力D.自然资源二、多选题3.根据周琦老师所讲,将大数据智能化融入高德地图,能够提供更精准的到达时间预测和实时躲避拥堵功能。
对4.“十二五”以来我国信息化发展的亮点包括以下哪些方面?■A.信息产业的支撑性.保障性.带动性作用进一步增强■B.信息基础设施建设取得长足进步,为信息化全面深化发展提供了有力保障■C.电子商务异军突起,互联网经济发展速度超出预期■D.两化融合成为当前我国工业创新驱动.转型升级的时代特征5.云计算的特点包括以下哪些方面?■A.服务可计算■B.高性价比■C.服务可租用D.低使用度 28.下列选项中,属于贵州发展大数据的先天优势的是()。
■A.空气清新■B.远离地震带■C.气候凉爽■D.电力资源充沛6.大数据作为一种数据集合,它的含义包括()。
■A.数据很大B.很有价值■C.构成复杂■D.变化很快7.宁家骏委员指出,20世纪下半个世纪直至现在,是信息技术时代。
对8.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是 3分得分.■A.从柜台式管理走向全天候管理■B.从粗放化管理走向精细化管理■C.从被动反应走向主动预见型管理■D.从单兵作战走向联合共享型管理9.宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。
对10.大数据的核心是洞察,洞察有以下哪些特色?ABCD分A.洞察工作重点B.洞察调度奥妙C.洞察管理规律D.洞察未来趋势11.云计算是信息技术发展和集成应用到新阶段产生的新技术。
正确错误12.《中共中央关于全面深化改革若干重大问题的决定》提出,要推进国家()和()现代化。
A.治理能力B.治理体系C.治理文化D.治理制度13.以下说法正确的有哪些?A.机器的智能方式和人是完全一样的B.机器的智能方式是结果导向的C.机器的智能方式和人的智能不同D.机器产生智能的方式是通过数据.数学模型14.信息技术的发展非常快,表现在()。
精选2020年最新公需科目:《大数据》模拟考核题库(含标准答案)

2020年最新公需科目《大数据》考试题(含答案)一、选择题1.下列哪项通常是集群的最主要瓶颈a)CPU b)网络 c)磁盘Id)内存答案.C 磁盘首先集群的目的是为了节省成本,用廉价的 pc 机,取代小型机及大型机。
小型机和大型机有什么特点?2.cpu 处理能力强二、填空题3.HDFS 默认 Blck Size是64MB。
(填128也正确)三、单选题4.万维网之父是( C)。
(单选题)A.彼得·德鲁克B.舍恩伯格C.蒂姆·伯纳斯-李D.斯科特·布朗四、多选题5.大数据作为一种数据集合,它的含义包括()。
ACDA.数据很大B.很有价值C.构成复杂D.变化很快6.宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。
正确错误7.阿兰·图灵在哪一年提出图灵测试的概念?CA.1952年B.1954年C.1950年D.1955年8.贵州发展大数据的“八个一”建议包括()。
■A.制定一个工作计划.建立一个领导机构■B.培养一批干部.出台一批政策■C.引入一批人才.聚集一批创客■D.谋划一批产业.引进一批项目9.根据涂子沛先生所讲,以下说法正确的有哪些?ABCD分A.数据垃圾对商业公司是一个挑战B.个人要把数据当做自己的遗产C.中国社会迟早要面临数据遗产问题D.国家要制定合适的法律来规范数据遗产继承的问题10.根据周琦老师所讲,高德交通信息服务覆盖全国主干道路及其它()以上。
DA.90%B.70%C.30%D.50%11.云计算就是软件在云端无所不在.无限强大的计算,也叫网络化计算或网格计算。
(判断题 1 分)■正确错误 60.根据周琦老师所讲,高德地图使用大数据能进行小路的识别。
(判断题 1 分)分■正确错误12.云计算使得使用信息的存储是一个()的方式,它会大大地节约网络的成本,使得网络将来越来越泛在.越来越普及,成本越来越低。
ADA.分布式B.密闭式C.密集式D.共享式13.根据周琦老师所讲,高德交通信息服务覆盖全国高速(B)以上。
邢台市人民政府办公室关于印发邢台市康养产业发展规划(2020—2025年)的通知

邢台市人民政府办公室关于印发邢台市康养产业发展规划(2020—2025年)的通知文章属性•【制定机关】邢台市人民政府办公室•【公布日期】2020.07.08•【字号】邢政办字〔2020〕37号•【施行日期】2020.07.08•【效力等级】地方规范性文件•【时效性】现行有效•【主题分类】工业和信息化管理综合规定,企业技术进步与高新技术产业化正文邢台市人民政府办公室关于印发邢台市康养产业发展规划(2020—2025年)的通知各县(市、区)人民政府,开发区、邢东新区管委会,市政府各部门:《邢台市康养产业发展规划(2020—2025年)》已经市政府同意,现印发给你们,请认真组织实施。
邢台市人民政府办公室2020年7月8日邢台市康养产业发展规划(2020—2025年)康养产业是为社会提供康养产品、服务的各相关产业和部门组成业态的总和,是为满足人民群众全生命周期健康管理需求的融合性产业,也是备受关注的新兴产业。
为了全面深入实施“健康中国”战略,贯彻落实国务院、省政府关于促进健康服务业、康养产业发展的部署要求,推动邢台市康养产业与经济社会协调发展,满足人民群众康养服务需求,特编制《邢台市康养产业发展规划》。
规划期限为2020—2025年。
规划范围为邢台市所辖全部行政区域,包括20个县(市、区),总面积1.24万平方公里。
一、产业发展基础(一)主要优势。
自然生态环境优良。
全市有林地面积601万亩,森林覆盖率达到32.1%。
其中,太行山深山地区植被覆盖率高达94.6%,林木覆盖率达90.7%,空气中负氧离子含量达每立方厘米1.2万个。
全市矿物质水、地热温泉资源也极为丰富。
这些优良的自然生态资源,为康养产业发展提供了广阔的承载空间。
旅游资源富集。
邢台市山地自然资源和山地运动旅游资源富集,西部太行山区避暑避霾优势明显,山地越野、山地自行车、滑雪、攀岩、漂流等旅游资源丰富。
现有A级以上旅游景区34家,其中4A级景区10家,3A级景区15家。
最新2020年最新公需科目《大数据》模拟题库(含答案)

2020年最新公需科目《大数据》考试题(含答案)一、选择题1.Hadp 作者a)Martin Fwlerb)Kent Beckc)Dug cutting答案.C Dug cutting二、填空题2.Map/Reduce框架由一个单独的master JbTracker 和每个集群节点一个slave TaskTracker 共同组成。
三、多选题3.医疗健康数据的基本情况不包括以下哪项? CA.诊疗数据B.个人健康管理数据C.公共安全数据D.健康档案数据4.2000年,全国涉农网站超过6000家。
×正确错误5.大数据的思维会把原来销售的概念变成服务的概念。
√正确错误6.大数据的本质是A.联系B.挖掘C.洞察D.搜集7.云计算使得使用信息的存储是一个()的方式,它会大大地节约网络的成本,使得网络将来越来越泛在.越来越普及,成本越来越低。
A.密集式B.共享式C.分布式D.密闭式8.运用大数据进行大治理要做到()。
ABCD分A.用数据决策B.用数据管理C.用数据说话D.用数据创新9.大数据的思维会把原来销售的概念变成服务的概念。
对10.下列哪些国家已经将大数据上升为国家战略?■A.英国■B.日本■C.美国■D.法国11.大数据的思维会把原来销售的概念变成服务的概念。
(判断题 1 分)■正确错误12.()年,部分计算机专家首次提出大数据概念。
DA.2010B.2011C.2005D.200813.2015年,腾讯微信月活跃用户超过8亿。
正确错误14.数据再利用的意义在于( ABC)。
A.挖掘数据的潜在价值实现数据重组的创新价值C.利用数据可扩展性拓宽业务领域D.优化存储设备,降低设备成本E.提高社会效益,优化社会管理四、论述题15.根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种(C)A.数据管理人员B。
数据分析员C。
研究科学家D。
软件开发工程师16.下列关于计算机木马的说法错误的是:(A )A.只要不访问互联网,就能避免受到木马侵害B.Wrd文档也会感染木马C.杀毒软件对防止木马病毒泛滥具有重要作用D.尽量访问知名网站能减少感染木马的概率17.具体来说,摩尔定律就是每(D)个月,产品的性能将提高一倍。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(发展战略)数据库新技术及其发展方向数据库新技术及其发展趋势数据库技术是计算机科学的重要分支,主要研究如何安全高效地管理大量、持久、共享的数据。
数据库的研究始于20世纪60年代中期,它的发展有着三大标志性事件。
第壹件大事,1969年IBMXX公司研制开发了基于层次模型的数据库管理系统的商品化软件InformationManagementSystem,即IMS系统,是首例成功的数据库管理系统软件。
第二件大事,美国数据系统语言协会CODASYL(ConferenceOnDataSystemLanguage)下属的数据库任务组DBTG(DataBaseTaskGroup)对数据库方法进行系统的研究和讨论后,于20世纪60年代末到70年代初提出了若干方案。
DBTG方案确定且建立了数据库系统的许多概念、方法和技术。
DBTG所提议的方法是基于网状结构的,它是数据库网状模型的基础和典型代表。
第三件大事,1970年IBMXX公司SanJose研究实验室的研究员E.F.Codd 博士发表了题为“大型共享数据库数据的关系模型”的论文,提出数据库的关系模型,从而开创了数据库关系方法和关系数据理论的研究领域,为关系数据库技术奠定了理论基础,E.F.Codd因此于1981年获得ACM图录奖。
20世纪80年代几乎所有新开发的系统均是关系系统。
随着计算机系统硬件、Internet和Web技术的发展,数据库系统所管理的数据格式、数据处理方法以及应用环境不断变化,同时人工智能、多媒体技术和其他学科技术的发展,数据库技术面临着前所未有的挑战。
当前数据库技术发展的现状,关系数据库技术仍然是主流国内数据库的发展趋势也是飞速的,于数据库技术的当前及未来发展里程中,数据仓库以及基于此技术的商业智能无疑将是大势所趋。
IBM的实验室于这方面进行了10多年的研究,且将研究成果发展成为商用产品。
除了用于OLAP(联机分析处理)的后台服务器DB20LAPServer外,IBM仍提供了壹系列关联的产品,包括前端工具,形成壹整套解决方案。
其它数据库厂商于数据仓库领域也毫不示弱方法各有不同。
Informix也是类似,于其动态服务器IDS(InformixDynamicServer)中提供壹系列关联选件,如高级决策支持选件AdvancedDecisionSupportOption,OLAP选件扩展且行选件ExtendedParallelOption等,且认为这种体系结构严谨,管理方便,索引机制完善,且行处理的效率更高,其中数据仓库和数据库查询的SQL语句的壹致使用户开发更加简便;而微软则是于其SQIServer7.0中集成了代号为Plato柏拉图)的OLAP服务器,和上述XX公司不同的是,Sybase提供了专门的0LAP服务器SybaselQ,且将和数据仓库关联工具打包成WarehouseStudio。
从中国的数据库市场来见,大部分数据库系统的建立是用来进行传统的OLTP业务。
也有壹些企业建立了数据仓库系统,但真正发挥效用的却不多见。
和TCP/IP,SMTP,Java 等相比,尚不存于可靠的、完善的、被广泛接受的数据仓库标准,影响了数据仓库项目的实施。
关系数据库技术出当下20世纪70年代,经过80年代的发展到90年代已经比较成熟,于90年代初期曾壹度受到面向对象数据库的巨大挑战,可是市场最后仍是选择了关系数据库。
无论是《ORACLEXX公司的Oracle9i、IBMXX公司的DB2,仍是微软的SQLServer等均是关系型数据库。
GartnerDataquest的方案显示关系数据库管理系统(RDBMS)的市场份额最大,2000年RDBMS的市场份额占整个数据库市场的80%,这个比例比1999年增长了15%。
这组数据充分说明RDBMS仍然是当今最为流行的数据库软件。
下壹代数据库技术的发展主流—面向对象的数据序技术和关系数据序技术针对关系数据库技术现有的局限性,理论界当下主要有三种观点:(1)面向对象的数据库技术将成为下壹代数据库技术发展的主流。
(2)将面向对象的数据库技术引入关系数据库中。
即面向对象的关系数据库技术。
(3)演绎面向对象数据库技术。
目前来说,非结构化数据库也是数据库发展新趋势的壹个新的方向,非结构化数据库是部分研究者针对关系数据库模型过于简单,不便表达复杂的嵌套需要以及支持数据类型有限等局限,从数据模型人手而提出的全面基于因特网应用的新型数据库理论。
他们认为这种数据库的最大区别就于于它突破了关系数据库结构定义不易改变和数据定长的限制,支持重复字段、子字段以及变长字段且实现了对变长数据和重复字段进行处理和数据项的变长存储管理,于处理连续信息(包括全文信息)和非结构信息(重复数据和变长数据)中有着传统关系型数据库所无法比拟的优势。
但研究者认为此种数据库技术且不会完全取代当下流行的系数据库,而是它们的有益的补充。
和多学科技术的有机结合有学者指出:数据库和学科技术的结合将会建立壹系列新数据库,如分布式数据库、且行数据库、知识库、多媒体数据库等、这将是数据库技术重要的发展方向。
其中,许多研究者均对多媒体数据库作为研究的重点,且认为多媒体技术和可视化技术引人多媒体数据库将是未来数据库技术发展的热点和难点。
未来数据库技术及市场发展的俩大方向—数据仓库和电子商务,部分学者于对各个数据库厂商的发展方向和应用需求的不断扩展的现状进行分析的基础上,提出数据库技术及市场于向数据仓库和电子商务俩个方向不断发展的观点。
他们指出:从去年开始,许多行业如电信、金融、税务等逐步认识到数据仓库技术对于企业宏观发展所带来的巨大经济效益,纷纷建立起数据仓库系统。
于我国提供大型数据仓库解决方案的厂商主要有。
Oracle,IBM,Sybase,CA以及Informix等厂商,巳经建设成功且已收回投资的项目主要有招商银行系统和国信证券系统等。
目前,国内外学者对数据仓库的研究正于继续深人。
和此同时,壹些学者将数据库技术及市场发展的视角瞄准电子商务领域,他们认为:当下的信息系统逐渐要求按照以客户为中心的方式建立应用框架,因此势必要求数据库应用更加广泛地接触客户,而Internet给了我们壹个非常便捷的连接途径,通过Internet我们能够实现所谓的。
One-OneMarketing和。
One-Onebusiness,进而实现ebusines。
因此,电子商务将成为未来数据库技术发展的另壹方向。
许多研究者从实践的角度对数据库技术进行研究,提出了适合应用领域的数据库技术,如工程数据库、统计数据库、科学数据库、空间数据库、地理数据库等。
这类数据库于原理上也没有多大的变化,可是它们却和壹定的应用相结合,从而加强了系统对有关应用的支摔能力,尤其表当下数据模型、语言、查询方面。
部分研究者认为,随着研究工作的继续深人和数据库技术于实践工作中的应用,数据库技术将会更多朝着专门应用领域发展。
随着计算机网络技术及Internet应用的日趋普及,势必要求数据库系统的应用平台向Web平台迁移,最终达到全球数据信息共享的目的,如何实现数据库平台和Web平台的无缝对接即对Web数据库技术的研究已成为近期研究的热点.国内外学者对数据仓库技术以及和之关联的数据挖掘和知识发现进行了大量的研究和论述。
从数据库中发现知识(KDD)(即知识发现)的核心技术就是数据挖掘(DM)。
数据挖掘是目前发展极为迅速的壹个研究领域,它综合了机器学习、统计分析和数据库技术,是为数据库中数据的决策型使用服务的。
如何扩充数据库系统的功能,使之包括数据挖掘能力,是当前数据库界的壹个热点,具体说来,就是研究简单的查询原语和新壹代查询优化技术。
实际上,数据仓库技术所要研究和解决的问题就是从OLAP系统、异构分散的外部数据源、脱机的历史业务数据中获取数据,处理后为数据分析和管理决策提供应用服务。
部分研究者认为要推动数据仓库技术的发展就需要将数据挖掘和数据仓库协同起来工作。
他们认为:壹方面,数据仓库技术能够迎合和简化数据挖掘过程中的重要步骤,提高数据挖掘的效率和能力,确保数据挖掘中数据来源的广泛性和完整性。
另壹方面,数据挖掘技术已经成为数据仓库应用中极为重要和相对独立的方面和工具。
目前,国内对数据仓库、数据挖掘等数据库技术的研究正于紧锣密鼓地进行,该技术的发展无疑将会推动新壹轮的数据库技术的发展。
计算机科学主要目标是使计算机和人的界面尽量靠近人这边。
因此,要尽量提高计算机的智能水平。
智能化是计算机科学各个分支的研究前沿。
于数据库方面,智能化的工作是将人工智能技术和数据库技术相结合,即演绎数据库知识库研究。
目前的主要困难于于递归查询处理无法取得满意的性能,硬件技术的革命(大内存、且行机、高速存取的外存储器)将是提高知识库查询效率的重要因素。
多媒体数据处理的困难很多,即使是壹般的复杂对象目前也仍不能很好地处理。
多媒体数据的建模、存储和多媒体数据库的查询及查询处理等均是需要我们研究解决的内容。
信息分布方面主要是分布式数据库系统的研究。
分布式数据库从20世纪70年代开始研究,可是壹直没有出现商品化的分布式数据库系统,这说明了它的难度。
当前比较好的具有数据分布特征的数据库管理系统是Client/Server体系结构的系统(如:SYBASE,ORACLE7等)。
但新的计算机应用又对它提出了新的要求,智能化、新型事务模型、多媒体数据的处理、高速信息通讯、数据源的高度透明性等将是新型的分布式数据库系统的重要研究内容。
到目前为止,数据库设计和应用程序设计是分离的,且且于具体的应用系统开发中,往往由2个小组各行其事。
其后果是壹方面的优良设计不得不放弃,导致系统性能低下或用户要求无法满足。
面向对象技术是二者结合的有效手段。
可是,良好地结合仍需要很长时间的努力。
处理的数据越来越庞大、计算机网络越来越复杂、系统的智能水平越来越高是计算机系统发展的总趋势。
因此,未来的信息管理系统的特征将是处理复杂对象、分布、智能。
于复杂对象处理方面,面向对象数据库、多媒体数据库将会由于广泛的应用背景和强大系统实验而迅速发展。
于数据分布方面,客户/服务器数据库系统将快速发展,且于应用上取得良好效果。
于智能化方面,数据库和人工智能将于各自的领域不断发展、不断取得新的成果。
二者结合方面的研究将不断地利用二者的成果研制出新型的系统。
任何时候俩方面的结合均是必要的。
从对有关数据库技术发展文献的调研和综述能够见出:目前,国内外大部分研究者对数据库技术集中于以下几方面当前数据库技术发展的主流问题;未来数据库技术的发展主流问题;数据库技术和学科技术结合发展的问题;数据库技术于专业应用领域中的发展向题;数据库技术发展的新趋势问题;数据仓库技术和数据挖掘技术。
我们从信息集成、数据流管理、传感器数据库技术、半结构化数据和XML数据管理、网格数据管理、DBMS自适应管理、移动数据管理、微小型数据库、数据库用户界面等方面分别讨论目前数据库领域研究方向的发展现状、面临的问题和未来趋势。