王珊《数据库系统概论》章节题库(大数据管理)【圣才出品】
最新数据库系统概论第5版(王珊、萨师煊)课后答案第4章数据库安全性

最新数据库系统概论第5版(王珊、萨师煊)课后答案第4章数据库安全性第4章数据库安全性1.什么是数据库的安全性?答:数据库的安全性是指保护数据库以防止不合法的使用所造成的数据泄露、更改或破坏。
2.数据库安全性和计算机系统的安全性有什么关系?答:安全性问题不是数据库系统所独有的,所有计算机系统都有这个问题。
只是在数据库系统中大量数据集中存放,而且为许多最终用户直接共享,从而使安全性问题更为突出。
系统安全保护措施是否有效是数据库系统的主要指标之一。
数据库的安全性和计算机系统的安全性,包括操作系统、网络系统的安全性是紧密联系、相互支持的。
CC评估保证级(EAL)的划分4.试述实现数据库安全性控制的常用方法和技术。
答:实现数据库安全性控制的常用方法和技术有:1)用户标识和鉴别:该方法由系统提供一定的方式让用户标识自己的名字或身份。
每次用户要求进入系统时,由系统进行核对,通过鉴定后才提供系统的使用权。
2)存取控制:通过用户权限定义和合法权检查确保只有合法权限的用户访问数据库,所有未被授权的人员无法存取数据。
例如CZ 级中的自主存取控制( DAC ) , Bl 级中的强制存取控制(MAC )。
3)视图机制:为不同的用户定义视图,通过视图机制把要保密的数据对无权存取的用户隐藏起来,从而自动地对数据提供一定程度的安全保护。
4)审计:建立审计日志,把用户对数据库的所有操作自动记录下来放入审计日志中,DBA可以利用审计跟踪的信息,重现导致数据库现有状况的一系列事件,找出非法存取数据的人、时间和内容等。
5)数据加密:对存储和传输的数据进行加密处理,从而使得不知道解密算法的人无法获知数据的内容。
5.什么是数据库中的自主存取控制方法和强制存取控制方法?答:自主存取控制方法:定义各个用户对不同数据对象的存取权限。
当用户对数据库访问时首先检查用户的存取权限。
防止不合法用户对数据库的存取。
强制存取控制方法:每一个数据对象被(强制地)标以一定的密级,每一个用户也被(强制地)授予某一个级别的许可证。
数据库系统概论(第五版)王珊第五章课后习题答案

数据库系统概论(第五版)王珊第五章课后习题答案1什么是数据库的完整性?答:数据库的完整性是指数据的正确性和相容性。
2 .数据库的完整性概念与数据库的安全性概念有什么区别和联系?答:数据的完整性和安全性是两个不同的概念,但是有⼀定的联系。
前者是为了防⽌数据库中存在不符合语义的数据,防⽌错误信息的输⼊和输出,即所谓垃圾进垃圾出( Garba : e In Garba : e out )所造成的⽆效操作和错误结果。
后者是保护数据库防⽌恶意的破坏和⾮法的存取。
也就是说,安全性措施的防范对象是⾮法⽤户和⾮法操作,完整性措施的防范对象是不合语义的数据。
3 .什么是数据库的完整性约束条件?可分为哪⼏类?答完整性约束条件是指数据库中的数据应该满⾜的语义约束条件。
⼀般可以分为六类:静态列级约束、静态元组约束、静态关系约束、动态列级约束、动态元组约束、动态关系约束。
静态列级约束是对⼀个列的取值域的说明,包括以下⼏个⽅⾯: ( l )对数据类型的约束,包括数据的类型、长度、单位、精度等; ( 2 )对数据格式的约束; ( 3 )对取值范围或取值集合的约束; ( 4 )对空值的约束; ( 5 )其他约束。
静态元组约束就是规定组成⼀个元组的各个列之间的约束关系,静态元组约束只局限在单个元组上。
静态关系约束是在⼀个关系的各个元组之间或者若⼲关系之间常常存在各种联系或约束。
常见的静态关系约束有: ( l )实体完整性约束; ( 2 )参照完整性约束; ( 3 )函数依赖约束。
动态列级约束是修改列定义或列值时应满⾜的约束条件,包括下⾯两⽅⾯: ( l )修改列定义时的约束; ( 2 )修改列值时的约束。
动态元组约束是指修改某个元组的值时需要参照其旧值,并且新旧值之间需要满⾜某种约束条件。
动态关系约束是加在关系变化前后状态上的限制条件,例如事务⼀致性、原⼦性等约束条件。
4 . DBMS 的完整性控制机制应具有哪些功能?答:DBMS 的完整性控制机制应具有三个⽅⾯的功能: ( l )定义功能,即提供定义完整性约束条件的机制; ( 2 )检查功能,即检查⽤户发出的操作请求是否违背了完整性约束条件;( 3 )违约反应:如果发现⽤户的操作请求使数据违背了完整性约束条件,则采取⼀定的动作来保证数据的完整性。
数据库系统概论王珊第5版第五版教材课后习题答案详解pdf

内容说明王珊《数据库系统概论》(第5版)是我国高校采用较多的权威教材之一,无论指定参考书是否为该教材,对该教材的课后习题加以练习和掌握,非常有助于考生的复习和备考。
本册以王珊《数据库系统概论》(第5版)为依据,对课后习题进行了详细的分析与解答,并对相关重要知识点进行了延伸和归纳。
明立考试(公众号)本文档的内容参考了部分网络资料及图书资料,是出于传递更多信息之目的,并不代表故意侵犯原作者或出版人的版权和利益,如果原作者或出版人对本文档有任何异议,请与作者联系,会在第一时间处理!内容说明 (1)声明 (2)目录 (3)第1章绪论 (5)课后习题 (5)参考答案 (6)第2章关系数据库 (12)课后习题 (12)参考答案 (14)第3章关系数据库标准语言SQL (18)课后习题 (18)参考答案 (19)第4章数据库安全性 (22)课后习题 (22)参考答案 (23)第5章数据库完整性 (26)课后习题 (26)参考答案 (27)第6章关系数据理论 (29)课后习题 (29)参考答案 (31)第7章数据库设计 (34)课后习题 (34)参考答案 (35)第8章数据库编程 (39)课后习题 (39)参考答案 (40)第9章关系查询处理和查询优化 (42)课后习题 (42)参考答案 (43)第10章数据库恢复技术 (46)课后习题 (46)参考答案 (48)第11章并发控制 (51)课后习题 (51)参考答案 (53)第12章数据库管理系统 (59)课后习题 (59)参考答案 (60)第13章数据库技术发展概述 (63)课后习题 (63)参考答案 (64)第14章大数据管理 (65)课后习题 (65)参考答案 (66)第15章内存数据库系统 (68)课后习题 (68)参考答案 (69)第16章数据仓库与联机分析处理技术 (71)课后习题 (71)参考答案 (72)第1章绪论课后习题1.试述数据、数据库、数据库管理系统、数据库系统的概念。
数据库系统概论复习王珊版

数据库系统概论笔记数据(Data):是数据库中存储的基本对象数据的定义:描述事物的符号记录数据的种类:文字、图形、图象、声音等数据的特点:数据与其语义是不可分的数据库(Database,简称DB):是长期储存在计算机内、有组织的、可共享的大量数据集合数据库的特征:⏹数据按一定的数据模型组织、描述和储存⏹可为各种用户共享⏹冗余度较小⏹数据独立性较高⏹易扩展数据库管理系统(Database Management System,简称DBMS):是位于用户与操作系统之间的一层数据管理软件。
DBMS的用途:科学地组织和存储数据、高效地获取和维护数据DBMS的主要功能:数据库的运行管理保证数据的安全性、完整性、多用户对数据的并发使用发生故障后的系统恢复⏹数据库的建立和维护功能(实用程序)数据库数据批量装载数据库转储介质故障恢复数据库的重组织性能监视等数据库系统(Database System,简称DBS)是指在计算机系统中引入数据库后的系统构成。
⏹数据库系统的构成⏹由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员(和用户)构成。
⏹数据管理⏹对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。
⏹数据模型应满足三方面要求⏹能比较真实地模拟现实世界⏹容易为人所理解⏹便于在计算机上实现⏹数据模型分成两个不同的层次(1) 概念模型也称信息模型,它是按用户的观点来对数据和信息建模。
(2) 数据模型主要包括网状模型、层次模型、关系模型等,它是按计算机系统的观点对数据建模。
⏹客观对象的抽象过程---两步抽象⏹现实世界中的客观对象抽象为概念模型;⏹把概念模型转换为某一DBMS支持的数据模型。
⏹数据结构⏹对象类型的集合数据结构是对系统静态特性的描述⏹两类对象⏹与数据类型、内容、性质有关的对象⏹与数据之间联系有关的对象⏹数据操作⏹对数据库中各种对象(型)的实例(值)允许执行的操作及有关的操作规则⏹数据操作的类型⏹检索⏹更新(包括插入、删除、修改)⏹数据模型对操作的定义⏹操作的确切含义⏹操作符号⏹操作规则(如优先级)⏹实现操作的语言⏹数据操作是对系统动态特性的描述。
数据库系统概论复习王珊版

数据库系统概论复习王珊版集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#数据库系统概论笔记数据(Data):是数据库中存储的基本对象数据的定义:描述事物的符号记录数据的种类:文字、图形、图象、声音等数据的特点:数据与其语义是不可分的数据库(Database,简称DB):是长期储存在计算机内、有组织的、可共享的大量数据集合数据库的特征:⏹数据按一定的数据模型组织、描述和储存⏹可为各种用户共享⏹冗余度较小⏹数据独立性较高⏹易扩展数据库管理系统(Database Management System,简称DBMS):是位于用户与操作系统之间的一层数据管理软件。
DBMS的用途:科学地组织和存储数据、高效地获取和维护数据DBMS的主要功能:数据库的运行管理保证数据的安全性、完整性、多用户对数据的并发使用发生故障后的系统恢复⏹数据库的建立和维护功能(实用程序)数据库数据批量装载数据库转储介质故障恢复数据库的重组织性能监视等数据库系统(Database System,简称DBS)是指在计算机系统中引入数据库后的系统构成。
⏹数据库系统的构成⏹由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员(和用户)构成。
⏹数据管理⏹对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。
⏹数据模型应满足三方面要求⏹能比较真实地模拟现实世界⏹容易为人所理解⏹便于在计算机上实现⏹数据模型分成两个不同的层次(1) 概念模型也称信息模型,它是按用户的观点来对数据和信息建模。
(2) 数据模型主要包括网状模型、层次模型、关系模型等,它是按计算机系统的观点对数据建模。
⏹客观对象的抽象过程---两步抽象⏹现实世界中的客观对象抽象为概念模型;⏹把概念模型转换为某一DBMS支持的数据模型。
⏹数据结构⏹对象类型的集合数据结构是对系统静态特性的描述⏹两类对象⏹与数据类型、内容、性质有关的对象⏹与数据之间联系有关的对象⏹数据操作⏹对数据库中各种对象(型)的实例(值)允许执行的操作及有关的操作规则⏹数据操作的类型⏹检索⏹更新(包括插入、删除、修改)⏹数据模型对操作的定义⏹操作的确切含义⏹操作符号⏹操作规则(如优先级)⏹实现操作的语言⏹数据操作是对系统动态特性的描述。
第五章王珊,萨师煊版《数据库系统概论》讲义及课后习题答案

3.在参照关系中插入元组时的问题
• 受限插入 – 仅当被参照关系中存在相应的元组,其主码值 与参照关系插入元组的外码值相同时,系统才 执行插入操作,否则拒绝此操作。 • 递归插入 – 首先向被参照关系中插入相应的元组,其主码 值等于参照关系插入元组的外码值,然后向参 照关系插入元组。
3.在参照关系中插入元组时的问题
完整性约束条件(续)
3) 取值范围或取值集合的约束 例:规定成绩的取值范围为0-100 年龄的取值范围为14-29 性别的取值集合为[男,女] 4) 对空值的约束 空值:未定义或未知的值 空值:与零值和空格不同 有的列允许空值,有的则不允许,如成绩可为空值 5) 其他约束 例:关于列的排序说明,组合列等
2.在被参照关系中删除元组时的问题
• 置空值删除 删除被参照关系的元组,并将参照关系 中与被参照关系中被删除元组主码值相 等的外码值置为空值。
2.在被参照关系中删除元组时的问题
例:要删除Student关系中Sno=950001的元组, 而SC关系中有4个元组的Sno都等于950001。 – 级联删除:将SC关系中所有4个Sno=950001 SC 4 Sno=950001 的元组一起删除。如果参照关系同时又是另一 个关系的被参照关系,则这种删除操作会继续 级联下去 – 受限删除:系统将拒绝执行此删除操作。
这三种处理方法,哪一种是正确的,要依应用 环境的语义来定
2.在被参照关系中删除元组时的问题
• 级联删除
将参照关系中外码值与被参照关系中要删除元 组主码值相对应的元组一起删除
• 受限删除
当参照关系中没有任何元组的外码值与要删除 的被参照关系的元组的主码值相对应时,系统 才执行删除操作,否则拒绝此删除操作
允许修改主码策略
数据库系统概论王珊第四版
(2) 数据结构 一个数据结构可以由若干个数据项组成,也可以由若干个 数据结构组成,或由若干个数据项和数据结构混合组成。 数据结构描述={数据结构名,含义说明,
组成:{数据项或数据结构}}
数据结构 : 以“学生”为例 数据结构:学生 含义说明:是学籍管理子系统的主体数据结构,定义了一
数据库设计定义
广义:是数据库及其应用系统的设计 狭义: 设计数据库本身
一般定义:是指对于一个给定的应用环境,构造最优的数 据库模式,建立数据库及其应用系统,使之能够有效地存 储和管理数据,满足各种用户的应用需求,包括信息管理 要求和数据操作要求。
数据库系统概论王珊第四版
7.1 数据库设计概述
7.1.1 数据库设计的特点
个学生的有关信息 组成:学号,姓名,性别,年龄,所在系,年级
数据库系统概论王珊第四版
(3) 数据流 数据流是数据结构在系统内传输的路径。 数据流描述={数据流名,说明,数据流来源,
数据流去向,组成:{数据结构}, 平均流量,高峰期流量}
数据流: “体检结果”可如下描述: 数据流:体检结果 说明:学生参加体格检查的最终结果 数据流来源:体检 数据流去向:批准 组成:…… 平均流量:…… 高峰期流量:……
二、需求分析的方法
结构化分析方法(SA) :是从最上层的系统组织机构入手,采 用自顶向下,逐层分解的方式分析系统,并用数据流图和数据 字典描述系统。
SA方法把任何一个系统抽象为如下形式。
数据存储
信息要求
数据流
数据流
数据来源
处理
数据输出
处理要求
数据库系统概论王珊第四版
三、数据流图(DFD, Data Flow Diagram)
数据库系统概论第5版(王珊、萨师煊)课后答案第4章数据库安全性
数据库系统概论第5版(王珊、萨师煊)课后答案第4章数据库安全性第4章数据库安全性1.什么是数据库的安全性答:数据库的安全性是指保护数据库以防⽌不合法的使⽤所造成的数据泄露、更改或破坏。
2.数据库安全性和计算机系统的安全性有什么关系答:安全性问题不是数据库系统所独有的,所有计算机系统都有这个问题。
只是在数据库系统中⼤量数据集中存放,⽽且为许多最终⽤户直接共享,从⽽使安全性问题更为突出。
系统安全保护措施是否有效是数据库系统的主要指标之⼀。
数据库的安全性和计算机系统的安全性,包括操作系统、⽹络系统的安全性是紧密联系、相互⽀持的。
CC评估保证级(EAL)的划分4.试述实现数据库安全性控制的常⽤⽅法和技术。
答:实现数据库安全性控制的常⽤⽅法和技术有:1)⽤户标识和鉴别:该⽅法由系统提供⼀定的⽅式让⽤户标识⾃⼰的名字或⾝份。
每次⽤户要求进⼊系统时,由系统进⾏核对,通过鉴定后才提供系统的使⽤权。
2)存取控制:通过⽤户权限定义和合法权检查确保只有合法权限的⽤户访问数据库,所有未被授权的⼈员⽆法存取数据。
例如CZ 级中的⾃主存取控制( DAC ) , Bl 级中的强制存取控制(MAC )。
3)视图机制:为不同的⽤户定义视图,通过视图机制把要保密的数据对⽆权存取的⽤户隐藏起来,从⽽⾃动地对数据提供⼀定程度的安全保护。
4)审计:建⽴审计⽇志,把⽤户对数据库的所有操作⾃动记录下来放⼊审计⽇志中,DBA可以利⽤审计跟踪的信息,重现导致数据库现有状况的⼀系列事件,找出⾮法存取数据的⼈、时间和内容等。
5)数据加密:对存储和传输的数据进⾏加密处理,从⽽使得不知道解密算法的⼈⽆法获知数据的内容。
5.什么是数据库中的⾃主存取控制⽅法和强制存取控制⽅法答:⾃主存取控制⽅法:定义各个⽤户对不同数据对象的存取权限。
当⽤户对数据库访问时⾸先检查⽤户的存取权限。
防⽌不合法⽤户对数据库的存取。
强制存取控制⽅法:每⼀个数据对象被(强制地)标以⼀定的密级,每⼀个⽤户也被(强制地)授予某⼀个级别的许可证。
数据库系统概论第5版(王珊、萨师煊)课后答案第5章数据库完整性
数据库系统概论第5版(王珊、萨师煊)课后答案第5章数据库完整性第5章数据库完整性1.什么是数据库的完整性?答: 数据库的完整性是指数据的正确性和相容性。
2.数据库的完整性概念与数据库的安全性概念有什么区别和联系?答: 数据的完整性和安全性是两个不同的概念,但是有一定的联系。
前者是为了防止数据库中存在不符合语义的数据,防止错误信息的输入和输出,即所谓垃圾进垃圾出(Garba : e In Garba : e out )所造成的无效操作和错误结果。
后者是保护数据库防止恶意的破坏和非法的存取。
也就是说,安全性措施的防范对象是非法用户和非法操作,完整性措施的防范对象是不合语义的数据。
3.什么是数据库的完整性约束条件?答:完整性约束条件是指数据库中的数据应该满足的语义约束条件。
一般可以分为六类:静态列级约束、静态元组约束、静态关系约束、动态列级约束、动态元组约束、动态关系约束。
常见的静态关系约束有:实体完整性约束;参照完整性约束;函数依赖约束。
4.关系DBMS 的完整性控制机制应具有哪些功能?答: DBMS 的完整性控制机制应具有三个方面的功能:1)定义功能,即提供定义完整性约束条件的机制;2)检查功能,即检查用户发出的操作请求是否违背了完整性约束条件;3)违约反应:如果发现用户的操作请求使数据违背了完整性约束条件,则采取一定的动作来保证数据的完整性。
5.关系DBMS 在实现参照完整性时需要考虑哪些方面?答:关系DBMS 在实现参照完整性时需要考虑以下几个方面:1)外码是否可以接受空值。
2)被参照关系中删除元组或修改主码时,若使参照关系在被参照关系中找不到与之相等的属性值,系统可选择的作法有三种:拒绝执行(默认策略)、级联操作、设置为空值。
3)参照关系中插入或修改元组时,若使参照关系在被参照关系中找不到与之相等的属性值,系统可选择的作法有三种:拒绝执行(默认策略)、级联操作(CASCADE)、设置为空值。
数据库系统概论(第四版)王珊 期末练习第二章db
练习二一、选择题1.关系数据库管理系统应能实现的专门关系运算包括▁▁▁▁▁。
在关系代数运算中,五种基本运算为▁▁▁▁▁。
A.排序、索引、统计B.选择、投影、连接C.关联、更新、排序D.显示、打印、制表A.并、差、选择、投影、自然连接B.并、差、交、选择、投影C.并、差、选择、投影、乘积D.并、差、交、选择、乘积2.关系模型中,一个关键字是▁▁▁▁▁。
A.可由多个任意属性组成B.至多由一个属性组成C.可由一个或多个其值能惟一标识该关系模式中任何元组的属性组成D.以上都不是3.一个关系数据库文件中的各条记录▁▁▁▁▁。
A.前后顺序不能任意颠倒,一定要按照输入的顺序排列B.前后顺序可以任意颠倒,不影响库中的数据关系C.前后顺序可以任意颠倒,但排列顺序不同,统计处理的结果就可能不同D.前后顺序不能任意颠倒,一定要按照关键字段值的顺序排列4.在关系代数的传统集合运算中,假定有关系R和S,运算结果为W。
如果W中的元组属于R,或者属于S,则W为▁▁▁▁▁运算的结果。
如果W中的元组属于R而不属于S,则W为▁▁▁▁▁运算的结果。
如果W中的元组既属于R又属于S,则W为▁▁▁▁▁运算的结果。
A.笛卡尔积B.并C.差D.交A.笛卡尔积B.并C.差D.交A.笛卡尔积B.并C.差D.交5.在关系代数的专门关系运算中,从表中取出满足条件的属性的操作称为▁▁▁▁▁;从表中选出满足某种条件的元组的操作称为▁▁▁▁▁;将两个关系中具有共同属性值的元组连接到一起构成新表的操作称为▁▁▁▁▁。
A.选择B.投影C.连接D.扫描A.选择B.投影C.连接D.扫描A.选择B.投影C.连接D.扫描6.自然连接是构成新关系的有效方法。
一般情况下,当对关系R和S使用自然连接时,要求R和S 含有一个或多个共有的▁▁▁▁▁▁。
A.元组B.行C.记录D.属性7.关系数据库用▁▁▁▁▁来表示实体之间的联系,其任何检索操作的实现都是由▁▁▁▁▁三种基本操作组合而成的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 / 4
十万种考研考证电子书、题库视频学习平台
圣才电子书
www.100xuexi.com
第14章 大数据管理
1.什么是大数据,简述大数据的分类与基本特征。
答:(1)定义
大数据是指无法在可容忍的时间内用现有IT技术和软硬件工具对其进行感知、获取、
管理、处理和服务的数据集合。
专家给出的定义:大数据通常被认为是PB(103TB)或EB(1EB=106TB)或更高数
量级的数据,包括结构化的、半结构化的和非结构化的数据。其规模或复杂程度超出了传统
数据库和软件技术所能管理和处理的数据集范围。
(2)分类
①海量交易数据(企业OLTP应用)
海量交易数据的应用特点是数据海量、读写操作比较简单、访问和更新频繁、一次交易
的数据量大大,但要求支持事务ACID特性。对数据的完整性及安全性要求高,必须保证强
一致性。
②海量交互数据(社交网、传感器、全球定位系统、Web信息)
海量交互数据的应用特点是实时交互性强,但不要求支持事务特性。其数据的典型特点
是类型多样异构、不完备、噪音大、数据增长快,不要求具有强一致性。
③海量处理数据(企业OLAP应用)
海量处理数据的应用特点是面向海量数据分析,计算复杂,往往涉及多次迭代完成,追
求数据分析的高效率,但不要求支持事务特性。
(3)大数据的特征
2 / 4
十万种考研考证电子书、题库视频学习平台
圣才电子书
www.100xuexi.com
①巨量
大数据的首要特征是数据量巨大,而且在持续、急剧地膨胀。
②多样
大数据的多样性通常是指异构的数据类型、不同的数据表示和语义解释。
③快变
大数据的快变性也称为实时性,一方面指数据到达的速度很快,另一方而指能够进行处
理的时间很短,或者要求响应速度很快,即实时响应。
④价值
大数据的价值是潜在的、巨大的。大数据不仅具有经济价值和产业价值,还具有科学价
值。这是大数据最重要的特点,也是大数据的魅力所在。
2.分析传统RDBMS在大数据时代的局限性。
答:关系数据库在大数据时代丧失了互联网搜索这个机会,其主要原因是关系数据库管
理系统(并行数据库)的扩展性遇到了前所未有的障碍,不能胜任大数据分析的需求,关系
数据管理模型追求的是高度的一致性和正确性,面向超大数据的分析需求。
3.什么是NoSQL,试述NoSQL系统在人数据库发展中的作用。
答:(1)NoSQL是以互联网大数据应用为背景发展起来的分布式数据管理系统,它有
两种解释:一种是Non-Relational,即非关系数据库;另一种是Not Only SQL,即数据
管理技术不仅仅是SQL。NoSQL系统支持的数据模型通常分为:Key-Value模型、BigTable
模型、文档(document)。
(2)NoSQL系统为了提高存储能力和并发读写能力采用了极其简单的数据模型,支
3 / 4
十万种考研考证电子书、题库视频学习平台
圣才电子书
www.100xuexi.com
持简单的查询操作,而将复杂操作留给应用层实现。该系统对数据进行划分,对各个数据分
区进行备份,以应对结点可能的失败,提高系统可用性;通过大量结点的并行处理获得高性
能,采用的是横向扩展的方式(scale out)。
4.什么是NewSQL,查询相关资料,分析NewSQL是如何融合NoSQL和RDBMS
两者的优势的。
答:(1)NewSQL系统是融合了NoSQL系统和传统数据库事务管理功能的新型数据
库系统。
(2)NewSQL将SQL和NoSQL的优势结合起来,充分利用计算机硬件的新技术、
新结构,研究与开发了若干创新的实现技术。
5.描述MapReduce的计算过程。分析MapReduce技术作为大数据分析平台的优势
和不足。
答:(1)MapReduce技术主要应用于大规模廉价集群上的大数据并行处理,是以
key/value的分布式存储系统为基础,通过元数据集中存储、数据以chunk为单位分布存
储和数据chunk冗余复制来保证其高可用性。
(2)优势:MapReduce是一种并行编程模型。其处理模式以离线式批量处理为主。
(3)MapReduce存在如下不足:
①基于MapReduce的应用软件较少,许多数据分析功能需要用户自行开发,从而导
致使用成本增加;
②程序与数据缺乏独立性;
③在同等硬件条件下,MapReduce的性能远低于并行数据库;
4 / 4
十万种考研考证电子书、题库视频学习平台
圣才电子书
www.100xuexi.com
④MapReduce处理连接的性能尤其不尽如人意。
6.简述大数据的应用。
答:(1)感知现在预测未来——互联网文本大数据管理与挖掘
互联网文本大数据管理的特点如下:
①互联网文本大数据蕴含着丰富的社会信息,可以看作是对真实社会的网络映射。
②实时、深入分析互联网文本大数据,帮助人们在海量数据中获取有价值的信息,发现
蕴含的规律,可以更好地感知现在、预测未来,体现了第四范式数据密集型科学发现的研究
方式和思维方式。
③互联网文本大数据管理对大数据系统和技术的挑战是全面的、跨学科跨领域的,需要
创新,也要继承传统数据管理技术和数据仓库分析技术的精华。
(2)数据服务实时推荐——基于大数据分析的用户建模
这一类大数据应用的特点如下:
①模型的建立来自对大数据的分析结果,通俗地讲是“用数据说话”。建模的过程是动
态的,随着实际对象的变化,模型也在变化。
②数据处理既有对历史数据的离线分析和挖掘,又有对实时流数据的在线采集和分析,
体现了大数据上不同层次的分析:流分析、SQL分析、深度分析的需求。
③用户模型本身也是大数据,维度高,信息稀疏,用户模型的存储、管理是数据服务的
重要任务,要满足大规模应用需要的高并发数据更新与读取。