数据库复习资料(仅供参考)

数据库复习资料(仅供参考)
数据库复习资料(仅供参考)

1.理解约束在DBMS中的实现方法,特别是各种constraint与触发器等

数据完整性约束constraint

强制数据完整性可确保数据库中的数据质量。例如,如果输入了employee_id值为123的职员,那么该数据库不应允许其他职员使用同一ID值。如果计划将employee_rating列的值范围设定为从1到5,则数据库不应接受6。如果表有一dept_id列,该列存储职员的部门编号,则数据库应只允许接受公司中的有效部门编号。

对表进行计划有两个重要步骤:标识列的有效值和确定如何强制列中的数据完整性。数据完整性有四种类型:

实体完整性域完整性引用完整性用户定义完整性

实体完整性

实体完整性将行定义为特定表的唯一实体。实体完整性强制表的标识符列或主键的完整性(通过索引、UNIQUE约束、PRIMARY KEY约束或IDENTITY属性)。

域完整性

域完整性是指给定列的输入有效性。强制域有效性的方法有:限制类型(通过数据类型)、格式(通过CHECK约束和规则)或可能值的范围(通过FOREIGN KEY约束、CHECK约束、DEFAULT定义、NOT NULL定义和规则)。

引用完整性

在输入或删除记录时,引用完整性保持表之间已定义的关系。在Microsoft SQL Server 2000中,引用完整性基于外键与主键之间或外键与唯一键之间的关系(通过FOREIGN KEY和CHECK约束)。引用完整性确保键值在所有表中一致。这样的一致性要求不能引用不存在的值,如果键值更改了,那么在整个数据库中,对该键值的所有引用要进行一致的更改。

强制引用完整性时,SQL Server禁止用户进行下列操作:

当主表中没有关联的记录时,将记录添加到相关表中。

更改主表中的值并导致相关表中的记录孤立。

从主表中删除记录,但仍存在与该记录匹配的相关记录。

用户定义完整性

用户定义完整性使您得以定义不属于其它任何完整性分类的特定业务规则。所有的完整性类型都支持用户定义完整性(CREATE TABLE中的所有列级和表级约束、存储过程和触发器)。何为触发器?在SQL Server里面也就是对某一个表的一定的操作,触发某种条件,从而执行的一段程序。触发器是一个特殊的存储过程。常见的触发器有三种:分别应用于Insert , Update , Delete 事件。

存储过程(Stored Procedure)是由编译过的SQL语句、控制流语句、变量说明和赋值运算等组成的集合,由开发者创建并存储在数据字典(大部分DBMS叫系统表)中。我们可以通过存储过程中的语句来定义企业业务规则,特别对于复杂的表与表之间的饿关系,用存储过程来实现将变得相当容易。

触发器(Trigger)也是一个存储过程,该过程在插入、修改和删除等操作事前或事后由DBS自动激发(执行)。经常用于实现逻辑上相关的数据表之间的数据完整性和一致性。触发器非常适合于实施企业规则,如果某个输入违反了其中的某个企业规则,触发器可以显示相应错误并中止正在执行的数据库动作。

数据库完整性对于数据库应用系统非常关键,其作用主要体现在以下几个方面:

1.数据库完整性约束能够防止合法用户使用数据库时向数据库中添加不合语义的数据。

2.利用基于DBMS的完整性控制机制来实现业务规则,易于定义,容易理解,而且可以降低应用程序的复杂性,提高应用程序的运行效率。同时,基于DBMS的完整性控制机制是集中管理的,因此比应用程序更容易实现数据库的完整性。

3.合理的数据库完整性设计,能够同时兼顾数据库完整性和系统效能。比如装载大量数据时,只要在装载之前临时使基于DBMS的数据库完整性约束失效,此后再使其生效,就能保证既不影响数据装载的效率又能保证数据库的完整性。

4.在应用软件的功能测试中,完善的数据库完整性有助于尽早发现应用软件的错误。

系统分析师教程:

静态约束:数据库中的数据的语法、语义限制与数据间的逻辑约束称为静态约束。它反映了数据间固有的逻辑特性,是最重要的一类完整性约束。静态约束包括静态列级约束(对数据类型的约束、对数据格式的约束、对取之范围或取值集合的约束、对空值的约束、其他约束)、静态元组约束、静态关系约束(实体完整性约束、参照完整性约束、函数依赖约束、统计约束)

动态约束:数据库中的数据变化应遵守的规则称为数据动态约束,它反映了数据库状态变迁的约束。动态约束包括动态列级约束(修改列定义时的约束、修改列值时的约束)、动态元组约束、动态关系约束。

2.理解页面/块结构,了解自然连接时查询读块开销的估算方法,内存中块的淘汰方法

页面/块结构

物理上由1-2个OS的block形成一个逻辑上数据库的block.逻辑单位是段,分区也是段。形成表空间。统计值方图:超过多少比例时,可以进行全表扫描,否则执行……B-树索引的叶节点的块大小正好是数据库块的大小。由DBA的基本知识知道,pctfree参数是控制freelist un-links的(即将块由freelists中移除)。设置pctfree=10 意味着每个块都保留10%的空间用作行扩展。pctused参数是控制freelist re-links

的。设置pctused=40意味着只有在块的使用低于40%时才会回到表格的freelists中。一旦由于一个删除的操作而令块被重新加入到freelist 中,它将会一直保留在freelist中即使空间的使用超过了60%,只有在到达pctfree时才会将数据块由freelist中移走。

代价估算

*集中式数据库:

执行开销主要包括:?磁盘存取块数(I/O代价) ?处理机时间(CPU代价) ?查询的内存开销I/O代价是最主要的

*分布式数据库:总代价=I/O代价+CPU代价+内存代价+通信代价

设一个块能装10个Student元组或100个SC元组,在内存中存放5块Student元组和1块SC元组,则读取总块数为

1000/10+1000/(10*5)+10000/100=100+20×100=2100块

其中,读Student表100块。读SC表20遍,每遍100块。若每秒读写20块,则总计要花105s。

连接后的元组数为103×104=107。设每块能装10个元组,则写出这些块要用106/20=5×104s

执行自然连接,读取Student和SC表的策略不变,总的读取块数仍为2100块花费105s。

自然连接的结果比第一种情况大大减少,为104个写出这些元组时间为104/10/20=50s,为第一种情况的千分之一。

内存块淘汰

内存管理是操作系统的五大功能之一,主要的任务就是内存空间的调度,为需要放入内存的数据分配空间,将不再需要的数据移出内存。对内存的管理,可以采用多种管理方式,主要有:分页存储管理、段式存储管理、段页式存储管理。由于分页存储管理,处理简单,实现方便,所以大多数操作系统都采用这种方式。

分页存储管理的基本原理,就是将内存空间分成大小相同的页,同时外部存储空间也按照相同的尺寸分页,数据以页为单位从磁盘读入内存,以页为单位从内存写回磁盘。使用页表对内存空间中的页进行管理。

内存页的调度管理,可以分为两个方面:(1)请求调页管理,(2)请求淘汰换页管理。

1. 请求调页管理

系统在处理数据时,首先检查所需数据是否已经调入内存。如果调入内存,则直接使用;如果没有调入内存,则产生缺页中断,以装入所需数据页。这就是请求调页管理。请求调页管理的关键是确定内存中是否存在所需数据,这是使用页表来实现的。页表记录了放入内存中的数据,系统通过对这个表的查询,来决定所需数据页是否在内存中。如何实现页表的快速扫描,是操作系统必须要考虑的问题。另外,数据读入内存以及从内存中移走,都需要对页表进行维护,以反映内存中数据的真实情况。

2. 请求淘汰换页管理

请求淘汰换页管理,决定内存中那些数据被移走。由于内存空间总是小于磁盘空间,不可能将所有数据全部、同时地装入内存。在出现缺页中断并且内存中没有空闲的页时,就需要首先从内存中调出当前不再使用的数据页以释放空间。

对请求淘汰换页管理,可以使用多种页面调度算法,主要有:先进先出算法(first input first output,FIFO)、循环检测算法、最近最少使用算法(least recently used,LRU)、最优淘汰算法(optimal replacement algorithm,OPT)等等。

最近最少使用算法的出发点是:如果某页被访问,则该页可能再次被访问。或者反过来说,如果某页很长时间没有被访问,则该页在最近一段时间内也不会被访问。该算法被广泛使用,实现时也需要页表。通过页表中数据页的排列顺序,表明那些页最近被访问、那些页很长时间没有被访问。和最近最少使用算法相对应的是最近最多使用算法(most recently used,MRU)。

需要说明的是,对请求调页管理和请求淘汰换页管理所使用页表的维护,需要消耗系统资源。由于多个处理可能同时引起页表的更新,系统在更新页表前需要对页表加锁,以防止页表被破坏。也正是由于使用锁,系统中可能会存在页表的竞争,引起系统性能的下降。系统自动完成页表的维护,用户不能直接控制,但可以通过改变数据的使用方式,达到影响页表使用的目的。

3. 数据库系统的内存调度管理

对数据库系统来说,内存空间被划分为多个部分。除进程缓冲区之外,其他部分都是共享内存,每一部分都需要页表,以实现它的请求调页和请求淘汰换页管理。对系统的整个内存空间,按照功能的不同,划分为多个部分进行单独管理,减少了页表所管理内存空间的范围,能极大地提高页表的搜索速度,降低事务之间的互相竞争。

对请求调页管理,自然希望要处理的数据都已经调入内存,避免进程的等待。数据库系统提供了异步预取进程,在处理大数据量时可以事先将要处理数据读入内存。对请求淘汰换页管理,数据库系统采用了最近最少使用算法,通过将最近最少使用数据写入磁盘而获取内存空间。对该算法的实现,不同数据库系统有不尽相同的实现方式。

数据库系统中的大部分数据处理在用户缓冲区中完成,因此这部分内存空间的调度管理尤为重要。一些数据库系统公开了其请求淘汰换页管理的实现机制,用户可以通过配置参数的更改来影响它的执行动作。

如果数据库系统中存放用户数据的表空间使用了不同的页尺寸,就需要在系统中建立不同页尺寸的内存缓冲区,以存取这些表空间中的数据。这是内存的分页存储管理方式所决定的。

3.能进行基本的ER建模,要求画图正确

概念描述

实体现实世界中具有共同性质的可识别对象的集合

属性描述实体或者联系的某个性质的数据项,关系也可以有属性,主键是两个实体的主键决定的主键唯一地标识一个实体或者联系实例

描述符非键属性,描述一个实体或者联系

复合属性共同描述一个对象的某个性质的一组简单属性

多值属性对于一个实体实例可以取多个值的实体属性

关系命名的m元集合,标识笛卡尔积的子集

二元关系两个不同实体上的联系

环,递归关系联系一个实体到自身的联系

三元关系三个不同实体上的联系

导出属性可以从别的属性计算得到的属性

角色Manager同时也是employee,具有work_for关系

弱实体弱实体的所有实例都通过一个联系R依赖于另一个实体的实例而存在

4.了解DSS与OLTP的区别,用户特性,索引方法,查询等

OLTP DSS

全称OLTP=online transaction processing DSS=data warehousing

翻译联机事物处理数据仓库

例子例如:飞机订票,网上交易,BBS等例如:各种资源资料查询系统

特征大量的在线用户和DML操作(数据操纵语言) 很少的DML操作

操作类型大量基于索引的查询大量的全表扫描的查询

索引用B-tree,reverse key索引,定期索引重建用bitmap索引

数据结构需要较多的小的回退段需要较少的大的回退段

查询不要用分布式查询用分布式查询

存储参数数据对象的存储参数pctfree 20 或者更高数据对象的存储参数pctfree 0

共享共享程序代码和各种变量常量字符变量和线索

存储结构启动多线索服务使用大的数据块,db_file_mutiblock_read_count

日志使用较大的日志文件使用较小的日志文件

功能listener开多个响应端口增加sort_area_size

5.熟悉BCNF范式基本定义,能进行满足规范的设计

设计范式(范式,数据库设计范式,数据库的设计范式)是符合某一种级别的关系模式的集合。构造数据库必须遵循一定的规则。在关系数据库中,这种规则就是范式。关系数据库中的关系必须满足一定的要求,即满足不同的范式。目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、第四范式(4NF)、第五范式(5NF)和第六范式(6NF)。满足最低要求的范式是第一范式(1NF)。在第一范式的基础上进一步满足更多要求的称为第二范式(2NF),其余范式以次类推。一般说来,数据库只需满足第三范式(3NF)就行了。

第一范式的定义

如果一个关系模式R的所有属性都是不可分的基本数据项,则R∈1NF。

第一范式(1NF)是指数据库表的每一列都是不可分割的基本数据项,同一列中不能有多个值,即实体中的某个属性不能有多个值或者不能有重复的属性。

第一范式包括下列指导原则:数据组的每个属性可以包含一个值;

关系中的每个数组必须包含相同数量的值;

关系中的每个数组一定不能相同。

第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库。

但是满足第一范式的关系模式并不一定是一个好的关系模式。

例:如职工号,姓名,电话号码组成一个表(一个人可能有一个办公室电话和一个家里电话号码)规范成为1NF有三种方法:一是重复存储职工号和姓名。这样,关键字只能是电话号码。

二是职工号为关键字,电话号码分为单位电话和住宅电话两个属性

三是职工号为关键字,但强制每条记录只能有一个电话号码。

以上三个方法,第一种方法最不可取,按实际情况选取后两种情况。

第二范式的定义

若关系模式R∈1NF,并且每一个非主属性都完全函数依赖于R的码,则R∈2NF。

例:SLC(Sno, Sdept, Sloc, Cno, Grade) ∈1NF

SLC(Sno, Sdept, Sloc, Cno, Grade) ∈2NF SC(Sno,Cno,Grade)∈ 2NF

SL(Sno,Sdept,Sloc)∈ 2NF

采用投影分解法将一个1NF的关系分解为多个2NF的关系,可以在一定程度上减轻原1NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。

将一个1NF关系分解为多个2NF的关系,并不能完全消除关系模式中的各种异常情况和数据冗余。

例:选课关系SCI(SNO,CNO,GRADE,CREDIT)其中SNO为学号,CNO为课程号,GRADEGE 为成绩,CREDIT 为学分。由以上条件,关键字为组合关键字(SNO,CNO)

在应用中使用以上关系模式有以下问题:

a.数据冗余,假设同一门课由40个学生选修,学分就重复40次。

b.更新异常,若调整了某课程的学分,相应的元组CREDIT值都要更新,有可能会出现同一门课学分不同。

c.插入异常,如计划开新课,由于没人选修,没有学号关键字,只能等有人选修才能把课程和学分存入。

d.删除异常,若学生已经结业,从当前数据库删除选修记录。某些门课程新生尚未选修,则此门课程及学分记录无法保存。

原因:非关键字属性CREDIT仅函数依赖于CNO,也就是CREDIT部分依赖组合关键字(SNO,CNO)而不是完全依赖。

解决方法:分成两个关系模式SC1(SNO,CNO,GRADE),C2(CNO,CREDIT)。新关系包括两个关系模式,它们之间通过SC1中的外关键字CNO相联系,需要时再进行自然联接,恢复了原来的关系。

第三范式的定义

关系模式R Y), 使得X->Y,Y->X,Y->Z,成立,则称R 中若不存在这样的码X、属性组Y及非主属性Z(Z ∈3NF。

若R∈3NF,则R的每一个非主属性既不部分函数依赖于候选码也不传递函数依赖于候选码。

如果R∈3NF,则R也是2NF。

采用投影分解法将一个2NF的关系分解为多个3NF的关系,可以在一定程度上解决原2NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。

将一个2NF关系分解为多个3NF的关系后,并不能完全消除关系模式中的各种异常情况和数据冗余

例:如S1(SNO,SNAME,DNO,DNAME,LOCATION)各属性分别代表学号,姓名,所在系,系名称,系地址。

关键字SNO决定各个属性。由于是单个关键字,没有部分依赖的问题,肯定是2NF。但这关系肯定有大量的冗余,有关学生所在的几个属性DNO,DNAME,LOCATION将重复存储,插入,删除和修改时也将产生类似以上例的情况。

原因:关系中存在传递依赖造成的。即SNO -> DNO。而DNO -> SNO却不存在,DNO -> LOCA TION, 因此关键辽SNO 对LOCATION 函数决定是通过传递依赖SNO -> LOCATION 实现的。也就是说,SNO不直接决定非主属性LOCA TION。

解决目地:每个关系模式中不能留有传递依赖。

解决方法:分为两个关系S(SNO,SNAME,DNO),D(DNO,DNAME,LOCATION)

注意:关系S中不能没有外关键字DNO。否则两个关系之间失去联系。

鲍依斯-科得范式(BCNF):在第三范式的基础上,数据库表中如果不存在任何字段对任一候选关键字段的传递函数依赖则符合第三范式。关系模式中如果每一个决定因素都包含码,那么这个关系就是BCNF范式。

假设仓库管理关系表为StorehouseManage(仓库ID, 存储物品ID, 管理员ID, 数量),且有一个管理员只在一个仓库工作;一个仓库可以存储多种物品。这个数据库表中存在如下决定关系:

(仓库ID, 存储物品ID) →(管理员ID, 数量) (管理员ID, 存储物品ID) → (仓库ID, 数量)

所以,(仓库ID, 存储物品ID)和(管理员ID, 存储物品ID)都是StorehouseManage的候选关键字,表中的唯一非关键字段为数量,它是符合第三范式的。但是,由于存在如下决定关系:

(仓库ID) → (管理员ID) (管理员ID) → (仓库ID)

即存在关键字段决定关键字段的情况,所以其不符合BCNF范式。它会出现如下异常情况:

(1) 删除异常:当仓库被清空后,所有"存储物品ID"和"数量"信息被删除的同时,"仓库ID"和"管理员ID"信息也被删除了。

(2) 插入异常:当仓库没有存储任何物品时,无法给仓库分配管理员。

(3) 更新异常:如果仓库换了管理员,则表中所有行的管理员ID都要修改。

把仓库管理关系表分解为二个关系表:仓库管理:StorehouseManage(仓库ID, 管理员ID);

仓库:Storehouse(仓库ID, 存储物品ID, 数量)。

这样的数据库表是符合BCNF范式的,消除了删除异常、插入异常和更新异常。

6.了解查询的处理过程等

1)语法分析,分析语句的语法是否符合规范,衡量语句中各表达式的意义。

2)语义分析,检查语句中涉及的所有数据库对象是否存在,且用户有相应的权限。

3)视图转换,将涉及视图的查询语句转换为相应的对基表查询语句。

4)表达式转换,将复杂的SQL 表达式转换为较简单的等效连接表达式。

5)选择优化器,不同的优化器一般产生不同的“执行计划” 。

6)选择连接方式,ORACLE 有三种连接方式,对多表连接ORACLE 可选择适当的连接方式。

7)选择连接顺序,对多表连接ORACLE 选择哪一对表先连接,选择这两表中哪个表做为源数据表。

8)选择数据搜索路径,根据以上条件选择合适的数据搜索路径,如是选用全表搜索还是利用索引或是其他的方式。

9)运行“执行计划”。

7.有哪些数据库产品

Sybase、Oracle、SQL server、foxpro、IBM DB2、MS Access、Mysql

8.其它

IPO图:

HIPO图(Hierarchy Plus Input/Processing/Output)图是美国IBM公司70年代发展起来的表示软件系统结构的工具。它既可以描述软件总的模块层次结构--H图(层次图),又可以描述每个模块输入/输出数据、处理功能及模块调用的详细情况--IPO图。HIPO图以模块分解的层次性以及模块内部输入、处理、输出三大基本部分为基础建立的。它是表示软件系统结构的工具。HIPO图以模块分解的层次性以及模块内部输入、处理、输出三大基本部分为基础建立的。

1. HIPO图的H图

用于描述软件的层次结构,矩形框表示一个模块,矩形框之间的直线表示模块之间的调用关系,同结构图一样未指明调用顺序。如图4-10为销售管理系统的层次图。

2. IPO图

H图只说明了软件系统由那些模块组成及其控制层次结构,并未说明模块间的信息传递及模块内部的处理。因此对一些重要模块还必须根据数据流图、数据字典及H图绘制具体的IPO图,如图4-11

在计算机领域IPO是指结构化设计中变换型结构的输入(Input)、加工(Processing)、输出(Output)。IPO图是对每个模块进行详细设计的工具,它是输入加工输出(INPUT PROCESS OUTPUT)图的简称,它是由美国IBM公司发起并完善起来的一种工具。在系统的模块结构图形成过程中,产生了大量的模块,在进行详细设计时开发者应为每一个模块写一份说明。IPO图就是用来说明每个模块的输入、输出数据和数据加工的重要工具。

IPO图的主体是算法说明部分,该部分可采用结构化语言、判定表、判定树,也可用N-S图、问题分析图和过程设计语言等工具进行描述,要准确而简明的描述模块执行的细节。

在IPO图中,输入、输出数据来源于数据词典。局部数据项是指个别模块内部使用的数据,与系统的其它部分无关,仅由本模块定义、存贮和使用。注释是对本模块有关问题作必要的说明。

开发人员不仅可以利用IPO图进行模块设计,而且还可以利用它评价总体设计。用户和管理人员可利用IPO图编写、修改和维护程序。因而,IPO图是系统设计阶段的一种重要文档资料。

函数依赖基本概念和范式概念

●函数依赖:

设R(U)是一个属性集U上的关系模式,X和Y是U的子集。

若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称“X函数确定Y” 或“Y函数依赖于X”,记作X→Y。

X称为这个函数依赖的决定属性集(Determinant)。Y=f(x)

1. 函数依赖不是指关系模式R的某个或某些关系实例满足的约束条件,而是指R的所有关系实例均要满足的约束条件。

2. 函数依赖是语义范畴的概念。只能根据数据的语义来确定函数依赖。

例如“姓名→年龄”这个函数依赖只有在不允许有同名人的条件下成立

3. 数据库设计者可以对现实世界作强制的规定。例如规定不允许同名人出现,函数依赖“姓名→年龄”成立。所插入的元组必须满足规定的函数依赖,若发现有同名人存在,则拒绝装入该元组。

部分函数依赖:若x→y 并且,存在x的真子集x1,使得x1→y,则y部分依赖于x。

完全函数依赖:若x→y并且,对于x的任何一个真子集x1,都不存在x1→y 则称y完全依赖于x。

索引

一、索引的概念

索引就是加快检索表中数据的方法。数据库的索引类似于书籍的索引。在书籍中,索引允许用户不必翻阅完整个书就能迅速地找到所需要的信息。在数据库中,索引也允许数据库程序迅速地找到表中的数据,而不必扫描整个数据库。

二、索引的特点

1.索引可以加快数据库的检索速度

2.索引降低了数据库插入、修改、删除等维护任务的速度

3.索引创建在表上,不能创建在视图上

4.索引既可以直接创建,也可以间接创建

5.可以在优化隐藏中,使用索引

6.使用查询处理器执行SQL语句,在一个表上,一次只能使用一个索引

三、索引的优点

1.创建唯一性索引,保证数据库表中每一行数据的唯一性

2.大大加快数据的检索速度,这也是创建索引的最主要的原因

3.加速表和表之间的连接,特别是在实现数据的参考完整性方面特别有意义。

4.在使用分组和排序子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。

5.通过使用索引,可以在查询的过程中使用优化隐藏器,提高系统的性能。

四、索引的缺点

1.创建索引和维护索引要耗费时间,这种时间随着数据量的增加而增加

2.索引需要占物理空间,除数据表占数据空间外,每个索引还要占一定物理空间,如果要建立聚簇索引,那么需要的空间就会更大

3.当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,降低了数据的维护速度

索引类型

唯一索引

唯一索引是不允许其中任何两行具有相同索引值的索引。

当现有数据中存在重复的键值时,大多数数据库不允许将新创建的唯一索引与表一起保存。数据库还可能防止添加将在表中创建重复键值的新数据。例如,如果在employee 表中职员的姓(lname) 上创建了唯一索引,则任何两个员工都不能同姓。

主键索引

数据库表经常有一列或列组合,其值唯一标识表中的每一行。该列称为表的主键。

在数据库关系图中为表定义主键将自动创建主键索引,主键索引是唯一索引的特定类型。该索引要求主键中的每个值都唯一。当在查询中使用主键索引时,它还允许对数据的快速访问。

聚集索引

在聚集索引中,表中行的物理顺序与键值的逻辑(索引)顺序相同。一个表只能包含一个聚集索引。如果某索引不是聚集索引,则表

中行的物理顺序与键值的逻辑顺序不匹配。与非聚集索引相比,聚集索引通常提供更快的数据访问速度。

面向统计的索引

B-树索引在Oracle中是一个通用的索引,在创建索引时它就是默认的索引类型。最多可以包括32列。

位图索引Oracle为每个唯一键创建一个位图,然后把与键值所关联的ROWID保存为位图。最多可以包括30列。

一般情况下,大多数用户都只创建TYPE为NORMAL的B-树索引,所以对于较低基数的列我们都是不创建索引的,因为B-树索引对查询速度提升不一定会有改善,甚至会增加Insert、Update、Delete命令所消耗的时间。下面我们通过一个例子来比较B-树索引与位图索引在对查询速度提升的效果。

位图索引在加载表(插入操作)时通常要比B-树索引做得好。通常,位图索引要比一个低基数(很少不同值)上的B-树索引要快3~4倍,但如果新增的值占插入行的70%以上时,B-树索引通常会更快一些。当每条记录都增加一个新值时,B-树索引要比位图索引快3倍。建议不要在一些联机事务处理(OLTP)应用程序中使用位图索引。B-树索引的索引值中包含ROWID,这样Oracle就可以在行级别上锁定索引。位图索引被存储为压缩的索引值,其中包含了一个范围内的ROWID,因此ORACLE必须针对一个给定值锁定所有范围内的ROWID。这种锁定可能自阿某些DML语句中造成死锁。SELECT语句不会受到这种锁定问题的影响。

位图索引有很多限制:

1、基于规则的优化器不会考虑位图索引

2、当执行A TLER TABLE语句,并修改包含有位图索引的列时,会使位图索引实效

3、位图索引在索引块中储存了索引键的值;然而,他们并不能用户任何类型的完整性检查

4、位图索引不能被申明为唯一索引

数据库系统概论期末试题及答案(重点知识)

试题十 一、单项选择题 (本大题共15小题,每小题2分,共30分) 在每小题列出的四个备选项中只有一个是符合题目要 求的,错选、多选或未选均无分。 1. 数据库系统的特点是( )、数据独立、减少数据冗余、避免数据不一致和加强了数据保护。 A .数据共享 B .数据存储 C .数据应用 D .数据保密 2. 数据库系统中,物理数据独立性是指( )。 A .数据库与数据库管理系统的相互独立 B .应用程序与DBMS 的相互独立 C .应用程序与存储在磁盘上数据库的物理模式是相互独立的 D .应用程序与数据库中数据的逻辑结构相互独立 3. 在数据库的三级模式结构中,描述数据库中全体数据的全局逻辑结构和特征的是( )。 A .外模式 B .内模式 C .存储模式 D .模式 4. E-R 模型用于数据库设计的哪个阶段( )? A .需求分析 B .概念结构设计 C .逻辑结构设计 D .物理结构设计 5. 现有关系表:学生(宿舍编号,宿舍地址,学号,姓名,性别,专业,出生日期)的主码是( )。 A .宿舍编号 B .学号 C .宿舍地址,姓名 D .宿舍编号,学号 6. 自然连接是构成新关系的有效方法。一般情况下,当对关系R 和S 使用自然连接时,要求R 和S 含有一个或多个共有的( )。 A .元组 B .行 C .记录 D .属性 7. 下列关系运算中,( )运算不属于专门的关系运算。 A .选择 B .连接 C .广义笛卡尔积 D .投影 8. SQL 语言具有( )的功能。 ( 考 生 答 题 不 得 超 过 此 线 )

A.关系规范化、数据操纵、数据控制 B.数据定义、数据操纵、数据控制 C.数据定义、关系规范化、数据控制 D.数据定义、关系规范化、数据操纵 9.如果在一个关系中,存在某个属性(或属性组),虽然不是该关系的主码或只是主码的一部分,但却是另一个关系的主码时,称该属性(或属性组)为这个关系的() A.候选码 B.主码 C. 外码 D. 连接码 10.下列关于关系数据模型的术语中,()术语所表达的概念与二维表中的 “行”的概念最接近? A.属性 B.关系 C. 域 D. 元组 11.假定学生关系是S(S#,SNAME,SEX,AGE),课程关系是C(C#,CNAME, TEACHER),学生选课关系是SC(S#,C#,GRADE)。 要查找某个学生的基本信息及其选课的平均成绩,将使用关系()A.S和SC B.SC和C C.S和C D.S、SC和C 12.在SQL语言的SELECT语句中,用于对结果元组进行排序的是()子句。 A. GROUP BY B.HAVING C.ORDER BY D.WHERE 13.设有关系SC(SNO,CNO,GRADE),主码是(SNO,CNO)。遵照实体完整性规则,下面()选项是正确的。 A.只有SNO不能取空值B.只有CNO不能取空值 C.只有GRADE不能取空值D.SNO与CNO都不能取空值 14.下面关于函数依赖的叙述中,()是不正确的。 A.若X→Y,WY→Z,则XW→Z B.若Y X,则X→Y C.若XY→Z,则X→Z,Y→Z D.若X→YZ,则X→Y,X→Z 15.设有关系R(A,B,C)和S(C,D)。与SQL语句select A,B,D from R,S where R.C=S.C等价的关系代数表达式是() A.σR.C=S.C(πA,B,D(R×S)) B.πA,B,D(σR,C= S.C(R×S)) C.σR.C=S.C((πA,B(R))×(πD(S))) D.σR,C=S.C(πD((πA,B(R))×S))

校园基础地理空间数据库建设设计方案

校园基础地理空间数据库建设设计方案 遥感1503班第10组 (杨森泉张晨欣杨剑钢熊倩倩) 测绘地理信息技术专业 昆明冶金高等专科学校测绘学院 2017年5月

一.数据来源 二. 目的 三 .任务 四. 任务范围 五 .任务分配与计划六.小组任务分配七. E-R模型设计八.关系模式九.属性结构表十.编码方案

一.数据来源 原始数据为大二上学期期末实训数字测图成果(即DWG格式的校园地形图) 导入GIS 软件数据则为修改过的校园地形图 二.目的 把现实世界中有一定范围内存在着的应用数据抽象成一个数据库的具体结构的过程。空间数据库设计要满足用户需求,具有良好的数据库性能,准确模拟现实世界,能够被某个数据库管理系统接受。

三.任务 任务包括三个方面:数据结构、数据操作、完整性约束 具体为: ①静态特征设计——结构特性,包括概念结构设计和逻辑结构设计; ②动态特性设计——数据库的行为特性,设计查询、静态事务处理等应用程序; ③物理设计,设计数据库的存储模式和存储方式。 主要步骤:需求分析→概念设计→逻辑设计→物理设计 原则:①尽量减少空间数据存储冗余;②提供稳定的空间数据结构,在用户的需要改变时,数据结构能够做出相应的变化;③满足用户对空间数据及时访问的需求,高校提供用户所需的空间数据查询结果;④在空间元素间为耻复杂的联系,反应空间数据的复杂性;⑤支持多种决策需要,具有较强的应用适应性。 四、任务范围 空间数据库实现的步骤、建库的前期准备工作内容、建库流程 步骤:①建立实际的空间数据库结构;②装入试验性数据测试应用程序;③装入实际空间数据,建立实际运行的空间数据库。 前期准备工作内容:①数据源的选择;②数据采集存储原则;③建库的数据准备;④数据库入库的组织管理。 建库流程:①首先必须确定数字化的方法及工具;②准备数字化原图,并掌握该图的投影、比例尺、网格等空间信息;③按照分层要求进行

数据库复习题答案

(说明:仅仅代表个人观点,答案正确率为98%,可能会有错的地方,有问题请问度娘) 复习参考资料 选择题 :30分(15题) 名词解释:20分(4题) 综合题:50分 一、选择题: 1. 数据库系统是采用了数据库技术的计算机系统,数据库系统由数据库、数据库管理系统、应用系统和( C)。 A. 系统分析员 B. 程序员 C. 数据库管理员 D. 操作员 2. 数据库(DB),数据库系统(DBS)和数据库管理系统(DBMS)之间的关系是( A)。 A. DBS包括DB和DBMS B. DBMS包括DB和DBS C. DB包括DBS和DBMS D. DBS就是DB,也就是DBMS 3. 下面列出的数据库管理技术发展的三个阶段中,没有专门的软件对数据进行管理的是( D)。 I.人工管理阶段 II.文件系统阶段 III.数据库阶段 A. I 和 II B. 只有 II C. II 和 III D. 只有 I 4. 下列四项中,不属于数据库系统特点的是(C )。 A. 数据共享 B. 数据完整性 C. 数据冗余度高 D. 数据独立性高 5. 数据库系统的数据独立性体现在( B)。 A. 不会因为数据的变化而影响到应用程序 B. 不会因为数据存储结构与数据逻辑结构的变化而影响应用程序

C. 不会因为存储策略的变化而影响存储结构 D. 不会因为某些存储结构的变化而影响其他的存储结构 6. 描述数据库全体数据的全局逻辑结构和特性的是(A )。 A. 模式 B. 内模式 C. 外模式 D. 以上三种 7. 要保证数据库的数据独立性,需要修改的是( C)。 A. 模式与外模式 B. 模式与内模式 C. 三级模式之间的两层映射 D. 三层模式 8. 要保证数据库的逻辑数据独立性,需要修改的是( A)。 A. 模式与外模式之间的映射 B. 模式与内模式之间的映射 C. 模式 D. 三级模式 9. 用户或应用程序看到的那部分局部逻辑结构和特征的描述是( C)模式。 A. 模式 B. 物理模式 C. 子模式 D. 内模式 10. 下述( D)不是DBA数据库管理员的职责。 A. 完整性约束说明 B. 定义数据库模式 C. 数据库安全 D. 数据库管理系统设计 11. 概念模型是现实世界的第一层抽象,这一类模型中最著名的模型是(D )。 A. 层次模型 B. 关系模型 C. 网状模型 D. 实体-关系模型 12. 区分不同实体的依据是(B )。 A. 名称 B. 属性 C. 对象 D. 概念 13. 关系数据模型是目前最重要的一种数据模型,它的三个要素分别是(B )。 A. 实体完整性、参照完整性、用户自定义完整性 B. 数据结构、关系操作、完整性约束 C. 数据增加、数据修改、数据查询 D. 外模式、模式、内模式 14. 在(A )中一个结点可以有多个双亲,结点之间可以有多种联系。 A. 网状模型

(完整版)数据库系统概论期末试题及答案(重点知识)

试题十 1. 数据库系统的特点是( )、数据独立、减少数据冗余、避免数据不一致和加强了数据保护。 A .数据共享 B .数据存储 C .数据应用 D .数据保密 2. 数据库系统中,物理数据独立性是指( )。 A .数据库与数据库管理系统的相互独立 B .应用程序与DBMS 的相互独立 C .应用程序与存储在磁盘上数据库的物理模式是相互独立的 D .应用程序与数据库中数据的逻辑结构相互独立 3. 在数据库的三级模式结构中,描述数据库中全体数据的全局逻辑结构和特征的是( )。 A .外模式 B .内模式 C .存储模式 D .模式 4. E-R 模型用于数据库设计的哪个阶段( )? A .需求分析 B .概念结构设计 C .逻辑结构设计 D .物理结构设计 5. 现有关系表:学生(宿舍编号,宿舍地址,学号,姓名,性别,专业,出生日期)的主码是( )。 A .宿舍编号 B .学号 C .宿舍地址,姓名 D .宿舍编号,学号 6. 自然连接是构成新关系的有效方法。一般情况下,当对关系R 和S 使用自然连接时,要求R 和S 含有一个或多个共有的( )。 A .元组 B .行 C .记录 D .属性 7. 下列关系运算中,( )运算不属于专门的关系运算。 A .选择 B .连接 C .广义笛卡尔积 D .投影 8. SQL 语言具有( )的功能。 A .关系规范化、数据操纵、数据控制 B .数据定义、数据操纵、数据控制 C .数据定义、关系规范化、数据控制 D .数据定义、关系规范化、数据操纵 ( 考 生 答 题 不 得 超 过 此 线 )

中文三大全文数据库的比较

中文三大全文数据库的比较 摘要通过本课程的学习,结合本人的学习情况从三大数据库对论文的收录情况、检索功能、检索结果、检索界面等方面对中文三大全文数据库——《中文期刊网全文数据库》、《维普中文科技期刊数据库》和《万方数据资源系统数字化期刊》进行了比较,阐述了一些自己对这三大全文数据库的认识。最后并谈了谈本人的学习收获和对本课程的些许建议。 关键词中文期刊网全文数据库维普中文科技期刊数据库万方数据资源系统数字化期刊全文数据库 收录情况:这三个数据库基本覆盖了科学技术和社会科学的各个领域。其中“维普”期刊的收藏量占有绝对优势,几乎覆盖了中国出版的所有中文期刊,并且收录了大量内部发行期刊,收录的年限最长,其中收录自然科学和工程技术方面的期刊量比“CNKI”多出近50%,但在文史哲类方面则几乎是空白,因此,“维普”适合用户进行科技文献的回溯性检索。“CNKI”重点收录了国内公开出版的核心期刊与具有专业特色的中西文期刊,综合性上做得较好。而“万方”收录期刊数量为三者中最少,但核心期刊比率高,收录文献的质量最高。 检索功能:三个数据库都提供了关键词、篇名、刊名、作者、机构、文摘等6个检索入口。就其特殊检索功能而言,“CNKI”在每个检索入口提供了检索词字典,通过使用它可以规范所输入的检索词,有利于更全更准地检索文献信息。“维普”在主题标引用词的基础上,编制了同义词库,有助于相关文献的检索,提高文献的查全率。“万方”在检索时,可以对期刊所分布的地域进行限定。 检索结果:比如通过著者字段的检索,张安将教授是从事化学研究的,他所发表的论文是科技方面的,在上表中“CNKI”收录了16篇,“万方”收录了5篇,而“维普”收录了24篇(换成医学方面的);张靖龙教授是从事文学研究的,在上表中“CNKI”收录了9篇,“万方”收录了0篇,“维普”收录了1篇。从这个比较中可以看出,三个数据库中综合性最强的是“CNKI”。三个数据库中文摘做得最好的是“CNKI”,不仅可以从中获得文献的基本情况,而且能通过超级链接的方式,找到更多与查找主题相关的内容。 检索界面:“CNKI”配备了功能强大的网络数据库全文检索系统,从它的检索界面中可以看出,该数据库检索方法简单、灵活,即使不具有专业检索知识的用户也很容易掌握。“维普”通过分类和导航实现文献的浏览,还能通过初级和高级检索进行检索,页面之间衔接的比较清楚。“万方”通过多种途径检索文献,但是页面过于复杂、繁琐,很难让初次接触的读者顺利地检索到文献,同时在页面的组织、导航的实现上也有待改善。 过渡一下,下面结合自己这学期的学习情况写咱这学期学习本课程的收获和一些建议方面的内容等。(控制在150—300字)。 最后写参考文献。

数据库系统概论期末试题及答案整理版

《数据库原理及应用》试题1 一、选择题 1、数据库系统的基本特征是_________。 A 、数据的统一控制 B 、数据共享性和统一控制 C 、数据共享性、独立性和冗余度小 D 、数据共享性和数据独立性 (难度系数C )正确答案:C 2、DB 、DBMS 和DBS 三者之间的关系是_________。 A 、DBS 与D B 和DBMS 无关 B 、DBMS 包括DBS 和DB C 、DB 包括DBMS 和DBS D 、DBS 包括DB 和DBMS (难度系数B )正确答案:D 3、设有关系R 和S ,关系代数 S)(R R -- 表示的是_________。 A 、R ∩S B 、R ―S C 、R ÷S D 、R ∪S (难度系数B )正确答案:A 4、自然连接是构成新关系的有效方法。一般情况下,当对关系R 和S 使用 自然连接时,要求R 和S 含有一个或多个共有的__________。 A 、行 B 、属性 C 、记录 D 、元组 (难度系数C )正确答案:B 5、以下是信息世界的模型,且实际上是现实世界到机器世界的一个中间层 次的是_________。 A 、数据模型 B 、概念模型 C 、关系模型 D 、E-R 图 (难度系数C )正确答案:C 6、构成E —R 模型的三个基本要素是_________。 A 、实体、属性值、关系; B 、实体、属性、联系; C 、实体、实体集、联系; D 、实体、实体集、属性; (难度系数C )正确答案:B 7、在关系代数运算中,五种基本运算为_________。

A 、并、差、选择、投影、连接 B 、并、交、选择、投影、笛卡尔积 C 、并、差、选择、投影、笛卡尔 积 D 、并、除、投影、笛卡尔积、选择 (难度系数B )正确答案:C 8、在下列关于规范化理论的叙述中,不正确的是_________。 A 、任何一个关系模式一定有键。 B 、任何一个包含两个属性的关系模式一定满足3NF 。 C 、任何一个包含两个属性的关系模式一定满足BCNF 。 D 、任何一个包含三个属性的关系模式一定满足2NF 。 (难度系数B )正确答案:D 9、设有关系模式R(A,B,C)和S(C,D)。与SQL 语句“SELECT A,B,D FROM R,S WHERE R.C=S.C ”等价的关系代数表达式为_________。 A 、S))(R (σπS.C R.C D B,A,?= B 、S))(R (πσD B,A,S. C R.C ?= C 、(S))π(R)(πσ D B A,S.C R.C ?= D 、S)(R))(π(πσB A,D S.C R.C ?= (难度系数A )正确答案:A 10、SQL 的视图是从_________中导出的。 A 、基本表 B 、视图 C 、数据库 D 、基本表或视图 (难度系数C )正确答案:D 11、用如下的SQL 语句创建一个Teacher 表 CREATE TABLE Teacher ( TNO Char(6) NOT NULL, NAME Char(8) NOT NULL, SEX Char(2), SAL INT, SDETP char(12) check (SDEPT IN(‘IS ’,’MA ’,’CS ’))) 可以插入到Teacher 表中的元组是_________。 A 、(‘T0203’,‘刘刚’,NULL ,NULL ,‘IS ’) B 、( NULL , ‘王芳’,‘女’,‘1200’,‘CS ’) C 、(‘T0111’,NULL ,‘男’,23,‘MA ’) D 、(‘T0101’,‘李华’,男,2100,‘EN ’) (难度系数A )正确答案:A

无锡市基础空间数据库SHP格式方案(大比例尺)

无锡市基础空间数据SHP格式设计方案 (大比例尺) 1、综述 1.1目的 为无锡市规划局基础空间数据建库提供标准。 1.2适用范围 1:500、1:1000、1:2000基础地形图数据 1.3制定原则 ●保证按本方案生产的数据可以实现同SHP数据的高效互转; ●保证按本方案生产的数据在转入数据库后可以实现标准图的输出; ●操作方便。 1.4类型约定 ● ●

1.5引用标准 《GB/T 14804-93 1:500 1:1000 1:2000 地形图要素分类与代码》(1994-08-01)《GB/T 7929-1995 1:500 1:1000 1:2000 地形图图式》(1996-05-01) 《GB 1:500 1:1000 1:2000 地形图数字化规范》(1998-08-01) 《GB/T14804-93 1:500 1:1000 1:2000 地形图要素分类与代码》(1994-08-01)《GT地籍数据库标准》 《GB/T 13923-92 国土基础信息数据分类与代码》(1993-07-01) 2、实体的划分 数据在SDE的服务器里是按照点、线、面和注记划分的,每一个SDE图层(FEATURECLASS)只能存储上述的一种空间对象。由于这种存储模型的限制,势必造成很多国标中的复杂地物被拆分到不同的SDE图层。为了在编码中体现设计的合理性、对实体的物理存储进行统一的管理,特在数据库的设计中在对空间实体做逻辑的划分。 2.1简单点 ●简单点实体只记录插入点的位置和相关属性,所有的简单点实体都必须以插入符号 的形式采集。 ●简单点状实体对应ARCOBJECT体系的IPOINT对象。 ●采集单位在使用点符号的时候要保证简单点的符号要和本方案提供的符号描述一 致,符号的插入点一致。 2.2简单无向线 ●简单线需要作业单位针对每一种实体制作线符号,这里所指的线符号必须是采集系 统提供的线符号库,不能用程序绘制。

数据库原理复习资料整理

第一章 1.四大基本概念: 数据:数据库中存储的基本对象,它是描述事物的符号记录。种类有:文字、图形、图象、声音等。特点是:数据与其语义是不可分的。 数据库:(Database,简称DB)是长期储存在计算机内、有组织的、可共享的大量数据集合。其特点是:数据按一定的数据模型组织、描述和储存;可为各种用户共享;冗余度较小;数据独立性较高;易扩展。(特点:永久存储、有组织、可共享) 数据库管理系统:是位于用户与操作系统之间的一层数据管理软件。 数据库管理系统的主要功能:数据定义功能;数据组织、存储和管理;数据操纵功能;数据库的事物管理和运行管理;数据库的建立和维护功能;其他功能。 数据库系统:是指在计算机系统中引入数据库后的系统。一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员(和用户)构成。 在不引起混淆的情况下常常把数据库系统简称为数据库。 2.数据管理技术的三个阶段及其特点 人工管理阶段:特点:1、数据不保存。 2、没有软件系统对数据进行管理。 3、这一时期没有文件的概念,数据的组织方式必须由程序员自行设计。 4、一组数据对应一组程序,数据是不共享的。 5、数据不具有独立性,当数据结构发生变化时,应用程序要变化。 文件系统阶段:特点:1、数据可以长期保存。 2、由文件系统管理数据。 3、数据共享性差, 冗余度大—文件是面向应用的。 4、数据独立性差—是不具有弹性的无结构的数据集合,文件之间是孤立的,不能反映事物间联系。 数据库系统阶段:特点:数据的管理者:DBMS 数据面向的对象:现实世界 数据的共享程度:共享性高 数据的独立性:高度的物理独立性和一定的逻辑独立性 数据的结构化:整体结构化 数据控制能力:由DBMS统一管理和控制 3、数据库系统的特点:数据结构化;数据的共享性高,冗余度低,易扩充;数据独立性高;数据有DBMS统一管理和控制。 4、数据模型的组成要素:数据结构、数据操作和完整性约束。 数据结构是对系统静态特性的描述。 数据操作是对系统动态特性的描述。 5、概念模型: 基本概念:实体:客观存在并可相互区别的事物称为实体。 属性:实体所具有的某一特性称为属性。 码:唯一标识实体的属性集称为码。 域:属性的取值范围称为该属性的域。 实体型:具有相同属性的实体具有的共同的特征和性质,即: 用实体名及其属性名集合来抽象和刻画同类实体。

数据库系统概论各章复习试题及答案

数据库系统概论复习资料: 第一章: 一、选择题: 1.在数据管理技术的发展过程中,经历了人工管理阶段、文件系统阶段和数据库系统阶段。在这几个阶段中,数据独立性最高的是 A 阶段。 A.数据库系统 B.文件系统 C.人工管理 D.数据项管理 2.数据库的概念模型独立于 A 。 A.具体的机器和DBMS B.E-R图 C.信息世界 D.现实世界 3.数据库的基本特点是 B 。 A.(1)数据可以共享(或数据结构化) (2)数据独立性 (3)数据冗余大,易移植 (4)统一管理和控制 B.(1)数据可以共享(或数据结构化) (2)数据独立性 (3)数据冗余小,易扩充 (4)统一管理和控制 C.(1)数据可以共享(或数据结构化) (2)数据互换性 (3)数据冗余小,易扩充 (4)统一管理和控制 D.(1)数据非结构化 (2)数据独立性 (3)数据冗余小,易扩充 (4)统一管理和控制 4. B 是存储在计算机内有结构的数据的集合。 A.数据库系统B.数据库 C.数据库管理系统 D.数据结构 5.数据库中存储的是 C 。 A.数据 B.数据模型C.数据以及数据之间的联系 D.信息 6. 数据库中,数据的物理独立性是指 C 。 A.数据库与数据库管理系统的相互独立 B.用户程序与DBMS的相互独立 C.用户的应用程序与存储在磁盘上数据库中的数据是相互独立的 D.应用程序与数据库中数据的逻辑结构相互独立 7. 数据库的特点之一是数据的共享,严格地讲,这里的数据共享是指 D 。 A.同一个应用中的多个程序共享一个数据集合 B.多个用户、同一种语言共享数据 C.多个用户共享一个数据文件 D.多种应用、多种语言、多个用户相互覆盖地使用数据集合 8.数据库系统的核心是 B 。 A.数据库 B.数据库管理系统 C.数据模型 D.软件工具 9. 下述关于数据库系统的正确叙述是 A 。 A.数据库系统减少了数据冗余 B.数据库系统避免了一切冗余 C.数据库系统中数据的一致性是指数据类型一致 D.数据库系统比文件系统能管理更多的数据 10. 数将数据库的结构划分成多个层次,是为了提高数据库的①和②。 ①A.数据独立性 B.逻辑独立性 C.管理规范性 D.数据的共享 ②A.数据独立性 B.物理独立性 C.逻辑独立性 D.管理规范性 【答案:】①B ②B 11. 数据库(DB)、数据库系统(DBS)和数据库管理系统(DBMS)三者之间的关系是 A 。 A.DBS包括DB和DBMS B.DDMS包括DB和DBS C.DB包括DBS和DBMS D.DBS就是DB,也就是DBMS

数据库复习材料教案资料

数据库复习材料

Oracle数据库体系结构 一、填空题 1.Oracle数据库系统的物理存储结构主要由3类文件组成,分别为数据文件、日志文件、控制文件。 2.用户对数据库的操作如果产生日志信息,则该日志信息首先被存储在日志缓冲区中,随后由 LGWR 进程保存到日志文件中。 3.一个表空间物理上对应一个或多个数据文件。 4.在Oracle的逻辑存储结构中,根据存储数据类型,可以将段分为数据段、索引段、回退段、LOB段或临时段。 5.在Oracle的逻辑存储结构中,数据块是最小的I/O单元。 6. 表空间的管理类型可以分为本地管理和字典管理. 7.在ORACLE系统中,为了实现对表,视图和索引等数据库对象进行了管理,ORACLE采用模式实现。 8.一个模式只能够被一个数据库用户所拥有,其创建的所有模式对象都保存在自己的模式中。 9如果定义了CHAR数据类型的字段,并且向其赋值时,字符串的长度小于定义的长度,则使用空格填充;而VARCHAR2类型的字段用于存储变长的字符串,即如果向该列赋的字符长度小于定义时的长度,该列的字符长度只会是实际字符数据的长度,系统不会使用空格填充。 10.ROWID实际上保存的是记录的物理地址,因此通过ROWID来访问记录可以获得最快的访问速度。

11.在创建表空间命令的STORAGE子句中可以设置6个存储参数。其中,INITIAL指定为表中的数据分配的第一个盘区大小;NEXT指定为存储表中的数据分配的第二个盘区大小;PCTINCREASE指定从第二个盘区之后,每个盘区相对于上一个盘区的增长百分比;MINEXTENTS指定允许为表中的数据所分配的最小盘区数目;MAXEXTENTS指定允许为表中的数据所分配的最大盘区数目。 12.通过数据块空间管理参数可以控制数据块中空闲空间的使用方法,其中PCTFREE用于控制数据块的更新预留的空间,而PCTUSED用于控制数据块在删除时释放空间的门槛。 13、如果出现了失败故障,用户修改的数据没有永久地写到数据文件里,那么就可以利用(控制文件)找到数据的更改,这样做过的工作就不会丢失了. 14、(控制文件)是一个小的二进制文件,它维护着数据库的全局物理结构,用以支持数据库成功地启动和运行. 15、表空间是Oracle数据库中数据的逻辑组织,每个数据库至少有一个(SYSTEM系统)表空间. 16、(DBWR)进程把修改过的数据块从内存写回到数据库的数据文件中. 17、当用户进程出错,PMON后台进程负责清理它 18、创建数据库时自动建立的tablespace名称SYSTEM tablespace 19、数据库表空间一般分为永久性表空间、还原表空间、临时表空间 二、选择题 1.下列选项中,哪一部分不是Oracle实例的组成部分? C A.系统全局区SGA

国内三大中文期刊全文数据库的比较

国内三大中文期刊全文数据库的比较研究(建议新手查阅) 中国期刊网全文数据库》、《维普中文科技期刊数据库》和《万方数据库资源系统数字化期刊》是国内影响力和利用率很高的综合性中文电子期刊全文数据库,这三个数据库已经成为大多数高等院校、公共图书馆和科研机构文献信息保障系统的重要组成部分。在互联网中,这三大数据库也成为中文学术信息的重要代表,体现了我国现有的中文电子文献数据库的建设水平。 笔者结合工作和学习中的实践,就上述三大数据库的收录情况、检索功能、检索结果、检索界面、用户服务等方面进行全面的比较,并通过检索实践举例进行比较分析,以供参考。 1 收录情况(数据较早,甚至不是2004年的数据,感觉更像2002年左右的数据,后面将尽可能给出最新的数据值。) 收录范围与数量 《中国期刊网全文数据库》(本文中简称“清华”)是由清华同方光盘股份有限公司、光盘国家工程研究中心和中国学术期刊(光盘版)电子杂志社共同研制出版的综合性全文数据库。该数据库收录自从1994年来公开出版发行的6600余种国内核心期刊和一些具有专业特色的中英文期刊全文,累积全文文献618万多篇,题录1500万余条,按学科分为理工A(数理科学)、理工B(化学化工能源与材料)、理工C(工业技术)、农业、医药卫生、文史哲、经济政治与法律、教育与社会科学、电子技术与信息科学九大类,126个专题文献数据库。 《中文科技期刊数据库》(本文中简称“维普”)由科技部西南信息中心主办,重庆维普资讯有限公司制作。其前身为《中文科技期刊篇名数据库》。该数据库收录了自1989年以来国内出版发行的12000种期刊,其中全文收录8000余种,按学科分为经济管理、教育科学、图书情报、自然科学、农业科学、医药卫生、工程技术等7大类,27个专辑,200个专题,按《中图法》编制了树型分类导航和刊名导航系统,基本覆盖了国内公开出版的具有学术价值的期刊,同时还收录了中国港台地区出版的108种学术期刊,积累700余万篇全文文献,数据量以每年100万篇的速度递增。 《万方数据资源系统数字化期刊》(本文中简称“万方”)是万方数据库资源系统三大组成部分之一,由中国科技信息研究所属下的北京万方数据股份有限公司创办。万方期刊收录了我国自然科学的大量期刊以及社会科学的部分期刊,范围包括基础科学、医药卫生、农业科学、工业技术、人文科学等5大类,以及英文版期刊、中国科学系列杂志,共2500多

数据库系统概论期末考试复习资料

数据库系统概论复习资料: 第一章: 一选择题: 1. 在数据管理技术的发展过程中,经历了人工管理阶段、文件系统阶段和数据库系统阶段。在这几个阶段中, 阶段(A )。A .数据库系统 2. 3. 数据独立性最高的是 数据库的概念模型独立于 F A o A.具体的机器和 DBMS B .E-R 图 C .信息世界 D .现实世界 数据库的基本特点是 B o A .(1)数据可以共享 (或数据结构化) (2) 数据独立性 数据冗余大, 易移植 (4) 统一管理和控制 B .(1)数据可以共享 (或数据结构化) (2) 数据独立性 数据冗余小, 易扩充 (4) 统一管理和控制 C .(1)数据可以共享 (或数据结构化) (2) 数据互换性 数据冗余小, 易扩充 (4) 统一管理和控制 D .(1)数据非结构化 (2) 数据独立性 数据冗余小, 易扩充 (4) 统一管理和控制 B 答案:B B .文件系统 C .人工管理 D .数据项管理 是存储在计算机内有结构的数据的集合。 A .数据库系统 B.数据库C .数据库管理系统 D.数据结构 5. 数据库中存储的是 _C 。 A .数据 B .数据模 间的联系 D . 6. 数据库中,数据的物理独立性是指 C ________________ 。 A .数据库与数据库管理系统的相互》 B — 与 C .用户的应用程序与存储在磁盘上数据库中的数据是相互独立的 C 7..数据库的特点之一是数据的共享,严格地讲,这里的数据共享是指 4. 信息 DBMS 的相互独立 ..D .应用程序与数据库中数据的逻辑结构相互独立 A .同一个应用中的多个程序共享一个数据集合 B .多个用户、同一种语言共享数据 C .多个用户共享一个数据文件 D .多种应用、多种语言、多个用户相互覆盖地使用数据集合 8. 据库系统的核心是 B __________ 。A .数据库B .数据库管理系统 C .数据模型 D .软件工具 答案:B 9. 下述关于数据库系 ― A __________________ 。 A .数据库系统减少了数据冗余 B .数据库系统避免了一切冗余 D .数据库系统比文件系统能管理更多的数据 数将数据库的结构划分成多个层次,是为了提高数据库的 ① A .数据独立性 B . ② A .数据独立性 B . 数据库(DB)、数据库系统 .DBS 包括 DB 和 DBMS 10. 逻辑独立性 C .管理规范性 物理独立性 C .逻辑独立性 答案: C .数据库系统中数据的一致性是指数据类型一致 答案:A ①B 和 ②B 。 11. A 12. A 13. 14. 15. A 16 A 17. A 18. A D .数据的共享 D .管理规范性 (DBS)和数据库管理系统(DBMS 三者之间的关系是答案:A B . DDMS 包括 DB 和 DBS C . DB 包括 DBS 和 DBMS D . DBS 就是 DB,也就是 DBMS D 。 答案:①B 在数据库中,产生数据不一致的根本原因是 .数据存储量太大 B .没有严格保护数据 C .未对数据进行完整性控制 D .数据冗余 答案:D 数据库管理系统(DBMS 是 D A .数学软件B .应用软件 C .计算机辅助设计 D .系统软件 答案:D 数据库管理系统(DBMS 的主要功能是 B ________ 。A.修改数据库 B .定义数据库 C .应用数据库D.保护数据库 数据库系统的特点是 _A _______ 、数据独立、减少数据冗余、避免数据不一致和加强了数据保护。 .数据共享 B .数据存储 C .数据应用 D .数据保密 答案:A 数据库系统的最大特点是 A 。 ?数据的三级抽象和二级独立性 B ?数据共享性 C ?数据的结构化 数据库管理系统能实现对数据库中数据的查询、插入、修改和删除等操作,这种功能称为 .数据定义功能 B .数据管理功能 C .数据操纵功能 D .数据控制功能 数据库管理系统是 B __________ 。 ?操作系统的一部分 B .在操作系统支持下的系统软件 C ?一种编译程序 描述数据库中全体数据的全局逻辑结构和特征的是 () 答案: D C 答案:C ?数据独立性 答案: D ?一种操作系统 答案: 19.据库的三级模式结构中, A .外模式 B .内模式 C .存储模式 20据库系统的数据独立性是指 B A .不会因为数据的变化而影响应用程序 C .不会因为存储策略的变化而影响存储结构 21.信息世界中的术语,与之对应的数据库术语为 22次型、网状型和关系型数据库划分原则是 _ D .模式 B.不会因为系统数据存储结构与数据逻辑结构的变化而影响应用程序 D ?不会因为某些存储结构的变化而影响其他的存储结构 D A .文件 B .数据库 C .字段 D .记录 答案: 答案: D A .记录长度 B .文件的大小 C .联系的复杂程度 D .数据之间的联系 23. 传统的数据模型分类,数据库系统可以分为三种类型 __C _____________ 。 A 24. 25. A 答案:D .大型、中型和小型 B .西文、中文和兼容 C .层次、网状和关系 D 层次模型不能直接表示 C A . 1 : 1关系 B . 1 : m 关系 C 数据库技术的奠基人之一 E.F . Codd 从1970年起发表过多篇论文,主要论述的是 .层次数据模型 B .网状数据模型 C .关系数据模型 D .面向对象数据模型 ?数据、图形和多媒体 .m : n 关系 D . C 。 答案:C :1和1 : m 关系 答案:C 二、填空题 数据管理技术经历了 人工管理、文件系统 数据库是长期存储在计算机内、有 DBMS 是指 它是位于用户 1. 2. 3. 4. 和数据库系统三个阶段。 答案:①人工管理 答案:①组织 ②共享 答案:①数据库管理系统 ②用户 ③操作系统 数据库的运行管理 和数据库的建立以及维护 等4个方面。 ②文件系统 ②数据库系统 5. 6. 组织的、可共享的数据集合。 和 ③ 之间的一层管理软件。 、数据操纵功能 数据库管理系统的主要功能有数据定义功能 答案:①数据定义功能 ②数据操纵功能 数据独立性又可分为逻辑数据独立性 _和物理数据独立性。 答案:①逻辑数据独立性 ②物理数据独立性 当数据的物理存储改变了,应用程序不变,而由DBMS 处理这种改变,这是指数据的—物理独立性 _。 答案:物理独立性

数据库复习资料全

数据库原理 1.1试述数据、数据管理、数据库管理系统、数据库的概念。 数据:描述事物的符号记录成为数据,如数值数据、文本数据和多媒体数据(如图形、图像、音频和视频)等。 数据管理:是对数据进行有效的分类、组织、编码、存储、检索、维护和应用,它是数据处理的中心问题。 数据库管理系统:是由一个相互关联的数据的集合和一组用以访问、管理和控制这些数据的程序组成。 数据库是长期储存在计算机内、有组织的、可共享的数据集合。 1.4什么是数据独立性?数据独立性又分为哪两个层次?为什么需要数据独立性? 数据独立性是用来描述数据与应用程序之间的依赖程度,包括数据的物理独立性和数据的逻辑独立性,依赖程度越低则独立性越高。 数据独立性又分为外模式/模式映像、模式/内模式映像两个层次。 数据的独立性把数据的定义从应用程序中分离出来,加上存取数据的方法又由数据库管理系统负责提供,从而大大简化了应用程序的编写,并减少了应用程序的维护代价。 1.6什么是数据模型?数据模型的基本要素有哪些?为什么需要数据模型? 数据模型是一个描述数据语义、数据与数据之间联系(数据结构)、数据操作,以及一致性(完整性)约束的概念工具的集合。 数据模型的基本要素:1、数据结构;2、数据操作;3、数据的完整性约束条件。 由于计算机不可能直接处理现实世界中的具体事物,所以人们必须事先把具体事物转换成计算机能够处理的数据。也就是把现实世界中具体的人、物、活动、概念等用数据模型这个工具来进行抽象、表示和处理。 1.7为什么数据模型要分为概念模型、逻辑模型和物理模型3类?试分别解释概念模型、逻辑模型和物理模型。 数据模型应满足3方面的要求:一是能比较真实地模拟现实世界;二是容易被人所理解;三是便于在计算机上实现。一种数据模型要很好地同时满足这3方面的要求是很困难的,因此数据库管理系统针对不同的使用对象和应用目的,分别采用概念模型、逻辑模型和物理模型。 概念模型:概念层次的数据模型称为概念数据模型,它按用户的观点或认识对现实世界的数据和信息进行建模,主要用于数据库设计。 逻辑模型:逻辑层是数据抽象的中间层,用于描述数据库数据的整体逻辑结构。 物理模型:物理层是数据抽象的最底层,用来描述数据的物理存储结构和存取方法。 1.9关系模型的主要优点有哪些? 关系数据模型具有以下优点: (1)关系模型建立在严格的数学概念的基础之上,有关系代数作为语言模型,有关系数据理论作为理论基础。 (2)关系模型的概念单一。无论实体还是实体之间的联系都是用关系来表示,对数据的操作结果还是关系。所以其数据结构简单、清晰,用户易懂易用。 (3)关系模型的存取路径对用户透明,从而具有更高的数据独立性、更好的安全保密性,也简化了程序员的工作,提高了软件的开发和维护效率。 1.10为什么数据库管理系统要对数据进行抽象?分为哪几级抽象? 一个商用的数据库管理系统必须支持高效的数据检索。这种高效性的需求促使设计者在数据库管理系统中使用复杂的数据结构来表示和存储数据。由于许多数据库管理系统的用户并未受过计算机专业训练,系统开发人员就通过多个层次上的抽象来实现对用户屏蔽复杂性,以简化用户与系统的交互。分为物理层

数据库基础知识试题(含答案)

数据库基础知识试题 部门____________ __________ 日期_________ 得分__________ 一、不定项选择题(每题1.5分,共30分) 1.DELETE语句用来删除表中的数据,一次可以删除( )。D A .一行 B.多行 C.一行和多行 D.多行 2.数据库文件中主数据文件扩展名和次数据库文件扩展名分别为( )。C A. .mdf .ldf B. .ldf .mdf C. .mdf .ndf D. .ndf .mdf 3.视图是从一个或多个表中或视图中导出的()。A A 表 B 查询 C 报表 D 数据 4.下列运算符中表示任意字符的是( )。B A. * B. % C. LIKE D._ 5.()是SQL Server中最重要的管理工具。A A.企业管理器 B.查询分析器 C.服务管理器 D.事件探察器 6.()不是用来查询、添加、修改和删除数据库中数据的语句。D A、SELECT B、INSERT C、UPDATE D、DROP 7.在oracle中下列哪个表名是不允许的()。D A、abc$ B、abc C、abc_ D、_abc 8.使用SQL命令将教师表teacher中工资salary字段的值增加500,应该使用的命令 是()。D A、Replace salary with salary+500 B、Update teacher salary with salary+500 C、Update set salary with salary+500 D、Update teacher set salary=salary+500 9.表的两种相关约束是()。C

数据库复习题全

数据库与管理信息系统复习题 一、简答题 1. 试述数据库二级映像和数据独立性之间的关系 DBMS在三级模式之间提供二级映像——“外模式|模式映像”和“模式|内模式映像”,保证了数据库的数据具有较高的逻辑独立性和物理独立性。 数据库的二级映像保证了数据库外模式的稳定性,从底层保证了应用程序的稳定性,除非应用需求本身发生变化,否则应用程序一般不需要修改。 数据库的三级模式与二级映像实现了数据与程序之间的独立性,使数据的定义和描述可以从应用程序中分离出来。另外,由于数据的存取由DBMS管理,用户不必考虑存取路径等细节,从而简化了应用程序的编制,大大降低了应用程序的维护和修改成本。 2.请举例说明在同一个关系内部也可能存在参照的完整性约束。 参照完整性约束是不同关系之间或一个关系的不同元组之间的制约。不仅在关系间存在引用,同一关系内部属性也可能存在引用关系。也就是说,参照完整性规则中,参照关系和目标关系(被参照关系)可以是同一个关系。 比如对于关系“学生(学号,姓名,性别,专业号,年龄,班长)”,主键是学号,班长属性表示该学生所在班级的班长的学好呢,这班长的属性实际引用了学号属性,也就是是说,班长必须是实际存在的学生的学号。 3.简述事务的特性。(PPT上只给出了四个特性,我又在后面加了每个特性的意思,作为参考) 事务的:原子性、一致性、隔离性、持续性 (1)原子性 事务的原子性指的是,事务中包含的程序作为数据库的逻辑工作单位,它所做的对数据修改操作要么全部执行,要么完全不执行。这种特性称为原子性。 (事务的原子性要求,如果把一个事务可看作是一个程序,它要么完整的被执行,要么完全不执行。就是说事务的操纵序列或者完全应用到数据库或者完全不影响数据库。这种特性称为原子性。假如用户在一个事务内完成了对数据库的更新,这时所有的更新对外部世界必须是可见的,或者完全没有更新。前者称事务已提交,后者称事务撤消(或流产)。DBMS必须确保由成功提交的事务完成的所有操纵在数据库内有完全的反映,而失败的事务对数据库完全没有影响) (2) 一致性 事务的一致性指的是在一个事务执行之前和执行之后数据库都必须处于一致性状态。即事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。这种特性称为事务的一致性。 (假如数据库的状态满足所有的完整性约束,就说该数据库是一致的。一致性处理数据库中对所有语义约束的保护。假如数据库的状态满足所有的完整性约束,就说该数据库是一致的。例如,当数据库处于一致性状态S1时,对数据库执行一个事务,在事务执行期间假定数据库的状态是不一致的,当事务执行结束时,数据库处在一致性状态S2。) (3) 隔离性 隔离性指并发的事务是相互隔离的。一个事务的执行不能被其他事物干扰。即一个事务内部的操作及使用的数据对其他并发事务是隔离的,并发执行的各个事务之间不能相互干扰。 (隔离性是DBMS针对并发事务间的冲突提供的安全保证。DBMS可以通过加锁在并发执行的事务间提供不同级别的隔离。假如并发交叉执行的事务没有任何控制,操纵相同的共享对象的多个并发事务的执行可能引起异常情况。DBMS可以在并发执行的事务间提供不同级别的隔离。隔离的级别和并发事务的吞吐量之间存在反比关系。较多事务的可隔离性可能会带来较高的冲突和较多的事务流产。流产的事务要消耗

相关文档
最新文档