关系数据库规范化理论

关系数据库规范化理论
关系数据库规范化理论

第四章关系数据库规范化理论

一个关系数据库模式由一组关系模式组成,一个关系模式由一组属性名组成。关系数据库设计,就是如何把已给定的相互关联的一组属性名分组,并把每一组属性名组成关系的问题。然而,属性的分组不是唯一的,不同的分组对应着不同的数据库应用系统,它们的效率往往相差很远。

为了使数据库设计合理可靠,简单实用,长期以来,形成了关系数据库设计的理论——规范化理论。

4.1 关系规范化的作用

规范化,就是用形式更为简洁,结构更加规范的关系模式取代原有关系模式的过程。

如果将两个或两个以上实体的数据存放在一个表里,就会出现下列三个问题:?数据冗余度大

?插入异常

?删除异常

所谓数据冗余,就是相同数据在数据库中多次重复存放的现象。数据冗余不仅会浪费存储空间,而且可能造成数据的不一致性。

插入异常是指,当在不规范的数据表中插入数据时,由于实体完整性约束要求主码不能为空的限制,而使有用数据无法插入的情况。

删除异常是指,当不规范的数据表中某条需要删除的元组中包含有一部分有用数据时,就会出现删除困难。

(以P98工资表为例)

解决上述三个问题的方法,就是将不规范的关系分解成为多个关系,使得每个关系中只包含一个实体的数据。

(讲例子解)

当然,改进后的关系模式也存在另一问题,当查询职工工资时需要将两个关系连接后方能查询,而关系连接的代价也是很大的。

那么,什么样的关系需要分解?分解关系模式的理论依据又是什么?分解完后能否完全消除上述三个问题?回答这些问题需要理论指导。下面,将加以讨论:

4.2 函数依赖

4.2.1属性间关系

实体间的联系有两类:一类是实体与实体之间联系;另一类是实体内部各属性间的联系。

数据库建模一章中讨论的是前一类,在这里我们将学习第二类。

和第一类一样,实体内部各属性间的联系也分为1:1、1:n 和m:n 三类: 例:职工(职工号,姓名,身份证号码,职称,部门) 1、 一对一关系(1:1)

设X 、Y 是关系R 的两个属性(集)。如果对于X 中的任一具体值,Y 中至多有一个值与之对应,反之,对于Y 中的任一具体值,X 中也至多有一个值与之对应,则称X 、Y 两属性间是一对一关系。

如本例职工关系中职工号与身份证号码之间就是一对一关系。 2、一对多关系(1:n )

设X 、Y 是关系R 的两个属性(集)。如果对于X 中的任一具体值,Y 中可以找到多个值与之对应,而对于Y 中的任一具体值,X 中至多只有一个值与之对应,则称属性X 对Y 是一对多关系。

如职工关系中职工号与职称之间就是一对多的关系。 3、多对多关系(m:n )

设X 、Y 是关系R 的两个属性(集)。如果对于X 中的任一具体值,Y 中有n 个值与之对应,而对于Y 中的任一具体值,X 中也有m 个值与之对应,则称属性X 对Y 是一对多(m:n )关系。

例如,职工关系中,职称与部门之间就是多对多的关系。 上述属性间的三种关系,实际上是属性值之间相互依赖与相互制约的反映,因而称之为属性间的数据依赖。

数据依赖共有三种:

? 函数依赖(Functional Dependency ,FD ) ? 多值依赖(Multivalued Dependency ,MVD ) ? 连接依赖(Join Dependency ,JD ) 其中最重要的是函数依赖和多值依赖。 4.2.2 函数依赖

函数依赖,是属性之间的一种联系。在关系R 中,X 、Y 为R 的两个属性或属性组,如果对于R 的所有关系r 都存在:对于X 的每一个具体值,Y 都只有一个具体值与之对应,则称属性Y 函数依赖于属性X 。或者说,属性X 函数决定属性Y ,记作X →Y 。其中X 叫作决定因素,Y 叫作被决定因素。

上述定义,可简言之:如果属性X 的值决定属性Y 的值,那么属性Y 函数依赖于属性X 。换一种说法:如果知道X 的值,就可以获得Y 的值,则可以说X 决定Y 。

若Y 函数不依赖于X

X →若X →Y ,Y →X ,记作:

◆ 如果X 、Y 间是1:1关系,则存在函数依赖 X ←→Y

◆ 如果X 、Y 间是1:n 关系,则存在函数依赖: X →Y 或Y →X (多方为决定因

素)

◆ 如果X 、Y 间是m:n 关系,则不存在函数依赖。 注意,属性间的函数依赖不是指R 的某个或某些关系子集满足上述限定条件,而是指R 的一切关系子集都要满足定义中的限定。只要有一个具体的关系r (R 的一个关系子集)不满足定义中的条件,就破坏了函数依赖,使函数依赖不成立。

这里的关系子集,指的是R 的某一部分元组的集合,例如:地测学院的学生关系中只包含了地测学院学生的数据,所以它是长安大学学生关系的一个子集。

4.2.3 码的定义

前面,我们对码进行了直观化的定义,下面用函数依赖的概念对码作出较为精确的形式化的定义:

设K是关系模式R(U,F)中的属性或属性组,K’是K的任一子集。若K→U,而不存在K'→U,则K为R的候选码(Candidate Key)

?若候选码多于一个,则选其中的一个为主码(Primary Key);

?包含在任一候选码中的属性,叫做主属性(Primary Attribute);

?不包含在任何码中的属性称为非主属性(Nonprime Attribute)或非码属性(Nonkey Attribute)

?关系模式中,最简单的情况是单个属性是码,称为单码(Single Key);最极端的情况是整个属性组是码,称为全码(All-Key)。

前面已多次遇到单码的情况,下面是一个全码的例子:

签约(演员名,制片公司,电影名)

外码:设有两个关系R和S,X是R的属性或属性组,并且X不是R的码,但X是S 的码(或与S的码意义相同),则称X是R的外部码(Foreign Key),简称外码或外键。

如:职工(职工号,姓名,性别,职称,部门号)

部门(部门号,部门名,电话,负责人)

其中职工关系中的“部门号”就是职工关系的一个外码。

在此需要注意,在定义中说X不是R的码,并不是说X不是R的主属性,X不是码,但可以是码的组成属性,或者是任一候选码中的一个主属性。

如:学生(学生号,姓名,性别,年龄…)

课程(课程号,课程名,任课老师…)

选课(学生号,课程号,成绩)

在选课关系中,(学生号,课程号)是该关系的码,学生号、课程号又分别是组成主码的属性(但单独不是码),它们分别是学生关系和课程关系的主码,所以是选课关系的两个外码。

关系间的联系,可以通过同时存在于两个或多个关系中的主码和外码的取值来建立。如要查询某个职工所在部门的情况,只需查询部门表中的部门号与该职工部门号相同的记录即可。所以,主码和外码提供了一个表示关系间联系的途径。

4.2.4 函数依赖和码的唯一性

由上述码的形式化定义,我们可以说:码是由一个或多个属性组成的,可唯一标识元组的最小属性组。

码在关系中总是唯一的,即一个码函数唯一地决定一行。如果码的值重复,则整个元组都会重复。否则,违反了实体完整性规则。而元组的重复则表示存在两个完全相同的实体,这显然是不可能的,所以码是不允许重复取值的。

所以,只有当某个属性或属性组能够函数决定关系中的每一个其它的属性,且该属性组的任何一个真子集都做不到这一点时,该属性或属性组才是该关系的码。

函数依赖是一个与数据有关的事物规则的概念。如果属性B函数依赖于属性A,那么若知道了A的值,则完全可以找到B的值。这并非是可以由A的值计算出B的值,而是逻辑上只能存在一个B的值。

4.3 关系模式的规范化

一、非规范化的关系

当一个表中存在还可以再分的数据项时,这个表就是非规范化的表。非规范化表存在两种情况:

?表中具有组合数据项(P102表6-4)

?表中具有多值数据项(P103表6-5)

当一个关系中的所有分量都是不可再分的数据项时,该关系是规范化的。即当表中不存在组合数据项和多值数据项,只存在不可分的数据项时,这个表是规范化的。

二维表按其规范化程度从低到高可分为5级范式(Normal Form),分别称为1NF、2NF、3NF(BCNF)、4NF、5NF。规范化程度较高者必是较低者的子集,即:

1NF?2NF?3NF?BCNF?4NF?5NF

二、第一范式(1NF)

定义1:如果关系模式R中不包含多值属性,则R满足第一范式(First Normal Form),记作:

R∈1NF

1NF是对关系的最低要求,不满足1NF的关系是非规范化的关系。

非规范化关系转化为规范化关系1NF方法很简单,只要上表分别从横向、纵向展开即

可。如下表:

上表虽然符合1NF,但仍是有问题的关系,表中存在大量的数据冗余和潜在的数据更新异常。原因是(职工号,学历)是右表的码,但姓名、职称、系名、系办地址却与学历无关,只与码的一部分有关。所以上表还需进一步地规范化。

三、第二范式(2NF)

定义1:设X、Y是关系R的两个不同的属性或属性组,且X →Y。如果存在X的某一个真子集X’,使X’→Y成立,则称Y部分函数依赖于X,记作:X P→Y(Partial)。反之,则称Y完全函数依赖于X,记作:X F→Y (Full)

定义2:如果一个关系R∈1NF,且它的所有非主属性都完全函数依赖于R的任一候选码,则R属于第二范式,记作:R∈2NF。

说明:上述定义中所谓的候选码也包括主码,因为码首先应是候选码,才可以被指定为码。

例如关系模式:

职工(职工号,姓名,职称,项目号,项目名称,项目角色)中

(职工号,项目号)是该关系的码,而职工号→姓名、职工号→职称、项目号→项目名称…

所以(职工号,项目号)P→职称、(职工号,项目号)P→项目名称

故上述职工关系不符合第二范式要求。它存在三个问题:插入异常、删除异常和修改异常。

其中修改异常是这样的,当职工关系中项目名称发生变化时,由于参与该项目的人员很多,每人一条记录,要修改项目信息,就得对每一个参加该项目的人员信息进行修改,加大了工作量,还有可能发生遗漏,存在着数据一致性被破坏的可能。

可把上述职工关系分解成如下三个关系:

职工(职工号,姓名,职称)

参与项目(职工号,项目号,项目角色)

项目(项目号,项目名称)

上述三个关系都符合定义2的要求,所以都符合2NF

推论:如果关系模式R∈1NF,且它的每一个候选码都是单码,则R∈2NF

符合第二范式的关系模式仍可能存在数据冗余、更新异常等问题。如关系

职工信息(职工号,姓名,职称,系名,系办地址)虽然也符合2NF,但当某个系中有100名职工时,元组中的系办地址就要重复100次,存在着较高的数据冗余。原因是关系中,系办地址不是直接函数依赖于职工号,而是因为职工号函数决定系名,而系名函数决定系办地址,才使得系办地址函数依赖于职工号,这种依赖是一个传递依赖的过程。

所以,上述职工信息的关系模式还需要进一步的规范化。

四、第三范式(3NF)

定义1:在关系R中,X、Y、Z是R的三个不同的属性或属性组,如果X→Y,Y→Z,但Y→X,且Y不是X的子集,则称Z传递函数依赖于X。

定义2:如果关系模式R∈2NF,且它的每一个非主属性都不传递依赖于任何候选码,则称R是第三范式,记作:R∈3NF

推论1:如果关系模式R∈1NF,且它的每一个非主属性既不部分依赖、也不传递依赖于任何候选码,则R∈3NF

推论2:不存非主属性的关系模式一定为3NF

五、改进的3NF——BCNF(Boyee-Codd Normal Form)

定义:设关系模式R(U,F)∈1NF,若F的任一函数依赖X→Y(Y X)中X都包含了R的一个码,则称R∈BCNF。

换言之,在关系模式R中,如果每一个函数依赖的决定因素都包含码,则R∈BCNF 推论:如果R∈BCNF,则:

?R中所有非主属性对每一个码都是完全函数依赖;

?R中所有主属性对每一个不包含它的码,都是完全函数依赖;

?R中没有任何属性完全函数依赖于非码的任何一组属性。

定理:如果R∈BCNF,则R∈3NF一定成立。

证明:(结合传递依赖的定义,用反证法)

注意:当R∈3NF时,R未必属于BCNF。因为3NF比BCNF放宽了一个限制,它允许决定因素不包含码。例如:

通讯(城市名,街道名,邮政编码)中:

F={(城市名,街道名)→邮政编码,邮政编码→城市名}

非主属性邮政编码完全函数依赖于码,且无传递依赖,故属于3NF,但邮政编码也是一个决定因素,而且它没有包含码,所以该关系不属于BCNF。

又如:

Teaching(Student,Teacher,Course)简记为Teaching(S,T,C)

规定:一个教师只能教一门课,每门课程可由多个教师讲授;学生一旦选定某门课程,教师就相应地固定。

F={T→C,(S,C)→T,(S,T) →C}

该关系的候选码是(S,C)和(S,T),因此,三个属性都是主属性,由于不存在非主属性,该关系一定是3NF。但由于决定因素T没包含码,故它不是BCNF。

关系模式Teaching仍然存在着数据冗余问题,因为存在着主属性对码的部分函数依赖问题。

确切地表示:F={T→C,(S,C)P→T,(S,T) P→C}

所以Teaching关系可以分解为以下两个BCNF关系模式:

Teacher(Teacher,Course)Student(Student,Teacher)

3NF的“不彻底”性,表现在可能存在主属性对码的部分依赖和传递依赖。

一个关系模式如果达到了BCNF,那么,在函数依赖范围内,它就已经实现了彻底的分离,消除了数据冗余、插入和删除异常。

4.4 多值依赖和第四范式

一、多值依赖(Multivalued Dependency)

例:学校中某一门课程由多个教员讲授,他们使用相同的一套参考书,每个教员可以讲授多门课程,每种参考书可以供多门课程使用。下列是用一个非规范化的表来表示教员T,

C和参考书B之间的关系。

把上表变换成一张规范化的二维表

Teaching,如右表

关系模式Teaching(C,T,B)的

码是(C,T,B),即All-Key。因而

Teaching∈BCNF。按照上述语义规定,

当某门课程增加一名讲课教员时,就要向

Teaching表中增加与相应参考书等数目

对数据的增、删、改很不方便,数据的

冗余也十分明显。如果仔细考察这类关系模式,会发现它具有一种称之为多值依赖的数据依赖关系。

定义:设R(U)是属性集U上的一个关系模式,X,Y,Z是U的子集,且Z=U-X-Y。如果对R(U)的任一关系r,给定一对(x,z)值,都有一组y值与之对应,这组y值仅仅决定于x值而与z值无关。则称Y多值依赖于X,或X多值决定Y,记作:X→→Y。――例如,在关系模式Teaching中,对于一个(C,B)值(物理,普通物理学),有一组T值{李勇,王军},而这组值仅仅决定于课程C上的值(物理)。即对于另一个(物理,

光学原理),它对应的T值仍然是{李勇,王军},所以T的值与B的值无关,仅决定于C 的值,即C→→T。

多值依赖的另一个等价的形式化定义为:

设关系模式R(U),X、Y、Z是U的子集,Z=U-X-Y,r是R的任意一个关系,t1、t2是r的任意两个元组。如果t1[X]=t2[X],并在r中存在两个元组t3、t4,使得:

t3[X]=t4[X]=t1[X]

t3[Y]=t1[Y],t3[Z]=t2[Z],

t4[Y]=t2[Y],t4[Z]=t1[Z]

成立,则X→→Y。

换句话说:如果X→→Y在R(U)中成立,则只要在R的任一关系r中存在两个元组t1、t2在X属性上的值相等,则交换这两个元组在Y(或Z)上的值后得到的两个新元组t3、t4也必是关系r中的元组。

定义中如果Z=Ф(空集),则称X→→Y为平凡的多值依赖,否则为非平凡的多值依赖。

多值依赖具有如下性质:

1.对称性:若X→→Y,则X→→Z,其中Z=U-X-Y

2.传递性:若X→→Y,Y→→Z,则X→→Z-Y

3.若X→→Y,X→→Z,则X→→YZ

4.若X→→Y,X→→Z,则X→→Y∩Z

5.若X→→Y,X→→Z,则X→→Y-Z,X→→Z-Y

多值依赖与函数依赖相比,具有下面两个基本区别:

(1)多值依赖的有效性与属性集的范围有关

若X→→Y在U上成立,则在V(XY?V?U)上一定成立;反之则不然,即X→→Y 在V(V?U)上成立,在U上并不一定成立。这是因为多值依赖的定义中不仅涉及属性组X、Y,而且涉及U中的其余属性Z(Z=U-X-Y)。

一般地说,在R(U)上若有X→→Y在V(V?U)上成立,则称X→→Y为R(U)的嵌入型多值依赖。

而在关系模式R(U)中函数依赖X→Y的有效性,仅决定于X和Y这两个属性集的值。只要在R(U)的任何一个关系r中,元组在X和Y上的值使得X→Y成立,则X→Y在任何属性集V(XY?V?U)上也成立。

(2)若函数依赖X→Y在R(U)上成立,则对于任何Y’ ?Y 均有X→Y’ 成立。而多值依赖X→→Y若在R(U)上成立,却不能断言对于任何Y’ ?Y有X→→Y’ 成立。

多值依赖的约束规则:在具有多值依赖的关系中,如果随便删去一个元组,就会破坏其对称性,那么,为了保持多值依赖关系中的“多值依赖”性,就必须删去另外的相关元组以

维持其对称性。这就是多值依赖的约束规则。目前的RDBMS 尚不具有维护这种约束的能力,需要程序员在编程中实现。

函数依赖可看成是多值依赖的特例,即函数依赖一定是多值依赖。而多值依赖则不一定就有函数依赖。

二、第四范式(4NF )

定义:如果关系模式R ∈1NF ,对于R 的每个非平凡的多值依赖X →→Y (Y X ),X 含有码,则称R 是第四范式,即R ∈4NF

关系模式R ∈4NF 时,R 中所有的非平凡多值依赖实际上就是函数依赖。因为每一个

决定因素中都含有码,所以R 一定属于BCNF 。

4NF 实际上就是限制关系模式的属性间不允许有非平凡,而且非函数依赖的多值依赖存在。反过来说,4NF 所允许的非平凡多值依赖实际上是函数依赖。

例题中的Teaching 关系属于BCNF ,但它不属于4NF 。因为它的码是(C ,T ,B ),关系中存在非平凡多值依赖C →→T ,C →→B ,但C 不包含码,而只是码的一部分。

要使Teaching 关系符合4NF ,必须将其分解为CT (C ,T )和CB (C ,B )两个关系模式。如右表:

从表中显而易见,符合BCNF 的关系Teaching 仍然存在着数据冗余,而分解后的关系CT 和CB 中只有平凡多值依赖,所以符合4NF ,它们已经消除了数据冗余。可以说:BCNF 是在

只有函数依赖的关系模式中,规范化程度最高的范式,而4NF 是在有多值依赖的关系模式中,规范化程度最高的范式。

如果关系模式中存在连接依赖,即便它符合4NF ,仍有可能遇到数据冗余及更新异常等问题。所以对于达到4NF 的关系模式,还需要消除其中可能存在的连接依赖,才可以进

一步达到5NF的关系模式。

关于连接依赖和5NF的内容,已超出了本课程教学大纲的要求,在此不再介绍。

4.5 关系的规范化程度

在关系数据库中,对关系模式的基本要求是满足第一范式。符合1NF的关系模式就是合法的,允许的。但是人们发现有些关系存在这样那样的问题,就提出了关系规范化的要求。

?关系规范化的目的,是解决关系模式中存在的数据冗余、插入和删除异常、更新繁琐等问题。

?关系规范化的基本思想是,消除数据依赖中不合适的部分,使各关系模式达到某种程度的分离,使一个关系只描述一个概念、一个实体或实体间的一种联。所以规范

化的实质就是概念单一化的过程。

?关系规范化的过程是通过对关系模式的分解来实现的。把低一级的关系模式分解为若干高一级的关系模式。

?规范化程度越高,分解就越细,所得关系的数据冗余就越小,更新异常也会越少。

?但是,规范化在减少关系的数据冗余和消除更新异常的同时,也加大了系统对数据检索的开销,降低了数据检索的效率。因为关系分得越细,数据检索时所涉及的关

系个数就越多,系统只有对所有这些关系的进行自然连接,才能获取所需的全部信

息。而连接操作所需的系统资源和开销是比较大的。所以不能说,规范化程度越高

的关系模式优良。

?规范化应满足的基本原则是:由低到高,逐步规范,权衡利弊,适可而止。通常以满足第三范式为基本要求。

?关系模式的分解是通过投影运算实现的。而这种投影分解的方案不是唯一的。所以

列三个条件:

?分解是无损连接分

解,分解后所得各

关系,通过连接要

能恢复出分解前的

数据。不能少也不

能多。

?分解所得的所有关

系都是高一级的范式的关系

?分解所得关系的个数要最少。

4.6 函数依赖公理与模式分解

在规范化理论中,模式分解以及分解是否等价是有一定算法的。函数依赖公理系统是模式分解算法的基础,它可以从已知的函数依赖推导出其它的函数依赖。

下面首先讨论函数依赖的一套推理规则,这套规则是由Armstrong于1974年提出来的,因此常被称为Armstrong公理系统。

一、函数依赖公理

Armstrong公理系统:

设有关系模式R(U,F),X,Y,Z,W?U,则对R(U,F)有:

?A1(自反律):若Y?X,则X→Y;(由自反律所得到的函数依赖均是平凡的函数依赖)

?A2(增广律):若X→Y,则XZ→YZ (YZ=Y∪Z)

?A3(传递律):若X→Y,Y→Z,则X→Z。

这些规则是保真的,它们不会产生错误的函数依赖。

引理1:Armstrong公理是正确的。即如果函数依赖F成立,则由F根据Armstrong 公理所推导的函数依赖总是成立的。(并且被称为F所蕴含的函数依赖)

证明:设t1,t2是关系R中的任意两个元组。

A1

A2

A3

定理1:Armstrong公理是正确的、完备的。

由Armstrong公理系统,可以得到以下三个推论:

?合成规则:若X→Y,X→Z,则X→YZ;

?分解规则:若X→YZ,则X→Y,X→Z;

?伪传递规则:若X→Y,YW→Z,则XW→Z。

根据合成规则和分解规则很容易得到这样的重要事实。称之为引理2:

引理2:X→A1 A2…A k成立的充分必要条件是X→A i成立(i=1,2,…,k)。

例:证明:对R(A,B,C,G,H,I),F={A→B,A→C,CG→H,CG→I,B →H},存在:A→H,CG→HI,AG→I

求证:(1)由于A→B,B→H,依传递律,可得A→H

(2)由于CG→H,CG→I,依合成规则,可得CG→HI

(3)由于A→C,CG→I,依伪传递律,可得AG→I。也可另证为:

由A→C,依增广律,得AG→CG,又CG→I,依传递律,得:AG→I

二、闭包及其计算

定义:R(U,F),由Armstrong公理从F推出的函数依赖X→A i中A i的属性集合,为X的属性闭包,记作:X+,读作X关于函数依赖集F的闭包。

也有的书上这样表示:X F+={A|X→A能由F根据Armstrong公理导出}

由引理2可以推出引理3:

设R(U,F),X,Y?U,则从F推导出X→Y的充要条件是Y?X+

如果要判断X→Y是否能由F根据Armstrong公理导出,只需求出X+,并判断Y是否为X+的子集即可。

那么,只要求出X+,一切问题就都解决了。书上有一个求X+的算法。其基本思想是:首先明确X+的含义是X所能函数决定的所有被决定因素的集合。然后,只要能证明某个属性或属性组函数依赖于X,便能确定它属于X+,因为X→X是无争的事实,所以X应属于X+,然后在F中寻找其决定因素包含于X的函数依赖,若存在,则它的被决定因素也应属于X+,(若Y→Z,则WY→WZ,从而可分解为WY→W和WY→Z)。依次类推,找出F中所有决定因素包含于所求出的中间集的所有函数依赖,并把它们的被决定因素都并到该闭包的中间集中。直到在F中再也找不到符合上述条件的函数依赖时。所求的闭包集就是最终的闭包。

下面通过一个例子来说明。

例:R(U,F),其中U={A,B,C,D,E,I},F={A→D,AB→C,BI→C,ED→I,C→E},求(AC)+

解:(1)令X={AC},则X(0)=AC;

(2)在F中找出左边是AC子集的函数依赖:A→D,C→E;

(3)X(1)=X(0)∪D∪E=ACDE;

(4)很明显X(1)≠X(0);

(5)在F中找左边是ACDE子集的函数依赖:ED→I;

(6)X(2)=X(1)∪I =ACDEI ;

(7)虽然X(2)≠X(1),但是F中未用过的函数依赖的左边属性已没有X(2)的子集,所以停止计算,输出(AC)+=X(2)=ACDEI。

三、函数依赖的覆盖

函数依赖集的闭包:关系模式R(U,F)中为F所逻辑蕴含的函数依赖的全体叫做F

的闭包,记为F+。

函数依赖的覆盖:设F和G是关系模式R(U)上的两个函数依赖集,如果F+=G+,则称F和G是等价的,记作F≡G。也可以说F覆盖G,或G覆盖F,或F、G相互覆盖。

两个引理:(1)F≡G的充分必要条件是F?G+、G?F+

(2)任一函数依赖集,总可以为一右边全是单属性的函数依赖集所覆盖。

对上述引理(1)是显而易见的。引理(2)可以这样理解,根据函数依赖的分解规则,任一个右部为属性组的函数依赖都可以分解为右部为单属性的若干个函数依赖。所以,对于任一个函数依赖集,总可以找到一个右边全是单属性的函数依赖集覆盖它。

定义:如果函数依赖集F满足下列条件,则称F为一个极小函数依赖集,或称最小依赖集或最小覆盖。

?F中任一函数依赖的右部都是单属性;

?F中任一函数依赖X→A,都不会使F与F-{X→A}等价。

?F中任一函数依赖X→A,X的任一真子集Z,不会使F-{X→A}∪{Z→A}与F等价。

上述第二个条件保证了F中不存在多余的函数依赖,第三个条件保证了F中每个函数依赖左部没有多余的属性。要注意上列条件三中的下划线部分,并注意Z→A不是一个函数依赖,而是指Z?X的一组Z→A。并且F-{X→A}∪{Z→A}是不确切的。

定理:任一函数依赖集F均等价于一个极小的函数依赖集F m。

最小的依赖集可以上述定义为基本思想所确定的算法求解。

四、关系模式的分解

关系模式经分解后,应与原来的关系模式等价。即两者对数据的使用者来说应是等价的。即对分解前后的关系,做相同内容的查询,应产生相同的结果。这是对模式分解的基本要求。

历年来,人们对等价的概念形成了三种不同的定义:

?分解具有“无损连接性”(Lossless join);

?分解具有“函数依赖保持性”(Preserve dependency);

?分解既要具有“无损连接性”,又要具有“函数依赖保持性”

下面分别介绍无损连接性和函数依赖保持性两个概念的含义及其判定算法。

1、无损连接性:

对关系模式分解时,原关系模式下任一合法的关系实例,在分解之后,应能通过自然连接运算恢复起来。所以无损连接性有时也称为无损分解。

(下列定义按照课时的情况选择讲解或不讲)

定义:设ρ={R1,R2,…,Rk}是关系模式R(U,F)的一个分解,如果对于R 的任一满足F的关系r,都有r=∏R1(r)?∏R2(r)?…?∏Rk(r),则称分解ρ是满足函数依赖集F的无损连接分解或无损分解。

关于无损连接性的判断算法很巧妙,也很容易理解,在课堂上不讲,但有可能出现此类考题,请同学们自己看书学习。

(有时间时可以讲书上例子P114下部例6.6)

2、函依赖保持性:

函数依赖集的投影:设有关系模式R(U,F),Z?U,则Z所涉及到的F中所有函数依赖为F在Z上的投影,记为∏Z(F),有∏Z(F)={X→Y|(X→Y)∈F+且XY?Z}函数依赖保持性:设R(U,F)的一个分解ρ={R1,R2,…,Rk},如果F等价于

∏R1(F)∪∏R2(F)∪…∪∏Rk(F)

则称分解ρ具有函数依赖保持性。

一个无损连接的分解不一定具有函数依赖保持性;同样地,一个具有函数依赖保持性的分解也不一定具无损连接性。

检验一个分解是否具有依赖保持性,实际上是检验∏R1(F)∪∏R2(F)∪…∪∏Rk (F)是否覆盖F。

(书上关于它的算法令人费解。可以不讲)

介绍P114页例6.6是一个具有依赖保持性的分解。

在实际数据库设计中,关系模式的分解主要有两种准则:

(1)只满足无损连接性;

(2)既满足无损连接性,又满足函数依赖保持性。

准则(2)比(1)更理想,但分解时受到更多的限制。如果一个分解,只满足函数依赖保持性,而不满足无损连接性,是没有实用价值的。所以无损连接性是模式分解必须满足的条件。

教师语言文字规范化基本功培训资料:语言文字知识问答题目演示课件.docx

教师语言文字规范化基本功培训资料:语言文字知识问答题目 语言文字知识问答题目 (一)问答题 1.《中华人民共和国国家通用语言文字法》由哪位国家领导人签发公布? 2.《国家通用语言文字法》哪年哪月哪日起施行? 3.请说出2000年10月31日第九届全国人民代表大会常务委员会第十八次会议通过的一部关于语言文字的法律的全称。 4.国家普通话水平分几级几等? 5.国家机关工作人员普通话水平应达到几级几等以上? 6.国家机关工作人员普通话水平应不能低于多少分? 7.教育部、国家语委规定各级各类学校和幼儿园以及其他教育机构的教师的普通话水平应不低于几级几等?其中语文教师和对外汉语教师不低于几级几等?语音教师不低于几级几等? 8.自治区语言文字工作委员会是哪年哪月哪日成立的? 9.现任国家语委主任是谁? 10.现任自治区语委主任是谁? 11.《国家通用语言文字法》规定国家机关的公务用语用字是什么语言文字?“下班铃响了,商量工作的会议可以用方言了”对吗? 12.《国家通用语言文字法》中规定,国家通用语言文字的使用应当做到哪“三个有利于”? 13.我国多部法律都规定推广普通话,请说出其中3部法律。 14.1992年以后我国推广普通话工作的12字方针是什么? 15.推广普通话的4个重点领域是什么? 16.我国哪一部法律写明“国家推广全国通用的普通话”? 17.我国哪部法律写明“国家推广普通话,推行规范汉字”? 18.中共中央印发的什么重要文件(注:什么“纲要”)中写明“正确使用祖国的语言文字,大力推广普通话”? 19.普通话测试等级证书由哪一级语言文字工作办事机构颁发? 20.国务院规定每年9月第三周定为全国推广普通话宣传周。今年的全国推普周是第几届? 21.《国家通用语言文字法》中规定有4种情形可以保留或者使用繁体字、异体字,请说出其中两种情形。 22.《国家通用语言文字法》中规定有6种情形可以使用方言,请说出其中两种情形。 23.对外汉语教学应当教授什么语言文字? 24.《国家通用语言文字法》规定以普通话作为工作语言的5种人员的普通话水平应当分别达到国家规定的等级标准。请说出这5种人员的名称。 26.“国家通用语言文字”指的是什么语言、什么文字? 27.国家通用语言文字以什么“方案”作为拼写和注音工具? 28.为查明当地贩毒团伙藏毒窝点,某公安局侦察员以当地吸毒者的身份与贩毒团伙打交道。在与贩毒分子联系时,侦察员说的是贩毒团伙习惯说的当地方言,请问:这位侦察员的用语违反了《国家通用语言文字法》的规定吗?请找出法律依据。 29.因为这次“中国—东盟博览会”有港、澳、台的人士来参加,所以会标、文字材料、名片可以用繁体字,这种说法对吗? 30.全国人大常委会通过《国家通用语言文字法》的日期和国家主席签发公布的日期是同一天吗? 31.推广普通话就是在任何场合都要说普通话,对吗? 32.国务院规定的每年9月份开展一项全国性的推广普通话的宣传活动,请问,这项活动的名称

数据库规范化理论习题

规范化理论习题1. 解释下列名词: 函数依赖、部分函数依赖、完全函数依赖、传递函数依赖、候选关键字、主关键字、全关键字、1NF、2NF、3NF、BCNF、多值依赖、4NF、连接依赖、5NF、最小函数依赖集、无损分解 函数依赖:FD(function dependency),设有关系模式R(U),X,Y是U的子集, r是R的任一具体关系,如果对r的任意两个元组t1,t2,由t1[X]=t2[X]导致t1[Y]=t2[Y], 则称X函数决定Y,或Y函数依赖于X,记为X→Y。X→Y为模式R的一个函数依赖。 部分函数依赖:即局部依赖,对于一个函数依赖W→A,如果存在X W(X包含于W)有X→A成立,那么称W→A是局部依赖,否则称W→A为完全依赖。 完全函数依赖:见上。 传递函数依赖:在关系模式中,如果Y→X,X→A,且X Y(X不决定Y), A X(A不属于X),那么称Y→A是传递依赖。 候 选关键字:设K 为关主关键字:若关系模式R有多个候选码,则选定其中一个作为主关键字 (Primary Key),有时也称作为主码。 全关键字:若关系模式R整个属性组都是码,称为全关键字(All Key)或全码。 1NF:第一范式。如果关系模式R的所有属性的值域中每一个值都是不可再分解的值, 则称R是属于第一范式模式。如果某个数据库模式都是第一范式的,则称该数据库存模式属于第一范式的数据库模式。第一范式的模式要求属性值不可

再分裂成更小部分,即属性项不能是属性组合和组属性组成。 2NF:第二范式。如果关系模式R为第一范式,并且R中每一个非主属性完全函数依赖于R的某个候选键,则称是第二范式模式;如果某个数据库模式中每个关系模式都是第二范式的,则称该数据库模式属于第二范式的数据库模式。 (注:如果A是关系模式R的候选键的一个属性,则称A是R的主属性,否则称A是R 的非主属性。) 。 3NF:第三范式。如果关系模式R是第二范式,且每个非主属性都不传递依赖于R的候选键,则称R是第三范式的模式。如果某个数据库模式中的每个关系模式都是第三范式,则称为3NF的数据库模式。 BCNF:BC范式。如果关系模式R是第一范式,且每个属性都不传递依赖于R 的候选键,那么称R是BCNF的模式。 多值依赖:设R(U)是属性集U上的一个关系模式,X,Y,Z是U的子集,并且Z=U-X-Y, 用x,y,z分别代表属性集X,Y,Z的值,只要r是R的关系,r中存在元组(x,y1,z1)和(x,y2,z2)时,就也存在元组(x,y1,z2)和(x,y2,z1),那么称多值依赖(MultiValued Dependency MVD) X→→Y在关系模式R中成立。 4NF:第四范式。设R是一个关系模式,D是R上的多值依赖集合。如果D中成立非平凡多值依赖X→→Y时, X必是R的超键,那么称R是第四范式的模式。 连接依赖:关系模式R(U)中,U是全体属性集,X,Y,…,Z是U的子集,当且仅当R是由其在X,Y,…,Z上投影的自然连接组成时,称R满足对X,Y,…,Z的连接依赖。记为JD(X,Y,…,Z)。 5NF:关于模式R中,当且仅当R中每个连接依赖均为R的候选码所蕴涵时,称R属于5NF。

数据库设计理论

数据库的设计理论 第一节,关系模式的设计问题 一概念: 1. 关系模型:用二维表来表示实体集,用外键来表示实体间的联系,这样的数据模型,叫做关系数据模型。 关系模型包含内涵和外延两个方面: 外延:就是关系或实例、或当前值。它与时间有关,随时间的变化而变化。(主要是由于元组的插入、删除、修改等操作引起的) 内涵:内涵是与时间独立的,它包括关系属性、以及域的一些定义和说明。还有数据的各种完整性约束。 数据的完整性约束分为静态约束和动态约束。 静态约束包括数据之间的联系(称为数据依赖),主键的设计和各种限制。 动态约束主要定义如插入、删除和修改等操作的影响。 通常我们称内涵为关系模式。 2. 关系模式:是对一个关系的描述,二维表的表头那一行称为关系模式,又称为表的框架或记录类型。 关系模式的定义包括:模式名、属性名、值域名和模式的主键。关系模式仅仅是对数据特征的描述。 关系模式的一般形式为R ( U , D , DOM , F ) R 是关系名。 U 是全部属性的集合。 D 是属性域的集合。 DOM 是U 和D 之间的映射关系,关系运算的安全限制。 F 是属性间的各种约束关系,也称为数据依赖。

关系模式可以表示为: 关系模式(属性名1,属性名2 ,……,属性名n ) 示例:学生(学号,姓名,年龄,性别,籍贯)。 当且仅当U 上的一个关系r 满足 F 时,r 就称为关系模式R(U,F)上的一个关系,R是关系的型,r 是关系的值,每个值称为R 的一个关系。 关系数据库模式: 一个数据库是由多个关系构成的。 一个关系数据库对应多个不同的关系模式,关系数据库模式是一个数据库中所有的关系模式的集合。它规定了数据库的全局逻辑结构。 关系数据库模式可以表示为: S = { Ri < Ui , Di , DOM , Fi > | i = 1,2,…, n } 3. 关系子模式 关系子模式是用户所用到的那部分数据的描述。 外模式是关系子模式的集合。 4. 存储模式 存储模式及内模式。 关系数据库理论的主要内容: (1)数据依赖。数据依赖起着核心的作用。 (2)范式。 (3)模式的设计方法。 如何设计一个合理的数据库模式: (1)与实际问题相结合。 泛关系模式:把现实问题的所有属性组成一个关系模式 泛关系:泛关系模式的实例称为泛关系。 泛关系模式中存在的问题: a 数据冗余 b 更新异常, c 插入异常 d 删除异常。

第7章关系数据库规范化理论复习题

第7章关系规范化理论 一、单项选择题 1.关系规范化中的删除操作异常是指①,插入操作异常是指②。 A.不该删除的数据被删除 B.不该插入的数据被插入 C.应该删除的数据未被删除 D.应该插入的数据未被插入 答案:①A ②D 2.设计性能较优的关系模式称为规范化,规范化主要的理论依据是。 A.关系规范化理论 B.关系运算理论 C.关系代数理论 D.数理逻辑 答案:A 3.规范化理论是关系数据库进行逻辑设计的理论依据。根据这个理论,关系数据库中的关系必须满足:其每一属性都是。 A.互不相关的 B.不可分解的 C.长度可变的 D.互相关联的 答案:B 4.关系数据库规范化是为解决关系数据库中问题而引入的。 A.插入、删除和数据冗余 B.提高查询速度 C.减少数据操作的复杂性 D.保证数据的安全性和完整性 答案:A 5.规范化过程主要为克服数据库逻辑结构中的插入异常,删除异常以及的缺陷。 A.数据的不一致性 B.结构不合理 C.冗余度大 D.数据丢失 答案:C 6.当关系模式R(A,B)已属于3NF,下列说法中是正确的。 A.它一定消除了插入和删除异常 B.仍存在一定的插入和删除异常 C.一定属于BCNF D.A和C都是 答案:B 7. 关系模式1NF是指_________。 A. 不存在传递依赖现象 B. 不存在部分依赖现象

C.不存在非主属性 D. 不存在组合属性 答案:D 8. 关系模式中2NF是指_______。 A.满足1NF且不存在非主属性对关键字的传递依赖现象 B.满足1NF且不存在非主属性对关键字部分依赖现象 C.满足1NF且不存在非主属性 D.满足1NF且不存在组合属性 答案:B 9. 关系模式中3NF是指___________。 A.满足2NF且不存在非主属性对关键字的传递依赖现象 B.满足2NF且不存在非主属性对关键字部分依赖现象 C.满足2NF且不存在非主属性 D.满足2NF且不存在组合属性 答案:A 10.关系模型中的关系模式至少是。 A.1NF B.2NF C.3NF D.BCNF 答案:A 11.关系模式中,满足2NF的模式,。 A.可能是1NF B.必定是1NF C.必定是3NF D.必定是BCNF 答案:B 12.X→Y为平凡函数依赖是指__________。 A.X

语言文字规范知识手册范本

语言文字规知识手册 1.推普周简介 为了推进国家通用语言文字的规和普及,经国务院批准,从1998年起,每年9月份第三周为“全国推广普通话宣传周”。通过开展推普周活动,在全国围大力宣传国家语言文字方针政策及《国家通用语言文字法》,大力推广和普及普通话,积极推行规汉字,在全社会营造“说普通话,写规字,做文明人”的良好氛围。 2.为什么要开展“全国推广普通话宣传周”活动? 我国是多民族、多方言的国家。共同语的普及程度是国家和民族文明程度的一个重要标志。新中国成立以来,推广普通话工作已开展40多年并取得很大成绩,但全社会普及普通话的目标尚未实现,还不能适应改革开放和社会主义现代化建设对于普及民族共同语的客观需要。因此,大力推行、积极普及全国通用的普通话,既是当前经济文化建设和社会发展的迫切需求,也是各族人民的热切愿望,是符合全国人民根本利益的。开展“全国推广普通话宣传周”活动对提高广大干部、群众的推普参与意识和语言文字规意识,进一步推动推广普通话工作和整个语言文字工作向纵深发展,具有重要意义。 3.“全国推广普通话宣传周活动”的宗旨是什么? “全国推广普通话宣传周”活动的宗旨是:以党的十六大精神为指导,通过多种形式的宣传活动,向全社会广泛宣传大力推广普通话对于社会主义现代化建设的必要性、迫切性,进一步提高广大干部群众的语言规意识和“推普”参与意识,在全社会形成说普通话的风气,推动推广普通话工作向纵深发展。 4.国家如何开展推普周活动? 国家专门成立了“全国推广普通话宣传周活动领导小组”(由教育部、国家语委牵头,办公室设在教育部),统一部署和指导全国推普周活动。按照惯例,除了在全国围组织开展推普周宣传活动外,

关系数据库规范化理论常见试题及答案

关系数据库规范化理论常见试题及答案 1.关系规范化中的操作异常有哪些?它是由什么引起的?解决的办法是什么? 答:关系规范化中的操作异常有插入异常、更新异常和删除异常,这些异常是由于关系中存在不好的函数依赖关系引起的。消除不良函数依赖的办法是进行模式分解,即将一个关系模式分解为多个关系模式。 2.第一范式、第二范式和第三范式的关系的定义是什么? 答:不包含非原子项属性的关系就是第一范式的关系;对于第一范式的关系,如果此关系中的每个非主属性都完全函数依赖于主键,则此关系属于第二范式;对于第二范式的关系,如果所有的非主属性都不传递依赖于主键,则此关系就是第三范式的。 3.什么是部分依赖?什么是传递依赖?请举例说明。 答:部分依赖关系是指某个属性只由构成主键的部分列决定,而和另一些列无关。例如对关系:学生选课(学号,姓名,课程号,成绩),此关系的主键是(学号,课程号),而“姓名”列只由“学号”决定,与“课程号”无关,这就是部分依赖关系。 传递依赖指的是某个非主键属性是由另一个非主键属性决定的,而这个非主键属性再由主键决定。例如对关系:学生(学号、姓名、所在系,系主任),此关系的主键为(学号),而“系主任”由“所在系”决定,“所在系”又由“学号”决定,因此“系主任” 对“学号”是传递依赖关系。 4.第三范式的表是否一定不包含部分依赖关系? 答:是的。 5.对于主键只由一个属性组成的关系,如果它是第一范式关系,则它是否一定也是第二范式关系?答:是的。因为如果一个关系的主键只由一个属性组成,则此关系中一定不会存在部分依赖关系。 6.设有关系模式:学生修课管理(学号,姓名,所在系,性别,课程号,课程名,学分,成绩)。设一名学生可以选修多门课程,一门课程可以被多名学生选修。一名学生有唯一的所在系,每门课程有唯一的课程名和学分。请指出此关系模式的候选键,判断此关系模式是第几范式的;若不是第三范式的,请将其规范化为第三范式关系模式,并指出分解后的每个关系模式的主键和外键。 答:候选键为:(学号,课程号),它也是此关系模式的主键。由于存在函数依赖:学号→姓名,课程号→课程名 因此,存在非主属性对主键的部分函数依赖关系,因此它不是第二范式的表。分解如下:学生表(学号,姓名,所在系,性别),主键为“学号”,已属于第三范式。 课程表(课程号,课程名,学分),主键为“课程号”,已属于第三范式。 选课表(学号,课程号,成绩),主键为(学号,课程号),已属于第三范式 7.设有关系模式:学生表(学号,姓名,所在系,班号,班主任,系主任),其语义为:一名学生只在一个系的一个班学习,一个系只有一名系主任,一个班只有一名班主任,一个系可以有多个班。请指出此关系模式的候选键,判断此关系模式是第几范式的;若不是第三范式的,请将其规范化为第三范式关系模式,并指出分解后的每个关系模式的主键和外键。

《数据库原理》知识点总结

《数据库原理》知识点总结标准化文件发布号:(9312-EUATWW-MWUB-WUNN-INNUL-DQQTY-

目录未找到目录项。 一数据库基础知识(第1、2章) 一、有关概念 1.数据 2.数据库(DB) 3.数据库管理系统(DBMS) Access 桌面DBMS VFP SQL Server Oracle 客户机/服务器型DBMS MySQL DB2 4.数据库系统(DBS) 数据库(DB) 数据库管理系统(DBMS) 开发工具 应用系统 二、数据管理技术的发展 1.数据管理的三个阶段 概念模型 一、模型的三个世界 1.现实世界

2.信息世界:即根据需求分析画概念模型(即E-R图),E-R图与DBMS 无关。 3.机器世界:将E-R图转换为某一种数据模型,数据模型与DBMS相关。 注意:信息世界又称概念模型,机器世界又称数据模型 二、实体及属性 1.实体:客观存在并可相互区别的事物。 2.属性: 3.关键词(码、key):能唯一标识每个实体又不含多余属性的属性组合。 一个表的码可以有多个,但主码只能有一个。 例:借书表(学号,姓名,书号,书名,作者,定价,借期,还期) 规定:学生一次可以借多本书,同一种书只能借一本,但可以多次续借。 4.实体型:即二维表的结构 例 student(no,name,sex,age,dept) 5.实体集:即整个二维表 三、实体间的联系: 1.两实体集间实体之间的联系 1:1联系 1:n联系 m:n联系 2.同一实体集内实体之间的联系 1:1联系 1:n联系 m:n联系 四、概念模型(常用E-R图表示) 属性: 联系: 说明:① E-R图作为用户与开发人员的中间语言。 ② E-R图可以等价转换为层次、网状、关系模型。 举例: 学校有若干个系,每个系有若干班级和教研室,每个教研室有若干教员,其中有的教授 和副教授每人各带若干研究生。每个班有若干学生,每个学生选修若干课程,每门课程有若干学生选修。用E-R图画出概念模型。

语言文字规范化知识讲座资料

语言文字规范化知识讲座资料 合肥大地学校七年级语文组 关于“儿化” 一、在普通话里,韵母er除了自成音节外,还可以跟其它音节融合在一起,并使这个音节的韵母卷舌,带上卷舌色彩,这种语音现象叫“儿化”。 二、儿化的读法 ★儿化韵怎么读,取决于“儿”字前一个音节。 1. 前一个音节尾音为ɑo e u时,原韵母不变,直接加卷舌。 例:花儿(huār) 雪末儿(mòr) 挨个儿(ɡèr) 拈阄儿(jiūr) 2. 前一个音节尾音为i n时,丢i或n,加卷舌。 例:小孩儿(hár) 一会儿(hùr) 聊天儿(tiār) 3. 前一个音节整个韵母是i、ü的,原韵母不变,直接加卷舌。 例:玩意儿(yìr) 针鼻儿(bír) 小曲儿(qǔr) 4. 前一个音节尾音是nɡ的,丢nɡ,加卷舌,同时元音鼻化。 例:帮忙儿(már) 打鸣儿(mír) 板凳儿(dèr) 5. 前一个音节是zi、ci、si、zhi、chi、shi、ri ,丢-i,加er。(与er相拼) 例:写字儿(zèr) 词儿(cér) 没事儿(shèr) 三、要注意的问题:慢慢地(读原音)慢慢儿地(将第二个音节读成阴平) 四、趣味练习 1. 进了门儿,倒杯水儿,喝了两口运运气儿,顺手拿起小唱本儿,唱一曲儿又一曲儿,练完了嗓子,我练嘴皮儿。 2. 逛早市儿,真有趣儿。小摊儿一份儿挨一份儿。蔬菜水果儿和桑椹儿,螃蟹小鱼儿和虾米儿,土豆白薯花生粒儿,花椒大料和粉皮儿。鸭蛋松花和鸡子儿,黄瓜顶花儿又带刺儿,还有萝卜白菜窝笋叶儿。针头线脑儿和顶针儿,笤帚簸箕洗脸盆儿,拖鞋袜子成双对儿,包子油条冒热气儿。各种吆喝各种味儿,南腔北调儿真来劲儿。 关于轻声 一、轻声是指在一连串音节组成的词语或句子里,某一些音节失去其原有的调值,读得又轻又短。 二、轻声的读法 ★轻声怎么读,决定于前一个音节的声调。 1. 前面的音节是阴平、阳平、去声时,后面的轻声音节读成短促的低降调,调值为【31】 例:阴平+轻声:休息庄稼哥哥师傅姑娘

关系数据库理论

第4部分关系数据库理论 复习习题与讲解资料 【主讲教师:钱哨】 一.考试大纲考点要求 1 了解关系模式设计中可能出现的问题及其产生原因以及解决的途径。 2 掌握函数依赖、完全函数依赖、部分函数依赖、传递函数依赖的定义,能计算属性的封闭集,并由此得到关系的候选键。 3 掌握第一范式( 1NF )、第二范式( 2NF )和第三范式( 3NF )的定义,能判别关系模式的范式等级。 4 掌握关系模式的分解(规范到 3NF )的步骤、分解的原则和分解的方法。 二.单项选择题 1. 为了设计出性能较优的关系模式,必须进行规范化,规范化主要的理论依据是()。 A. 关系规范化理论 B. 关系代数理论 C.数理逻辑 D. 关系运算理论 2. 规范化理论是关系数据库进行逻辑设计的理论依据,根据这个理论,关系数据库中的关系必须满足:每一个属性都是()。 A. 长度不变的 B. 不可分解的 C.互相关联的 D. 互不相关的 3. 已知关系模式R(A,B,C,D,E)及其上的函数相关性集合F={A→D,B→C ,E→ A },该关系模式的候选关键字是()。 A.AB B. BE C.CD D. DE

4. 设学生关系S(SNO,SNAME,SSEX,SAGE,SDPART)的主键为SNO,学生选课关系SC(SNO,CNO,SCORE)的主键为SNO和CNO,则关系R(SNO,CNO,SSEX,SAGE,SDPART,SCORE)的主键为SNO和CNO,其满足()。 A. 1NF B.2NF C. 3NF D. BCNF 5. 设有关系模式W(C,P,S,G,T,R),其中各属性的含义是:C表示课程,P表示教师,S表示学生,G表示成绩,T表示时间,R表示教室,根据语义有如下数据依赖集:D={ C →P,(S,C)→G,(T,R)→C,(T,P)→R,(T,S)→R },关系模式W的一个关键字是()。 A. (S,C) B. (T,R) C. (T,P) D. (T,S) 6. 关系模式中,满足2NF的模式()。 A. 可能是1NF B. 必定是1NF C. 必定是3NF D. 必定是BCNF 7. 关系模式R中的属性全是主属性,则R的最高范式必定是()。 A. 1NF B. 2NF C. 3NF D. BCNF 8. 消除了部分函数依赖的1NF的关系模式,必定是()。 A. 1NF B. 2NF C. 3NF D. BCNF 9. 如果A->B ,那么属性A和属性B的联系是()。 A. 一对多 B. 多对一 C.多对多 D. 以上都不是 10. 关系模式的候选关键字可以有1个或多个,而主关键字有()。 A. 多个 B. 0个 C. 1个 D. 1个或多个 11. 候选关键字的属性可以有()。 A. 多个 B. 0个 C. 1个 D. 1个或多个 12. 关系模式的任何属性()。 A. 不可再分 B. 可以再分 C. 命名在关系模式上可以不唯一 D. 以上都不是 13. 设有关系模式W(C,P,S,G,T,R),其中各属性的含义是:C表示课程,P表示教师,S表示学生,G表示成绩,T表示时间,R表示教室,根据语义有如下数据依赖集:D={ C →P,(S,C)→G,(T,R)→C,(T,P)→R,(T,S)→R },若将关系模式W分解为三个关系模式W1(C,P),W2(S,C,G),W2(S,T,R,C),则W1的规范化程序最

第4章+关系数据库设计理论答案

第4章关系数据库设计理论 选择题答案: (1) A (2) B (3) B (4) A (5) D (6) B (7) C (8) B (9) B (10) C (11) D (12) A (13) D (14) D (15) B (16) B (17) D (20) C (21) C (23) A (26) B (27) B (28) B (29) B (30) B (31) D (33) B B D 一、选择题: 1. 为了设计出性能较优的关系模式,必须进行规范化,规范化主要的理论依据是()。 A. 关系规范化理论 B. 关系代数理论C.数理逻辑 D. 关系运算理论 2. 规范化理论是关系数据库进行逻辑设计的理论依据,根据这个理论,关系数据库中的关系必须满足:每一个属性都是()。 A. 长度不变的 B. 不可分解的 C.互相关联的 D. 互不相关的 3. 已知关系模式R(A,B,C,D,E)及其上的函数相关性集合F={A→D,B→C ,E→A },该关系模式的候选关键字是()。 A.AB B. BE C.CD D. DE 4. 设学生关系S(SNO,SNAME,SSEX,SAGE,SDPART)的主键为SNO,学生选课关系SC(SNO,CNO,SCORE)的主键为SNO和CNO, 则关系R(SNO,CNO,SSEX,SAGE,SDPART,SCORE)的主键为SNO和CNO,其满足()。 A. 1NF B.2NF C. 3NF D. BCNF 5. 设有关系模式W(C,P,S,G,T,R),其中各属性的含义是:C表示课程,P表示教师,S表示学生,G表示成绩,T表示时间,R表示教室,根据语义有如下数据依赖集:D={ C→P,(S,C)→G,(T,R)→C,(T,P)→R,(T,S)→R },关系模式W的一个关键字是()。 A. (S,C) B. (T,R) C. (T,P) D. (T,S) 6. 关系模式中,满足2NF的模式()。 A. 可能是1NF B. 必定是1NF C. 必定是3NF D. 必定是BCNF 7. 关系模式R中的属性全是主属性,则R的最高范式必定是()。 A. 1NF B. 2NF C. 3NF D. BCNF 8. 消除了部分函数依赖的1NF的关系模式,必定是()。 A. 1NF B. 2NF C. 3NF D. BCNF 9. 如果A->B ,那么属性A和属性B的联系是()。 A. 一对多 B. 多对一C.多对多 D. 以上都不是 10. 关系模式的候选关键字可以有1个或多个,而主关键字有()。 A. 多个 B. 0个 C. 1个 D. 1个或多个 11. 候选关键字的属性可以有()。 A. 多个 B. 0个 C. 1个 D. 1个或多个 12. 关系模式的任何属性()。 A. 不可再分 B. 可以再分 C. 命名在关系模式上可以不唯一 D. 以上都不是 13. 设有关系模式W(C,P,S,G,T,R),其中各属性的含义是:C表示课程,P表示教师,S表示学生,G表示成绩,T表示时间,R表示教室,根据语义有如下数据依赖集:D={ C→P,(S,C)→G,(T,R)→C,(T,P)→R,(T,S)→R },若将关系模式W分解为三个关系

语言文字规范化知识测试试题小学生组

语言文字规范化知识竞赛试题(教师组) 学校:姓名:成绩: 单项选择题 2% 1、2000年10月31日,第九届全国人大常委会第十次会议通过的我国语言文字法的正式名称是()。 A《中华人民共和国国家通用语言文字法》 B《国家语言文字 法》 C《中华人民共和国国家通用语言文字法》 2、我国国家通用语言文字是()。 A汉语和汉字 B普通话和规范汉字 C汉语和通用汉字 3、我国公民有学习和使用国家通用语言文字的()。 A责任 B义务 C权利 4、我国国家通用语言文字的规范和标准是由()颁布的。 A语言学家 B学术机构 C国家 5、学校及其他教育机构以普通话和规范汉字为()。法律另有规定的除外。 A基本的教育教学用语用字 B所有的教育教学用语用字 C生活学习的用语用字 6、国家机关以()为公务用语用字。法律另有规定的除外。 7、公共服务行业以()为基本的服务用字。 A常用汉字 B繁体字 C规范汉字 8、提倡公共服务行业以()为服务用语。 A普通话 B普通话和当地方言 C当地方言 9、我国国家通用语言文字以()作为拼写和注音工具。 A注音字母 B《汉语拼音方案》 C国际音标 10、国家当前推广普通话的方针是()。 A大力提倡,重点普及,逐步提高 B大力推行,重点普及,逐步提高C 大力推行,积极普及,逐步提高 11、《中华人民共和国宪法》第十九条有关语言使用的规定是( )。 A国家推广全国通用的普通话 B推广现代汉语 C推广普通话 12、国务院批准,从1998年起每年9月份的第3周是( )。 A宣传普通话周 B全国推广普通话化宣传周 C宣传普通话、简化字周 13、推广普通话是促使公民普遍具备普通话应用能力,()。 A在任何场合都说普通话,不说方言 B在正式场合和公共交际场合说普通话 C只在学校里说普通话 14、普通话以北京语音为标准音,以北方话为基础方言,以( )为语法规范。

《数据库原理》1-2章作业(答案)

《数据库原理》知识点 第一章 1、什么是4D(Data, DB、DBMS、DBS),它们之间的关系? 答: 所谓4D是分别指:数据(Data)、数据库(DB或DataBase)、数据库管理系统(DBMS)、数据库系统(DBS)。其中: 数据(Data): 数据库(DB或DataBase): 数据库管理系统(DBMS): 数据库系统(DBS): 当开发一个数据库系统(DBS)时,通常需要借助数据库管理系统(DBMS)来完成建立数据库(DB)、对数据库中数据(Data)进行操作等功能。 2、数据模型的组成要素有哪些? 答:包括: 数据结构:描述数据库的组成对象以及对象之间的联系。 数据操作:指对数据库中各种对象的实例允许执行的操作集合。 数据的完整性约束条件:是指给定的数据模型中数据及其联系所具有的制约和依存规则。 3、ER模型的组成要素有哪些? 答: 实体型、属性和联系所组成。 实体型: 属性: 联系: 4、学校中有若干系,每个系有若干班级和教研室,每个教研室有若干教师,其中有的教授和副教授每人各带若干研究生,每个班有若干学生,每个学生选修若干课程,每门课程可由若干学生选修。请用E-R图画出此学校的概念模型。 答:

5、某工厂生产若干产品,每种产品由不同的零件组成,有的零件可用在不同的产品上。这些零件由不同的原材料制成,不同零件所用的材料可以相同。这些零件按照所属的不同产品分别放在仓库中,原材料按照类别放在若干仓库中。请用E-R图画出此工厂产品、零件、材料、仓库的概念模型。

6、试述数据库系统三级模式结构,这种结构的优点是什么? 答: 数据库系统的三级模式结构由外模式、模式、内模式组成。 外模式: 模式: 内模式: 数据库系统的三级模式是针对数据的3个抽象级别,其优点是:它把数据的具体组织留给DBMS管理,使用户能抽象地处理数据,而不必关心数据在计算机中的具体表示和存储方式。 为了能够在内部实现这3个抽象层次之间的联系和转换,数据库系统在三级模式之间提供了二层映像:外模式/模式映像、模式/内模式映像,通过二层映像保证了数据库系统中数据能够具有较高的逻辑独立性和物理独立性。 7、叙述DBS的组成,其中的主要软件是什么?主要人员是谁? 答: DBS一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员和用户组成。 主要软件包括:数据库管理系统。 主要人员:数据库管理员。 第二章 1、叙述关系模型的三类完整性,并举例说明。 答:

语言文字规范化知识讲座

语言文字规范化知识讲座 ——语言文字规范化的历史 文字是记录语言的最重要的辅助性交际工语言是人类最重要的交际工具, 具。二者对于维护国家统一,促进内外交流,增强民族团结,建设精神文明,都必然重因此,都具有极为重要的作用。古今中外任何一个独立自主的国家,有明确记中国历史上的语言文字规范化工作发端极早,视语言文字的规范化。绵延三千多年而不绝。载的历史从西周开始,一直到当代,1046 ——1911 年)(公元前一、中国古代的语言文字规范化年即主要集中在语音和文字两个方中国古代的语言文字规范化有一个特点,西周语言以雅言为共面,后者通过编纂字典进行。前者通过编制韵书进行,?6?1 “”)同语。(子所雅言,《论语书、诗、执礼皆雅言也。述而》:雅言是我国是当时西周东都洛阳所用的语言。雅言即正言(王都之音为正),东周语言仍以雅言为共最早的民族共同语。《史籀》,文字籀文)大篆(这本我国也是世界上现存最早并对词汇进行了规范,出现了《尔雅》同语,“”“”“”“”“”合近。,的类义词典。雅意为解释词语要近于雅正,即尔雅正尔即4300 19 每一类多条,乎规范。全书以词义为纲编写,个类。共收词分为“”通过分类将同义词以释~山、开头,~鸟等。例如释诂,~水、~亲、——雅言为共同大篆收集在一起,然后用共同语加以解释。语言以文字秦——“”西汉扬雄编写了《輏轩使者绝代语释别国方言》语汉文字书同文,小篆其语音标准仍然是指通语,对方言词汇进行了整理。也即共同语,绝代语,洛阳音。他将同一个词在各地方言中的不同说法收集在一起,然后用通语解释。9353 以小篆作为标准字体。东汉许慎编写了《说文解字》,个汉字,共收入“”,汉灵帝刊于石碑这是中国历史上第一部汉字规范字典。昭定五经,汉末,北朝皆以洛魏、即《熹平石经》,以隶书为标准字体。西晋、魏晋南北朝以洛东晋、共同语都是洛阳话。南朝以南京为都,出现反切法,阳为都,,南朝梁朝的顾野王奉旨编纂《玉篇》阳音为标准音,统一了书面语的读音。16917 , 陆法 言编个字,以楷书为标准字体隋是我国第一部楷体字典。收入12158 其直接目的是为了文以洛阳音为标准音。个,收字写韵书《切韵》, 学创作的需要,《切韵》唐《唐韵》修订,但实际上起到了正音字典的作用。为“”用要考语音标准不变。言利用科考推行共同语。(口试,铨选(复试)“”唐太宗令大臣颜师古编写《五经定书写楷书)标准语)、(书法,两科。改称《大和《字样》,皆以楷书为标准字体。诏令重修《切韵》,本》宋语音标准皆洛阳音。后又诏令编纂《集韵》。宋重修广韵》(简称《广韵》)。22726 31319 ,皆以楷收字收字编纂《类篇》,诏令重修《玉篇》,个;个以洛阳音为标准音。(一说以元书为标准字体。周德清编《中原音韵》,元“”(洛大都即今北京音为标准音诏令编纂《洪武正韵》,)。中原雅音明以33179 33419 字)(。和民间编写了《字汇》(《正字通》阳音)字)为依据。雍正诏令福以南京音(洛阳音)清为标准音。康熙诏令编纂《音韵阐微》,“”命广东设立供官员和学生学习官话。正音书院康熙诏令编纂字书,,建、47035 “”清末切音字运动字)。名为《康熙字典》(字典这个名称由此产生。1840 一古代的

标准化理论知识

标准化理论知识 1、什么是标准? 为在一定的范围内获得最佳秩序,对活动或其结果规定共同的和重复使用的规则、导则或特性的文件。该文件经协商一致制定并经一个公认机构的批准。标准应以科学、技术和实践经验的综合成果为基础,以促进最佳社会效益为目的。 2、什么是标准化? 为在一定的范围内获得最佳秩序,对实际的或潜在的问题制定共同的和重复使用的规则的活动。 3、标准化的对象是什么? 在国民经济的各个领域中,凡具有多次重复使用和需要制定标准的具体产品,以及各种定额、规划、要求、方法、概念等,都可成为标准化对象。 标准化对象一般可分为两大类:一类是标准化的具体对象,即需要制定标准的具体事物;另一类是标准化总体对象,即各种具体对象的总和所构成的整体,通过它可以研究各种具体对象的共同属性、本质和普遍规律。 4、标准化的基本特性是什么? 标准化的基本特性主要包括以下几个方面: ①抽象性; ②技术性; ③经济性; ④连续性; ⑤约束性; ⑥政策性。 5、标准化的基本原理是什么? 标准化的基本原理通常是指统一原理、简化原理、协调原理和最优化原理。 统一原理就是为了保证事物发展所必须的秩序和效率,对事物的形成、功能或其它特性,确定适合于一定时期和一定条件的一致规范,并使这种一致规范与被取代的对象在功能

上达到等效。 统一原理包含以下要点: ①统一是为了确定一组对象的一致规范,其目的是保证事物所必须的秩序和效率。 ②统一的原则是功能等效,从一组对象中选择确定一致规范,应能包含被取代对象 所 具备的必要功能; ③统一是相对的,确定的一致规范,只适用于一定时期和一定条件,随着时间的推移和条件的改变,目的统一就要由新的统一所代替。 简化原理是为了经济有效地满足需要,对标准化对象的结构、型式、规格化或其它性能进行筛选提炼,剔除其中多余的、低效能的、可替换的环节,精炼并确定出能满足全面需要所必要的高效能的环节,保持整体构成精简合理,使之功能效率最高。 简化原理包含以下几个要点: ①简化的目的是为了经济,使之更有效地满足需要; ②简化的原则是从全面需要出发,保持整体构成精简合理,使之功能效率最高。所谓功能效率系指功能全面需要的能力; ③简基本方法是对处于自然存在状态的对象进行科学的筛选提炼,易除其中多余的、低效能的、可替换的环节,精炼出高效能的能全面需要所必须的环节; ④简化的实质不是简单化而是精炼化、其结果不是以少替多,而是以少胜多。 协调原理是为了使标准系统的整体功能达到最佳,并产生实际效果,必须通过有效的方式协调系统内外相关因素之间的关系,确定为建立和保持相互一致,适应或平衡关系所必须具备的条件。 协调原理包含以下要点: ①协调的目的在于使标准系统的整体功能达到最佳并产生实际效果; ②协调对象是系统内相关因素的关系以及系统与外部相关因素的关系; ③相关因素之间需要建立相互一致关系,相互适应关系,相互平衡关系(技术经济指标平衡、有关各方利益矛盾的平衡),为此必须确立条件; ④协调的有效方式有:有关各方面的协商一致,多因素的综合效果最优化,多因素矛盾的综合平衡等。 按照特定的目标,在一定的限制条件下,对标准系统的构成因素及其关系进行选择、设

关系规范化

关系规范化 规范化理论是数据库逻辑设计的指南和工具,具体步骤如下:(1)考察关系模型的函数依赖关系,确定范式等级。逐一分析各关系模式,考察是否存在部分函数依赖、传递函数依赖等,确定它们分别属于第几范式。 (2)对关系模式进行合并或分解。根据应用要求,考察这些关系模式是否合乎要求,从而确定是否要对这些模式进行合并或分解,例如,对于具有相同主码的关系模式一般可以合并;对于非BCNF的关系模式,要考察“异常弊病”是否在实际应用中产生影响,对于那些只是查询,不执行更新操作,则不必对模式进行规范化(分解),实际应用中并不是规范化程度越高越好,有时分解带来的消除更新异常的好处与经常查询需要频繁进行自然连接所带来的效率低相比会得不偿失。对于那些需要分解的关系模式,可以用规范化方法和理论进行模式分解。最后,对产生的各关系模式进行评价、调整,确定出较合适的一组关系模式。 关系规范化理论提供了判断关系逻辑模式优劣的理论标准,帮助预测模式可能出现的问题,是产生各种模式的算法工具,因此是设计人员的有力工具。 扩展阅读: ?1 《数据库设计解决方案》 1.3 关系规范化 https://www.360docs.net/doc/403895676.html, 2007-04-07 13:31 史创明、王俊伟清华大学出版社我要评论(0) ?摘要:在数据库中,数据之间存在着密切的联系。关系数据库由相互联系的一组关系所组成,每个关系包括关系模式和关系值两个方面。关系模式是对关系的抽象定义,给出关系的具体结构;关系的值是关系的具体内容,反映关系在某一时刻的状态。 ?标签:SQL SQL2000微软数据库 ?在数据库中,数据之间存在着密切的联系。关系数据库由相互联系的一组关系所组成,每个关系包括关系模式和关系值两个方面。关系模式是对关系的抽象定义,给出关系的具体结构; 关系的值是关系的具体内容,反映关系在某一时刻的状态。一个关系包含许多元组,每个元组都是符合关系模式结构的一个具体值,并且都分属于相应的属性。在关系数据库中的每个关系都需要进行规范化,使之达到一定的规范化程度,从而提高数据的结构化、共享性、一

数据库原理及应用(课后练习)---第4章 关系数据库设计理论

第4章关系数据库设计理论第4章关系数据库设计理论 习题 一、选择题 1、C 2、B 3、C 4、C 5、A 6、B 7、A 8、B 9、D 10、B 二、填空题 1、数据依赖主要包括_函数_依赖、_多值_依赖和连接依赖。 2、一个不好的关系模式会存在_插入异常_、_删除异常_和__修改复杂_等弊端。 3、设X→Y为R上的一个函数依赖,若_对任意X的真子集X’,均无X’→Y 存在__,则称Y完全函数依赖于X。 4、设关系模式R上有函数依赖X→Y和Y→Z成立,若_Y不包含于X_且_Y→X不成立_,则称Z传递函数依赖于X。 5、设关系模式R的属性集为U,K为U的子集,若_K→U为完全函数依赖_,则称K 为R的候选键。 6、包含R中全部属性的候选键称_主属性_。不在任何候选键中的属性称__非主属性_。 7、Armstrong公理系统是_有效__的和_完备__的。 8、第三范式是基于_函数_依赖的范式,第四范式是基于_多值_依赖的范式。 9、关系数据库中的关系模式至少应属于_第一_范式。 10、规范化过程,是通过投影分解,把_一个范式级别较低的_的关系模式“分解”为_若干个范式级别较高__的关系模式。 111

数据库原理及应用 112 三、简答题 1、解释下列术语的含义:函数依赖、平凡函数依赖、非平凡函数依赖、部分函数依赖、完全函数依赖、传递函数依赖、范式、无损连接性、依赖保持性。 解: 函数依赖:设关系模式R (U ,F ),U 是属性全集,F 是U 上的函数依赖集,X 和Y 是U 的子集,如果对于R (U )的任意一个可能的关系r ,对于X 的每一个具体值,Y 都有唯一的具体的值与之对应,则称X 函数决定Y ,或Y 函数依赖于X ,记X →Y 。我们称X 为决定因素,Y 为依赖因素。当Y 不函数依赖于X 时,记作:X Y 。当X →Y 且Y →X 时,则记作:X ?Y 。 平凡函数依赖:当属性集Y 是属性集X 的子集时,则必然存在着函数依赖X →Y ,这种类型的函数依赖称为平凡的函数依赖。 非平凡函数依赖:如果Y 不是X 子集,则称X →Y 为非平凡的函数依赖。 完全函数依赖与部分函数依赖:设有关系模式R (U ),U 是属性全集,X 和Y 是U 的子 集,X →Y ,并且对于X 的任何一个真子集X ',都有X 'Y ,则称Y 对X 完全函数依赖(Full Functional Dependency ),记作X ?→?f Y 。如果对X 的某个真子集X ',有X '→Y ,则称Y 对X 部分函数依赖(Partial Functional Dependency ),记作X ?→? p Y 。 传递函数依赖:设有关系模式R (U ),U 是属性全集,X ,Y ,Z 是U 的子集,若X →Y (Y X ),但Y X ,又Y →Z ,则称Z 对X 传递函数依赖(Transitive Functional Dependency ),记作:X ?→? t Z 。 范式:在关系数据库的规范化过程中,为不同程度的规范化要求设立的不同的标准或准则称为范式(Normal Form )。满足最低要求的叫第一范式,简称1NF 。在第一范式中满足进一步要求的为第二范式(2NF),其余以此类推。R 为第几范式就可以写成R ∈xNF (x 表示某范式名)。 当把某范式看成是满足该范式的所有关系模式的集合时,各个范式之间的集合关系可以表示为:5NF ?4NF ?BCNF ?3NF ?2NF ?1NF 。 一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式的集合,这种过程就叫规范化。 无损连接性:设R (X ,Y ,Z ),X 、Y 、Z 为不相交的属性集合,如果有X →Y 、X →Z ,则有R (X ,Y ,Z )=R[X ,Y]∞R[X ,Z],其中R[X ,Y]表示关系R 在属性(X ,Y )上的投影,即R 等于两个分别含决定因素X 的投影关系(分别是R[X ,Y]与R[X ,Z])在X 上的自然连接,这样便保证了关系R 分解后不会丢失原有的信息,这称作关系分解的无损连接性。 依赖保持性:设有关系模式R (U ,F ),Z ?U ,则Z 所涉及到的F 中所有函数依赖为F

相关文档
最新文档