关系模式的分解与函数依赖关系的判断

合集下载

关系模式分解的无损连接和保持函数依赖

关系模式分解的无损连接和保持函数依赖一、引言关系模式是关系数据库中的核心元素之一，它描述了数据的结构和关系。

在设计关系数据库时，我们常常需要对关系模式进行分解，以满足数据库的需求。

本文将讨论关系模式分解的无损连接和保持函数依赖的相关概念和方法。

二、关系模式分解关系模式分解是将一个关系模式拆分成多个较小的关系模式的过程。

在分解关系模式时，我们需要考虑两个重要的性质：无损连接和保持函数依赖。

2.1 无损连接无损连接是指在关系模式分解后，通过对分解后的关系进行连接操作能够恢复原始关系模式。

换句话说，无损连接要求分解后的关系能够完整地保留原始关系中的所有信息。

2.2 保持函数依赖保持函数依赖是指在关系模式分解后，分解后的关系中依然能够保持原始关系中的函数依赖关系。

函数依赖是指一个属性或者属性集合的值决定了另一个属性或者属性集合的值。

三、关系模式分解的方法关系模式分解有多种方法，下面介绍三种常用的方法：自然连接、垂直分解和水平分解。

3.1 自然连接自然连接是指通过公共属性将两个或多个关系模式进行连接，得到一个具有完整信息的新关系模式。

自然连接的特点是能够保持原始关系中的所有信息和函数依赖。

3.2 垂直分解垂直分解是指根据属性集合的划分，将一个关系模式分解成多个关系模式。

垂直分解的优点是能够消除冗余数据，提高查询效率。

但是需要注意的是，垂直分解可能会造成关系丢失或信息损失。

3.3 水平分解水平分解是指将一个关系模式的元组进行水平划分，得到多个关系模式。

水平分解的特点是能够提高并发性能和容错性。

但是需要注意的是，水平分解可能会造成查询的复杂性增加和数据的分布不均衡。

四、关系模式分解的应用关系模式分解在实际的数据库设计中有着广泛的应用。

下面介绍两个例子以说明关系模式分解的应用。

4.1 学生课程关系考虑一个学生选课系统，其中包含学生和课程两个关系模式。

学生关系模式包括学生ID、姓名和年龄等属性，课程关系模式包括课程ID、课程名称和教师名称等属性。

关系模式分解的两种主要准则

关系模式分解的两种主要准则关系模式分解是数据库设计中非常重要的一个环节，它可以将一个复杂的关系模式分解成若干个更简单的关系模式，从而提高数据库的性能和可维护性。

在进行关系模式分解时，需要遵循一些准则，本文将介绍其中的两种主要准则。

一、函数依赖分解准则函数依赖是指一个或多个属性的值决定另一个属性的值。

在关系模式中，函数依赖是关系模式中数据之间的约束关系，也是关系模式分解的重要依据。

在进行函数依赖分解时，可以根据以下准则进行分解：1.不产生冗余数据：分解后的新关系模式不能产生冗余数据，即不能存在同一条数据在不同的关系模式中重复出现的情况。

2.保持原有的函数依赖关系：分解后的新关系模式应该能够与原有的函数依赖关系对应，保证数据的完整性和一致性。

3.尽可能保持关系模式的最小性：在函数依赖分解时，应该尽可能降低关系模式的冗余度，保持关系模式的最小性。

二、多值依赖分解准则多值依赖是指一个或多个属性的值决定另一组属性的值，这与函数依赖有所不同。

在进行多值依赖分解时，需要遵循以下准则：1.保持原有的多值依赖关系：分解后的新关系模式应该能够与原有的多值依赖关系对应，保证数据的完整性和一致性。

2.不产生冗余数据：分解后的新关系模式不能产生冗余数据，即不能出现同一条数据在不同的关系模式中重复出现的情况。

3.保留原有的关系模式属性：分解后的新关系模式应该保留原有的关系模式属性，且数据应该可以通过新关系模式及相应的联结操作还原到原有的关系模式中。

总结：以上是关系模式分解的两种主要准则，无论是进行函数依赖分解还是多值依赖分解，都需要遵循不产生冗余数据、保持原有的依赖关系以及保留原有属性的原则。

在分解过程中，不同的准则可能会产生冲突，此时需要根据实际情况进行权衡，选择最优的方案。

分解结果必须保证数据的完整性和一致性，还可以提高数据库的性能和可维护性。

第六章关系模式分解理论

第六章关系模式分解理论关系模式分解理论主要有以下几个基本概念：1. 函数依赖（Functional Dependency）：函数依赖描述了关系模式中的属性之间的依赖关系。

如果一个属性的取值可以唯一地确定另一个或一组其他属性的取值，我们称这个关系为函数依赖关系。

函数依赖是关系模式分解的基础。

2. 主属性和非主属性（Primary Attribute and Non-Primary Attribute）：主属性是一个关系模式中的属性子集，它可以唯一地标识一个元组。

非主属性是除主属性以外的其他属性。

3. 范式（Normal Form）：范式是一组规范化原则，用于评估关系模式的优劣和规范化程度。

常见的范式有第一范式（1NF）、第二范式（2NF）、第三范式（3NF）等，范式的级别越高，关系模式的规范化程度越高。

关系模式分解理论的目的是提高数据库的性能和可扩展性，并减少数据的冗余和重复。

通过将一个关系模式分解为多个较小的子模式，我们可以实现以下几个优势：1.数据库性能的提升：将大型关系模式分解为多个子模式，可以减少查询的数据量，提高数据库查询效率和响应速度。

2.数据库可扩展性的提高：将关系模式分解为多个子模式，可以将数据存储在不同的物理存储介质上，从而实现数据库的横向扩展，提高数据库的处理能力和负载均衡能力。

3.数据库维护的便捷性：通过将关系模式分解为多个子模式，可以将数据库的不同部分交给不同的数据库管理员负责，提高数据库维护的效率和精度。

关系模式分解理论在数据库设计和优化中都起到了重要的作用。

通过合理地分解关系模式，我们可以改善数据库的性能和可扩展性，并实现数据的最优化存储和管理。

然而，在进行关系模式分解时，我们也需要注意一些问题，如分解后的子模式之间是否存在冗余和重复数据、分解后子模式的查询效率如何等，这些问题需要综合考虑，以达到最佳的设计效果。

关系模式分解

举例：
例 5.8 设有关系模式 R(A,B,C) ，函数依赖集
F={A→B ， C→B} ，分解 ρ ={R1,R2} ，其中 R1=AB ， R2=BC 。检验分解 ρ 是否具有无损联接性。分解ρ不具有无损联接性
三、保持函数依赖集
1、定义
设有关系模式 R(U,F) ， F 是 R 的函数依赖集， ρ ＝{R1,R2,…,Rk}是R上的一个分解。如果所有函数依赖集πRi(F)（i=1，2，…,k）的并集逻辑蕴含 F 中的每一个函数依赖，则称分解 ρ 具有依赖保持性，也即分解ρ 保持依赖集F。即
A R1 R2 R3 R4 R5 a1 a1 a1 a1 a1 B b12 a2 a2 b42 b52 C b13 b13 a3 a3 a3 D a4 a4 a4 a4 a4 E b15 b25 a5 a5 a5
例 5.7 设R(ABCDE)，F={A→C，B→C，C→D，DE→C，
CE→A}，ρ={R1(AD)，R2(AB)，R3(BE)，R4(CDE)， R5(AE)}，检验分解ρ是否具有无损联接性。第三步：判断
2、算法5.2 判断一个分解的无损联接性输入：关系模式R(A1,…,An)，
函数依赖集F，
R的一个分解ρ ＝(R1,…,Rk)。
输出：ρ 是否为无损联接的判断。方法:
2、算法5.2 判断一个分解的无损联接性（续1）
（1）构造一个k行n列表S，其中：
A1 R1 … Ri … Rk … Aj … An
例 5.7 设R(ABCDE)，F={A→C，B→C，C→D，DE→C，
CE→A}，ρ={R1(AD)，R2(AB)，R3(BE)，R4(CDE)， R5(AE)}，检验分解ρ是否具有无损联接性。第二步：修正②B→C

数据库学习摘记——关系模式的函数依赖

数据库学习摘记——关系模式的函数依赖关系与关系模式的联系：关系模式是相对稳定的，静态的，是把所有元组删去后的⼀张空表格，是对元组数据组织⽅式的结构描述，⽽关系却是动态变化的，不稳定的，是将若⼲元组填⼊关系模式后得到的⼀个取值实例。

每⼀个关系对应⼀个关系模式，每⼀个关系模式可以定义多个关系。

关系模式R(U)对应的具体关系通常⽤⼩写字母r来表⽰。

函数依赖：设R(U)是属性集U={A1, A2, …, An}上的关系模式，X和Y是U的⼦集。

若对R(U)的任⼀具体关系r中的任意两个元组t1和t2，只要t1[X]=t2[X] 就有t1[Y]=t2[Y]。

则称"X函数确定Y" 或"Y函数依赖于X"，记作X→Y，X为这个函数依赖的决定因素。

函数依赖要求R(U)的⼀切具体关系r都要满⾜的约束条件。

若X→Y且Y→X，则记作X⇿Y平凡函数依赖：X→Y，Y⊆X // 对于任⼀关系模式，平凡函数依赖必然是成⽴的⾮平凡函数依赖：X→Y，Y⊄X完全函数依赖：如果X→Y，且对于X的任何⼀个真⼦集X'，都有X不函数确定Y ，则称Y对X完全函数依赖或者X完全决定Y，记作：部分函数依赖：如果X→Y，但Y不是完全函数依赖于X，则称Y 对X部分函数依赖，记作：传递函数依赖：如果X→Y，Y→Z，且 Y→X，Y⊄X，Z⊄Y,则称Z对X传递函数依赖，记作:候选键：对关系模式R(U)，设K⊆U，且K完全函数确定U，则K为能够唯⼀确定关系中任何⼀个元组(实体)的最少属性集合，称K为R(U)的候选键或候选关键字。

【R(U，F)，U={ A，B，C，D，E，G }，F={AB→C，CD→E，E→A，A→G}，求候选键】因G只在右边出现，所以G⼀定不属于候选码⽽B，D只在左边出现，所以B，D⼀定属于候选码BD的闭包还是BD，则对BD进⾏组合，除了G以外，BD可以跟A，C，E进⾏组合先看ABDABD本⾝⾃包ABD，⽽AB→C，CD→E，A→G，所以ABD的闭包为ABDCEG=U再看BDCCD→E，E→A，A→G，BDC本⾝⾃包，所以BDC的闭包为BDCEAG=U最后看BDEE→A，A→G，AB→C，BDE本⾝⾃包，所以BDE的闭包为BDEAGC=U因为(ABD)、(BCD)、(BDE)的闭包都是ABCDEG所以本问题的候选码有3个分别是ABC、BCD和BDE主键：通常在R(U)的多个候选键中任意选定⼀个候选键作为主键，也称为主码或主关键字。

无损分解与函数依赖的判断

一：大部分是对一个关系模式分解成两个模式的考察，分解为三个以上模式时无损分解和保持依赖的判断比较复杂，考的可能性不大，因此我们只对“一个关系模式分解成两个模式”这种类型的题的相关判断做一个总结。

以下的论述都基于这样一个前提：R是具有函数依赖集F的关系模式，（R1 ，R2）是R的一个分解。

首先我们给出一个看似无关却非常重要的概念：属性集的闭包。

令α为一属性集。

我们称在函数依赖集F下由α函数确定的所有属性的集合为F下α的闭包，记为α+ 。

下面给出一个计算α+的算法，该算法的输入是函数依赖集F和属性集α，输出存储在变量result中。

算法一：result:=α;while(result发生变化)dofor each 函数依赖β→γ in F dobeginif β∈result then result:=result∪γ;end属性集闭包的计算有以下两个常用用途：·判断α是否为超码，通过计算α+（α在F下的闭包），看α+ 是否包含了R中的所有属性。

若是，则α为R的超码。

·通过检验是否β∈α+，来验证函数依赖是否成立。

也就是说，用属性闭包计算α+，看它是否包含β。

（请原谅我用∈符号来表示两个集合之间的包含关系，那个表示包含的符号我找不到，大家知道是什么意思就行了。

）看一个例子吧，2005年11月系分上午37题：● 给定关系R(A1，A2，A3，A4)上的函数依赖集F={A1→A2，A3→A2，A2→A3，A2→A4}，R的候选关键字为________。

（37）A. A1 B. A1A3 C. A1A3A4 D. A1A2A3首先我们按照上面的算法计算A1+ 。

result=A1，由于A1→A2，A1∈result，所以resul t=result∪A2=A1A2由于A2→A3，A2∈result，所以result=result∪A3=A1A2A3由于A2→A4，A2∈result，所以result=result∪A3=A1A2A3A4由于A3→A2，A3∈result，所以result=result∪A2=A1A2A3A4通过计算我们看到，A1+ =result={A1A2A3A4}，所以A1是R的超码，理所当然是R的候选关键字。

关系模式文档

4.1 名词解释(1)函数依赖：FD(function dependency)，设有关系模式R(U)，X，Y是U的子集， r是R 的任一具体关系，如果对r的任意两个元组t1,t2,由t1[X]=t2[X]导致t1[Y]=t2[Y], 则称X 函数决定Y,或Y函数依赖于X，记为X→Y。

X→Y为模式R的一个函数依赖。

(2) 函数依赖的逻辑蕴涵：设F是关系模式R的一个函数依赖集，X，Y是R的属性子集，如果从F中的函数依赖能够推出X→Y，则称F逻辑蕴涵X→Y,记为F|=X→Y。

(3) 部分函数依赖：即局部依赖，对于一个函数依赖W→A，如果存在X W(X包含于W)有X→A 成立，那么称W→A是局部依赖，否则称W→A为完全依赖。

(4)完全函数依赖：见上。

(5) 传递依赖：在关系模式中，如果Y→X，X→A，且X Y（X不决定Y）， A X（A不属于X）,那么称Y→A是传递依赖。

(6) 函数依赖集F的闭包F+: 被逻辑蕴涵的函数依赖的全体构成的集合，称为F的闭包(closure),记为F+。

(7) 1NF：第一范式。

如果关系模式R的所有属性的值域中每一个值都是不可再分解的值, 则称R是属于第一范式模式。

如果某个数据库模式都是第一范式的，则称该数据库存模式属于第一范式的数据库模式。

第一范式的模式要求属性值不可再分裂成更小部分，即属性项不能是属性组合和组属性组成。

(8) 2NF：第二范式。

如果关系模式R为第一范式，并且R中每一个非主属性完全函数依赖于R的某个候选键，则称是第二范式模式；如果某个数据库模式中每个关系模式都是第二范式的，则称该数据库模式属于第二范式的数据库模式。

(注：如果A是关系模式R的候选键的一个属性，则称A是R的主属性，否则称A是R的非主属性。

)(9)3NF：第三范式。

如果关系模式R是第二范式，且每个非主属性都不传递依赖于R的候选键，则称R是第三范式的模式。

如果某个数据库模式中的每个关系模式都是第三范式，则称为3NF的数据库模式。

第四章数据库规范化理论(第二节)

在上面的例中，关系模式：COURSE(C#, TITLE, LNAME, ROOM#)
其中存在非主属性ROOM#对码的传递依赖，即：
C#→LNAME, LNAME→ROOM# 因此COURSE不属于3NF。
将COURSE分解为：COURSE1(C#, TITLE, LNAME) 和 LECTURE(LNAME, ROOM#),
则关系模式COURSE1和LECTURE中都没有传递函数依赖，
因此 COURSE1 和 LECTURE 都属于3NF。
16
第四章数据库规范化理论
第二节、范式理论
三、第三范式（3NF）
至此，关系模式REPORT分解为下列3个属于3NF的一组关系模式：
REPORT1 (S#, C#, MARKS) COURSE1 (C#, TITLE, LNAME) LECTURE (LNAME, ROOM#)
非第一范式的例子如表4-4，可以转换为第一范式如表4-5。
表4-4
研究生
导师
专业
第一个研究生第二个研究生
表4-5
导师专业第一个研究生第二个研究生
几乎所有的商用关系DBMS都要求关系为第一范式
4
第四章数据库规范化理论
第二节、范式理论
一、第一范式（1NF）
如果关系仅仅满足第一范式的条件是不够的，可能会存在更新异常。
定义：关系模式R∈1NF，若X→Y，且Y⊈ X 时，X必含有候选码，则R∈BCNF。
即在关系模式R中，若R的每一个决定因素都包含候选码，则R∈BCNF。
由BCNF的定义可知，一个满足BCNF的关系模式有如下特性：
● 每个非主属性对每个码都是完全函数依赖；
● 所有的主属性对每一个不包含它的码，也是完全函数依赖；

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

关系模式的分解与函数依赖关系的判断
（在读此文章时须认真细心读懂每一行每一个细节）
关于无损分解和保持依赖的判断，是系分和数工考试中每年基本上都会考的题，而且绝大部分是对一个关系模式分解成两个模式的考察，分解为三个以上模式时无损分解和保持依赖的判断比较复杂，考的可能性不大，因此我们只对“一个关系模式分解成两个模式”这种类型的题的相关判断做一个总结。

以下的论述都基于这样一个前提：
R是具有函数依赖集F的关系模式，（R1 ，R2）是R的一个分解。

首先我们给出一个看似无关却非常重要的概念：属性集的闭包。

令α为一属性集。

我们称在函数依赖集F下由α函数确定的所有属性的集合为F下α的闭包，记为α+ 。

下面给出一个计算α+的算法，该算法的输入是函数依赖集F和属性集α，输出存储在变量result中。

算法一：
result=α;
while(result发生变化)do
for each 函数依赖β→γ in F do
begin
if β∈result then result=(result∪γ);
end
(此算法是要算出α属性所能决定的所有属性是那些，包括传递依赖的属性，如主键所能决定的是整个表的所有属性。

例如α→β、β→γ、β→δ、δ→θ，此算法能算出属性为：{α、β、γ、β、δ、θ})
属性集闭包的计算有以下两个常用用途：
·判断α是否为超码: 通过计算α+（α在F下的闭包），看α+ 是否包含了R中的所有属性。

若是，则α为R的超码。

·通过检验是否β∈α+，来验证函数依赖是否成立。

也就是说，用属性闭包计算α+，看它是否包含β。

（请原谅我用∈符号来表示两个集合之间的包含关系，那个表示包含的符号我找不到，大家知道是什么意思就行了。

）
看一个例子吧，2005年11月系分上午37题：
● 给定关系R(A1，A2，A3，A4)上的函数依赖集F={A1→A2，A3→A2，A2→A3，A2→A4}，R的候选关键字为________。

（37）A. A1 B. A1A3 C. A1A3A4 D. A1A2A3
首先我们按照上面的算法计算A1+ 。

result=A1，
由于A1→A2，A1∈result，所以result=result∪A2=A1A2
由于A2→A3，A2∈result，所以result=result∪A3=A1A2A3
由于A2→A4，A2∈result，所以result=result∪A4=A1A2A3A4
由于A3→A2，A3∈result，所以result=result∪A2=A1A2A3A4
通过计算我们看到，A1+ =result={A1A2A3A4}，所以A1是R的超码，理所当然是R的候选关键字。

此题选A 。

好了，有了前面的铺垫，我们进入正题。

无损分解的判断。

如果R1∩R2是R1或R2的超码，则R上的分解（R1，R2）是无损分解。

这是一个充分条件，当所有的约束都是函数依赖时它才是必要条件（例如多值依赖就是一种非函数依赖的约束），不过这已经足够了。

保持依赖的判断。

如果F上的无论那个函数依赖都能在其分解后的若干个关系中找到一个关系，并且该函数依赖在此关系上成立，则这个分解是保持依赖的（这是一个充分条件），即F上全部函数依赖都能在分解后的关系上成立。

如果上述判断失败，并不能断言分解不是保持依赖的，还要使用下面的通用方法来做进一步判断。

该方法的表述如下：
算法二：
对F上的每一个α→β使用下面的过程：
result=α; //此行result=α中的α与α→β中的α是同一个α
while(result发生变化)do
for each 分解后的Ri
t=((result∩Ri)+) ∩Ri //“(result∩Ri)+”表示”result∩Ri”的闭包(即在此处调算法一计算出”result∩Ri”的闭包值) result=result∪t
这里的属性闭包是在函数依赖集F下计算出来的。

如果result中包含了β的所有属性，则函数依赖α→β。

分解是保持依赖的当且仅当上述过程中F的所有依赖都被保持。

下面给出一个例题，2006年5月系分上午43题：
●设关系模式R<U, F>，其中U=｛A, B, C, D, E｝，F＝{A→BC，C→D，BC→E，E→A｝，则分解ρ={R1（ABCE），R2（CD）｝满足（43）。

（43）A．具有无损连接性、保持函数依赖
B．不具有无损连接性、保持函数依赖
C．具有无损连接性、不保持函数依赖
D．不具有无损连接性、不保持函数依赖
先做无损链接的判断。

R1∩R2={C}，计算C+。

Result=C
由于C→D，C∈result，所以result=result∪D=CD
可见C是R2的超码，该分解是一个无损分解。

再做保持依赖的判断。

A→BC，BC→E，E→A都在R1上成立（也就是说每一个函数依赖左右两边的属性都在R1中），C→D 在R2上成立，因此给分解是保持依赖的。

选A。

再看一个复杂点的例题。

2007年5月数工40-41题。

●给定关系模式R<U, F>，U=｛A, B, C, D, E｝，F＝{B→A，D→A，A→E，AC→B｝，其候选关键字为（40），则分解ρ={R1（ABCE），R2（CD）｝满足（41）。

（40）A．ABD
B．ABE
C．ACD
D．CD
（41）A．具有无损连接性、保持函数依赖
B．不具有无损连接性、保持函数依赖
C．具有无损连接性、不保持函数依赖
D．不具有无损连接性、不保持函数依赖
看见了吧，和前面一题多么的相像！
对于第一问，分别计算ABCD四个选项的闭包，
（ABD）+ = { ABDE }
（ABE）+ = { ABE }
（ACD）+ = { ABCDE }
（CD）+ = { ABCDE }
选D。

再看第二问。

先做无损链接的判断。

R1∩R2={C}，计算C+。

result=C
因此C既不是R1也不是R2的超码，该分解不具有无损分解性。

再做保持依赖的判断。

B→A，A→E，AC→B在R1上成立，D→A在R1和R2上都不成立，因此需做进一步判断。

由于B→A，A→E都是被保持的（因为它们的元素都在R1中），因此我们要判断的是D→A，AC→B是不是也被保持。

对于D→A应用算法二：
result=D
对R1，result∩R1=ф（空集，找不到空集的符号，就用这个表示吧），t=ф，result=D
再对R2，result∩R2=D，D+ =ADE ，t=D+ ∩R2=D (D+ =ADE表示result∩R2的闭包值为ADE,用算法一计算得到)
一个循环后result未发生变化，因此最后result=D，并未包含A，所以D→A未被保持，该分解不是保持依赖的。

选D。

在以下给定的关系模式分解中，D→A的依赖是保持下来的：
给定关系模式R<U, F>，U=｛A, B, C, D, E,h｝，F＝{B→A，D→A，A→E，AC→B,d→h,h→b｝，则分解ρ={R1（ABCE），R2（CD h）,(abh)｝
原因是：D→H，H→B，B→A，所以D→A成立。

总结：
函数依赖：
◆X →Y、Y→Z ，”→” 符号左右两边的属性X、Y必须在同一个关系①中X与Y的依赖关系才能
成立，Y与Z必需在同一个关系②中Y与Z的依赖关系才能成立，但X与Z却可以不必在同一个关系中，函数的传递依赖关系还是被传递保持下来的，即X→Z仍然是成立，即关系①中的X仍能决定关系②中的Z。

◆若在关系③中有四个属性（A、B、C、D），如果存在如下函数依赖：A→B、B→C ；关系③如果被
分解为若干个关系，其中的一个关系是（A、C），则在关系（A、C）中A→C仍能成立，即函数依赖A→C在关系（A、C）中被保留下来。