第六讲 关系数据理论
合集下载
关系数据理论

则称Z传递函数依赖于X S# SD,SD DEAN
练习:给出一个具有传递函数依赖的关系模式例子
存在传递函数依赖的例子
示例
考虑为管理职工的工资信息而设计一个关系模式
职工 赵明 钱广 孙志 李开 周祥
级别 4 5 6 5 6
工资 500 600 700 600 700
函数依赖
候选码:设K为R< U , F >的属性(组),若K f U,
消除非主属性对码的部分依赖 如S2NF,因为 (S#,C#)p SN (S#,C#)p SD
2NF
改造
非主属性有两种,一种完全依赖于码,一种部分依赖于码。 将S分解为: SC(S# , C# , G) S_SD(S# , SN , SD , DEAN)
练习
关系模式R(A,B,C,D),码为AB,给出它的一个函数 依赖集,使得R属于1NF而不属于2NF
第六章 关系数据理论
内容出处: 1.Abraham Silberschatz《数据库系统概念》第七 章
第六章 关系数据理论
教学目的
本章讨论如何进行关系数据库的逻辑设计。首先介绍函数依赖的概念,然 后利用函数依赖和其他类型的依赖定义范式,并给出利用Armstrong公理 系统确定范式级别的方法,最后介绍一些将关系模式分解为更高级范式的 模式分解算法。
问题:关系模式的形式描述?
关系模式的设计问题
关系模式的形式描述
关系模式由五部分组成,即关系模式是一个五元组: R(U,D,DOM,F)
R:关系名 U:组成该关系的属性名集合 D:属性组U中属性所来自的域 DOM:属性到域的映射 F:属性间的数据依赖集合。它限定了组成关系的各个元组
3NF
不良特性
S_SD(S# , SN , SD , DEAN)
练习:给出一个具有传递函数依赖的关系模式例子
存在传递函数依赖的例子
示例
考虑为管理职工的工资信息而设计一个关系模式
职工 赵明 钱广 孙志 李开 周祥
级别 4 5 6 5 6
工资 500 600 700 600 700
函数依赖
候选码:设K为R< U , F >的属性(组),若K f U,
消除非主属性对码的部分依赖 如S2NF,因为 (S#,C#)p SN (S#,C#)p SD
2NF
改造
非主属性有两种,一种完全依赖于码,一种部分依赖于码。 将S分解为: SC(S# , C# , G) S_SD(S# , SN , SD , DEAN)
练习
关系模式R(A,B,C,D),码为AB,给出它的一个函数 依赖集,使得R属于1NF而不属于2NF
第六章 关系数据理论
内容出处: 1.Abraham Silberschatz《数据库系统概念》第七 章
第六章 关系数据理论
教学目的
本章讨论如何进行关系数据库的逻辑设计。首先介绍函数依赖的概念,然 后利用函数依赖和其他类型的依赖定义范式,并给出利用Armstrong公理 系统确定范式级别的方法,最后介绍一些将关系模式分解为更高级范式的 模式分解算法。
问题:关系模式的形式描述?
关系模式的设计问题
关系模式的形式描述
关系模式由五部分组成,即关系模式是一个五元组: R(U,D,DOM,F)
R:关系名 U:组成该关系的属性名集合 D:属性组U中属性所来自的域 DOM:属性到域的映射 F:属性间的数据依赖集合。它限定了组成关系的各个元组
3NF
不良特性
S_SD(S# , SN , SD , DEAN)
第六章关系数据理论精品文档

2NF的定义 如果R∈1NF,且每一个非主属性完全函数依赖于
码,则, R∈2NF 。
2NF(续)
例: 关系模式S-L-C(Sno, Sdept, Sloc, Cno, Grade) 其中,Sloc为学生住处,假设每个系的学生住在同一个地方。 主键:{Sno,Cno}
函数依赖包括:
F={(Sno, Cno) f Grade, Sno → Sdept, Sno → Sloc, Sdept → Sloc}
Sno → Sname
完全
(Sno,Cno) → Grade
完全
(Sno,Sname) → Sdept
部分
直接函数依赖与传递函数依赖
如果X→Y,Y→Z,且Y X,Y→X,则称Z传递函数依赖于 X。
例如: Student(Sno, Sname, Sdept, Mname, Cno, Grade)
因为Sno → Sdept, Sdept → Mname 所以存在传递依赖Sno → Mname
将一个2NF关系分解为多个3NF的关系后,并不能完全消 除关系模式中的各种异常情况和数据冗余。
课堂练习2:
将Student(Sno, Sname, Sdept, Mname, Cno, Grade)分解为一组2NF模式:
SC(Sno, Cno, Grade) SD(Sno, Sname, Sdept, Mname)
主键:{Sno}
6.2.5 3NF
3NF的定义 如果R 是2NF,且每个非主属性都不传递依赖 于R的候选码,则R属于3NF。
3NF(续)
分析下面的两个2NF,它们是不是属于3NF。 SC(Sno, Cno, Grade) 是 SL(Sno, Sdept, Sloc) 不是
码,则, R∈2NF 。
2NF(续)
例: 关系模式S-L-C(Sno, Sdept, Sloc, Cno, Grade) 其中,Sloc为学生住处,假设每个系的学生住在同一个地方。 主键:{Sno,Cno}
函数依赖包括:
F={(Sno, Cno) f Grade, Sno → Sdept, Sno → Sloc, Sdept → Sloc}
Sno → Sname
完全
(Sno,Cno) → Grade
完全
(Sno,Sname) → Sdept
部分
直接函数依赖与传递函数依赖
如果X→Y,Y→Z,且Y X,Y→X,则称Z传递函数依赖于 X。
例如: Student(Sno, Sname, Sdept, Mname, Cno, Grade)
因为Sno → Sdept, Sdept → Mname 所以存在传递依赖Sno → Mname
将一个2NF关系分解为多个3NF的关系后,并不能完全消 除关系模式中的各种异常情况和数据冗余。
课堂练习2:
将Student(Sno, Sname, Sdept, Mname, Cno, Grade)分解为一组2NF模式:
SC(Sno, Cno, Grade) SD(Sno, Sname, Sdept, Mname)
主键:{Sno}
6.2.5 3NF
3NF的定义 如果R 是2NF,且每个非主属性都不传递依赖 于R的候选码,则R属于3NF。
3NF(续)
分析下面的两个2NF,它们是不是属于3NF。 SC(Sno, Cno, Grade) 是 SL(Sno, Sdept, Sloc) 不是
数据库课件第6章关系数据理论

学号 95001 95001
95002 95003 95003 95004
95005
STC
课程号 C003 C002
C003 C002 C004 C001 C001
教师号 T01 T02
T01 T02 T05 T04
T03
a.插入异常分析:插入尚未选课的学生时,能否插入?或 插入没有学生选课的课程时,能否插入? 都不能
Y
Z
X
学号 传递 系主 任
Z
1.范式
范式(Normal Form, NF):关系模式的规范形式。 是符合某一种级别的关系模式的集合。
2.规范化
规范化:将一个给定的关系模式转化为某种级别范 式的过程称为关系模式的规范化过程,简称规范化。
规范化目的:逐渐消除异常,减少冗余。
规范化方法:一般采用分解的办法,将低级别范式 向高级别范式转化,使关系的语义单纯化。
2.部分函数依赖: X →Y,存在一个 X’ →Y, X P Y。
(学号,课程号) p
课程名
X
Y
关系模式R(U), U 是R的属性集合,X、Y、Z是U的 子集,X’是X的任意真子集。
3.传递函数依赖: X→Y,Y→Z,且Y X,Y X, 则X→Z ,称Z传递函数依赖于X。
学号→系名
XY 系名→ 系主任
(1) 学号 (学号, 姓名, 系名) (2) 系 (系名, 系主任)
例题分析: 1、工人(工号,姓名,工种,定额,车间,车间主任) 若有如下函数依赖:
①工号→姓名 ③工号→车间
②工号→工种 ④工种→定额
⑤车间→车间主任
2.比赛(球队,比赛场次,得分) 函数依赖情况: 3.假设一个帐号一天只能取一次款,那么关系模式: 取款(日期,帐号,取款金额,取款身份证号)
第六章 关系数据理论.ppt

5
3
3
解答:A->BC, B->C,AB->C…
21
6.2.1 函数依赖 (续)
2. 相关说明 函数依赖成立的条件 平凡的函数依赖 如果X Y,但Y X,则称其为平凡的函数依赖,否则 称为非平凡的函数依赖 如(Sno,SN) SN是平凡的函数依赖
22
6.2.1 函数依赖 (续)
32
6.2.3 范式(续)
3. 2NF
2NF的定义 • 若R1NF,且每个非主属性完全依赖于码,则称 R2NF • 消除非主属性对码的部分依赖 如S2NF,因为 (Sno,Cno)p SN (Sno,Cno)p SD
33
6.2.3 范式(续)
3. 2NF
1NF到2NF的改造
• 非主属性有两种,一种完全依赖于码,一种部分 依赖于码。 将S分解为: SC(Sno , Cno , G) S_SD(Sno , SN , SD , DEAN)
• 消除非主属性对码的部分函数依赖
34
改造结果
Sno SD
SD
DEAN
S01 杨明
D01
思齐
S02 李婉
D01
思齐
S03 刘海
D02
述圣
关系模式S(Sno , SN , SD , DEAN , Cno , G)在现实世 界中的体现的属性之间的依赖关系
• 一个系由若干学生,但一个学生只属于一个系(1-n) Sno -> SD
• 一个系只有一名主任 SD -> DEAN
• 每个学生学习一个课程,都有一个成绩G (Sno, Cno) -> G
27
范式关系图
1NF 2NF 3NF BCNF 4NF
第6节关系数据理论

CREATE TRIGGER I_OR_U BEFORE INSERT OR UPDATE ON TEACHER FOR EACH ROW AS BEGIN IF (NEW.Job=“教授”) AND (NEW.SAL <4000) THEN NEW.SAL:=4000 ENDIF END;
返回
17
[WHEN <触发条件>] <触发动作体>
触发事件可以是 INSERT,DELETE或 UPDATE。也可以是 这几个事件的组合
触发器被激活时,只有当条件为真时,触发动作体才执
行,否则不执行,如果省略WHEN触发条件,则触发动
作体在触发器激活后立即执行
返回
15
➢触发动作体既可以是一个PL/SQL过程块, 也可以是对已创建存储过程的调用。
返回
22
•下面首先回顾一下关系模型的形式化定义。 一个关系模式应当是一个五元组。 R(U, D, DOM, F) •关系名R; •一组属性U; •属性组U中属性所来自的域D; •属性到域的映射DOM; •属性组U上的一组数据依赖F。
由于D和DOM对模式设计关系不大,因此我们在本章中把关 系模式看作是一个三元组:R〈U,F〉
CONSTRAINT C4 CHECK (Ssex IN ('男', '女'));
5.6 触发器
数据库触发器:用户定义在关系表上的 一类靠事务驱动的特殊过程。一旦由某个用 户定义,任何用户对该数据的增、删、改操 作均由服务器自动激活相应的触发器,在 DBMS核心层进行集中的完整性控制。
返回
13
谁创建触发器?
删除元组 修改主码值
可能破坏参照完整性 可能破坏参照完整性
返回
17
[WHEN <触发条件>] <触发动作体>
触发事件可以是 INSERT,DELETE或 UPDATE。也可以是 这几个事件的组合
触发器被激活时,只有当条件为真时,触发动作体才执
行,否则不执行,如果省略WHEN触发条件,则触发动
作体在触发器激活后立即执行
返回
15
➢触发动作体既可以是一个PL/SQL过程块, 也可以是对已创建存储过程的调用。
返回
22
•下面首先回顾一下关系模型的形式化定义。 一个关系模式应当是一个五元组。 R(U, D, DOM, F) •关系名R; •一组属性U; •属性组U中属性所来自的域D; •属性到域的映射DOM; •属性组U上的一组数据依赖F。
由于D和DOM对模式设计关系不大,因此我们在本章中把关 系模式看作是一个三元组:R〈U,F〉
CONSTRAINT C4 CHECK (Ssex IN ('男', '女'));
5.6 触发器
数据库触发器:用户定义在关系表上的 一类靠事务驱动的特殊过程。一旦由某个用 户定义,任何用户对该数据的增、删、改操 作均由服务器自动激活相应的触发器,在 DBMS核心层进行集中的完整性控制。
返回
13
谁创建触发器?
删除元组 修改主码值
可能破坏参照完整性 可能破坏参照完整性
第6章关系数据理论PPT课件

6.1.3 为什么要讨论函数依赖?
有关系模式:
S-L-C(Sno,Sdept,SLOC,Cno,Grade)
Sno
Sname Ssex
Sdept
Sloc
Cno Grade
李勇
男
计算机系
2公寓
c01
90
李勇
男
计算机系
2公寓
c02
86
李勇
男
计算机系
2公寓
c06
NULL
刘晨
男
计算机系
2公寓
c02
78
刘晨
• 有以下依赖关系: Sno→Sname, Sno→Sdept, Sno→Sage
例2: SC(Sno, Cno, Grade) (Sno, Cno)→Grade
函数依赖定义
• 设有关系模式R(A1,A2,…,An),X和Y均为{A1,A2,…,An}的子 集,r是R的任一具体关系,t1、t2是r中的任意两个元组;
6.1.2 一些术语和符号
1. 如果X→Y,但Y不包含于X,则称 X→Y是非平凡的函数依赖。
2 . 如果X→Y,但Y包含于X,则称 X→Y是平凡的函数依赖。
若无特别声明,我们讨论的都是非平凡 的函数依赖。
术语和符号(续)
3. 如果X→Y,则X称为决定因子。 4. 如果X→Y,并且Y→X,则记作
X←→Y。
结论
• Student关系模式不是一个好的模式。 • “好”的模式:
• 不会发生插入异常、删除异常、更新异常, • 数据冗余应尽可能少。 • 原因:由存在于模式中的某些数据依赖引起 • 解决方法:通过分解关系模式来消除其中不 合适的数据依赖
6.2 关系规范化
数据库原理与应用第6章 关系数据理论-PPT精品课件
规范化理论目的: 讨论一个关系属性间不同的依赖情况(数据依赖)。 改造关系模式,通过分解关系模式来消除其中不合适 的数据依赖,以解决插入异常、删除异常、更新异常和 数据冗余问题。
两种重要的数据依赖: 函数依赖(Functional Dependency,FD) 多值依赖(Multivalued Dependency,MVD)
下成立
有关系实例均要满足的约束条件。
说明:
1. 所有关系实例均要满足 2. 语义范畴的概念 3. 数据库设计者可以对现实世界作强制的规定
需要指出的是:关系R中,如果属性组X是一个候选码或码,则属性组 Y一定函数依赖于X(这与候选码的定义一致)
术语和记号
X Y ,但 Y X ,则称 X Y 是非平凡的函数依赖
1) 元组的每个分量必须是不可分的数据项。 2) 数据库中的数据 冗余应尽可能少。 3) 关系数据库不能因为数据更新操作而引起数据不一致问题。 4) 当执行数据插入操作时,数据库中的数据不能产生插入异常现象 。 5) 数据库中的数据不能在执行删除操作时产生删除异常问题。
函数依赖 平凡函数依赖与非平凡函数依赖 完全函数依赖与部分函数依赖 传递函数依赖
问题的根源 1、关系规范化理论研究背景 2、数据依赖和键/码
关系模型建立在严格的数据 理论基础上,并可向别的数 据模型转换,因此常以关系 模型为背景来讨论这个问题
3、规范化(Normalization)理论(本章重点) 1NF、2NF、3NF、BCNF等范式
模式分解 关系模式规范化的必要性及方法途径
Sno
Cno
Grade
Sdept
Mname
该模式存在什么问题?怎么改善这个模式?
1. 数据冗余太大 2. 更新异常(Update Anomalies) 3. 插入异常(Insertion Anomalies) 4. 删除异常(Deletion Anomalies)
第6章 关系数据理论
如学生关系中,当学号确定后,其姓名也就唯一确定了。 选课关系中,当学号和课程号确定后,其成绩也就唯一确 定了。 1、函数依赖(Functional Dependency,缩写FD): 设 R(U)是属性集U上的关系模式,X、Y是U的子集。若 对于R中的任意关系 r,对于 r中的任意两个元组u、v都有 u[X]=v[X] u[Y]=v[Y] 成立,则称X函数决定Y,或称Y函数依赖于X,记作XY。 称X为决定因素。
某一关系模式R为第n范式,可简记 为R∈nNF。
§3
关系的范式
本节讨论下述问题: 如何根据关系模式属性间的数据依赖情况来判断它是否 具有某些不合适的性质? 如何将具有不合适性质的关系模式转换为更合适的形式 ? 一、规范化 1、范式(Normal Form) 按关系模式所具有的数据依赖性质对关系模式的分类 。也就是关系的规范化程度。 满足不同程度要求的为不同范式。 2、规范化 把一个低一级范式的关系模式通过模式分解转化为若 干个高一级的关系模式的过程。
f
U,则称U是全
例:关系模式 R(P,W,A) 注意: 一般来讲,全码是没有什 演奏者 作品 听众 (P,W,A)是R的全码。 么实际意义的。主键包含的 属性应尽可能少为好。
4、主属性和非主属性 主属性: 包含在任何一个候选码中的属性
非主属性:不包含在任何侯选码中的属性 例:SC(SNO,CNO,GRADE)中, (SNO,CNO)是码,故SNO,CNO是主属性 GRADE不包含在任何码中 ,故GRADE是非主属性。
工 资 职工 部门 …… 基本工资 奖金 号 借书人 所借书名 借书日期
张三
李四
B1 B2 B3 B2 B5
D1 D2 D3
D3
3、仅属于1NF的关系模式可能会产生的问题: 例:车间考核职工完成生产定额的关系模式:
某一关系模式R为第n范式,可简记 为R∈nNF。
§3
关系的范式
本节讨论下述问题: 如何根据关系模式属性间的数据依赖情况来判断它是否 具有某些不合适的性质? 如何将具有不合适性质的关系模式转换为更合适的形式 ? 一、规范化 1、范式(Normal Form) 按关系模式所具有的数据依赖性质对关系模式的分类 。也就是关系的规范化程度。 满足不同程度要求的为不同范式。 2、规范化 把一个低一级范式的关系模式通过模式分解转化为若 干个高一级的关系模式的过程。
f
U,则称U是全
例:关系模式 R(P,W,A) 注意: 一般来讲,全码是没有什 演奏者 作品 听众 (P,W,A)是R的全码。 么实际意义的。主键包含的 属性应尽可能少为好。
4、主属性和非主属性 主属性: 包含在任何一个候选码中的属性
非主属性:不包含在任何侯选码中的属性 例:SC(SNO,CNO,GRADE)中, (SNO,CNO)是码,故SNO,CNO是主属性 GRADE不包含在任何码中 ,故GRADE是非主属性。
工 资 职工 部门 …… 基本工资 奖金 号 借书人 所借书名 借书日期
张三
李四
B1 B2 B3 B2 B5
D1 D2 D3
D3
3、仅属于1NF的关系模式可能会产生的问题: 例:车间考核职工完成生产定额的关系模式:
第六章 关系数据理论
说明:
1. 函数依赖不是指关系模式R的某个或某些关系实例满足的约束 条件,而是指R的所有关系实例均要满足的约束条件。
2. 函数依赖是语义范畴的概念。只能根据数据的语义来确定函 数依赖。
例如 “姓名→年龄” 这个函数依赖只有在不允许有同名人的 条件下成立。
3. 现实世界中实体的很多属性间都有函数依赖关系,如 “学生 学号决定学生的姓名” ,即如果知道了学生的学号,就能确 定该学生的姓名。
例: 关系Student(Sno, Sname, Ssex, Sage, Sdept)假设不允许重名, 则有:Sno→Ssex, Sno→Sage, Sno→Sdept,
Sno→Sname, Sname→Sno,
Sname→Ssex, Sname→Sage, Sname→Sdept
7
6.2 规范化
注:① 码和外码一起提供了表示关系间联系的手段。 ② 给出多个候选码时,以 ", " 分隔不同的码;当一个码为
多个属性时,用括号括起来,属性间用 ", " 隔开。 如: 关系模式S(Sno, Sname, Sdept, Sage)的码为:Sno, Sname
关系模式SC(Sno, Cno, Grade)的码为:(Sno, Cno)
内涵:是对关系、属性、域的定义和说明,即关系模型的型 的定义。
一个完整的关系模型内涵的定义:
R ( U,D,dom(),F )
数据依赖 属性到域上的映射关系 关系的域 属性集 关系名
关系的内涵称为关系模式。它是静态的,不会随时间改变。
关系模式通常简记为:R (U,F) 或 R (U)。
3
6.1 关系模式设计引论
13
6.2 规范化
范式 (Normal Form)
1. 函数依赖不是指关系模式R的某个或某些关系实例满足的约束 条件,而是指R的所有关系实例均要满足的约束条件。
2. 函数依赖是语义范畴的概念。只能根据数据的语义来确定函 数依赖。
例如 “姓名→年龄” 这个函数依赖只有在不允许有同名人的 条件下成立。
3. 现实世界中实体的很多属性间都有函数依赖关系,如 “学生 学号决定学生的姓名” ,即如果知道了学生的学号,就能确 定该学生的姓名。
例: 关系Student(Sno, Sname, Ssex, Sage, Sdept)假设不允许重名, 则有:Sno→Ssex, Sno→Sage, Sno→Sdept,
Sno→Sname, Sname→Sno,
Sname→Ssex, Sname→Sage, Sname→Sdept
7
6.2 规范化
注:① 码和外码一起提供了表示关系间联系的手段。 ② 给出多个候选码时,以 ", " 分隔不同的码;当一个码为
多个属性时,用括号括起来,属性间用 ", " 隔开。 如: 关系模式S(Sno, Sname, Sdept, Sage)的码为:Sno, Sname
关系模式SC(Sno, Cno, Grade)的码为:(Sno, Cno)
内涵:是对关系、属性、域的定义和说明,即关系模型的型 的定义。
一个完整的关系模型内涵的定义:
R ( U,D,dom(),F )
数据依赖 属性到域上的映射关系 关系的域 属性集 关系名
关系的内涵称为关系模式。它是静态的,不会随时间改变。
关系模式通常简记为:R (U,F) 或 R (U)。
3
6.1 关系模式设计引论
13
6.2 规范化
范式 (Normal Form)
【教学课件】第六章 关系数据理论
第六章 关系数据理论2
2021/8/17
复习上节课内容
一. 关系模型概念回顾
▪ 关系、关系模型、关系数据库、定义
二. 关系模式中可能存在的异常(示例)
▪ 数据冗余、插入异常、删除异常、更新复杂
三. 关系模式中存在异常的原因
▪ 数据依赖(定义、分类)、函数依赖
四. 关系模式的规范化
▪ 函数依赖(平凡、非平凡、完全、部分、传递函数依赖)
故:模式sc为3NF,模式s-l依然为2NF;
2021/8/17
❖ 例2:判断2NF关系模式S(sno,sname)及SC(Sno,Cno ,Grade)是否满足3NF; 模式sc的函数依赖有:sno →sname 模式sc的函数依赖有:(sno,cno)→grade
故:模式s和sc皆为3NF;
2021/8/17
❖ 解决方法:
采用投影分解法,把S-L分解为两个关系模式,以消除传递函 数依赖:
S-L Sno
Sdept Sloc
Sno
Sdept
S-D
Sdept
Sloc
D-L
S-D(Sno, Sdept),D-L(Sdept,Sloc) 分解后的关系模式S-D与D-L中不再存在传递依赖 S-D(Sno,Sdept) ∈ 3NF,D-L(Sdept, Sloc)∈ 3NF
❖ 一个低一级范式的关系模式,通过模式分解(投影运算)可以 转化为若干个高一级范式的关系模式的集合,这个过程叫 做规范化;
❖ 用几个简单的关系去取代原来结构复杂的关系的过程叫做 关系规范化。规范化理论是围绕着范式建立的。
2021/8/17
关系规范化
❖ 目的: 使结构合理,使数据冗余尽量小,减少插入,删除和更 新异常;
2021/8/17
复习上节课内容
一. 关系模型概念回顾
▪ 关系、关系模型、关系数据库、定义
二. 关系模式中可能存在的异常(示例)
▪ 数据冗余、插入异常、删除异常、更新复杂
三. 关系模式中存在异常的原因
▪ 数据依赖(定义、分类)、函数依赖
四. 关系模式的规范化
▪ 函数依赖(平凡、非平凡、完全、部分、传递函数依赖)
故:模式sc为3NF,模式s-l依然为2NF;
2021/8/17
❖ 例2:判断2NF关系模式S(sno,sname)及SC(Sno,Cno ,Grade)是否满足3NF; 模式sc的函数依赖有:sno →sname 模式sc的函数依赖有:(sno,cno)→grade
故:模式s和sc皆为3NF;
2021/8/17
❖ 解决方法:
采用投影分解法,把S-L分解为两个关系模式,以消除传递函 数依赖:
S-L Sno
Sdept Sloc
Sno
Sdept
S-D
Sdept
Sloc
D-L
S-D(Sno, Sdept),D-L(Sdept,Sloc) 分解后的关系模式S-D与D-L中不再存在传递依赖 S-D(Sno,Sdept) ∈ 3NF,D-L(Sdept, Sloc)∈ 3NF
❖ 一个低一级范式的关系模式,通过模式分解(投影运算)可以 转化为若干个高一级范式的关系模式的集合,这个过程叫 做规范化;
❖ 用几个简单的关系去取代原来结构复杂的关系的过程叫做 关系规范化。规范化理论是围绕着范式建立的。
2021/8/17
关系规范化
❖ 目的: 使结构合理,使数据冗余尽量小,减少插入,删除和更 新异常;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用途
将判定X→Y是否能由 F 根据Armstrong公理导出的问题, 转化为求出XF+ 、判定Y是否为XF+的子集的问题。
数据依赖的公理系统(续)
[例1] 已知关系模式R<U,F>,其中 U = {A,B,C,D,E}; F = {AB→C,B→D,C→E,EC→B,AC→B}。 求(AB)F+ 。 解 : 设X(0)=AB; (1) X(1)= AB∪CD=ABCD。 (2) X(2)= X(1)∪E=ABCDE。 (3) X(2)= U,算法终止 (AB)F+ =ABCDE。 (AB为候选码)
(3) 删除操作复杂
(4) 修改操作复杂
规范化(续)
多值依赖的定义
定义:设R(U)是一个属性集U上的一个关系模式, X、 Y和Z是U的子
集,并且Z=U-X-Y。关系模式R(U)中多值依赖 X →→Y 成立,当
且仅当对R(U)的任一关系r,给定的一对(x,z)值,有一组Y的值 ,这组值仅仅决定于x值而与z值无关。
规范化(续)
平凡多值依赖和非平凡的多值依赖
若X→→Y,而Z=φ,则称 X→→Y 为平凡的多值依赖;
否则称 X→→Y为 非平凡的多值依赖。
多值依赖的性质
(1)多值依赖具有对称性 若X→→Y,则X→→Z,其中Z=U-X-Y (2)多值依赖具有传递性 若X→→Y,Y→→Z, 则X→→Z –Y (3)函数依赖是多值依赖的特殊情况 若X→Y,则X→→Y。 (4)若X→→Y,X→→Z,则X→→Y Z。 (5)若X→→Y,X→→Z,则X→→Y∩Z。 (6)若X→→Y,X→→Z,则X→→Y-Z,X→→Z -Y。
定义 如果一个关系模式R的所有属性都是不可分的基本数据 项,则R∈1NF。 分析:关系模式 sdc(Sno, Sname, dno, dmanager, cname, grade) ∈ 1NF
主码: (Sno, Cname)
(Sno, Cname) → dno
存在:非主属性(dno)对码(sno,cname)的部分函数依赖!
存在的问题:数据冗余、操作(增、删、改)异常。
问题的提出(续)
原因:由存在于模式中的某些数据依赖引起的。 解决方法:通过分解关系模式来消除其中不合适的数据依 赖。 如:将单一的关系模式分成3个关系模式:
S(Sno,Sname, dno,Sno → dno); S_C(Sno,Cname,Grade,(Sno,Cname) → Grade);
一个关系内部属性与属性乊间的约束关系; 现实世界属性间相互联系的抽象;
数据内在的性质;
语义的体现。
问题的提出(续)
数据依赖的类型
函数依赖
多值依赖
连接依赖
包含依赖
其他
问题的提出(续)
数据依赖对关系模式的影响
[例1] 创建关系模式sdc(Sno, Sname, dno, dmanager,cname,grade)。 单一的关系模式 : sdc(U, F), U: 属性集 F:函数依赖集 U ={ Sno, Sname, dno, dmanager, cname, grade } F ={ Sno → dno, Sno → Sname, dno → dmanager, (Sno, Cname) → grade } 分析:主码?
数据依赖的公理系统(续)
Armstrong公理系统
对于关系模式R <U,F >,有以下的推理规则: A1.自反律:若Y X U,则X →Y为F所蕴含。 A2.增广律:若X→Y为F所蕴含,且Z U,则XZ→YZ为F 所蕴含。
A3.传递律:若X→Y及Y→Z为F所蕴含,则X→Z为F所蕴
参考书B
普通物理学
光学原理 物理习题集
数学分析 微分方程
数学
计算数学 …
高等代数 数学分析 ... …
…
…
规范化(续)
用二维表表示Teaching 课程C
物理 物理 物理 物理 物理 物理 数学 数学 数学 数学 数学 数学 …
教员T
李勇 李勇 李勇 王军 王军 王军 李勇 李勇 李勇 张平 张平 张平 …
含。
数据依赖的公理系统(续)
导出规则
1. 根据A1,A2,A3这三条推理规则可以得到下面三条推理规则: 合并规则:由X→Y,X→Z,有X→YZ。 (A2, A3) 伪传递规则:由X→Y,WY→Z,有XW→Z。 (A2, A3) 分解规则:由X→Y及 ZY,有X→Z。 (A1, A3) 2. 根据合并规则和分解规则,可得:
等价于:每一个决定属性因素都包含码。 若R∈BCNF : 所有非主属性对每一个码都是完全函数依赖; 所有的主属性对每一个不包含它的码,也是完全函数依赖; 没有任何属性完全函数依赖于非码的任何一组属性。 R ∈BCNF
充分 不必要
R ∈3NF
规范化(续)
STJ∈3NF 没有任何非主属性对码传递依赖或部分依赖! STJ∈BCNF T是决定因素( T → J ),T不包含码。 解决方法:将STJ分解为二个关系模式:
引理1:X→A1 A2…Ak成立的充分必要条件是X→Ai成立(i=l,2,…,k) 。
数据依赖的公理系统(续)jsj
函数依赖闭包
定义2:在关系模式R<U,F>中为F所逻辑蕴含的函数依赖的全 体叫作 F的闭包,记为F+。 定义3:设F为属性集U上的一组函数依赖,X U, XF+ ={ A | X→A 能由F 根据Armstrong公理导出},XF+称为属 性集X关于函数依赖集F 的闭包。
范式
范式是符合某一种级别的关系模式的集合。 关系数据库中的关系必须满足一定的要求。满足不同程 度要求的为不同范式。 范式的种类:
第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、BC范式 (BCNF)、第四范式(4NF)等。
规范化(续)
第一范式(1NF)-- 关系模式的基本要求
参考书B
普通物理学 光学原理 物理习题集 普通物理学 光学原理 物理习题集 数学分析 微分方程 高等代数 数学分析 微分方程 高等代数 …
规范化(续)
Teaching∈BCNF Teaching具有唯一候选码(C,T,B), 即全码 Teaching模式中存在的问题: (1) 数据冗余度大 (2) 插入操作复杂 存在 多值依赖!
消除决定属性 集非码的非平 凡函数依赖
关系数据理论
三、数据依赖的公理系统
数据依赖的公理系统
逻辑蕴含
定义1:对于满足一组函数依赖 F 的关系模式R <U,F>,其任
何一个关系r,若函数依赖X→Y都成立, (即r中任意两元组t,s
,若 t[X] = s[X],则 t[Y] = s[Y] ),则称 F 逻辑蕴含X →Y。
规范化(续)
学生 S1 S1 S2 S3 教师 T1 T2 T3 T1 课程 J1 J2 J1 j1
存在异常!
S4 S2
S3 S4
T4 T5
T2 T5
j1 J2
j2 j2
主属性存在对 码的部分或传 递依赖!
规范化(续)
定义:关系模式R<U,F>∈1NF,若X→Y且Y X时X必含有码
,则R<U,F> ∈BCNF。
规范化(续)
第二范式(2NF)
定义 若R∈1NF,且每一个非主属性完全函数依赖于码,则 R∈2NF。 例:sdc(Sno,Sname,dno,dmanager,cname,grade) ∈2NF 分解后:sc(Sno, Cname, Grade) ∈ 2NF sd(Sno,sname, dno, dmanager) ∈ 2NF 问题:将一个1NF关系分解为多个2NF的关系,并不能完全消 除关系模式中的各种异常情况和数据冗余。 (对 sd 关系模式进行分析!)
应设法消除关系模式中非主属性对码的传递函数依赖。
规范化(续)
第三范式3NF
定义 关系模式R<U,F> 中若不存在这样的码X、属性组Y及非 主属性Z(Z Y), 使得X→Y,Y→Z成立,Y → X,则称R<U, F> ∈ 3NF。 若R∈3NF,则每一个非主属性既不部分依赖于码也不传 递依赖于码。 上例中,SD ∈ 3NF
关系数据理论
二、规范化
规范化
规范化理论是用来改造关系模式,通过分解关系模式来
消除其中不合适的数据依赖,以解决插入异常、删除异常、 更新异常和数据冗余问题。
规范化(续)
函数依赖
定义6.1 设R(U)是一个属性集U上的关系模式,X和Y是U的子集。 若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上 的属性值相等,而在Y上的属性值不等, 则称 “X函数确定Y” 或
数据依赖的公理系统(续)
Armstrong公理系统是有效的、完备的
有效性:由F出发根据Armstrong公理推导出来的每 一个函数依赖一定在F+中;
完备性:F+中的每一个函数依赖,必定可以由F出发 根据Armstrong公理推导出来。
数据依赖的公理系统(续)
引理2
设F为属性集U上的一组函数依赖,X,Y U,X→Y能由F 根据Armstrong公理导出的充分必要条件是Y XF+。
D(dno,dmanager,dno→dmanager);
问题的提出(续)
※ 一个关系模式属性组成的依据是什么?
※ 同一个关系模式的属性乊间有什么联系?
※ 属性的组合与数据冗余和更新异常有什么联系?
※ 构造一个“好”的关系模式应考虑哪些原则? ※ 如何将一个“不太好”的关系模式转化成“较好”的关系 模式?
关系模式STJ( S, T, J ),S表示学生,T表示教师,J表示课程。