第5章关系数据库规范化理论

合集下载

数据库原理与应用：第5章关系数据库规范化理论

∪
定义在R（U）中，如果 X→Y，Y→Z，其中 Y X，Y→X，则称Z对 X传递函数依赖，记作：X T Z。
【例】关系模式R（学号，姓名，出生年月，系编号，系负责人）
在此关系模式中有如下函数依赖：学号→系编号系编号→系负责人系编号→学号
（相当于X→Y）（相当于Y→Z）（相当于Y→X）
下面通过例子对这些问题进行分析：
[例1] 要求设计教学管理数据库，其关系模式，SCD如下： SCD（SNO，SN，AGE，DEPT，MN，CNO，SCORE）
ቤተ መጻሕፍቲ ባይዱ
其中
SNO 表示学生学号， AGE 表示学生年龄， MN 表示系主任姓名， SCORE 表示成绩。
SN 表示学生姓名， DEPT 表示学生所在系别， CNO 表示课程号，
按照一定的规范设计的关系模式，将结构复杂的关系分解成结构简单的关系，从而把不好的关系数据库模式转变成为好的关系数据库模式，这就是关系的规范化。
规范化又可以根据不同的要求而分成若干级别。
我们要设计的关系模式中的各属性是相互依赖、相互制约的，这样才构成了一个结构严谨的整体。
在设计关系模式的时候，必须从语义上分析这些依赖关系。数据库模式的好坏和关系中各属性间的依赖关系有关。因此，我们先讨论关系规范化理论。
上一页本节首页本章首页
当新插入一个系时，只要在关系D中添加一个记录就可以了；当某个学生尚未选课时，只要在关系 S中添加一条学生记录就可以了，而与选课关系无关，这就避免了插入异常。
当一个系的学生全部毕业时，只需在 S中该系的全部学生记录，而关系D 中有关该系的信息仍然保留，从而不会引起异常删除。
根据实际情况，这些数据有以下语义规定：
（1）（2）

关系数据库的规范化理论与数据库设计

关系数据库的规范化理论与数据库设计在当今数字化的时代，数据成为了企业和组织的重要资产，而关系数据库作为存储和管理数据的重要手段，其设计的合理性直接影响着数据的质量、完整性和可用性。

关系数据库的规范化理论是指导数据库设计的重要原则，它能够帮助我们避免数据冗余、更新异常等问题，从而提高数据库的性能和可靠性。

首先，我们来了解一下关系数据库的基本概念。

关系数据库是由一组二维表组成的，每张表都有一个唯一的表名，表中的每一行称为一个元组，代表一个实体；每一列称为一个属性，代表实体的一个特征。

通过在不同的表之间建立关联，我们可以实现数据的查询和操作。

那么，什么是规范化理论呢？规范化理论是一种用于设计关系数据库的方法和原则，其目的是通过对关系模式进行分解和优化，消除数据冗余和更新异常，确保数据的一致性和完整性。

规范化理论主要包括第一范式（1NF）、第二范式（2NF）、第三范式（3NF）等。

第一范式要求表中的每个属性都是不可再分的原子值。

例如，如果有一个“联系人信息”表，其中包含“地址”这个属性，如果地址又分为“省”“市”“区”“详细地址”等子属性，那么就不满足第一范式，需要将其拆分成多个属性。

第二范式要求在满足第一范式的基础上，每个非主属性都完全依赖于主键。

举个例子，如果有一个“订单”表，主键是“订单号”，而“客户姓名”和“客户地址”等非主属性只依赖于“客户编号”，而不是“订单号”，那么就不满足第二范式，需要将其拆分成两个表，一个是“订单”表，一个是“客户”表。

第三范式要求在满足第二范式的基础上，每个非主属性都不传递依赖于主键。

比如说，有一个“员工”表，主键是“员工编号”，“部门名称”依赖于“部门编号”，而“部门编号”又依赖于“员工编号”，这就不满足第三范式，需要将“部门名称”这个属性移到“部门”表中。

规范化理论在数据库设计中具有重要的意义。

通过规范化设计，可以减少数据冗余，节省存储空间。

想象一下，如果一个客户的信息在多个表中重复存储，不仅浪费空间，而且当客户信息发生变化时，需要在多个地方进行更新，容易导致数据不一致。

关系数据库规范化理论

数据一致性
规范化可以消除数据冗余，确保每个数据只在数据库中存储一次，从而提高数据的一致性。
第一范式 (1NF)
表结构
第一范式要求每个数据表都应具有原子性，即每个表中的列不能再进一步分解。
主键
每个表必须具有一个唯一标识记录的主键，用于保证数据的唯一性和关联性。
第二范式 (2NF)
1 函数依赖
数据表中出现函数依赖时，就需要进行第二范式的规范化。避免冗余数据。
关系数据库规范化理论
规范化是设计关系数据库中的一项重要理论，它能使数据存储结构更加合理、高效。通过划分数据表，规范化能够消除数据冗余、提高数据一致性和查询性能。
规范化定义
目的明确
规范化通过一定的规则将一个大的数据表拆分成多个小的数据表，以实现数据的高内聚和低耦合。
数据准确性
规范化能确保数据的准确性，因为数据被划分为更小的范围，每个数据表只存储特定类型的数据。
3 学生管理系统
拆分学生、课程、成绩等信息，确保学生信息的一致性和教务管理的高效性。
规范化的局限性及未来研究方向
局限性
规范化可能导致表结构复杂，加重查询和维护的工作量。某些情况下，冗余数据可能是必要的。
未Hale Waihona Puke 研究方向未来的研究可以探索如何在规范化的基础上平衡数据一致性和查询性能，以及结合其他技术实现更灵活的数据存储。
优点数据一致性提高数据冗余减少数据更新更容易
缺点可能会导致过度分解数据表，增加查询复杂性可能引起频繁的表连接操作，影响查询性能增加了设计和维护的复杂性
规范化的应用举例
1 在线购物系统
将用户、订单、商品等信息拆分为多个表，确保数据的一致性和查询效率。

第5章-关系数据库规范化理论-复习题

（客房号，床位号收）费标准
对于某个床位在某个时间是由特定的住客入住的：（客 ,床房 ,位住号号宿（日住期 ,客预） ,身付退份款房证日
根据上述函数依赖，可以求得关系模式的候选键为：（客房号，床位号，住宿日期）
2021/5/23
7
关系模式收费中：主属性：客房号，床位号，住宿日期非主属性：住客身份证号，住客姓名，性别，地址，收费标准，退房日期，预付款。根据关系模式存在的函数依赖有非主属性收费标准为候选键部分依赖关系，所以关系模式最高直达到第一范式。如何将关系模式进行分解使其达到第二范式。收费标准（客房号，床位号，收费标准）住宿（客房号，床位号，住宿日期，住客身份证，住客姓名，性别，地址，退房日期）
解：关系R存在的函数依赖有
（商店编号，商）品编部号门编号
（商店编号，部）门编负号责人
（商店编号，商）品编数号量
2021/5/23
4
利用函数依赖求候选键： L类属性：商店编号，商品编号；LR类：部门编号；R类：负责人数量。而且（商店编号，商品编号）＋＝U，所以关系模式R的候选键为（商店编号，商品编号）。判断R属于第几范式：非主属性为：部门编号，负责人，数量。它们对候选键都是完全函数依赖关系，所以R是满足第二范式的。但是，
2021/5/23
3
3、假设某商业集团数据库有一关系模式R如下： R（商店编号，商品编号，数量，部门编号，负责人）
现规定：1、每个商店的每种商品只在一个部门销售。 2、每个商店的每个部门只有一个负责人。 3、每个商店的每种商品只有一个库存数量。
回答下列问题：1、写出R的基本函数依赖 2、找出关系模式R的候选键 3、关系模式R最高达到第几范式？为什么

数据库原理第五章关系数据库的规范化设计

在以上三个关系模式中，实现了信息的某种程度的分离： T中存储教师基本信息，与所选课程及系主任无关； D中存储系的有关信息，与教师无关； TC中存储教师讲授课程的信息，而与教师及系的信息无关。
12
模式分解是关系规范化的主要方法(二)
与TDC相比，分解为三个关系模式后，数据的冗余度明显降低。当新插入一个系时，只要在关系D中添加一条记录。当某个教师尚未讲课，只要在关系T中添加一条教师记录，而与TC授课关系无关，这就避免了插入异常。当某个系的教师不再讲课时，只需在TC中删除该教师的全部授课记录，而关系D中有关该系的信息仍然保留，从而不会引起删除异常。同时，由于数据冗余度的降低，数据没有重复存储，也不会引起更新异常。
24
2.2 完全函数依赖和部分函数依赖
例如：学生成绩表中
姓名王一王二王三王一
学号 1 2 3 4
年龄 16 15 16 16
籍贯河北山东北京天津
姓名不能推出年龄，学号也不能推出年龄，但是姓名 + 学号能推出年龄，故完全依赖；
学号能直接推出籍贯，故是部分依赖
25
2.3 传递函数依赖
当关系中的元组增加、删除或更新后都不能被破坏这种函数依赖。因此，必须根据语义来确定属性之间的函数依赖，而不能单凭某一时刻关系中的实际数据值来判断。
20
函数依赖的定义和性质（六）
函数依赖可以保证关系分解的无损连接性
设R(X,Y,Z)，X,Y,Z为不相交的属性集合，如果X Y或X Z，则有R(X,Y,Z)=R[X,Y]*R[X,Z]，其中，R[X,Y]表示关系R在属性(X,Y)上的投影，即 R等于其投影在X上的自然连接，这样便保证了关系R分解后不会丢失原有的信息，称为关系分解的无损连接性

关系数据库设计理论

五、FD的推理规则
从已知的FD集推导未知的FD，可以使用的推导规则（Armstrong）设有关系模式R（U），X、Y、Z是U的子集： A1(自反性)：如果 Y X ，则有 XY 在R上成立。 A2(增广性)：如果 XY 在R上成立，那么有 XZYZ A3(传递性)：如果 XY和 YZ在R上成立，则有 XZ
S# -> SNAME C# -> TNAME (S#,C#) ->GRADE
三、属性间的联系和函数依赖属性间的联系有三种，但并不是每一种关系中都存在函数依赖，设有属性集X、Y属于关系模式R，
如果X和Y之间是‘1－1’关系，则存在函数依赖：
X YY, X
如果X和Y之间是‘1－M’关系，则存在函数依赖：
第五章关系数据库设计理论
5.1 问题的提出－什么是不好的数据库设计
实际问题，假定在设计数据库时出现如下的关系模式： Student(Sno, Sname, Dept，Cno, Grade) 学生（学号，姓名，院系，课程号，成绩）
Sno Sname Dept Cno Grade
1000 李平计算机 001
FD的分类： 1、对于FD：XY ，如果 Y X ，则称为“平凡的FD” 2、对于FD：XY ，如果 YX ，则称为“非平凡的FD” 3、对于FD：XY ，如果 YXφ则为“完全非平凡的FD”
Armstrong的推论： 1、合并规则：由 XYX,Z可以得 YZ 到X 2、分解规则：由 XYZ可以得 YX, 到 ZX 3、伪传递规则：由 XYY,WZ则得到 Z XW
86
1000 李平计算机 002
97
1000 李平计算机 003
83
1001 王莉计算机 001

关系数据库规范化理论

第4章关系数据库规范化理论数据库设计的一个最基本的问题是怎样建立一个合理的数据库模式，使数据库系统无论是在数据存储方面，还是在数据操作方面都具有较好的性能。

什么样的模型是合理的模型，什么样的模型是不合理的模型，应该通过什么标准去鉴别和采取什么方法来改进，这是在进行数据库设计之前必须明确的问题。

为使数据库设计合理可靠、简单实用，长期以来，形成了关系数据库设计理论，即规范化理论。

它是根据现实世界存在的数据依赖而进行的关系模式的规范化处理，从而得到一个合理的数据库设计效果。

本章首先说明关系规范化的作用，接着引入函数依赖和范式等基本概念，然后介绍关系模式等价性判定和模式分解的方法，最后简要介绍两种数据依赖的概念。

4.1 关系规范化的作用4.1.1问题的提出从前面的有关章节可知，关系是一张二维表，它是涉及属性的笛卡尔积的一个子集。

从笛卡尔积中选取哪些元组构成该关系，通常是由现实世界赋予该关系的元组语义来确定的。

元组语义实质上是一个n目谓词（n是属性集中属性的个数）。

使该n目谓词为真的笛卡尔积中的元素（或者说凡符合元组语义的元素）的全体就构成了该关系。

但由上述关系所组成的数据库还存在某些问题。

为了说明的方便，我们先看一个实例。

【例4.1】设有一个关于教学管理的关系模式R(U)，其中U由属性Sno、Sname、Ssex、Dname、Cname、Tname、Grade组成的属性集合，其中Sno的含义为学生学号，Sname为学生姓名，Ssex为学生性别，Dname为学生所在系别，Cname为学生所选的课程名称，Tname 为任课教师姓名，Grade为学生选修该门课程的成绩。

若将这些信息设计成一个关系，则关系模式为：教学（Sno，Sname，Ssex，Dname，Cname，Tname，Grade）选定此关系的主键为（Sno,Cname）。

由该关系的部分数据（如表4-1所示），我们不难看出，该关系存在着如下问题：1. 数据冗余（Data Redundancy）●每一个系名对该系的学生人数乘以每个学生选修的课程门数重复存储。

关系数据库规范化理论

第四章关系数据库规范化理论一个关系数据库模式由一组关系模式组成，一个关系模式由一组属性名组成。

关系数据库设计，就是如何把已给定的相互关联的一组属性名分组，并把每一组属性名组成关系的问题。

然而，属性的分组不是唯一的，不同的分组对应着不同的数据库应用系统，它们的效率往往相差很远。

为了使数据库设计合理可靠，简单实用，长期以来，形成了关系数据库设计的理论——规范化理论。

4.1 关系规范化的作用规范化，就是用形式更为简洁，结构更加规范的关系模式取代原有关系模式的过程。

如果将两个或两个以上实体的数据存放在一个表里，就会出现下列三个问题：数据冗余度大插入异常删除异常所谓数据冗余，就是相同数据在数据库中多次重复存放的现象。

数据冗余不仅会浪费存储空间，而且可能造成数据的不一致性。

插入异常是指，当在不规范的数据表中插入数据时，由于实体完整性约束要求主码不能为空的限制，而使有用数据无法插入的情况。

删除异常是指，当不规范的数据表中某条需要删除的元组中包含有一部分有用数据时，就会出现删除困难。

（以P98工资表为例）解决上述三个问题的方法，就是将不规范的关系分解成为多个关系，使得每个关系中只包含一个实体的数据。

（讲例子解）当然，改进后的关系模式也存在另一问题，当查询职工工资时需要将两个关系连接后方能查询，而关系连接的代价也是很大的。

那么，什么样的关系需要分解？分解关系模式的理论依据又是什么？分解完后能否完全消除上述三个问题？回答这些问题需要理论指导。

下面，将加以讨论：4.2 函数依赖实体间的联系有两类：一类是实体与实体之间联系；另一类是实体内部各属性间的联系。

数据库建模一章中讨论的是前一类，在这里我们将学习第二类。

和第一类一样，实体内部各属性间的联系也分为1:1、1:n和m:n三类：例：职工（职工号，姓名，身份证号码，职称，部门）1、一对一关系（1:1）设X、Y是关系R的两个属性（集）。

如果对于X中的任一具体值，Y中至多有一个值与之对应，反之，对于Y中的任一具体值，X中也至多有一个值与之对应，则称X、Y两属性间是一对一关系。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第5章关系数据库规范化理论
1. 理解并给出下列术语的定义：函数依赖、部分函数依赖、完全函数依赖、传
递依赖、超键、候选键、主键、外键、全键、1NF、2NF、3NF、BCNF、多值依赖、4NF、连接依赖、5NF。

2. 设关系模式R有n个属性，在模式R上可能成立的函数依赖有多少个？其中
平凡的函数依赖有多少个？非平凡函数依赖有多少个？
3. 设有关系模式R(ABCD)，F是R上成立的函数依赖之集，F={AB→CD，A→D}。

(1) 说明R不是2NF模式的理由。

(2) 将R分解成2NF模式集。

4. 设有关系模式R(ABC)，F是R上成立的函数依赖之集，F={C→B，B→A}。

(1) 说明R不是3NF模式的理由。

(2) 将R分解成3NF模式集。

5. 设有关系模式：
R(职工名，项目名，工资，部门名，部门经理)。

如果规定每个职工可参加多个项目，各领一份工资；每个项目只属于一个部门管理；每个部门只有一名经理。

(1) 写出关系模式R的函数依赖集合与关键码。

(2) 说明R不是2NF模式的理由，并把R分解成2NF模式集。

(3) 进而把R分解为3NF模式集，并说明理由。

6．现在要建立关于系、学生、班级、学会诸信息的一个关系数据库。

语义为：一个系有若干专业，每个专业每年只招一个班，每个班有若干学生，一个系的学生住在同一个宿舍区，每个学生可参加若干学会，每个学会有若干学生。

描述学生的属性有：学号、姓名、出生日期、系名、班号、宿舍区；
描述班级的属性有：班号、专业名、系名、人数、入校年份；
描述系的属性有：系名、系号、系办地点、人数；
描述学会的属性有：学会名、成立年份、地点、人数、学生参加某回有一个入会年份。

1）请写出关系模式。

2）写出每个关系模式的最小函数依赖集，指出是否存在传递依赖。

在函数依赖左部是多属性的情况下，讨论函数依赖是完全依赖，还是部分函数依赖。

3）指出各个关系模式的侯选关键字、外部关键字，以及有没有全关键字.
7．设关系模式R(A,B,C,D,E,F),函数依赖集F={A→C,C→A,B→AC,D→AC,BD→A}.
1)求出R的侯选码。

2）求出F的最小函数依赖集。

3）将R分解为3NF,使其既具有无损连接性又具有函数依赖保持性。

8．设关系模式R〈A，B，C，D，E，F〉，函数依赖集F=｛AB→E，AC→F，AD→B，B→C，C→D｝。

1）证明AB、AC、AD均是候选关键字。

2）证明主属性C部分依赖于关键字AB，传递依赖于AD。

同时证明主属性D 部分依赖于关键字AC，传递依赖于关键字AB。

9．设关系模式R〈A，B，C，D，E，F〉，函数依赖集F=｛AB→E，BC→D，BE→C，CD→B，CE→AF，CF→BD，C→A，D→EF｝，求F的最小函数依赖集。

10．判断下面的关系模式是不是BCNF，为什么？
1）任何一个二元关系。

2）关系模式选课（学号，课程号，成绩），函数依赖集F=｛（学号，课程号）→成绩｝。

3）关系模式R（A，B，C，D，E，F），函数依赖集F=｛A→B，C→F，E→A，CE→A｝，将R分解为p=｛ABE，CDEF｝。

判断p是否是无损连接。

11．设关系模式R{B，O，I，S，Q，D}，函数依赖集F={S→D，I→S，IS→Q，B →Q}。

1）找出R的主码。

2）把R分解为BCNF，且具有无损连接性。

12．设有关系模式R（A，B，C），数据依赖集F={AB→C，C→→A}，R属于第几范式？为什么？
13．设有关系模式R（A，B，C，D），数据依赖集F={A→B，B→A，AC→D，BC →D，
AD→C，BD→C，A→→CD，B→→CD}。

1）求R的主码。

2）R是否为第四范式？为什么？
3）R是不是BCNF？为什么？
4）R是不是3NF？为什么？
14．下述结论中哪些是正确的？哪些是不正确的？正确的就说明理由，不正确的请举出反例。

(1) 任何一个二元关系模式都属于3NF模式。

(2) 任何一个二元关系模式都属于BCNF模式。

(3) 任何一个二元关系模式都属于4NF模式。

(4) 任何一个二元关系模式都属于5NF模式。

(5) 在R(ABC)中，如果有A→B和B→C，则就有A→C。

(6) 在R(ABC)中，如果有A→B和A→C，则就有A→BC。

(7) 在R(ABC)中，如果有B→A和C→A，则就有BC→A。

(8) 在R(ABC)中，如果有BC→A，则有B→A和C→A。

第5章 关系数据库规范化理论

数据库原理与应用：第5章 关系数据库规范化理论

关系数据库的规范化理论与数据库设计

关系数据库规范化理论

第5章-关系数据库规范化理论-复习题

数据库原理第五章关系数据库的规范化设计

关系数据库设计理论

关系数据库规范化理论

关系数据库规范化理论

第5章关系数据库规范化理论

数据库原理与应用：第5章关系数据库规范化理论