五、规范化理论

合集下载

规范化理论

规范化理论规范化理论是指在数据预处理过程中通过一系列操作使数据达到一定的标准或要求的一种方法。

它在数据挖掘和机器学习中起到了重要的作用，可以解决数据不一致、错误、缺失等问题，并提高模型的准确性和稳定性。

规范化理论的核心思想是将不同范围的数值映射到统一的范围内，以便进行比较和处理。

它可以分为线性规范化和非线性规范化两种形式。

线性规范化是将原始数据缩放到[0,1]或[-1,1]之间的过程。

最常见的线性规范化方法是最小-最大规范化，即将原始数据减去最小值，再除以最大值与最小值的差。

这样可以保证数据的最小值被映射到0，最大值被映射到1，而中间的值则按照比例进行映射。

线性规范化的优点是简单易实现，可以有效地消除数据的最大最小值对模型的影响，但也存在着一定的局限性，对离群值比较敏感。

非线性规范化是将原始数据映射到非线性的范围内，以提高数据的可辨识性。

常见的非线性规范化方法有对数、指数和正态分布等。

例如，对数规范化可以将数据映射到对数尺度上，使数据的分布更加接近正态分布，适用于偏态分布数据的规范化处理。

非线性规范化可以更好地保持数据的相对关系，但也增加了规范化的复杂性。

规范化理论不仅可以用于数值型数据的规范化处理，也适用于类别型数据的规范化。

对于类别型数据，可以使用独热编码等方法将其转换成数值型数据，再进行规范化处理。

在实际应用中，规范化理论被广泛应用于数据挖掘、机器学习和统计分析等领域。

它可以提高数据的可读性和可解释性，减少模型的误差和不确定性，提高模型的鲁棒性和泛化能力。

同时，规范化也有助于数据的可视化和分析，提供更多的信息和见解。

总之，规范化理论是数据预处理中一种重要的方法，通过统一数据的尺度和范围，可以提高模型的性能和效果。

在实际应用中，需要根据具体的问题和数据特点选择适当的规范化方法，并对规范化的效果进行评估和调优。

浅析规范化理论在数据库设计中的重要作用

浅析规范化理论在数据库设计中的重要作用作者：梅红来源：《数字技术与应用》2019年第10期摘要：在数据库设计的过程中规范化理论是最为重要的部分，直接影响关系模式的设计与数据库设计的成功与否。

基于此，为了保证研究效率，要重视结合数据库设计实际，有效的分析规范化理论，保障数据库设计符合系统应用需求，深入研究规范化理论在数据设计中的应用，以及规范化理论的重要作用是非常必要的。

关键词：规范化理论;数据库设计;重要作用中图分类号：TP311.13 文献标识码：A 文章编号：1007-9416（2019）10-0217-020 引言进行数据库设计需要从多个方面入手，包括需求分析、逻辑设计、概念设计等等。

在进行概念设计的过程中，设计者要从多个角度入手，对实体以及相关属性进行抽取，这样才能够审计出不同的E-R图，再将E-R图进行数据表转换。

在这个过程中，规范化理论的作用就凸显出来，规范化理论是未然范式建立的，是研究不合理的关系模式转化为合理的关系模式的理论，同时也与数据库设计紧密相关。

下面通过实践，有效的对其进行深入探索。

1 关系数据库规范化为了保障每个环节设计的顺利进行，需要对不同关系进行研究与定义，关系数据库规范化理论对“设计不合理的关系模式”向“合理的关系模式”转化进行研究，其具体的思路，以合理分解关系为基础，有效的消除相关数据依赖，从而解决数据冗余，从实际分析，其中的每一个关系都是在一定的制约条件下存在的，这种存在方式被称之为范式。

较低范式关系可以通过转换，成为多个较高级的范式关系的集合，这种转换是通过无损分解实现的，这个转换的过程就是关系规范化。

2 关系模式规范化的重要性关系模式是研究的重点，也是数据库设计过程重要研究内容。

在应用的过程中，如果遇到关系规范化的问题，应该结合实际案例，开展实践设计，以提高数据库设计效率。

如：有一个企业员工管理数据库，其中包括使用者（老板、员工等）的工作号、姓名、性别、工作科室、工作范围、考核成绩等，根据这些信息，要设计有效的系统关系模式，并结合关系模式，确定使用者的相关信息（工作号、姓名、性别、工作科室、工作范围、考核成绩）。

《数据库原理及应用》试题1 (2)

二、填空（每空1分，共20分）1.关系模型和网状模型的数据结构分别是_____________和_____________。

（难度系数B）正确答案：二维表有向图2.数据模型是由______________、____________、和____________三部分组成的。

（难度系数C）正确答案：数据结构数据操作完整性约束3.关系数据语言可以分为三类：_____________、_____________和关系演算语言。

（难度系数C）正确答案：SQL语言关系代数语言4.删除基本表用______________语句，删除基本表的元组用_____________语句（难度系数B）正确答案：ALTER UPDATE5.规范化数据库设计分为以下六个设计阶段：需求分析阶段、_____________、_____________、___________、数据库实施阶段、数据库运行和维护阶段。

（难度系数B）正确答案：概念结构设计逻辑结构设计物理结构设计阶段6.事务的特性有：_____________、原子性、_____________和持久性。

（难度系数C）正确答案：一致性隔离性7. 当对视图进行UPDATE、INSERT和DELETE操作时，为了保证被操作的行满足视图定义中子查询语句的谓词条件，应在视图定义语句中使用可选择项________________________________。

（难度系数A）正确答案：WITH CHECK OPTION8. SQL中，表有三种： ____________、临时表(虚表)和____________。

（难度系数B）正确答案：视图、基本表9.在关系数据库规范化理论的研究中，在函数依赖的范畴内，___________范式达到了最高的规范化程度。

（难度系数B）正确答案：BC范式10.在关系数据库的规范化理论中，在执行“分解”时，必须遵守规范化原则：保持原有的函数依赖和________________________。

关系规范化理论

化定义来证明一个函数依赖是否成立。例如，对于关系模式S，当不存在重名的情况下，可以得到：

SN→AGE SN→DEPT
这种函数依赖关系，必须是在没有重名的条件下成立，否则
不成立。所以函数依赖反映了一种语义完整性约束。
返回
16
3．函数依赖与属性之间的联系类型有关。
（ 1 ）在一个关系模式中，如果属性 X 与 Y 有1:1 联系时，则存
根据实际情况，这些数据有如下语义规定：
1. 一个系有若干个学生，但一个学生只属于一个系； 2. 一个系只有一名系主任，但一个系主任可以同时兼几个系
的系主任； 3. 一个学生可以选修多门功课，每门课程可有若干学生选修； 4. 每个学生学习每门课程有一个成绩。

SCD关系模式的实例
如图4.1所示。返回
返回
13
4.2 函数依赖
4.2.1 函数依赖的定义及性质

关系模式中的各属性之间相互依赖、相互制约的联系称为数据依赖。数据依赖一般分为函数依赖、多值依赖和连接依赖。其中,函数依赖是最重要的数据依赖。
返回
14
4.2.1.1 函数依赖的定义
定义4.1 设关系模式 R(U，F) ，U是属性全集，F是 U上的函数依赖集，X和Y是U的子集，如果对于R(U)的任意一个可能的关系r，对于X的每一个具体值，Y都有唯一的具体值与之对应，则称X决定函数Y，或Y函数依赖于X，记作X→Y。我们称X为决定因素，Y为依赖因素。当Y不函数依赖于X时，记作： X Y。当X→Y且Y→X时，则记作： X Y。对于关系模式SCD
19
4.2.1.2 函数依赖的基本性质
1．投影性。

数据库5版第七章规范化理论例题解答

关系数据库规范化理论例题解答⊄（⊆⊂∈∉）例：证明定理 Armstrong公理是正确的，即如果F成立，则由F根据Armstrong公理所推导的函数依赖总是成立的。

设有R(U，F)，X、Y、Z均是U的子集，F是R的函数依赖集，推理规则如下：A1：自反律(reflexivity)如果Y ⊆X ⊆U，则X→Y为F所蕴涵。

A2：增广律(augmentation)如果X→Y为F所蕴涵，且Z⊆U，则XZ→YZ为F的所蕴涵。

(XZ代表X∪Z)A3：传递律(transitivity)如果X→Y和Y→Z为F所蕴涵，则X→Z为F的蕴涵。

证：设t1,t2是关系R中的任意两个元组。

A1：如果t1［X］=t2［X］,则因Y X，有t1［Y］=t2［Y］，故X→Y成立。

A2：如果t1［XZ］=t2［XZ］,则有t1［X］=t2［X］,t1［Z］=t2［Z］。

已知X→Y成立，因此可得t1［Y］=t2［Y］,由上可知t1［YZ］=t2［YZ］，故XZ→YZ成立。

A3：如果t1［X］=t2［X］,则t1［Y］=t2［Y］；如果t1［Y］=t2［Y］,则t1［Z］=t2［Z］由上可得，如果t1［X］=t2［X］,则t1［Z］=t2［Z］，故X→Z成立。

例：证明定理根据三条推理规则得到下面三条推理规则是正确的。

(1) 合并规则由X→Y，X→Z，有X→YZ。

(2) 伪传递规则由X→Y，WY→Z，有XW→Z。

(3) 分解规则如果X→Y，且Z ⊆ Y，则X→Z成立。

证： (1) 如果X→Y，则X→XY (A2)如果X→Z，则XY→YZ (A2)由上可得X→YZ (A3)(2) 如果X→Y，则WX→WY (A2)WY→Z （已知条件）故得WX→Z (A3)(3) 如果Z⊆Y，则Y→Z (A1)X→Y （已知条件）故得X→Z （A3）例：证明定理 X→Y能由Armstrong公理推导出的充要条件是Y⊆X + F证：设Y=｛A1,A2,…,Ak｝，先证充分性：假定Y ⊆X +F，则根据X+F的定义，X→Ai(i=1,2,…,k)可由Armstrong公理导出，根据合并规则则有X→Y。

第5章-关系数据库规范化理论-复习题

（客房号，床位号收）费标准
对于某个床位在某个时间是由特定的住客入住的：（客 ,床房 ,位住号号宿（日住期 ,客预） ,身付退份款房证日
根据上述函数依赖，可以求得关系模式的候选键为：（客房号，床位号，住宿日期）
2021/5/23
7
关系模式收费中：主属性：客房号，床位号，住宿日期非主属性：住客身份证号，住客姓名，性别，地址，收费标准，退房日期，预付款。根据关系模式存在的函数依赖有非主属性收费标准为候选键部分依赖关系，所以关系模式最高直达到第一范式。如何将关系模式进行分解使其达到第二范式。收费标准（客房号，床位号，收费标准）住宿（客房号，床位号，住宿日期，住客身份证，住客姓名，性别，地址，退房日期）
解：关系R存在的函数依赖有
（商店编号，商）品编部号门编号
（商店编号，部）门编负号责人
（商店编号，商）品编数号量
2021/5/23
4
利用函数依赖求候选键： L类属性：商店编号，商品编号；LR类：部门编号；R类：负责人数量。而且（商店编号，商品编号）＋＝U，所以关系模式R的候选键为（商店编号，商品编号）。判断R属于第几范式：非主属性为：部门编号，负责人，数量。它们对候选键都是完全函数依赖关系，所以R是满足第二范式的。但是，
2021/5/23
3
3、假设某商业集团数据库有一关系模式R如下： R（商店编号，商品编号，数量，部门编号，负责人）
现规定：1、每个商店的每种商品只在一个部门销售。 2、每个商店的每个部门只有一个负责人。 3、每个商店的每种商品只有一个库存数量。
回答下列问题：1、写出R的基本函数依赖 2、找出关系模式R的候选键 3、关系模式R最高达到第几范式？为什么

数据库设计与关系规范化考试

数据库设计与关系规范化考试（答案见尾页）一、选择题1. 数据库设计中，规范化的主要目的是什么？A. 减少数据冗余B. 增加数据完整性C. 提高查询效率D. 保证数据一致性2. 关系数据库中的关系模型是什么？A. 二维表结构B. 三维表结构C. 非结构化数据结构D. 结构化数据结构3. 在关系数据库中，什么是第一范式（NF）？A. 表中所有列都是原子类型B. 表中所有行都是相同的结构C. 每个非主属性都完全函数依赖于主键D. 表中所有列都与另一个列存在依赖关系4. 在关系数据库中，什么是第二范式（NF）？A. 表中所有列都是原子类型B. 表中所有行都是相同的结构C. 每个非主属性都完全函数依赖于主键D. 表中所有列都与另一个列存在依赖关系5. 在关系数据库中，什么是第三范式（NF）？A. 表中所有列都是原子类型B. 表中所有行都是相同的结构C. 每个非主属性都完全函数依赖于主键D. 表中所有列都与另一个列存在依赖关系6. 数据库规范化是为了解决什么样的问题？A. 数据冗余B. 数据不一致性C. 数据完整性D. 查询效率7. 在关系数据库中，什么是外键（Foreign Key）？A. 用来连接两个不同数据表的数据列B. 用来标识数据表的唯一性C. 用来定义数据的层次结构D. 用来保证数据的参照完整性8. 在关系数据库中，什么是内键（Inner Key）？A. 用来连接两个不同数据表的数据列B. 用来标识数据表的唯一性C. 用来定义数据的层次结构D. 用来保证数据的参照完整性9. 在关系数据库中，什么是候选键（Candidate Key）？A. 表中所有列都是原子类型B. 表中所有行都是相同的结构C. 表中所有非主属性都完全函数依赖于主键D. 表中所有列都与另一个列存在依赖关系10. 在关系数据库中，什么是主键（Primary Key）？A. 表中所有列都是原子类型B. 表中所有行都是相同的结构C. 表中所有非主属性都完全函数依赖于主键D. 表中所有列都与另一个列存在依赖关系11. 关系数据库中的关系模型是基于什么概念设计的？A. 数据库管理系统（DBMS）B. 数据结构C. 数据库管理员（DBA）D. 数据模型12. 在关系数据库中，哪一个操作不属于数据查询操作？A. 选择B. 投影C. 连接D. 分组13. 关系数据库的规范化是为了解决什么样的问题？A. 数据冗余B. 数据完整性C. 数据安全性D. 数据一致性14. 什么是第一范式（NF）？它要求数据库中的每一个属性都满足什么条件？A. 属性不可再分B. 属性可以再分C. 属性有意义D. 属性不重复15. 在关系数据库中，哪一个术语用来描述一个关系模式的两个实体集之间的联系？A. 外键B. 子表C. 联系D. 标准16. 什么是第二范式（NF）？它如何解决与第一范式（NF）的区别？A. 它要求每个非主属性完全函数依赖于整个候选键B. 它要求每个非主属性都不传递依赖于其他非主属性C. 它要求所有属性都是原子的D. 它要求属性之间没有依赖关系17. 什么是第三范式（NF）？它进一步解决了什么问题？A. 它消除了非主属性对候选键的部分函数依赖B. 它消除了非主属性对候选键的传递函数依赖C. 它要求所有属性都是必要的D. 它要求属性之间没有依赖关系18. 什么是第四范式（NF）？它解决了什么问题？A. 它消除了非主属性对候选键的传递和部分函数依赖B. 它消除了非主属性对候选键的传递和完全函数依赖C. 它要求所有属性都不传递依赖于其他非主属性D. 它要求属性之间没有依赖关系19. 什么是全外键？它在关系数据库中的作用是什么？A. 它是一个表中的一个字段，它的值引用了另一个表中的主键B. 它是一个表中的字段，它的值引用了另一个表中的唯一键C. 它是一个表中的字段，它的值引用了另一个表中的主键或唯一键D. 它是一个表中的字段，它的值引用了另一个表中的任何字段20. 什么是数据库的三级模式结构？它包括哪三个层次？A. 外模式、模式和内模式B. 用户模式、全局模式和子模式C. 存储模式、逻辑模式和物理模式D. 外模式、模式和存储模式21. 在关系数据库中，哪一个操作符用于撤销插入、更新或删除操作？A. DELETEB. ROLLBACKC. COMMITD. CASCADE22. 在关系数据库设计中，哪一个范式要求确保数据完整性？A. 第一范式（1NF）B. 第二范式（2NF）C. 第三范式（3NF）D. 第四范式（4NF）23. 什么是关系数据库中的外键约束？它的作用是什么？A. 限制关系表中的数据行数量B. 保证关系表中的数据一致性C. 限制关系表中的列数据类型D. 保证关系表中的数据完整性24. 在关系数据库中，哪一个关键字用于唯一标识表中的每一行？A. IDB. PRIMARY KEYC. UNIQUED. FOREIGN KEY25. 什么是关系数据库中的连接操作？它有哪些类型？A. 内连接B. 外连接C. 交叉连接D. 连接操作26. 在关系数据库中，哪一个操作符用于修改关系表中的数据？A. INSERTB. UPDATEC. DELETED. CREATE27. 什么是关系数据库中的候选键？它有什么特点？A. 候选键是唯一标识表中每一行的关键字段B. 候选键可以有多个C. 候选键必须包含主键D. 候选键不能包含空值28. 在关系数据库中，哪一个操作符用于排序关系表中的数据？A. ORDER BYB. GROUP BYC. DISTINCTD. JOIN29. 什么是关系数据库中的触发器？它的作用是什么？A. 作为关系数据库的附加功能，用于执行特定的操作B. 作为关系数据库的默认功能，用于执行特定的操作C. 触发器是一种数据库对象，用于自动执行特定的操作D. 触发器是一种数据库对象，用于强制实施数据完整性30. 在关系数据库中，键（Key）的作用是什么？A. 唯一标识表中的每行记录B. 唯一标识表中的每列记录C. 表示实体间的联系D. 维护数据的物理排序31. 什么是第一范式（NF）？它要求数据库中的表满足什么条件？A. 表中所有列都是原子类型B. 表中所有行都是相同的结构C. 表中所有列都必须依赖于主键D. 表中所有列的部分依赖主键32. 什么是第二范式（NF）？它如何解决第一范式中的问题？A. 消除非主键列对主键的部分依赖B. 消除非主键列之间的函数依赖C. 消除非主键列对主键的完全依赖D. 消除非主键列与主键之间的函数依赖33. 什么是数据库的正常记录数和附加记录数？A. 正常记录数是数据库中有效数据的数量B. 附加记录数是数据库中无效数据的数量C. 正常记录数加上附加记录数等于数据库的总数据量D. 正常记录数和附加记录数的总和等于数据库的总数据量34. 在数据库设计中，什么是外键（Foreign Key）？A. 用于唯一标识表中的每一行记录B. 用于表示实体间的联系C. 唯一标识表中的每一列记录D. 作为表之间关系的约束条件35. 什么是触发器（Trigger）？它在数据库中的作用是什么？A. 用于自动执行特定的SQL语句B. 用于强制数据完整性C. 用于实现事务的原子性D. 用于备份数据库36. 在数据库系统中，什么是索引（Index）？它有什么优点和缺点？A. 用于快速查询数据库中的特定数据B. 提高查询性能C. 创建索引可以增加数据库的规模D. 索引会占用额外的存储空间，并可能降低写入性能37. 在关系数据库中，什么是外键？它有什么作用？A. 外键是一个表中的列，其值引用另一个表的主键列。

关系数据库规范化理论复习题

第7章关系规范化理论一、单项选择题1．关系规范化中的删除操作异常是指①，插入操作异常是指②。

A．不该删除的数据被删除 B．不该插入的数据被插入C．应该删除的数据未被删除 D．应该插入的数据未被插入答案：①A ②D2．设计性能较优的关系模式称为规范化，规范化主要的理论依据是。

A．关系规范化理论 B．关系运算理论C．关系代数理论 D．数理逻辑答案：A3．规范化理论是关系数据库进行逻辑设计的理论依据。

根据这个理论，关系数据库中的关系必须满足：其每一属性都是。

A．互不相关的 B．不可分解的C．长度可变的 D．互相关联的答案：B4．关系数据库规范化是为解决关系数据库中问题而引入的。

A．插入、删除和数据冗余 B．提高查询速度C．减少数据操作的复杂性 D．保证数据的安全性和完整性答案：A5．规范化过程主要为克服数据库逻辑结构中的插入异常，删除异常以及的缺陷。

A．数据的不一致性 B．结构不合理C．冗余度大 D．数据丢失答案：C6．当关系模式R(A，B)已属于3NF，下列说法中是正确的。

A．它一定消除了插入和删除异常 B．仍存在一定的插入和删除异常C．一定属于BCNF D．A和C都是答案：B7. 关系模式1NF是指_________。

A. 不存在传递依赖现象B. 不存在部分依赖现象C．不存在非主属性 D. 不存在组合属性答案：D8. 关系模式中2NF是指_______。

A.满足1NF且不存在非主属性对关键字的传递依赖现象B.满足1NF且不存在非主属性对关键字部分依赖现象C.满足1NF且不存在非主属性D.满足1NF且不存在组合属性答案：B9. 关系模式中3NF是指___________。

A.满足2NF且不存在非主属性对关键字的传递依赖现象B.满足2NF且不存在非主属性对关键字部分依赖现象C.满足2NF且不存在非主属性D.满足2NF且不存在组合属性答案：A10．关系模型中的关系模式至少是。

A．1NF B．2NF C．3NF D．BCNF答案：A11．关系模式中，满足2NF的模式，。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第五章关系数据库的规范化理论 1 数据依赖1.1 函数依赖 1.1 函数依赖1.1 函数依赖 1.1 函数依赖1.2 完全函数依赖 1.2 完全函数依赖1.4 传递函数依赖1.4 传递函数依赖定义：在关系R中，当且仅当X →Y，（Y ⊆X，1.5 关键字（码） 1.5 关键字（码）1.5 关键字（码） 1.5 关键字（码）确定型联系：连接联系系/1教师/32 规范化理论不合法的关系2 规范化理论例如某书店的订购图书登记表如下：将上表中重复组进行分解，得到下表，满足1NF。

2.1 第一范式2.1 第一范式订单订户号姓名地址书号书名BN出版单位单订购数2.1 第一范式出现以上问题的原因是什么呢？2.2 第二范式 2.2 第二范式满足了2NF，但是还存在以下三个问题：2.2 第二范式NOBO2.3 第三范式定义：若关系R∈2NF ，且每个非键属性都不传递函数2.4 BCNF*SNC(SO,PO,CO,G) )2.4 BCNF*2.4 BCNF *2.4 BCNF小结小结在关系数据库里，对关系的基本要求是满足第一范小结2.5 多值依赖与第四范式例如，在教学管理中有关系模式CTX （C,T,X），具有下列约束：数学分析原理李军数学数学分析教程李军数学微积分学李军数学微积分学张华数学数学分析原理张华数学2.5 多值依赖与第四范式2.5 多值依赖与第四范式存在问题：2.5 多值依赖与第四范式 2.5 多值依赖与第四范式多值依赖与函数依赖的区别与联系：2.5 多值依赖与第四范式 2.5 多值依赖与第四范式2.5 多值依赖与第四范式2.5 多值依赖与第四范式4NF 定义：设关系模式R<U,F>∈1NF,如果对于R 的每个非2.5 多值依赖与第四范式可以将CTX 分解成CT 和CX 来解决上面的问题，CT 和CX 都满足4NF 。

2.6 连接依赖与第五范式2.6 连接依赖与第五范式2.6 连接依赖与第五范式AFP JEEP TRUCK CAR PRODUCT TOYOTA SMITHFORD SMITH FORD SMITHFACTORY AGENT TRUCK FORD JONES TRUCKFORDSMITH假设关系AFP有三个元组：1、2、3；现在AFP中加入元组4：（JONES,FORD,TRUCK) ↵2.6 连接依赖与第五范式连接依赖：设关系模式R,其属性集为U，X 1, X 2, …X k 为2.6 连接依赖与第五范式AFPTRUCK TOYOTA SMITH JEEPFORDSMITHCAR FORD SMITHPRODUCT FACTORY AGENTTOYOTAFORD SMITH FACTORY AGENT AFTRUCK JEEPCAR SMITH PRODUCT AGENT APTRUCK TOYOTA JEEPFORDCAR FORD PRODUCT FACTORY FP关系AFP (AGENT,FACTORY,PRODUCT)存在三个属性子集：2.6 连接依赖与第五范式AFP TOYOTA SMITH FORD SMITH FACTORY AGENT AFJEEP SMITH TRUCK TRUCKJONESCAR SMITH PRODUCT AGENT APTRUCK TOYOTA JEEP FORD TRUCKFORDCAR FORD PRODUCT FACTORYFPFORDJONESJEEP TRUCK CAR PRODUCT TOYOTA SMITHFORD SMITH FORD SMITHFACTORY AGENT TRUCK FORD JONES TRUCKFORDSMITH2.6 连接依赖与第五范式5NF:在关系模式R中,如果存在连接依赖，则每个连接依赖2.6 连接依赖与第五范式2.7 关系模式的分解2.7 关系模式的分解 2.7 关系模式的分解关系模式的规范化过程就是用一组子关系等价地2.7.1 无损失连接性的分解2.7 关系模式的分解关系模式R(U)的分解是将它用其子关系模式2.7.2 保持函数依赖的分解 2.7.2 保持函数依赖的分解2.7.2 保持函数依赖的分解612.7关系模式的分解：实例62保持函数依赖性分解的定义: 设关系模式R <U,F>，F是其满足的函数依赖的集合， ρ ={R1<U1,F1>,R2<U2,F2>,…,RK<Uk,Fk>} 是 R 的一个分解，若所有 Fi(i-=1,2,..k) 的并集逻辑蕴含 F 中的全部函数依赖，则该分解ρ具有保持函数依赖性。

例如，关系SCM(SO,CLS,MON)属性集：SO(学号)，CLS (班级), MON (班主任)。

语义：一个学生只属于一个班；一个班有多个学生；一个班只有一个班主任；1具有无损连接性：一定能达到BCNF.。

2保持函数依赖：一定能达到3NF.，而不一定能达到BCNF.。

3既保持函数依赖，又具有无损连接性：一定能达到 3NF.，而不一定能达到BCNF. 。

一个老师可以做多个班的班主任。

函数依赖集: SO→CLS, CLS →MON, SO →MON(传）该关系满足2NF。

2.7关系模式的分解：实例632.7SCMSO 01 02 03 04 05 CLS 51 51 62 61 61 MON 王明王明张芳张芳张芳关系模式的分解：实例SMSO 01 02 03 04 05 MON 王明王明张芳张芳张芳 SO 01 02 03 03 04 04 05 0564为了提高范式等级将关系SCM(SO,CLS,MON)进行分解，有三种分解方案：SM |×| CMCLS MON 51 51 62 61 62 61 62 61 王明王明张芳张芳张芳张芳张芳张芳ρ1={ SM(SO,MON), CM(CLS,MON) } ρ2={ SC(SO,CLS), SM(SO,MON) } ρ3={ SC(SO,CLS), CM(CLS,MON) }三种分解所得到的新关系，都满足3NF。

CMρ1不具有无损失连接性。

CLS MON 51 62 61 王明张芳张芳2.7关系模式的分解：实例652.7S-C-MSO 01 02 03 04 05 CLS 51 51 62 61 61 MON 王明王明张芳张芳张芳关系模式的分解：实例S-M S-MSO 01 02 03 04 05 SO 01 02 03 04 05 MON 张芳王明张芳张芳张芳 SO 01 02 03 04 05 MON 王明王明张芳张芳张芳66由于61班和62班的班主任都是张芳，因此从分解后的新关系中无法判别03，04，05号学生的班级，分解后的新关系SM |×| CM与原关系SCM的内容不同，说明丢失了信息。

产生这种现象的原因是，在ρ1分解得到的新关系中，SO→CLS未被保持。

S-CSO CLS 01 02 03 04 05 51 51 62 61 61S-C 01学生从51班转到 62班CLS 62 51 62 61 61ρ2：新关系S-M和S-C 不相互独立112.7关系模式的分解：实例672.7SCMSO 01 02 03 04 05 CLS 51 51 62 61 61 MON 王明王明张芳张芳张芳关系模式的分解：实例SCSO 01 02 03 04 05 CLS 51 51 62 61 61 SO 01 02 03 04 0568ρ2分解将原关系模式分解成S-C(SO,CLS)和SM(SO,MON）两个关系没有在分解中丢失了信息。

但是当01学生从51班转到62班时，不仅要修改关系S-C中学号是01的那个元组的CLS属性，还要修改关系S-M中相应元组的MON的属性值。

在关系SM中本没有属性CLS，却在修改CLS值时要作相应修改。

这样的分解显然不好，分解后的新关系彼此不能相互独立。

产生这种现象的原因同样是，在ρ2分解得到的新关系中，CLS →MON未被保持。

SM |×| CMCLS MON 51 51 62 61 61 王明王明张芳张芳张芳ρ3既具有无损失连接性, 新关系相互独立，又保持函数依赖。

CMCLS MON 51 62 61 王明张芳张芳2.7关系模式的分解：实例692.7关系模式的分解：实例70ρ3={SC(SO,CLS), C-M(CLS,MON)}分解得到的两个新关系 {SC(SO,CLS)和 CM(CLS,MON分别使用了原关系的两个完全函数依赖，蕴含了原来的传递函数依赖，既未丢失信息，新关系之间又相互独立。

总之，分解是用原来关系的若干投影来构造新的关系模式。

在实际应用中，要对问题作深入的分析，分解时要注意使用原关系模式中函数依赖的合适部分，这样才能保证分解既不损失连接性，又不丢失信息，而且·分解后的关系又能相互独立。

3. 规范化总结在关系数据库里，对关系的基本要求是满足第一范式，满足第一范式的关系就是合法的、允许的，但是人们发现有些关系存在插入、删除异常、数据冗余等毛病。

人们寻找解决这些问题的办法，这就是规范化的目的。

范式级别越高，关系越规范。

713. 规范化总结不合法关系消去重复组 1NF 消去非键属性对码的部分函数依赖 2NF72消除决定因素不是码的函数依l赖消去非键属性对码的传递函数依赖 3NF 消除键属性对码的部分和传递函数依赖 BCNF 消除非平凡且非函数依赖的多值依赖 4NF 消除连接依赖 5NF123. 规范化总结规范化的基本思想是逐步消除数据依赖中不合适的部分，使关系模式达到某种程度的“分离”，让一个关系描述一个概念、一个实体或者一种联系，若多于一个概念就把它“分离”出去。

因此所谓规范化实质上是让关系的概念单一化。

733. 规范化总结规范化的好处n使用方便，关系中的每一个数据项都是简单数据项，不是一组数或一个重复组。

所有元组包含的数据项的个数是相等的，这样可以很方便的存储单个数据项或一组数据项。

o可消除对数据进行插入、删除和修改时的相互牵扯，保持了数据的一致性。

p对数据库引入新型数据时，可减少对原有关系结构的修改。

q提高了存储空间的利用率，避免重复存储，降低了数据的冗余度。

r具有可联性。

将不规范的关系分解成多个规范化的关系后，可通过外来关键字来实现关系之间的各种联系。

74关系模式的规范化过程就是用一组子关系等价地代替原有关系的过程，所谓等价是既不增加也不丢失信息，分解的四个层次： 1.不增加，也不丢失属性 2.不损失连接性 3.关系模式互相独立 4.保持函数依赖性3. 规范化总结关系模式的规范化原则 :n从存储空间考虑，范式级别越高越好。