数据库基础理论

数据库基础理论
数据库基础理论

数据库概念

数据库就是数据存放的地方,是需要长期存放在计算机内的有组织并且可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度,较高的数据独立性和易扩展性,可以为不同的用户共享使用。

常见的数据库模型

数据库可以使用多种类型的系统模型(模型是指数据库管理系统中数据的存储结构),其中较为常见的有三种:

●层次模型(HietrarchicalModel)

●网关模型(Network Model)

●关系模型(Relation Model)

关系数据库概念

关系数据库是由数据表和数据表之间的关联组成。关系数据库的特点在于它将每个具有相同属性的数据独立地存在一个表中。对任何一个表而言,用户可以新增、删除和修改表中的数据,而不会影响表中的其他数据。下面来了解一下关系数据库中的一些基本术语:

◆键码(Key)关系模型中一个重要概念,在关系中用来标识行的一列或多列。

◆主关键字(Primary Key)它是被挑选出来,作为表行的性标识的候选关键字,一个表

中只有一个主关键字,主关键字又称为主键。

◆候选关键字(Candidate Key)它是性标识表中的一行而又不含多余属性的一个属性集。

◆公共关键安(Common Key)在关系数据库中,关系之间的联系是通过相容或相同的属

性或属性组来表示的。如果两个关系中具有相容或相同的属性或属性组,那么这个属性或属性组称为这两个关系的公共关键字。

◆外关键字(Foreign Key)如果公共关键字在一个关系中是主关键字,那么这个公共关键

字被称为另一个关系的外关键字。由此可见,外关键字表示了两个关系之间的联系,外关键字又称作外键。

关系数据为完整性规则

关系模型提供了三类完整性规则:实体完整性规则、参照完整规则和用户定义的完整性规则。其中实体完整性规则和参照完整性规则是关系模型必须满足的完整性的约束条件,称为关系完整性规则。

实体完整性在指关系的主属性(主键的组成部分)不能是空值。现实世界中的实体是可区分的,即它们具有某种性标识。相应地关系模型中以主键作为唯一性标识,主键中的属性即主属性不能取空值(“不知道”或“无意义”的值)。如果主属性取空值,就说明存在某个不可标识的实体,即存在不可区分的实体,主与现实世界的环境相矛盾,因此这个实体一定不是一个完整的实体。

参照完整性如果关系的外键R1与关系R2中的主键相符,那么外键的每个值必须在关系R2中主键的值中找到或者是空值。

用户定义完整性是针对某一具体的实际数据库的约束条件。它由应用环境所决定,反映某

一具体应用所涉及的数据必须满足的要求。关系模型提供定义和检验这类完整性的机制,以便用统一的系统的方法处理,而不必由应用程序承担这一功能。

范式

关系模型原理的核心是“规范化”概念,规范化是把数据库组织成在保持存储数据完整性的同时最小化冗余数据的结构的过程。规范化的数据库是符合关系模型规则的数据库,通常把这些规则称为范式。

范式是符合某一各级别的关系模型或的集合。关系数据库中的关系必须满足一定的要求即满足不同的范式,目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、Boyce-Codd范式(BCNF)、第四范式(4NF)和第五范式(5NF)。

第一范式

第一范式是指数据库表的第一列都是不可分割的基本数据项,同一列中不能有多个值,即实体中的某个属性不能有多个值或者不能有重复的属性。第一范式包括下列指导原则:

数组的每个属性只能包含一个值

关系中的每个数组必须包含相同数量的值

关系中的每个数组一定不能相同

第二范式

如果一个数据表已经满足第一范式,而且该数据表中的任何一个非主键字段的数值都依赖于该数据表的主键字段,那么该数据表满足第二范式,即2NF。

第三范式

如果一个数据表已经满足第二范式,而且该数据表中的任何两个非主键字段的数据值之间不存在函数信赖关系,那么该数据表满足第三范式,即3NF。

E_R模型简介

E_R(Entity-Relationship)数据模型,即实体-联系数据模型,是于1976年提出的早期的语义数据模型。该数据模型的最初提出是用于数据库设计,是面向问题的概念性数据模型,它用简单的图形反映了现实世界中存在的事物或数据及它们之间的关系。

实体

实体是观念世界中描述客观事物的概念,可以是个体的事物,例如一本书、一条街、一朵鲜花;也可以是抽象的事物,例如一个容量、一个城市、一种气体或一种感受等。同一类实体的所有实例就构成该对象的实体集。

Analysis Services

Analysis Services的主要作用是通过服务器和客户端技术的组合提供联机分析处理(Online Analytical Processing,OLAP)和数据挖掘功能。

使用Analysis Serivces,用户可以设计、创建和管理包含来自于其他数据源的多维结构,通过对多维数据进行多角度的分析,可以使用管理人员对业务数据挖掘模型的构造和应用,实现知识的发现、表示和管理。例如,使用Microsoft SQL Server 2008系统提供的Analysis Services 服务在学校的学生信息管理系统中完成对学生数据的挖掘分析,从面发现更多有价值的信息和知识,为有针对性地提高学生成绩、了解学生管理情况等提供有效的支持。

Reporting Services

Reporting Services包含用于创建和发布报表及报表模型的图形工具和向导、用于管理Reporting Services的报表服务器管理工具和用于对Reporting Services对象模型进行编程和扩展的应用程序编程接口(API)。

Microsoft SQL Server 2008 Reporting Services是一种基于服务器的解决方案,用于生成从多种关系数据源和多维数据源提取内容的企业报表,发布能以各种格式查看的报表,以及集中管理安全性和订阅。创建的报表可以通过基于Web的连接进行查看,也可以作为Microsoft Windows应用程序的一部分进行查看。

Integrationg Services

Integrationg Services是一个数据集成平台,负责完成有关数据的提取,转换和加载等操作。对于Analysis Serivces来说,数据库引擎是一个重要的数据源,而如何将数据源中的数据经过适当的处理并加载到Analysis Serivces中以便进行各种分析处理,这正是Integration Srevicea所要解决的问题。重要的是,Integrationg Services可以高效地处理各种各样的数据源,例如,SQL Server、Oracle、Excel、XML文档、文本文件等。

Microsoft SQL Server 2008 系统提供的Integration Services包括生成并调试包的图形工具和向导;执行如FTP操作、SQL语句执行和电子邮件消息传递等工作流功能的任务;用于提出和加载数据的数据源和目标;用于清理、聚合、合并和复制数据的转换;管理服务,即用于管理Integration Services包的Integration Services服务;以及用于对

相关主题
相关文档
最新文档