第2章数据模型
第2章 关系数据库数学模型

关系——二维表(行列),实体及其联系 都用关系表示。在用户看来关系数据的逻辑模 型就是一张二维表。
关系数据模型概述(续I)
关系操作 查询: 1)选择Select; 4)除Divide; Intersection; 编辑: 1)增加Insert; Update;
2)投影Project; 3)连接Join; 5)并Union; 6)交 7)差Difference;
三元关系的转换 一般要引入分离关系 如公司、产品和国家之间的m:n:p的三元关系及销 售联系。
关系代数
关系代数概述 关系代数的运算符 集合运算符
并U 交∩ 差 专门的关系运算符
笛卡尔积 × 选择σ 投影π 连接 除 算术比较符
> ≥ < ≤ = ≠ 逻辑运算符
EER模型到关系模式的转换(续IV)
为此,本例中引入一个分离关系On_Load(借 出的书),可以避免空值的出现。 这样,存在以下三个关系模式: Borrower(B#,Name,Address,……) Book(ISBN,Title,……) On_Load(ISBN,B#,Date1,Date2) 只有借出的书才会出现在关系On_Load中, 避免空值 的出现,并把属性Date1和Date2加到 关系On_Load中。
D1 x D2 x…x Dn={(d1,d2,…,dn) | di∈Di, i=1,2,…,n} (d1,d2,…,dn) --------n元组(n-tuple) di--------元组的每一分量(Component) Di为有限集时,其基数为mi,则卡积的基 数为M=m1*m2*…*mn
关系数据库
第二章 空间数据模型

2.2栅格数据模型-离散化的方法 栅格数据模型规则的格网(常用三角形,方格,六角形) 规则的格网(常用三角形,方格,六角形),三角形 是最基本的不可再分的单元,根据角度和边长的 不同,可以取不同的形状,方格、三角形和六角 形可完整地铺满一个平面。 不规则的格网,可当做拓扑多边形处理,如按街 不规则的格网 区划分,社会经济分区等。 。
空间数据模型
本章描述的是整个GIS理论中最为核心的内容。 理论中最为核心的内容。 本章描述的是整个 理论中最为核心的内容 为了能够利用信息系统工具来描述现实世界, 为了能够利用信息系统工具来描述现实世界,并 解决其中的问题,必须对现实世界进行建模。 解决其中的问题,必须对现实世界进行建模。对 于地理信息系统而言,其结果就是空间数据模型。 于地理信息系统而言,其结果就是空间数据模型。 空间数据模型可以分为三种: 空间数据模型可以分为三种: 场模型:用于描述空间中连续分布的现象; 场模型:用于描述空间中连续分布的现象; 要素模型:用于描述各种空间地物; 要素模型:用于描述各种空间地物; 网络模型:可以模拟现实世界中的各种网络; 网络模型:可以模拟现实世界中的各种网络;
(一)空间结构特征和属性域 一 空间结构特征和属性域 空间” “空间”经常是指可以进行长度和角度 测量的欧几里德空间。 测量的欧几里德空间。空间结构可以是规 则的或不规则的。 则的或不规则的。 属性域的数值可以包含以下几种类型: 属性域的数值可以包含以下几种类型: 名称、序数、间隔和比率。 名称、序数、间隔和比率。属性域的另一 个特征是支持空值, 个特征是支持空值,如果值未知或不确定 则赋予空值。 则赋予空值。
2011-4-6
25
2.2栅格数据模型 2.2栅格数据模型
栅格模型把空间看作像 元的划分, 元的划分,每个像元都 记录了所在位置的某种 现象,用像元值表示。 现象,用像元值表示。 该值可以表示一个确定 的现象,也可以是一种 模糊的现象。但一个像 元应该只赋一个单一的 值。
第二章数据模型

(1)矩形框——表示实体型; (2)菱形框——表示联系型; (3)椭圆形框——表示实体型或联系型的属性; (4)直线——用来连接上述三种图框。 做图时,把相应的命名记入框中;对组成关键字的属性,标记下 划线;在菱形框的引出线上要标上联系的方式(如1:N等)。
数据库系统原理
2.20
从现实世界到概念模型的转换由数据库设 计人员完成的。
从概念模型到逻辑模型的转换可以由数据 库设计人员完成,也可以用数据库设计工 具协助设计人员完成。
从逻辑模型到物理模型的转换是由DBMS 自动完成的。
数据库系统原理
2.7
李瑞改(lirg751@)
2.1 信息抽象过程
2.26
李瑞改(lirg751@)
2.4 结构数据模型(简称数据模型)
结构数据模型直接面向数据库的逻辑结构,是对现实世界的 第二层抽象,所以也称逻辑数据模型。 数据库的组成:
数据结构 规定了数据模型的静态特性,刻画数据模型性质最重要的方面。
数据操作 主要包括数据查询和数据更新,规定了数据模型的动态特性。
➢ (1)现实世界
现实世界是指客观存在的事物及其联系,现实世界 有个体和总体等概念。
个体:一个客观存在的可识别事物。 个体特征:每个个体都有一些区别于其他个体的特征 。例如一本书的特征可以有:书名,作者,价格,出 版社,页数等。 总体:所有同类个体的集合成为总体。例如:所有的 “书”就是一个总体。 事物联系:同类个体之间或不同类个体的关系。
2.1 信息抽象过程
➢ (3)机器世界
信息世界中的信息经过数字化处理形成计算机能够处理 的数据,就进入了机器世界,机器世界也叫计算机世界或 数字世界。
数据项:对应实体属性的数据单位,又称为字段。通常和属 性同名。
第2章 数据模型与概念模型

• 概念模型(E-R图):
思考题:某公司的业务活动统计 。 任务:要求统计公司各部门承担的工程项目及职工参与工程项 目情况。 分析: 一、实体集及属性: 实体集有:部门、职工、工程项目。 • 部门有部门号、部门名称两个属性; • 职工有职工号、姓名、性别属性; • 工程项目有工程号、工程名两个属性; 二、联系 • 每个部门承担多个工程项目,每个工程项目属于一个部门。 • 每个部门有多名职工,每一名职工只能属于一个部门。 • 每个职工可参与多个工程项目,且每个工程项目有多名职工参 与。 • 职工参与项目有参与时间。
计算机中对信息的表示和处理与计算机软硬件有关,
描述的数据不便于直接在计算机上实现,必须经过数字
化处理,转换成适合特定计算机系统(主要是DBMS)的
形式描述,形成计算机能够表示和处理的数据,这时就
进入了信息的计算机世界,或机器世界、数据世界。
下面就是一个学生-课程系统:
姓名 性别 年龄 所在院系
学号
2. 信息世界 通过对现实世界中事物及联系的认识,经过选择、 命名、分类等分析后形成印象和概念,并用一定形式加 以抽象描述,就进入信息世界。 如:
张三、李四是学生,分为一类,构成学生实体集,选择部分特 征并命名,描述为: 学生(学号、姓名、性别、年龄、所在院系) 数据库原理、数据结构是课程,分为一类,构成课程实体集, 选择部分特征并命名,描述为: 课程(课程号、课程名、学分)
(4) 域(Domain) 属性的取值范围称为属性的域。
2. 实体联系的类型 (1)两个实体集之间的联系 1) 一对一联系(1:1):设有两个实体集A和B,对于A 中的每一个实体, B中至多有一个实体与之联系; 反之亦然。 工厂 2) 一对多联系(1:n 1 ):设有两个实体集A和B,对于A 的每一个实体, B中有一个或多个实体与之联系; 负责 而对于B的每一个实体,A中至多有一个实体与之联 1 职工 学校 系。 厂长 3) 多对多联系(m:n):设有两个实体集 A和B,对于A 1 m 的每一个实体,B中有一个或多个实体与之联系; 参加 工作 反之亦然。 n n 一对一的联系是一对多联系的特例,一对多的联系是 体育团体 教师 多对多联系的特例
02第二章数据模型(答案)

第二章数据模型一、单项选择题1、按照传统的数据模型分类,数据库系统可分为三种类型( B )。
A、大型、中型和小型B、层次、网状和关系C、西文、中文和兼容D、数据、图形和多媒体2、在概念模型中,客观存在并可以相互区别的事物称为( C )。
A、物体B、物质C、实体D、个体3、用树型结构来表示实体之间联系的模型称为( A )。
A、层次模型B、关系模型C、运算模型D、网状模型4、按照数据模型划分,ACCESS是一个( A )。
A、关系型数据库管理系统B、网状型数据库管理系统C、层次型数据库管理系统D、混合型数据库管理系统5、关系数据模型用( C )结构表示实体和实体间的联系。
A、树型B、网状C、二维表D、对象6、E-R图中用( C )表示实体间的联系。
A、矩形B、正方形C、菱形D、椭圆形7、实体间的联系存在着( D )。
A、1:1联系B、1:n联系C、m:n联系D、1:1、1:n(n:1)和m:n8、一个公司可以接纳多名职员参加工作,但每个职员只能在一个公司工作,从公司到职员之间的联系类型是( D )。
A、多对多B、一对一C、多对一D、一对多9、E-R方法的三要素是( C )。
A、实体、属性、实体集B、实体、码、关系C、实体、属性、关系D、实体、域、码10、E-R表示法是设计( A )常用的方法。
A、概念模型B、数据库逻辑结构设计模型C、数据库物理结构设计模型D、都可以11、Access基于( C )数据模型。
A、层次B、网状C、关系D、面向对象12、E-R图在数据库设计中被广泛使用,椭圆表示( C )。
A、实体B、实体的主键C、实体的属性D、实体间的联系13、常见的数据模型有( C )。
A、面向对象、空间数据模型和NoSQLB、实体、属性和联系C、层次、网状和关系D、矩形、椭圆形和菱形二、判断题1、关系模型是目前最常用的数据模型。
√2、概念模型的表示与系统采用的数据模型有关。
×3、同类实体的集合称为实体型。
数据库第2章 数据模型

4.域(Domain)
某个(些)属性的取值范围称为该属性的域。例如,性别的域为(男,女), 姓名的域为字符串集合,学院名称的域为学校所有学院名称的集合。
4.文件集(File Set) 文件集是若干文件的集合,即由计算机操作系统通过文件系统来组织和管理。它 与信息世界中的对象集相对应。
文件系统通过对文件、目录、磁盘的管理,可以对文件的存储空间、读写权限等 进行管理。
2.1.4 三种世界的转换
信息的三种世界之间是可以进行转换的。人们常常首先将现实世界抽象为信 息世界,然后将信息世界转换为计算机世界。也就是说,首先将现实世界中 客观存在的事物或对象抽象为某一种信息结构,这种结构并不依赖于计算机 系统,是人们认识的概念模型;然后再将概念模型转换为计算机上某一具体 的DBMS支持的数据模型。这一转换过程如图2-1所世界抽象为信息世界的过程中,实际上是抽象出 现实系统中有应用价值的元素及其关联。这时所形成的信 息结构就是概念模型。这种信息结构不依赖于具体的计算 机系统。
2.2.1 概念模型的基本概念
1.实体(Entity)
客观存在并且可以互相区别的事物称为实体。实体可以是人,也可以是物, 也可以是抽象的概念;可以指事物本身,也可以指事物的联系。例如,一名 学生,一门课、一次选课、学生和课程的关系等,都是实体。实体是信息世 界的基本单位。
2.1.4 三种世界的转换
信息的三种世界在转换过程中,每种世界都有自己对象的概念描述,但是它 们之间又相互对应。信息的三种世界之间的对象对应关系见表2-1。
第二章数据模型

Database System
2.7
关系数据模型中的基本概念(3)
若关系中的某一属性组的值能唯一地标识一个元组① ,而其任何 真子集无此性质②, 则称该属性组为候选键( candidate key ) ,简称键。
键是满足条件 1的最小的属性集, 如学号就是关系student的键。 如(学号,性别)这个属性组就不是关系student的键。
STUDENT.学号=GRADE.学号
GRADE
计算机组成 0003
STUDENT 姓名 学号 性别 c3 001 m c4 002 m l4 007 f l5 009 m w5 209 f
出生年月 系别 1976/1/2 cs 1979/3/4 en 1978/9/3 cs 1980/4/2 au 198/3/1 au
学号 002 003 005 009
性别 m f m m
出生年月 1979/3/4
系别 en cs cs au
1983/4/5 1986/8/9 1980/4/2
Database System
2.17
关系模型中的操作(续)
2。投影操作
projection
Π <属性表>(<关系名>) 例 值: Π 姓名,性别,出生年份(STUDENT) 姓名 c3 c4 l4 l5 w5 性别 m m f m f 出生年月 1976/1/2 1979/3/4 1978/9/3 1980/4/2 1980/3/1
差:Difference 记作 交:Intersection 记作
乘:(广义的笛卡尔积)
Database System
2.15
R A a1 a1 a2 B b1 b2 b2 C c1 c2 c1
数据库基础-第二章 关系数据模型与关系运算

2.2 关系代数
数据查询基本运算
❖1.关系属性的指定——投影运算 这个操作是对一个关系进行垂直分割,消去某些列,并 重新安排列的顺序。
i1,i2,,in(R) {t | t ti1,ti2,,tin t1,t2,,tk R}
例子2-3
❖2.关系元组选定——选择运算 选择操作是根据某些条件对关系做水平分割,即选取符合 条件的元组。
R S {t | t R t S}
式中“-”为差运算符,t为元组变量,结果R-S为一个新的与R、S兼
容的关系,该关系是由属于R而且不属于S的元组构成的集合,即 在R中减去与S中相同的那些元组。
关系 R
A
B
C
a1
b1
c1
a1
b2
c2
a2
b2
c1
关系 R∪S
A
B
C
a1
b1
c1
a1
b2
c2
a2
b2 c2
a1
b2
c2
a2
b2
c1
图 2.9 关系 R 和关系 S 及其交运算
2.2 关系代数
2.除法运算
设关系R和S的元数分别为r和s(设r>s>0),那么R÷S是一个(r-s)元的 元组的集合。(R÷S)是满足下列条件的最大关系:其中每个元组t与S中 每个元组u组成的新元组<t,u>必在关系R中。
S# (S) S# (SC)
例2-7 在关系C中增加一门新课程(C13, ML, C3, null): 如果令这门新课程元组所构成的关系为R,则有: R=(C13,ML,C3,null),这时结果为:C∪R。
学生关系:S (S# ,Sn, Sex,Sa ,Sd) ; 课程关系:C (C# ,Cn ,P#,Tn) ; 选课关系:SC (S#, C# ,G),
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.3.2 网状模型
网状数据模型是一种比层次模型更具普遍 性的结构,它去掉了层次模型的两个限制,允 许多个结点没有双亲结点,也允许一个结点有 多个双亲结点。因此,网状模型可以方便地表 示各种类型的联系。网状模型是一种较为通用 的模型,从图论的观点看,它是一个不加任何 条件的无向图。一般来说,层次模型是网状模 型的特殊形式,网状模型是层次模型的一般形 式。
2.3 常见的三种数据模型
数据模型是对客观事物及联系的数据描述,是 概念模型的数据化,即数据模型提供表示和组 织数据的方法。一般地讲,数据模型是严格定 义的概念的集合,这些概念精确地描述系统的 静态特征、动态特征和完整性约束条件。因此, 数据模型通常由数据结构、数据操作和数据的 完整性约束三要素组成。
2.信息世界
信息世界就是现实世界在人们头脑中的反映, 又称概念世界。客观事物在信息世界中称为 实体,反映事物间联系的是实体模型或概念 模型。现实世界是物质的,相对而言信息世 界是抽象的。
3.数据世界
数据世界又叫机器世界,就是信息世界中的信息数 据化后对应的产物。现实世界中的客观事物及其联 系,在数据世界中以数据模型描述。相对于信息世 界,数据世界是量化的、物化的。 在数据库技术中,用数据模型对现实世界数据特征 进行抽象,来描述数据库的结构与语义。不同的数 据模型是提供给人们模型化数据和信息的不同工具。 根据模型应用的不同目的,可以将模型分为两类: 概念模型和数据模型。概念模型是按用户的观点对 数据和信息建模,数据模型是按计算机系统的观点 对数据建模。
2.3.3 关系模型
9.主属性和非主属性 在一个关系中,包含在任何候选关键字中的各个属性 都称为主属性;不包含在任何候选关键字中的属性都 称为非主属性。 10.外键或外码 一个关系的某个属性(或属性组合)不是该关系的主键 或只是主键的一部分,却是另一个关系的主键,则称 这样的属性为该关系的外键或外码(Foreign Key)。 外码是表与表联系的纽带。
2.属性
属性(Attribute)是实体所具有的某些特性,通过属 性对实体进行描述。实体是由属性组成的。一个实体 本身具有许多属性,能够唯一标识实体的属性称为该 实体的码。例如,学号是学生实体的码,每个学生都 有一个属于自己的学号,通过学号可以唯一确定是哪 位学生,在学校里,不可能有两个学生具有相同的学 号。学生实体可由学号、姓名、性别、年龄、系、专 业、年级等组成,例如,2015001、张强、男、21、 计算机系、软件工程、2015级,这些属性组合起来 表示“张强”这个学生。
1
所属
N 质 量 评 价
数量
课程 号
课程 名 开 课
学分
职工号
教科书 M
订 购
N 专业 1
N 课程 M
M
教 学
N 教师
姓名
性别 成绩 民族
书号
书名
出版 社
专业 号
专业 名 1 N
选 修 N
属 于
学生
学号
姓名
性别
年龄
2.2.2 E-R模型
概念模型是从用户角度看到的模型,是第一层 抽象。要求概念简单、表达清晰、易于理解, 它与具体的计算机硬件、 OS 及 DBMS 无关。 而数据模型才是从计算机角度看到的模型,要 求用有严格语法和语义的语言对数据进行严格 的形式化定义、限制和规定,使模型能转变为 计算机可以理解的格式。
2.数据操作
数据操作是指数据库中各记录允许执行的操作 的集合,包括操作方法及有关的操作规则,, 是对数据库动态特征的描述。例如插入、删除、 修改、检索等操作,数据模型要定义这些操作 的确切含义、操作符号、操作规则以及实现操 作的语言等。
2.3.1 层次模型
层次模型用树形结构来表示各类实体以及实体 间的联系。每个结点表示一个记录类型,结点 之间的连线表示记录类型间的联系,这种联系 只能是父子联系。 层次模型存在如下特点: (1)只有一个结点没有双亲结点,称为根结 点。 (2)根结点以外的其他结点有且只有一个双 亲结点。
(1)一对一联系(1:1):对于实体集A中的每一个实 体,实体集B中至多有一个实体与之对应,反之亦然, 则称实体集A与实体集B具有一对一联系,记为1:1。 例如,部门与经理之间联系,学校与校长之间的联系 等等就是一对一联系。 (2)一对多联系(1 : M):对于实体集A中的每一个 实体,实体集B中有多个实体与之对应;反过来,对 于实体集B中的每一个实体,实体集A中至多有一个 实体与之对应,则称实体集A与实体集B具有一对多 联系,记为1 : M。例如,一个班可以有多个学生, 但一个学生只能属于一个班。班级与学生之间的联系 就是一对多联系。
(3)多对多联系(M : N):对于实体集A 中的每一个实体,实体集B中有多个实体与 之对应;反过来,对于实体集B中的每一个 实体,实体集A中也有多个实体与之对应, 则称实体集A与实体集B具有多对多联系, 记为M:N。 例如,学生在选课时,一个学生可以选多门 课程,一门课程也可以被多个学生选,则学 生和课程之间具有多对多联系。
课程
M
选修
N
学生
N
属于
1
班级
课程号
成绩
性别
年龄
班级名
班主任
2.2.2 E-R模型
【例2-2】有一个高等学校信息数据库系统,包含学 生、教师、专业、教科书和课程五个实体,其中一个 专业可以有若干个学生,一个学生只能属于一个专业; 一个专业可以开多门课,一门课只能在一个专业开课; 一个专业可以有若干个教师,一个教师只能属于一个 专业;一位教师可以讲授多门课,一门课也可以有多 位教师讲授,每个教师讲授每门课都有一个质量评价; 一个专业可以订购若干本教科书,一本教科书也可以 有多个专业订购,每个专业订购的每本教科书都有一 个数量;一个学生可以选修多门课,每一门课都可以 有多个学生选修,学生选课后有成绩。该数据库系统 的E-R模型如图所示。
2.2 概念模型
概念模型是现实世界的抽象反映,它表 示实体类型及实体间的联系,是独立于 计算机系统的模型,是现实世界到机器 世界的一个中间层。
2.2.1 基本概念
1.实体 客观存在并可以相互区分的事物叫 实体(Entity)。从具体的人、物、事件 到抽象的状态与概念都可以用实体抽象 地表示;实体不仅可指事物本身,也可 指事物之间的具体联系。例如,在学校 里,一名学生、一名教师、一门课程、 一次会议等都称为实体。
2.3.3 关系模型
3.属性 二维表的列称为属性,每一列有一个属性名, 属性值是属性的具体取值。属性对应存储文件 中的一个字段。属性的具体取值就形成表中的 一个个元组。 4.域 域是属性的取值范围。例如,性别的域为(男, 女)。
2.3.3 关系模型
5.关系模式 对关系的信息结构及语义限制的描述称为关系 模式,用关系名和所包含的属性名的集合表示。 例如,职工信息表的关系模式是:职工(职工 号,姓名,性别,年龄,工资),注意:属性 间用逗号间隔。 6.关键字或码 在关系的属性中,能够用来唯一标识元组的属 ቤተ መጻሕፍቲ ባይዱ(或属性组合)称为关键字或码(Key)。
2.2.2 E-R模型
E-R图通用的表示方式如下。 (1)用矩形表示实体,在矩形框内写上实 体名。例如,学生实体、班级实体。 (2)用椭圆形表示实体的属性,并用无向 边把实体和属性连接起来。例如,学生实体 有学号、姓名、性别、年龄、班级名属性, 班级实体有班级名、班主任属性。
2.2.2 E-R模型
2.3.3 关系模型
用二维表格结构表示实体以及实体之间的联 系的数据模型称为关系模型。关系模型在用户 看来是一个二维表格,其概念单一,容易被初 学者接受。在关系模型中,操作的对象和操作 结果都是二维表。
2.3.3 关系模型
1.关系 一个关系就是一张二维表,每个关系都有一个 关系名。在计算机里,一个关系可以存储为一 个文件。 2.元组 二维表中的行称为元组,每一行是一个元组。 元组对应存储文件中的一个记录。
2.2.2 E-R模型
概念模型的表示方法很多,其中最为著名和 使用最为广泛的是P.P.Chen于1976年提 出的E-R模型。E-R(EntityRelationship,实体-联系)模型是直接从 现实世界中抽象出实体类型及实体间的联系, 是对现实世界的一种抽象,它的主要成分是 实体、联系和属性。E-R模型的图形表示称 为E-R图。
N
属于
1
班级
性别
年龄
班级名
班主任
2.2.2 E-R模型
【例2-1】有一个简单的学生信息数据库系统,包含班 级、学生和课程实体,其中一个班可以有若干个学生, 一个学生只能属于一个班;一个学生可以选修多门课, 一门课也可以有多个学生选修,学生选课后有成绩。该 数据库系统的E-R模型如图所示。
课程名 学分 学号 姓名
1.数据结构
数据结构是对计算机的数据组织方式和数据之 间联系进行框架性描述的集合,是对数据库静 态特征的描述。它研究存储在数据库中的对象 类型的集合,这些对象类型是数据库的组成部 分。数据库系统是按数据结构的类型来组织数 据的,因此数据库系统通常按照数据结构的类 型来命名数据模型。如层次结构、网状结构和 关系结构的模型分别命名为层次模型、网状模 型和关系模型,其中层次模型和网状模型统称 为非关系模型。
1.现实世界
现实世界(Real World)就是人们所能看 到的、接触到的世界,是存在于人脑之外的 客观世界。现实世界当中的事物是客观存在 的,事物与事物之间的联系也是客观存在的。 现实世界就是存在于人脑之外的客观世界, 客观事物及其相互联系就处于现实世界中。 客观事物可以用对象和性质来描述。
2.1 信息的三种世界
计算机信息处理的对象是现实生活中的客观 事物,在对客观事物实施处理的过程中,首 先要经历了解、熟悉的过程,从观测中抽象 出大量描述客观事物的信息,再对这些信息 进行整理、分类和规范,进而将规范化的信 息数据化,最终由数据库系统存储、处理。 在这一过程中,涉及到三个层次,即现实世 界、信息世界和机器世界,经历了两次抽象 和转换。