文件的物理结构

合集下载

计算机操作系统第八章

计算机操作系统第八章

将每一组含有的盘块数和该组所有的盘块号,记入前一组的第一个盘块的S.free[0]~S.free[99]中。这样,各组的第一个盘块就链接成一个链表。
将第一组的盘块总数和所有的盘块号,记入空闲盘块号栈中,作为当前可供分配的空闲盘块号。
1
2
3
4
UNIX空闲盘块的组织
文件目录是一种数据结构,由若干目录项组成,每个目录项对应其中一个文件的FCB(包括文件名、文件体的物理地址、存取控制信息等),文件体另外存放。文件目录是用于检索文件的,一般的,目录项应包括以下内容:
整个系统只设一张文件目录表,集中存放文件存储器上所有文件的FCB,这是最简单的一种目录结构。目录表存于外存中的某块固定区域,系统初启或需要时调入内存,每个文件的FCB对应目录表中的一项,通过目录表就可以管理该系统中的所有文件,包括对文件的创建、检索和删除等。
两级文件目录
把登记文件的目录分成两级:主文件目录MFD,和用户文件目录UFD 。系统为每个用户各设置一个UFD,登记本用户所有文件的信息,每个UFD相当于一个一级目录;系统再设置一个MFD,用来登记所有用户的用户名及其UFD在外存上的物理地址、长度,物理结构等属性。
01
记录式文件,在逻辑上可看成是一组记录的集合。每个记录由彼此相关的若干个数据项组成。记录式文件中的逻辑记录可依次编号,其序号称为逻辑记录号(简称记录号)。
02
文件逻辑结构
按照文件的逻辑地址顺序存取。在记录式文件中,这种操作体现为按照记录的排列顺序来进行存取。
01
文件的随机存取 随机存取是指允许用户按照记录编号或者某一数据项的值随机存取存取任一记录。
二级索引存储结构
将索引表离散存储,即将索引表本身分为若干个逻辑块,存储在若干物理盘块中,将索引表所占的各盘块号记入另一个索引表——索引表的索引表。这种结构就称两级索引结构。

文件的物理存储

文件的物理存储
大的、连续分区,将文件占用空间合并在一起。
Operating System Concepts – 7th Edition
9
Operating System Concepts – 7th Edition
10
链接结构
又称串联结构,将一个逻辑上连续的文件信息存 放在外存的不连续(或连续)物理块中。
Operating System Concepts – 7th Edition
25
解决办法
采用间接索引(多重索引),也就是在索引表所指的物理块 中存放的不是文件信息,而是装有这些信息的物理块地址;
一级间接索引,可寻址的文件长度将变为 n*n 块; 如果文件长度还大于 n*n块的话,则二级间接索引。
由一组相邻的物理块组成,是对记录式文件取连 续区分配而构成的文件。
特点 :顺序存取速度快
所需的磁盘寻道次数和寻道时间最少
Operating System Concepts – 7th Edition
5
Operating System Concepts – 7th Edition
6
顺序结构
对于字符流的无结构文件来说,每一个物理块中存放长 度相等的文件信息(存储文件尾部信息的物理块除外)。
对于记录式文件来说,由于记录长度既可以固定的,也 可以是可变的,而且其长度不一定刚好等于其物理块的 长度,因此,给记录从逻辑地址到物理地址的变换带来了 额外的负担。为了简单起见,假设文件系统中每个记录 的长度是固定的,且其长度正好等于物理块的长度。
索引表:存放文件信息所在的逻辑块号和与之对 应的物理块号
Operating System Concepts – 7th Edition

PDF文件结构详解

PDF文件结构详解

PDF(Portable Document Format,便携式文档结构)是一种很有用的文件格式,其最大的特点是平台无关而且功能强大(支持文字/图象/表单//音乐/视频等).做PDF的解析,首先要熟悉PDF文件的物理结构和逻辑结构。

PDF文件物理结构可分为以下几块: 1.文件头文件头是PDF文件的第一行,格式如下:%PDF-1.4这是个固定格式,表示这个PDF文件遵循的PDF规范版本,目前PDF的生成工具,除了官方的acrobat,其他生成的以1.4版本的居多。

对于做PDF开发来说,一个最简单的原则就是生成PDF的时候尽量符合低版本规范,以保证大多数解析器能支持;解析PDF的时候尽量支持高版本的规范,以保证支持大多数工具生成的PDF文件。

从1.4版本以后,PDF文件的版本并不唯一的只是在这里表示了,可能后面会改写(catalog的Version词条),所以解析PDF的时候,如果这里的版本大于等于1.4,应该再比较一下catalog里面的version,取其中高一点的版本。

2.对象集合这是一个PDF文件最重要的部分,文件中用到的所有对象,包括文本/图象/音乐/视频/字体/超连接/加密信息/文档结构信息等等,都在这里定义。

格式如下:2 0 obj ... end obj一个对象的定义包含4个部分:前面的2是对象序号,其用来唯一标记一个对象;0是生成号,按照PDF规范,如果一个PDF文件被修改,那这个数字是累加的,它和对象序号一起标记是原始对象还是修改后的对象,但是实际开发中,很少有用这种方式修改PDF的,都是重新编排对象号;obj和endobj是对象的定义范围,可以抽象的理解为这就是一个左括号和右括号;省略号部分是PDF规定的任意合法对象(一共8种,见后面附A)。

可以通过R关键字来引用任何一个对象,比如要引用上面的对象,可以使用2 0 R,需要主意的是,R关键字不仅可以引用一个已经定义的对象,还可以引用一个并不存在的对象,而且效果就和引用了一个空对象一样。

文件的结构——精选推荐

文件的结构——精选推荐

⽂件的结构⽂件的物理结构是从实现观点出发,⼜称为⽂件的存储结构,是指⽂件在外存上的存储组织形式。

⽂件的逻辑结构是从⽤户观点出发看到的⽂件的组织形式。

⽂件的逻辑结构与存储介质特性⽆关,但⽂件的物理结构与存储介质的特性有很⼤关系。

按逻辑结构,⽂件有⽆结构⽂件和有结构⽂件两种类型:⽆结构⽂件和有结构⽂件。

⽆结构⽂件(流式⽂件)⽆结构⽂件是最简单的⽂件组织形式。

⽆结构⽂件将数据按顺序组织成记录并积累保存,以字节(Byte)为单位。

由于⽆结构⽂件没有结构,因⽽对记录的访问只能通过穷举搜索的⽅式,故这种⽂件形式对⼤多数应⽤不适⽤。

但字符流的⽆结构⽂件管理简单,⽤户可以⽅便地对其进⾏操作。

所以,那些对基本信息单位操作不多的⽂件较适于⾤⽤字符流的⽆结构⽅式,如源程序⽂件、⽬标代码⽂件等。

有结构⽂件(记录式⽂件)有结构⽂件按记录的组织形式可以分为:1) 顺序⽂件。

⽂件中的记录⼀个接⼀个地顺序排列,记录可以是定长的或变长的,可以顺序存储或以链表形式存储,在访问时需要顺序搜索⽂件。

顺序⽂件有以下两种结构:第⼀种是串结构,记录之间的顺序与关键字⽆关。

通常的办法是由时间决定,即按存⼊时间的先后排列,最先存⼊的记录作为第1个记录,其次存⼊的为第2个记录,依此类推。

第⼆种是顺序结构,指⽂件中的所有记录按关键字顺序排列。

在对记录进⾏批量操作时,即每次要读或写⼀⼤批记录,对顺序⽂件的效率是所有逻辑⽂件中最⾼的;此外,也只有顺序⽂件才能存储在磁带上,并能有效地⼯作,但顺序⽂件对查找、修改、增加或删除单个记录的操作⽐较困难。

2) 索引⽂件。

如下图所⽰。

对于定长记录⽂件,如果要查找第i个记录,可直接根据下式计算来获得第i个记录相对于第⼀个记录的地址:然⽽,对于可变长记录的⽂件,要查找第i个记录时,必须顺序地查找前i-1个记录,从⽽获得相应记录的长度L,然后才能按下式计算出第i个记录的⾸址:注意:假定每个记录前⽤⼀个字节指明该记录的长度。

文件的逻辑结构

文件的逻辑结构

2. 无结构文件
如果说大量的数据结构和数据库,是采用有结构的文件形式的话,则大 量的源程序、 可执行文件、 库函数等, 所采用的就是无结构的文件形式, 即流式文件。 其长度以字节为单位。对流式文件的访问,则是采用读写 指针来指出下一个要访问的字符。可以把流式文件看作是记录式文件的一 个特例。在UNIX系统中,所有的文件都被看作是流式文件;即使是有结 构文件,也被视为流式文件;系统不对文件进行格式处理。
2. 顺序文件的优缺点
顺序文件的最佳应用场合,是在对诸记录进行批量存取时, 即每次要
读或写一大批记录。此时,对顺序文件的存取效率是所有逻辑文件中最高
的;此外,也只有顺序文件才能存储在磁带上, 并能有效地工作。
在交互应用的场合,如果用户(程序)要求查找或修改单个记录,为此
系统便要去逐个地查找诸记录。 这时, 顺序文件所表现出来的性能就可
能很差, 尤其是当文件较大时, 情况更为严重。 例如,有一个含有104 个记录的顺序文件,如果对它采用顺序查找法去查找一个指定的记录,则
平均需要查找5×103个记录; 如果是可变长记录的顺序文件,则为查找 一个记录所需付出的开销将更大,这就限制了顺序文件的长度。
1.3 索引文件
对于定长记录文件,如果要查找第i个记录, 可直接根据下式计算来获得 第i个记录相对于第一个记录首址的地址: Ai=i×L
操作系统
文件的逻辑结构
对于任何一个文件,都存在着以下两种形式的结构: (1)文件的逻辑结构(File Logical Structure)。 (2) 文件的物理结构, 又称为文件的存储结构, 是指文件在外存上的存 储组织形式。
1.1 文件逻辑结构的类型
1. 有结构文件 (1) 定长记录。 (2) 变长记录。 (1) 顺序文件。 (2) 索引文件。 (3) 索引顺序文件。

文件的物理结构及存储设备ppt

文件的物理结构及存储设备ppt
8.2.2 文件的物理结构及存储设备
(3) 索引文件 索引文件是由系统为每个文件建立一张索引表,表中 标明文件的逻辑块号所对应物理块号,索引表自身的物理 地址由FCB给出。
索引表结构 :
FCB . . 文件 A 索引表指针 . . 文件 A 的索引表 记录号 0 1 2 物理块号 4 4 7 10 R2 7 R3 10 R1
04 14 24 34 44 54
05 15 25 35 45 55
06 16 26 36 46 56
07 17 27 37 47 57
08 18 28 38 48 58
09 19 29 39 49 59
8.2.2 文件的物理结构及存储设备
如果索引表很大,超过了一个物理块,则系 统势必要像处理其他文件一样,来处理索引表的 物理存放方式,这样不利于索引表的动态增删。 解决的办法是采用多重索引的方式,也就是说, 当索引表所指的物理块超过一块时,再增加一个 次级索引表。这样,在高一级索引表表项里所指 向的物理块中并不存放实际的文件信息,而是存 放的一个索引表,在这个次一级的索引表中所指 向的物理块才是存放的文件信息。如果需要,可 以增加到3级以上的多级索引。
(Used in BSD Unix)
(filename is not stored in the inode)
index block
. . .
8.2.2 文件的物理结构及存储设备
2. 文件的存储设备 文件的存储设备分为不可重复使用的 和可重复使用的两类。 不可重复使用的文件存储设备也称为 I/O式字符设备,如打印纸等。 可重复使用的文件存储设备有磁带、 磁盘、光盘等,也称块设备。
链接索引块
directory entry

文件物理结构 多重索引结构

文件物理结构 多重索引结构

文件物理结构多重索引结构
文件物理结构是指文件在存储介质上的组织方式,它决定了文件的读取和写入操作的效率。

常见的文件物理结构包括顺序结构、链式结构、索引结构等。

多重索引结构是一种常见的文件物理结构,它将文件的索引信息进行多层次的组织,提高了文件的检索效率。

多重索引结构通常由主索引和辅助索引构成。

主索引是对文件中每个记录的关键字建立的索引,它包括了关键字和指向对应记录的指针。

主索引通常按照关键字的排序顺序组织,以便进行二分查找或其他高效的检索操作。

辅助索引是对文件中非关键字属性或其他属性建立的索引,它包含了关键字和指向对应记录的指针。

辅助索引可以提供多种不同的检索路径,方便不同的检索需求。

多重索引结构通过将文件的索引分层组织,可以减少索引的查找时间,提高了文件的检索效率。

同时,多重索引结构还可以减少索引的存储空间,提高了存储的利用率。

然而,多重索引结构也增加了索引的维护成本,对于频繁更新的文件可能不适合使用。

文件的结构及存取方法

文件的结构及存取方法

(2)链接文件 结构是把把每个 物理块的最后一 个单元用作指针, 指向下一个物理 块的地址,通过 指针链接形成物 理文件结构。如 图5.2所示。
返回
图5.2
使用链接文件结构时,在文件说明信息 中只需指明该文件的第一个物理块号就行了。 链接文件的优点是不要求对各个文件分配连 续存储空间,解决了外零头空间问题,提高 了存储空间利用率;文件长度可以动态增长, 只要调整链接指针就可以在任何一个信息块 之间插入或删除一个信息块。链接文件结构 一般适用于逻辑上连续的文件,且存取方法 应是顺序存取的。对随机存取文件,其存取 速度慢,因为只能按链接指针从头至尾顺序 搜索。
式文件的一个特例。在UNIX系统中,所有的文件都被看作是流式文
件,即使是有结构文件,也被视为流式文件,系统不对文件进行格
式处理。
返回
文件的物理结构是指文件在外存上的存储组织方
式。事实上,由于文件的物理结构决定了文件信息在
外存上的存储位置,因此,文件信息的逻辑块号(逻
辑地址)到物理块号(物理地址)的变换是由文件的
(1)空闲链表
空闲链表是将所有空闲空间以空闲块或空闲盘区(每个盘区可包含多 个块)为单位形成一个链表。
对以空闲块为单位形成的链表,称为空闲盘块链。分配存储空间时, 系统从链首依次择取所需的空闲块,回收空闲空间时,释放的空闲块 逐个链入链尾。对以空闲盘区为单位形成的链表,称为空闲盘区链。 空闲盘区链中的结点应包含本盘区拥有的盘块数和下一个空闲盘区结 点的指针。在回收盘区时,要对相邻盘区进行合并。
根据用户和系统管理上的需要,可采用多种方式来组织这些记录, 形成不同的记录文件结构:
(1)连续结构。按记录存入文件的先后次序排列,与文件内容 无关。查找时,只能从第一个记录开始顺序查找,查找效率低, 但有利于记录的追加和修改。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
控制信息的传输。
4. 逻辑记录与物理记录(磁盘块)
(1)逻辑记录 逻辑记录是文件中按信息在逻辑上的独立含义来划分
的信息单位。 逻辑记录是对文件进行存取操作的基本单位。
(2)物理记录 在存储介质上,由连续信息所组成的一个区域称为块,
也叫物理记录。
(3)逻辑记录与物理记录的区别和关系 一个是逻辑的概念。一个是物理的概念。逻辑记录最
(2)按信息保存期限分类 临时文件 永久文件
档案文件
(3)按保护级别分类 不保护文件 只读文件
执行文件 读写文件
(4)按文件流向分类 输入文件 输入输出文件
输出文件
(5)按文件的逻辑结构分类 流式文件 记录式文件
(6)按文件的物理结构分类 顺序(连续)文件 链接文件
索引文件
(7)UNIX系统将文件分为三类 普通文件:无结构的字符文件 目录文件:由文件的目录项组成的文件 特殊文件:设备文件
(3)文件属性
文件属性反映文件的类型、类别、存取控制、保护 级别等信息。
UNIX系统中文件属性:
- 普通文件
d
目录文件
p 管道文件
c
字符型设备文件
b
块设备文件
二. 文件系统
1. 什么是文件系统
文件系统是操作系统中负责管理和存取文件信息 的软件机构,包括:
管理文件所需的数据结构(如目录表、文件控制 块、存储分配表)
磁盘实际运作方式(与设备管理的接口)等等。 文件系统是一个负责文件存储空间管理的机构,主要功
能包括: 统一管理文件的存储空间,实施存储空间的分配与回收 实现文件的按名存取
实现名字空间向存储空间的映射 实现文件信息的共享,并提供文件的保护和保密措施
向用户提供一个方便使用的接口(提供对文件系统操作 命令,以及提供对文件的操作命令:信息存取、加工等)
系统维护及向用户提供有关信息 提供与I/O的统一接口
(3) 文件系统的特点
使用简单 使用文件名、一组文件操作命令
安全可靠 提供防护措施,在文件遭受破坏时,能及时复原。
既能共享,又能保密 身份验证,存取权限验证。
(二) 文件的逻辑组织与存取方法
一. 文件的两种结构 1. 两种不同的观点
用户观点: 是研究用户“思维”中的抽象文件,或称逻辑文件,
终在存放到物理记录上。
二. 文件的逻辑结构
文件的逻辑结构: 结构文件--记录式文件 无结构文件--流式文件
1. 流式文件 流式文件是有逻辑意义的一串有序字符的集合,是
无结构的。 流式文件按信息的个数或以特殊字符为界进行存取,
构成文件的基本单位是字符,文件的长度为所含字符数。 好处:提供很大的灵活性
2. 文件的逻辑结构
(1)什么是文件的逻辑结构 从用户角度看到的文件面貌,是用户思维中文件结
构,即用户对信息进行逻辑组织形成的文件结构。
(2)研究文件逻辑结构的目的 为用户提供一种逻辑结构清晰、使用简便的逻辑文
件形式。 用户按文件的逻辑结构形式去存储、检索合加工文
件中的信息。
3. 文件的物理结构
(一)文件系统的基本概念
一. 文件 所有的计算机应用程序都要:存储信息,检索信息 三个基本要求: 存储大量的信息; 长期保存信息; 可以共享信息
解决方法:把信息以一种单元,即文件的形式存储在磁盘 或其他外部介质上
1. 什么是文件
文件是在逻辑上具有完整意义的信息集合。 它有一个名字以供标识。文件名是以字母开头的 字母数字串。
文件名是一个不大于14个字符的字符串。并且区分英ቤተ መጻሕፍቲ ባይዱ 字母的大小写。
例如: ll.c a .out aa AA
注意:在UNIX系统中文件名就是一个字符串,没 有文件名和文件扩展名之分,文件的类型由用户命名时 确定。
例如,li.c,UNIX系统认为这个文件名的长度是4个 字符。而在DOS、WINDOWS系统中则解释这个文件名, li是文件名,c是文件扩展名,表示该文件是一个C语言 的源程序文件,而.是文件名和文件扩展名的分隔符。
其研究的侧重点在于为用户提供一种逻辑结构清晰、 使用简便的逻辑文件形式。用户将按照这种形式去存 储、检索和加工有关文件中的信息。
实现观点: 是研究驻留在设备“介质”中的实际文件,或称物理
文件。它研究的侧重点是选择一些工作性能良好、设 备利用率高的物理文件形式。系统将按照这种形式同 外部设备打交道并控制信息的传输。
管理程序 一组操作
2. 文件系统的功能
(1)从用户的角度看
文件系统如何呈现在其面前:一个文件有什么组 成,如何命名,如何保护文件,可以进行何种操作等 等。
文件系统是用户在计算机上存储信息和使用信息 的接口,实现了“按名存取”的功能。
(2)从系统的角度看 文件目录怎样实现,怎样管理存储空间,文件存储位置,
(2)文件扩展名
文件扩展名表示了文件的使用特征。 不大于3个字符,一般用来表示文件的类型。
例如:
C
C语言源程序文件
COM
可执行文件(小模式)
EXE
可执行文件(大模式)
BAT
批处理文件
OBJ
目标文件
hust.txt ll.c ll.obj ll.exe
操作系统教学片99.ppt
UNIX系统中的文件名:
构成文件的基本单位——信息项 记录
文件是具有符号名的信息(数据)项的集合 文件是具有符号名的记录的集合
2. 文件分类
(1)按文件的性质和用途分类 系统文件:有关OS及有关系统所组成文件,通过 操作系统调用为用户服务。 程序库文件:标准子程序及常用应用程序组成文 件,允许用户使用但不能修改 用户文件:
(1)什么是文件的物理结构 文件在存储介质上的结构(或称组织)。在当代,
文件的存储介质是磁盘,包括软盘、硬盘和光盘、磁带, 早期还有磁鼓。由于目前的磁带是模拟磁盘的结构,所 以文件的物理结构主要是指磁盘上文件的结构。
(2)研究文件物理结构的目的 选择工作性能良好、设备利用率高的物理文件形式。 系统按照文件的物理结构形式和外部设备打交道,
3. 文件名与属性
(1)文件名 根据文件的定义,每个文件必须有一个唯一的文件
名,用户使用文件名存取文件。系统使用文件内部标识 符管理文件。 文件名是一个有限长度的字符串。
DOS、WINDOWS系统中文件名: 文件名.[文件扩展名]
文件名是一个不大于8个字符的字符串,但WINDOWS 系统中允许超长文件名,最多可有256个字符,不区分 英文字母的大小写。
相关文档
最新文档