Linux的Ext2文件系统详解

前述：Linux系统管理员很重要的任务之一就是管理好自己的磁盘文件系统，每个分区不可太大也不可以太小，太大会导致磁盘容量的浪费，太小会导致产生的文件无法存储的问题。在Linux里面文件是由两部分数据组成，一部分是metadata，另一部分是data。那么这些数据都存放在文件系统的什么地方呢？这就让我们必须得了解文件系统的Inode与Block的基本原理了，而Linux最传统的磁盘文件系统使用的是Ext2，所以我们了解下它的内部原理。

第一部分：磁盘的组成和分区（基础）

磁盘的机械部分：

1、圆形的盘片（主要记录数据的部分）

2、机械手臂与机械手臂上的磁头（可读写盘片上的数据）

3、主轴马达，可以转动盘片，让机械手臂的磁头在盘片上读写数据

磁盘的基本概念

1、扇区是最小的物理存储单元（512bytes）

2、将扇区组成一个园，那就是柱面，柱面是分区的最小单位

3、第一个扇区最重要，里面有硬盘的主引导程序（MBR）占446bytes和分区表（partision tables）占64bytes。

4、目前流行的家用硬盘接口SATA和服务器硬盘接口SAS。

磁盘分区部分：

1、主分区和扩展分区最多可以有4个（硬盘的限制）

2、扩展分区最多只能有一个（操作系统限制）

3、逻辑分区是由扩展分区分化出来的分区

4、主分区和逻辑分区的内容可以被格式化，而扩展分区无法格式化

第二部分：文件系统的基本特性

我们都知道硬盘分区后都是需要格式化，之后操作系统才能使用该分区，为什么呢？这是因为各种操作系统的文件的属性和权限并不相同的，为了能够存放这些文件，因此将分区格式化，以成为操作系统能利用的系统格式。

文件系统通常会将两部分的数据分别放在不同的块，权限与属性放置到inode中，实际的数据放置到data block块中，另外还有一个超级块（superblock）会记录整个文件系统的整体信息，包括inode和block的总量、使用量、剩余量，以及文件系统的格式与信息。inode 会记录文件的属性，一个文件会占用一个inode,同时会记录文件的数据所在的block号码，block实际会记录文件的内容，若文件太大，会占用多个block。

第三部分：Linux的Ext2文件系统

1、data block(数据块)

data block是用来放置文件内容的地方，在Ext2文件系统下支持的block的大小为1KB、2KB和4KB。在格式化的时候，block的大小就被确定了，并且每个block都会有编号，以方便inode记录。

原则上，block的大小与数量在格式化是不能再改变了（除非重新格式化）；每个block内最多只能放置一个文件的数据，存在以下两种情况，一种是文件大于1个block则会占用多个block，另外一种是文件小于block，则block的剩余空间就不会再被使用了（磁盘空间的浪费）。

那既然上述说的大的block可能会导致严重的磁盘容量浪费，但是block设定为最小1K 呢？那么对于大的文件来说会占用数量更多的block，而inode要记录更过的block的号码，

此时又会到时文件系统的不良读写的性能。

因此，在系统进行格式化之前，要想好文件系统的预计使用情况，目前流行为4K。

2、inode

inode的主要内容是记录文件的属性以及该文件的实际数据是放在那几号的block内。inode记录文件数据有以下内容：

a、该文件的访问模式（r/w/x）

b、该文件的所有者与组(owner/group)

c、该文件的大小

d、该文件的时间戳（atim

e、ctime、mtime）

e、定义文件属性的标志

f、该文件真正内容的指向（pointer）

其实inode的数量以及大小在格式化的时候就已经被固定了，除了以上还有其它的特性如下：

每个inode的大小为128bytes,每个文件都仅会占用一个inode,因此文件系统能够创建的文件的数量是与inode的数量相关的。

系统读取文件时需要先找到inode，并且分析inode所记录的权限与用户是否符合，若符合才能继续读取block的内容。

第四部分：inode的结构示意图

首先，inode需要记录的数据非常的多，但偏偏只有128bytes，而inode记录一个block 号码就要花掉4bytes，一个inode如果不记录其他数据的化，最多也只能记录32个block 号码。假如一个文件的大小为4GB且每个block为4KB时，那么至少也要100万个block号码，那么按照上面所说的一个inode对应32个block号码，就需要至少32000个inode，这时会需要更多的inode,我们也没有那么多的inode,因此我们的系统就有了inode记录block号码的12个直接，1个间接，1个双间接，1个三间接的记录区。

下面我们通过上述inode的结构图，来分析下内部原理。

图中最左边为inode本身（128bytes）,里面有12个直接指向block号码对照，这12个记录就能够直接取得block的号码。至于我们说的间接就是再拿一个block的内存来放当做记录block的号码的记录区，如果文件较大时，系统就会使用间接。同理如果文件再大的化，可以使用双间接，和三间接。所谓的双间接第一个block再指向下一个记录编号的block在哪里，实际记录的是第二个block中。以此类推三间接就是利用第三层block来记录编号的，前两层的block都是放置记录区的内容。

若1个block的大小为1KB，下面我们看各层可以记录多少block

12个直接指向：12X1K=12K （直接连接，仅能记录12条block）

间接连接：256X1K=256K （每条block号码的记录会花掉4bytes,因此1个block会记录256条记录）

双间接：256X256X1K=64MB(第一层block会指定256个第二层，每个第二层又可以指定256个号码，就会对应256个block)

三间接：256X256X256X1K=16GB(第一层block会指定256个第二层，每个第二层又会指定256个第三层，每个第三层可以指定256个号码)

因此将以上四种方式加在一起约等于16GB，此时我们知道文件系统block格式化为1K 大小时，能够容纳最大的文件为16GB，由于Ext2文件系统本身限制block的大小，因此2K 和4K的block的大小，在此就不加介绍了，是同样的道理。

本文仅为Linux的Ext2文件系统的inode和block的简单介绍，其中还有超级块，块对照表，inode对照表等以及和目录树的关系内容，我们先了解其基本原理。

操作系统课程设计-模拟文件系统

目录第1章需求分析 (1) 第2章概要设计 (1) 系统的主要功能 (1) 系统模块功能结构 (1) 运行环境要求 (2) 数据结构设计 (2) 第3章详细设计 (3) 模块设计 (3) 算法流程图 (3) 第4章系统源代码 (4) 第5章系统测试及调试 (4) 运行结果及分析 (4) 系统测试结论 (5) 第6章总结与体会 (6) 第7章参考文献 (6) 附录 (7)

第1章需求分析通过模拟文件系统的实现，深入理解操作系统中文件系统的理论知识, 加深对教材中的重要算法的理解。同时通过编程实现这些算法,更好地掌握操作系统的原理及实现方法,提高综合运用各专业课知识的能力；掌握操作系统结构、实现机理和各种典型算法，系统地了解操作系统的设计和实现思路，并了解操作系统的发展动向和趋势。模拟二级文件管理系统的课程设计目的是通过研究Linux的文件系统结构，模拟设计一个简单的二级文件系统，第一级为主目录文件，第二级为用户文件。第2章概要设计系统的主要功能 1) 系统运行时根据输入的用户数目创建主目录 2) 能够实现下列命令： Login 用户登录 Create 建立文件 Read 读取文件 Write 写入文件 Delete 删除文件 Mkdir 建立目录 Cd 切换目录 Logout 退出登录系统模块功能结构

运行环境要求操作系统windows xp ，开发工具vc++ 数据结构设计用户结构：账号与密码结构 typedef struct users { char name[8]; char pwd[10]; }users; 本系统有8个默认的用户名,前面是用户名,后面为密码,用户登陆时只要输入正确便可进入系统,否则提示失败要求重新输入。 users usrarray[8] = { "usr1","usr1", "usr2","usr2", "usr3","usr3", "usr4","usr4",

Ext2数据块分配

Ext2数据块分配跟索引节点一样，Ext2也对磁盘数据块进行分配与释放。在详细分析相关代码之前，先引出两个重要的预备，一个是数据块寻址，一个是文件的洞 1 数据块寻址每个非空的普通文件都由一组数据块组成。这些块或者由文件内的相对位置（它们的文件块号）来标识，或者由磁盘分区内的位置（它们的逻辑块号）来标识。从文件内的偏移量f 导出相应数据块的逻辑块号需要两个步骤： 1. 从偏移量f导出文件的块号，即在偏移量f处的字符所在的块索引。 2. 把文件的块号转化为相应的逻辑块号。因为Unix文件不包含任何控制字符，因此，导出文件的第f 个字符所在的文件块号当容易的，只是用f除以文件系统块

的大小，并取整即可。例如，让我们假定块的大小为4KB。如果f小于4096，那么这个字符就在文件的第一数据块中，其文件的块号为O。如果f等于或大于4096而小于8192，则这个字符就在文件块号为1的数据块中，以此类推。得到了文件的块号是第一步。但是，由于Ext2文件的数据块在磁盘上不必是相邻的，因此把文件的块号转化为相应的逻辑块号可不是这么直截了当的了。因此，Ext2文件系统必须提供一种方法，用这种方法可以在磁盘上建立每个文件块号与相应逻辑块号之间的关系。在索引节点内部部分实现了这种映射（回到了 AT&T Unix的早期版本）。这种映射也涉及一些包含额外指针的专用块，这些块用来处理大型文件的索引节点的扩展。 ext2磁盘索引节点ext2_inode的i_block字段是一个有EXT2_N_BLOCKS个元素且包含逻辑块号的数组。在下面的讨论中，我们假定EXT2_N_BLOCKS的默认值为15（实际上到2.6.18这个值都一直是15）。如图所示，这个数组表示一个大型数据结构的初始化部分。

Linux 0.1.1文件系统的源码阅读

Linux 0.11文件系统的源码阅读总结 1.minix文件系统对于linux 0.11内核的文件系统的开发，Linus主要参考了Andrew S.Tanenbaum 所写的《MINIX操作系统设计与实现》，使用的是其中的1.0版本的MINIX文件系统。而高速缓冲区的工作原理参见M.J.Bach的《UNIX操作系统设计》第三章内容。通过对源代码的分析，我们可以将minix文件系统分为四个部分，如下如1-1。 ●高速缓冲区的管理程序。主要实现了对硬盘等块设备进行数据高速存取的函数。 ●文件系统的底层通用函数。包括文件索引节点的管理、磁盘数据块的分配和释放以及文件名与i节点的转换算法。 ●有关对文件中的数据进行读写操作的函数。包括字符设备、块设备、管道、常规文件的读写操作，由read_write.c函数进行总调度。 ●涉及到文件的系统调用接口的实现，这里主要涉及文件的打开、关闭、创建以及文件目录等系统调用，分布在namei和inode等文件中。图1-1 文件系统四部分之间关系图

1.1超级块首先我们了解一下MINIX文件系统的组成，主要包括六部分。对于一个360K软盘，其各部分的分布如下图1-2所示：图 1-2 建有MINIX文件系统的一个360K软盘中文件系统各部分的布局示意图注释1：硬盘的一个扇区是512B，而文件系统的数据块正好是两个扇区。注释2：引导块是计算机自动加电启动时可由ROM BIOS自动读入得执行代码和数据。注释3：逻辑块一般是数据块的2幂次方倍数。MINIX文件系统的逻辑块和数据块同等大小对于硬盘块设备，通常会划分几个分区，每个分区所存放的不同的文件系统。硬盘的第一个扇区是主引导扇区，其中存放着硬盘引导程序和分区表信息。分区表中得信息指明了硬盘上每个分区的类型、在硬盘中其实位置参数和结束位置参数以及占用的扇区总数。其结构如下图1-3所示。图1-3 硬盘设备上的分区和文件系统对于可以建立不同的多个文件系统的硬盘设备来说，minix文件系统引入超级块进行管理硬盘的文件系统结构信息。其结构如下图1-4所示。其中，s_ninodes表示设备上得i节点总数，s_nzones表示设备上的逻辑块为单位的总逻辑块数。s_imap_blocks 和s_zmap_blocks分别表示i节点位图和逻辑块位图所占用的磁盘块数。 s_firstdatazone表示设备上数据区开始处占用的第一个逻辑块块号。s_log_zone_size 是使用2为底的对数表示的每个逻辑块包含的磁盘块数。对于MINIX1.0文件系统该值为0，因此其逻辑块的大小就等于磁盘块大小。s_magic是文件系统魔幻数，用以指明文件系统的类型。对于MINIX1.0文件系统，它的魔幻数是0x137f。

认识文件系统

认识文件系统物联网学院平震宇

文件系统文件系统是一套实现了数据的存储、分级组织、访问和获取等操作的抽象数据类型，一种存储和组织计算机文件和数据的方法，它使得对其访问和查找变得容易。 Linux 最早的文件系统是Minix，但是专门为Linux 设计的文件系统——扩展文件系统第二版 (EXT2)被设计出来并添加到Linux中，这对Linux产生了重大影响。EXT2文件系统功能强大、易扩充、性能上进行了全面优化，也是所有Linux发布和安装的标准文件系统类型。

虚拟文件系统 Linux支持ext，ext2，xia，minix，umsdos，msdes，fat32 ，ntfs,proc，stub，ncp，hpfs，affs 以及 ufs 等多种文件系统。 Linux 对所有的文件系统采用统一的文件界面，用户通过文件的操作界面来实现对不同文件系统的操作。对于用户来说，我们不要去关心不同文件系统的具体操作过程，而只是对一个虚拟的文件操作界面来进行操作，这个操作界面就是 Linux 的虚拟文件系统(VFS ) 。 VFS 作为 Linux内核中的一个软件层，用于给用户空间的程序提供文件系统接口，同时也提供了内核中的一个抽象功能，允许不同的文件系统很好地共存。VFS 使 Linux 同时安装、支持许多不同类型的文件系统成为可能。VFS 拥有关于各种特殊文件系统的公共界面，如超级块、inode、文件操作函数入口等。实际文件系统的细节，统一由 VFS 的公共界面来索引，它们对系统核心和用户进程来说是透明的。

Linux上有许多可用的文件系统。每个文件系统都有其特定的用途，以便于特定用户解决不同的问题。 ?要求文件系统在频繁的文件操作（例如，新建，删除，截断）下能够保持较高的读写性能，要求低碎片化。 ?Linux下的日志文件系统能保持数据的完整性，但消耗过多系统资源,的弱点使之不能成为嵌入式系统中的主流应用。并且这些都是专门为硬盘这类的存储设备优化，对于flash这类的存储介质并不适用。

Ext3文件系统

EXT3文件系统 EXT2和EXT3是许多Linux操作系统发行版本的默认文件系统。EXT基于UFS，是一种快速、稳定的文件系统。随着Linux系统在关键业务中的应用，Linux文件系统的弱点也渐渐显露出来了；其中EXT2文件系统是非日志式文件系统，这在关键行业的应用是一个致命的弱点，EXT3文件系统弥补了这一缺点。 EXT3文件系统是直接从EXT2文件系统发展而来，目前EXT3文件系统已经非常稳定可靠。它完全兼容EXT2文件系统。用户可以平滑地过渡到一个日志功能健全的文件系统中来。这实际上了也是EXT3日志文件系统初始设计的初衷。 Ext3文件系统属于一种日志文件系统，是对Ext2系统的扩展。Ext3系统兼容Ext2文件系统，二者之间的相互转换并不复杂。 Ext2是 GNU/Linux 系统中标准的文件系统，其簇快取层的优良设计使得Ext2系统存取文件的性能非常好，尤其是针对中小型的文件更显优势。 Ext3是一种日志式文件系统，日志文件系统比传统的文件系统安全，因为它用独立的日志文件跟踪磁盘内容的变化。就像关系型数据库（RDBMS），日志文件系统可以用事务处理的方式，提交或撤消文件系统的变化。由于文件系统都有快取层参与运作，不使用时必须将文件系统卸下，以便将快取层的资料写回磁盘中。因此每当系统要关机时，必须将其所有的文件系统全部关闭后才能进行关机。如果在文件系统尚未关闭前就关机 (如停电) 时，下次重开机后会造成文件系统的资料不一致，故（所以）这时必须做文件系统的重整工作，将不一致与错误的地方修复。然而这一重整的工作是相当耗时的，特别是容量大的文件系统，而且也不能百分之百保证所有的资料都不会流失。为了克服此问题，使用（便出现了）所谓的日志式文件系统 (Journal File System) 。此类文件系统最大的特色是，它会将整个磁盘的写入动作完整记录在磁盘的某个区域上，以便有需要时可以回溯追踪。由于资料的写入动作包含许多的细节，如改变文件标头资料、搜寻磁盘可写入空间、一个个写入资料区段等等，每一个细节进行到一半若被中断，就会造成文件系统的不一致，因而需要重整。然而在日志式文件系统中，由于详细纪录了每个细节，故当在某个过程中被中断时，系统可以根据这些记录直接回溯并重整被中断的部分，而不必花时间去检查其他的部分，故重整的工作速度相当快，几乎不需要花时间。 EXT3日志文件系统的特点 1、高可用性系统使用了EXT3文件系统后，即使在非正常关机后，系统也不需要检查文件系统。宕机发生后，恢复EXT3文件系统的时间只要数十秒钟。 2、数据的完整性: EXT3文件系统能够极大地提高文件系统的完整性，避免了意外宕机对文件系统的破

stm32sdiofatfs文件系统源码分析

、概述 1、目的在移植之前，先将源代码大概的阅读一遍，主要是了解文件系统的结构、各个函数的功能和接口、与移植相关的代码等等。 2、准备工作在官方网站下载了0.07c 版本的源代码，利用记事本进行阅读。二、源代码的结构 1、源代码组成源代码压缩包解压后，共两个文件夹，doc是说明，src里就是代码。src文件夹里共五个文件和一个文件夹。文件夹是option，还有OOreadme.txt、 diskio.c、diskio.h、ff.c、ff.h、integer.h。对比网上的文章，版本已经不同了，已经没有所谓的tff.c 和tff.h 了，估计现在都采用条件编译解决这个问题了，当然文件更少，可能编译选项可能越复杂。 2、00readme.txt 的说明 Low level disk I/O module is not included in this archive because the FatFs module is only a generic file system layer and not depend on any specific storage device. You have to provide a low level disk I/O module that written to control your storage device .主要是说不包含底层10代码，这是个通用文件系统可以在各种介质上使用。我们移植时针对具体存储设备提供底层代码。接下来做了版权声明-可以自由使用和传播。然后对版本的变迁做了说明。 3、源代码阅读次序

先读integer.h,了解所用的数据类型，然后是ff.h, 了解文件系统所用的数据结构和各种函数声明，然后是diskio.h，了解与介质相关的数据结构和操作函数。再把ff.c和diskio.c两个文件所实现的函数大致扫描一遍。最后根据用户应用层程序调用函数的次序仔细阅读相关代码。三、源代码阅读 1、integer.h 头文件这个文件主要是类型声明。以下是部分代码。 typedef intINT; typedef unsigned int UINT; typedef signed charCHAR;/* These types must be 8-bit integer */ 都是用typedef 做类型定义。移植时可以修改这部分代码,特别是某些定义与你所在工程的类型定义有冲突的时候。 2、ff.h 头文件以下是部分代码的分析 #include “ intege使用i n teger.h 的类型定义 #ifndef _FATFS #define _FATFS 0x007版本号007c, 0.07c #define _WORD_ACCESS 0如//果定义为1,则可以使用word 访问。中间有一些看着说明很容易弄清楚意思。这里就不例举了。 #define _CODE_PAGE 936 /* The _CODE_PAGE specifies the OEM code page to be used on the target system. /936 -Simplified Chinese GBK (DBCS, OEM, WindoW跟据这个中国应该是936.

Ext2格式分析

Ext2格式分析 1、Ext2磁盘数据结构任何Ext2分区中的第一个块从不受Ext2文件系统的管理，因为这一块是为分区的引导扇区所保留的。Ext2分区的其余部分被分成块组（block group），每个块组的分布图如图所示。正如你从图中所看到的，一些数据结构正好可以放在一块中，而另一些可能需要更多的块。在Ext2文件系统中的所有块组大小相同并被顺序存放，因此，内核可以从块组的整数索引很容易地得到磁盘中一个块组的位置：由于内核尽可能地把属于同一个文件的数据块存放在同一块组中，所以块组减少了文件碎片。块组中的每个块包含下列信息之一： 1.文件系统的超级块的一个拷贝 2.一组块组描述符的拷贝 3.一个数据块位图 4.一个索引节点位图 5.一个索引节点表 6.属于文件的一大块数据，即数据块如果一个块中不包含任何有意义的信息，就说这个块是空闲的。从上图中可以看出，超级块与组描述符被复制到每个块组中。其实呢，只有块组0中所包含超级块和组描述符才由内核使用，而其余的超级块和组描述符都保持不变；事实上，内核甚至不考虑它们。当e2fsck程序对Ext2文件系统的状态执行一致性检查时，就引用存放在块组0中的超级块和组描述符，然后把它们拷贝到其他所有的块组中。如果出现数据损坏，并且块组0 中的主超级块和主描述符变为无效，那么，系

统管理员就可以命令e2fsck引用存放在某个块组（除了第一个块组）中的超级块和组描述符的旧拷贝。通常情况下，这些多余的拷贝所存放的信息足以让e2fsck把Ext2分区带回到一个一致的状态。那么有多少块组呢？这取决于分区的大小和块的大小。其主要限制在于块位图，因为块位图必须存放在一个单独的块中。块位图用来标识一个组中块的占用和空闲状况。所以，每组中至多可以有8×b个块，b是以字节为单位的块大小。例如，一个块是 1024 Byte，那么，一个块的位图就有8192个位，一个块组正好就对应8192个块(位图中的一个bit描述一个块)。 Ext2超块(super Block) Ext2超块中包含了描叙文件系统基本尺寸和形态的信息，是用定义在include／Linux ／ext2_fs．h中ext2_supe_block数据结构描述的。文件系统管理器利用它们来使用和维护文件系统。通常安装文件系统时只读取数据块组0中的超块，但是为防止文件系统被破坏，每个数据块组都包含了它的拷贝。超块中的主要信息如下： Magic Number：文件系统安装软件用来检验是否是一个真正的EXl2文件系统超块。当前Exl2版本中为0xEF53。 Block Size：以字节记数的文件系统块大小，如1024字节。 Blocks per Group：每个组中块数目。当文件系统创建时此块大小被固定下来。 Free Blocks：文件系统中的空闲块数。 Free Inodes：文件系统中空闲Inode数。 First Inode：文件系统中第一个Inode号。EX配根文件系统中第一个Inode将是指向‘／’目录的人口。 ExT2组描述符(Group Descript) 每个数据块组都拥有一个描叙结构的组描叙符，它是定义在include／Linux／ext2一fs．h中的ext2一group—desc结构。组描叙符放置在一起形成了组描叙符表。每个数据块组在超块拷贝后包含整个组描叙符表。象超块一样，所有数据块组中的组描叙符表被复制到每个数据块组中以防文件系统崩溃。EX配文件系统仅使用第一个拷贝(在数据块组0中)。组描叙符主要包含以下信息： Blocks Bitm印：对应此数据块组的块分配位图的块号，在块分配和回收时使用。 Inode Bitmap：对应此数据块组的Inode分配位图的块号，在Inode分配和回收时使用。 Inode Table：对应数据块组的Inode表的起始块号。每个Inode用下面的EX佗Inode 结构来表示。

文件系统结构分析

文件系统结构分析 1嵌入式文件系统 1.1嵌入式文件系统体系结构在嵌入式系统中，文件系统是嵌入式系统的一个组成模块，它是作为系统的一个可加载选项提供给用户，由用户决定是否需要加载它。同时，它还需要满足结构紧凑、代码量小、支持多种存储设备、可伸缩、可剪裁、可移植等特点。基于上面的要求，嵌入式文件系统在设计和实现时就要把它作为一个独立的模块来整体考虑。特别是对文件系统内部资源的管理要做到独立性。由于嵌入式文件系统是作为嵌入式系统的一个可选加载项提供给用户的，当用户针对其应用的特殊要求对嵌入式系统进行配置时没有选择加载文件系统，但是用户还是需要使用到系统I/O。由于这种情况的出现就决定了嵌入式系统中的文件系统不再具有I/O设备的管理功能。系统I/O的管理和使用接口的提供将由 I/O管理模块完成，文件系统作为一个独立的自包含模块存在。基于以上考虑，嵌入式文件系统的体系结构如图1所示。 1卩硬件图1嵌入式文件系统体系结构在嵌入式文件系统的最上层是文件系统 API。文件系统的一切功能都是通过这一层提供给用户的。同时，在整个文件系统中也只有这一层对用户是可见的。在这一层中所提供的所有功能接口都将严格的遵循 POSIX标准。文件系统核心层是实现文件系统主要功能的模块。在这一层中，文件系统要把

用户的功能操作转化成对文件系统的抽象对象的操作。这些操作将通过下面的功能模块最终落实到物理介质上面。如果文件系统需要支持多种具体的文件系统格式的话，这一层还可以进一步细分成虚拟文件系统和逻辑文件系统。块高速缓存的存在是为了提高文件系统的性能。在这一层中缓存着以前访问过的块设备数据。文件系统通过一定的算法来高效的管理这些数据，以提高缓冲的性能。同时，它的存在使下层的数据操作对上层的文件操作透明，提高了文件系统的模块性。 1.2 嵌入式文件系统体系的功能与特点文件系统是操作系统的重要组成部分，用于控制对存储设备的存取。它提供对文件和目录的分层组织形式、数据缓冲（对于实时系统，允许绕过缓冲）以及对文件存取权限的控制。嵌入式系统所使用的文件系统除了要提供通用文件系统的功能外，还由于嵌入式操作系统的特殊性而具有其自身的一些特点。嵌入式文件系统的设计应该满足如下目标： 1.实现按名存取。和桌面操作系统类似，用户对文件的操作是通过其“文件名”来完成的。因此，用户只需知道待操作文件的文件名，就可以方便的访问数据，而不必关心文件在物理设备上是如何存放的，以及如何对文件的打开、关闭操作进行处理等细节。所有与文件相关的管理工作都由文件系统组件隐式完成。 2.与实时系统相适应。嵌入式应用大多数都具有实时性需求。实时系统不仅要求计算结果地准确无误，而且要求特定的指令要在限定的时间内完成，这就对文件系统提出了很高的要求。在通用操作系统中，往往采取分页和虚拟存储器管理的机制来满足规定的指令时间。然而嵌入式实时操作系统一般都不具有虚拟存储器管理机制，且各种外部设备的性能差异较大，控制文件系统的实时性变得非常困难。为了尽可能提高文件系统的实时性，除了选取高速存储介质作为嵌入式系统的外设外，还应该根据设备的特点设置一定大小的高速缓冲，以提高数据存取的相应速度。 3.支持多任务环境。面对日益复杂的计算环境，应用常常采取“分而治之” 的方法，将解决方案划分为多个任务，每个任务完成相对单一的功能。实时操作系统的设计目标之一就是对多任务的支持。从应用的层面上看，多任务可以对文件进行并发读操作，在实时内核进程间同步与通信机制支持下进行写操作。此外，文件系统内部实现也应该具备较好的可重入性，即利用同步机制对全局数据结构进行必要的保护。 4.支持多种逻辑文件系统标准。随着操作系统技术的发展，出现了多种成熟的桌面文件系统标准，如 Windows下的FAT系列，Linux中的ext系列等。将这些成熟标

ext2文件系统

ext2文件系统总体存储布局我们知道，一个磁盘可以划分成多个分区，每个分区必须先用格式化工具（例如某种mkfs命令）格式化成某种格式的文件系统，然后才能存储文件，格式化的过程会在磁盘上写一些管理存储布局的信息。下图是一个磁盘分区格式化成ext2文件系统后的存储布局。图 29.2. ext2文件系统的总体存储布局文件系统中存储的最小单位是块（Block），一个块究竟多大是在格式化时确定的，例如mke2fs 的-b选项可以设定块大小为1024、2048或4096字节。而上图中启动块（Boot Block）的大小是确定的，就是1KB，启动块是由PC标准规定的，用来存储磁盘分区信息和启动信息，任何文件系统都不能使用启动块。启动块之后才是ext2文件系统的开始，ext2文件系统将整个分区划成若干个同样大小的块组（Block Group），每个块组都由以下部分组成。超级块（Super Block）描述整个分区的文件系统信息，例如块大小、文件系统版本号、上次mount的时间等等。超级块在每个块组的开头都有一份拷贝。块组描述符表（GDT，Group Descriptor Table）由很多块组描述符组成，整个分区分成多少个块组就对应有多少个块组描述符。每个块组描述符（Group Descriptor）存储一个块组的描述信息，例如在这个块组中从哪里开始是inode表，从哪里开始是数据块，空闲的inode和数据块还有多少个等等。和超级块类似，块组描述符表在每个块组的开头也都有一份拷贝，这些信息是非常重要的，一旦超级块意外损坏就会丢失整个分区的数据，一旦块组描述符意外损坏就会丢失整个块组的数据，因此它们都有多份拷贝。通常内核只用到第0个块组中的拷贝，当执行e2fsck检查文件系统一致性时，第0个块组中的超级块和块组描述符表就会拷贝到其它块组，这样当第0个块组的开头意外损坏时就可以用其它拷贝来恢复，从而减少损失。块位图（Block Bitmap）一个块组中的块是这样利用的：数据块（Data Block）存储所有文件的数据，比如某个分区的块大小是1024字节，某个文件是2049字节，那么就需要三个数据块来存，即使第三个块只存了一

ext2文件系统删除后的恢复

ext2文件系统下数据进行数据恢复摘要 ext2文件系统下数据进行数据恢复 --------------------------------------------------------------------- 本系的 BBS 系统真是多灾多难 (嗯 .... 其实是因为我的疏忽，才会这么多灾多难 ....) ，继这几日系统时间不正确，造成许多人的 ID 被误砍后，又一次因系统设定上的问题，将 BBS 的重要备份档给杀了。这件事是学弟发现后告诉我的，当我上站来一见到他的mail, 当真是欲哭无泪，差点没去撞墙。那时已是周六晚 11:00 左右，我一边想着要编一套说辞向大家解释无法替大家进行数据恢复旧信件与设定了，一边还在想是否能够挽回局面。大家知道， UNIX like 的系统是很难像 M$ 的系统一样，做到 undelete 的，所有网管前辈都曾再三警告我们，要小心! 小心! 砍档之前三思而后行，砍了之后再后悔也没用。虽然我已渐渐做到砍档三思而后行，但之次误砍事件是系统在背景中定时执行的，等到我找出原因时已是数据被砍后一个多小时。我凭着一点点的印象，想起在网络上，有人讨论过在 Linux ext2 filesystem中 undelete 的可能性，但我所见到的多半是负面的答案，但好象真的有人做过这件事，于是我第一个所做的，就是马上将该数据原来所在的 partition mount成 read-only, 禁止任何的写入动作，不是怕再有数据被误砍 (因为已没什么可砍的了) ，而是怕有新数据写进来，新资料可能会覆盖到旧资料原本存在的磁区 (block) 。我们现在唯一个指望，就是企图将数据原来存在的磁区一个个找回来，并且「希望」这些磁区上的旧资料都还在，然后将这些磁区串成一个数据。终于被我找到了!! 原来这方面的技术文件就存在我自己的系统中 :-)) /usr/doc/HOWTO/mini/Ext2fs-Undeletion.gz 于是我就按照这份文件的指示一步步来，总算将一个长达 8MB 的压缩档数据恢复了 99%, 还有一个长达 1.1 MB 的压缩档完整无缺地救了回来。感谢上帝、 Linux 的设计者、写那篇文件的作者、曾经讨论过此技术的人、以及 Linux 如此优秀的 ext2 filesystem, 让我有机会抢救过去。现在，我将我的抢救步骤做一个整理让大家参考，希望有派得上用场的时候 (喔! 不，最好是希望大家永远不要有机会用到以下的步数 :-))) 在此严正声明!! 写这篇文章的目的，是给那些处于万不得已情况下的人们，有一个挽回的机会，并不意味着从此我们就可以大意，砍档不需要三思。前面提到，我有一个数据无法100% 救回，事实上，长达 8MB 的数据能救回 99% 已是幸运中的幸运，一般的情况下若能救回 70% - 80% 已经要愉笑了。所以，不要指望 undelete 能救回一切。预防胜于治疗! 请大

基于c语言的文件系统FAT16操作源代码

文件： FAT.H //微控设计网原创 https://www.360docs.net/doc/cc15652833.html, 作者: debug版主typedef unsigned char uint8; typedef unsigned int uint16; typedef unsigned long uint32; #pragma pack(1) typedef struct { uint8 BS_jmpBoot[3]; uint8 BS_OEMName[8]; uint16 BPB_BytesPerSec; uint8 BPB_SecPerClus; uint16 BPB_RsvdSecCnt; uint8 BPB_NumFATs; uint16 BPB_RootEntCnt; uint16 BPB_TotSec16; uint8 BPB_Media; uint16 BPB_FATSz16; uint16 BPB_SecPerTrk; uint16 BPB_NumHeads; uint32 BPB_HiddSec; uint32 BPB_TotSec32; uint8 BS_DrvNum; uint8 BS_Reservedl; uint8 BS_BootSig; uint32 BS_VolID; uint8 BS_VolLab[11]; uint8 BS_FilSysType[8]; uint8 ExecutableCode[448]; uint8 ExecutableMarker[2]; } FAT_BPB; typedef struct { uint8 NAME[8]; uint8 TYPE[3]; } FILE_NAME; typedef struct { uint16 Start; uint32 Size; } FILE_POSIT; typedef struct {

磁盘格式分析Ext2格式分析

Ext2格式分析 Ext2的一般特征 VFS主要是提供一个系统调用接口，然后将相关文件系统对象与具体的文件系统串联起来。从本文开始，我们将选择一个具体的文件系统进行研究，这个文件系统就是第二扩展文件系统（Ext2）。ext2是 Linux所固有的，事实上已在每个Linux系统中得以使用此外，Ext2在对现代文件系统的高性能支持方面也显示出很多良好的实践性。 Ext2文件系统具有以下一般特点： 1、当创建Ext2文件系统时，系统管理员可以根据预期的文件平均长度来选择最佳的块大小（从1024B——4096B）。例如，当文件的平均长度小于几千字节时，块的大小为1024B是最佳的，因为这会产生较少的内部碎片——也就是文件长度与存放块的磁盘分区有较少的不匹配。另一方面，大的块对于大于几千字节的文件通常比较合合适，因为这样的磁盘传送较少，因而减轻了系统的开销。 2、当创建Ext2文件系统时，系统管理员可以根据在给定大小的分区上预计存放的文件数来选择给该分区分配多少个索引节点。这可以有效地利用磁盘的空间。 3、文件系统把磁盘块分为组。每组包含存放在相邻磁道上的数据块和索引节点。正是这种结构，使得可以用较少的磁盘平均寻道时间对存放在一个单独块组中的文件并行访问。 4、在磁盘数据块被实际使用之前，文件系统就把这些块预分配给普通文件。因此当文件的大小增加时，因为物理上相邻的几个块已被保留，这就减少了文件的碎片。 5、支持快速符号链接。如果符号链接表示一个短路径名（小于或等于60个字符），就把它存放在索引节点中而不用通过由一个数据块进行转换。此外，Ext2还包含了一些使它既健壮又灵活的特点： 1、文件更新策略的谨慎实现将系统崩溃的影响减到最少。我们只举一个例子来体现这个优点：例如，当给文件创建一个硬链接时，首先增加磁盘索引节点中的硬链接计数器，然后把这个新的名字加到合适的目录中。在这种方式下，如果在更新索引节点后而改变这个目录之前出现一个硬件故障，这样即使索引节点的计数器产生错误，但目录是一致的。因此，尽管删除文件时无法自动收回文件的数据块，但并不导致灾难性的后果。如果这种处理的顺序相反（更新索引节点前改变目录），同样的硬件故障将会导致危险的不一致，删除原始的硬链接就会从磁盘删除它的数据块，但新的目录项将指向一个不存在的索引节点。如果那个索引节点号以后又被另外的文件所使用，那么向这个旧目录的写操作将毁坏这个新的文件。 2、在启动时支持对文件系统的状态进行自动的一致性检查。这种检查是由外部程序e2fsck完成的，这个外部程序不仅可以在系统崩溃之后被激活，也可以在一个预定义的文件系统安装数（每次安装操作之后对计数器加1）之后被激活，或者在自从最近检查以来所花的预定义时间之后被激活。 3、支持不可变（immutable）的文件（不能修改、删除和更名）和仅追加（append-only）的文件（只能把数据追加在文件尾）。 4、既与Unix System V Release 4（SVR4）相兼容，也与新文件的用户组ID的BSD 语义相兼容。在SVR4中，新文件采用创建它的进程的用户组ID；而在BSD中，新文件继承包含它的目录的用户组ID。Ext2包含一个安装选项，由你指定采用哪种语义。即使Ext2文件系统是如此成熟、稳定的程序，也还要考虑引入另外几个负面特性。

EXT2、EXT3、EXT4、XFS、GPT详解

EXT2、EXT3、EXT4、XFS、GPT详解原创：运维老司机小柒博客 7月18日 EXT2与EXT3区别 Linux之前缺省情况下使用的文件系统为Ext2，ext2文件系统的确高效稳定。但是，随着Linux系统在关键业务中的应用，Linux文件系统的弱点也渐渐显露出来了:其中系统缺省使用的ext2文件系统是非日志文件系统。这在关键行业的应用是一个致命的弱点，Ext3文件系统是直接从Ext2文件系统发展而来，目前ext3文件系统已经非常稳定可靠。它完全兼容ext2文件系统。用户可以平滑地过渡到一个日志功能健全的文件系统中来。这实际上了也是ext3日志文件系统初始设计的初衷。 1) ext3和ext2的主要区别在于，ext3引入Journal（日志）机制，Linux 内核从2.4.15开始支持ext3，它是从文件系统过渡到日志式文件系统最为简单的一种选择，ext3提供了数据完整性和可用性保证。 2) ext2和ext3的格式完全相同，只是在ext3硬盘最后面有一部分空间用来存放Journal的记录； 3) 在ext2中，写文件到硬盘中时，先将文件写入缓存中，当缓存写满时才会写入硬盘中；

4) 在ext3中，写文件到硬盘中时，先将文件写入缓存中，待缓存写满时系统先通知Journal，再将文件写入硬盘，完成后再通知Journal，资料已完成写入工作； 5) 在ext3中，也就是有Journal机制里，系统开机时检查Journal的内容，来查看是否有错误产生，这样就加快了开机速度； EXT3日志文件系统的特点 1、高可用性系统使用了ext3文件系统后，即使在非正常关机后，系统也不需要检查文件系统。宕机发生后，恢复ext3文件系统的时间只要数十秒钟。 2、数据的完整性 ext3文件系统能够极大地提高文件系统的完整性，避免了意外宕机对文件系统的破坏。在保证数据完整性方面，ext3文件系统有2种模式可供选择。其中之一就是"同时保持文件系统及数据的一致性"模式。采用这种方式，你永远不再会看到由于非正常关机而存储在磁盘上的垃圾文件。 3、文件系统的速度尽管使用ext3文件系统时，有时在存储数据时可能要多次写数据，但是，从总体上看来，ext3比ext2的性能还要好一些。这是因为ext3的日志功能对磁盘的驱动器读写头进行了优化。所以，文件系统的读写性能较之Ext2文件系统并来说，性能并没有降低。

Linux文件系统与案例详解及源码导读

[文件系统]Linux文件系统—源代码导读众所周知，文件系统是Unix系统最基本的资源。最初的Unix系统一般都只支持一种单一类型的文件系统，在这种情况下，文件系统的结构深入到整个系统内核中。而现在的系统大多都在系统内核和文件系统之间提供一个标准的接口，这样不同文件结构之间的数据可以十分方便地交换。Linux也在系统内核和文件系统之间提供了一种叫做VFS（virtual file system）的标准接口。这样，文件系统的代码就分成了两部分：上层用于处理系统内核的各种表格和数据结构；而下层用来实现文件系统本身的函数，并通过VFS来调用。这些函数主要包括： * 管理缓冲区(buffer. c)。 * 响应系统调用fcntl() 和ioctl()(fcntl.c and ioctl.c)。 * 将管道和文件输入/输出映射到索引节点和缓冲区(fifo.c, pipe.c)。 * 锁定和不锁定文件和记录(locks.c)。 * 映射名字到索引节点(namei.c, open.c)。 * 实现select( )函数(select . c)。 * 提供各种信息(stat.c)。 * 挂接和卸载文件系统(super.c)。 * 调用可执行代码和转存核心(exec.c)。 * 装入各种二进制格式(bin_fmt*.c)。

VFS接口则由一系列相对高级的操作组成，这些操作由和文件系统无关的代码调用，并且由不同的文件系统执行。其中最主要的结构有inode_operations 和file_operations。file_system_type是系统内核中指向真正文件系统的结构。每挂接一次文件系统，都将使用file_system_type组成的数组。file_system_type组成的数组嵌入到了fs/filesystems.c中。相关文件系统的read_super函数负责填充super_block结构。 -------------------------------------------------------------------------------- 源码导读 *Linux 如何维护它支持的文件系统中的文件 *描述了虚拟文件系统（Virtual File System VFS ） *解释了Linux 核心中真实的文件系统如何被支持 Linux 的一个最重要的特点之一使它可以支持许多不同的文件系统。这让它非常灵活，可以和许多其他操作系统共存。在写作本章的时候，Linux 可一直支持15 种文件系统：ext 、ext2 、xia 、minix 、umsdos 、msdos 、vfat 、proc 、smb 、ncp 、

[STM32]-stm32+sdio+fatfs文件系统-源码分析要点

[STM32]stm32+sdio+fatfs文件系统源码分析一、概述 1、目的在移植之前，先将源代码大概的阅读一遍，主要是了解文件系统的结构、各个函数的功能和接口、与移植相关的代码等等。 2、准备工作在官方网站下载了0.07c版本的源代码，利用记事本进行阅读。二、源代码的结构 1、源代码组成源代码压缩包解压后，共两个文件夹，doc是说明，src里就是代码。src文件夹里共五个文件和一个文件夹。文件夹是option，还有00readme.txt、diskio.c、diskio.h、ff.c、ff.h、integer.h。对比网上的文章，版本已经不同了，已经没有所谓的tff.c和tff.h了，估计现在都采用条件编译解决这个问题了，当然文件更少，可能编译选项可能越复杂。 2、00readme.txt的说明 Low level disk I/O module is not included in this archive because the FatFs module is only a generic file system layer and not depend on any specific storage device. You have to provide a low level disk I/O module that written to control your storage device.主要是说不包含底层IO代码，这是个通用文件系统可以在各种介质上使用。我们移植时针对具体存储设备提供底层代码。接下来做了版权声明-可以自由使用和传播。然后对版本的变迁做了说明。 3、源代码阅读次序先读integer.h,了解所用的数据类型，然后是ff.h,了解文件系统所用的数据结构和各种函数声明，然后是diskio.h，了解与介质相关的数据结构和操作函数。再把ff.c和diskio.c两个文件所实现的函数大致扫描一遍。最后根据用户应用层程序调用函数的次序仔细阅读相关代码。三、源代码阅读 1、integer.h头文件这个文件主要是类型声明。以下是部分代码。 typedef int INT; typedef unsigned int UINT; typedef signed char CHAR;/* These types must be 8-bit integer */都是用typedef做类型定义。移植时可以修改这部分代码，特别是某些定义与你所在工程的类型定义有冲突的时候。 2、ff.h头文件以下是部分代码的分析 #include "integer.h" 使用integer.h的类型定义 #ifndef _FATFS #define _FATFS 0x007C 版本号007c，0.07c #define _WORD_ACCESS 0 //如果定义为1，则可以使用word访问。中间有一些看着说明很容易弄清楚意思。这里就不例举了。 #define _CODE_PAGE 936 /* The _CODE_PAGE specifies the OEM code page to be used on the target system. OEM code page什么意思不大明白。 / 936 - Simplified Chinese GBK (DBCS, OEM, Windows)跟据这个中国应该是936.打开option文件夹看一下。打开cc936.c文件，里面有一个很大的数组static const WCHAR

FATFS文件系统剖析(全)

FATFS文件系统剖析1： FAT16：数据按照其不同的特点和作用大致可分为5部分：MBR区、DBR区、FAT区、DIR区和DATA区，相比fat12多了DBR区 Main boot record: MBR（0--1bdh）磁盘参数存放 DPT（1beh--1fdh）磁盘分区表 55，aa 分区结束标志 DBR（Dos Boot Record）是操作系统引导记录区的意思 FAT区（有两个，一个备份）：对于fat16，每一个fat项16位，所以可寻址的簇项数为65535（2的16次方）。而其每簇大小不超过32k，所以其每个分区最大容量为2G。fat32，每一个fat项32位，可寻址簇数目为2的32次方。 DIR区（根目录区）：紧接着第二FAT表（即备份的FAT表）之后，记录着根目录下每个文件（目录）的起始单元，文件的属性等。定位文件位置时，操作系统根据DIR中的起始单元，结合FAT表就可以知道文件在硬盘中的具体位置和大小了。 DATA区：实际文件内容存放区。 FAT32：暂时放在这里，不讨论！ Fatfs：嵌入式fat文件系统，支持fat16，fat32。包含有ff.h,diskio.h,integer.h,ffconf.h 四个头文件以及ff.c 文件系统实现。当然要实现具体的应用移植，自己要根据diskio.h实现其diskio。c 底层驱动。 diskio.h : 底层驱动头文件 ff.h : 文件系统实现头文件，定义有文件系统所需的数据结构 ff.c : 文件系统的具体实现

如下开始逐个文件加以分析： integer.h :仅实现数据类型重定义,增加系统的可移植性。 ffconf.h : 文件系统配置---逐个配置，先配置实现一个最小的fat文件系统,下面来分析各配置选项： #define _FFCONF 8255 //版本号 #define _FS_TINY 0 /* 0:Normal or 1:Tiny */ //在这里与先前版本有些许变化，是通过配置头配置两种不同大小的文件系统，这里配置为0。 #define _FS_READONLY 1//定义文件系统只读，也就不能写修改，在此定义为1，这样文件系统会大大缩小，简化学习理解过程。 #define _FS_MINIMIZE 3 /* 0 to 3 */ 这个选项是用于过滤掉一些文件系统功能，为0时是全功能，3是功能实现最小 #define _USE_STRFUNC 0 /* 0:Disable or 1/2:Enable */ 是否使用字符串文件接口，为0，不使用 #define _USE_MKFS 0 /* 0:Disable or 1:Enable */ 制作文件系统，这个功能实现是还要_FS_READONLY=0 #define _USE_FORWARD 0 /* 0:Disable or 1:Enable */ f_forward function 实现还需_FS_TINY =1 #define _USE_FASTSEEK 0 /* 0:Disable or 1:Enable */ 快速查找功能 #define _CODE_PAGE 936 // 936 - Simplified Chinese GBK (DBCS, OEM, Windows) #define _USE_LFN 0/* 0 to 3 */ 0:不使用长文件名 #define _MAX_LFN 255/* Maximum LFN length to handle (12 to 255) */ #define _LFN_UNICODE 0 /* 0:ANSI/OEM or 1:Unicode */