Linux内核模式

目前，操作系统内核的结构模式主要可分为整体式的单内核模式和层次式的微内核模式。而Linux0.11是采用了单内核模式。单内核模式的主要优点是内核代码结构紧凑，执行速度快，不足之处主要是层次结构性不强。

在单内核模式的系统中，操作系统所提供服务的流程为：应用主程序使用指定的参数值执行系统调用指令(init

x80)，使CPU从用户态(User Mode)切换到核心态(Kernel Model)，然后操作系统根据具体的参数值调用特定的系统调用服务程序，而这些服务程序则根据需要在底层的一些支持函数以完成特定的功能。在完成了应用程序所需要的服务后，操作系统又从核心态切换回应用态，返回到应用程序中继续执行后面的指令。因此概要地讲，单内核模式的内核也可以粗略地分为三个层次：调用服务的主程序层，执行系统调用的服务层和支持系统调用的底层函数。

2.2 Linux内核系统体系结构

Linux 内核主要由5个模块构成，它们分别是：进程调度模块，内存管理模块，文件系统模块，进程间通信模块和网络接口模块。

进程调度模块用来负责控制进程对CPU资源的使用。所采取的调度策略是各进程能够公平合理地访问CPU,同时保证内核能及时地执行硬件操作。内存管理模块用于确保所有进程能够安全地共享机器主内存区，同时，内存管理模块还支持虚拟内存管理方式，使得Linux支持进程使用比实际内存空间更多的内存容量。并可以利用文件系统把暂时不用的内存数据块会被交换到存储设备上去，当需要时再换回来。文件系统的模块用于支持对外部设备的驱动和存储。虚拟文件系统模块通过向所有的外部存储设备提供一个通用的文件接口，隐藏了各种硬件设备的不同细节。从而提供并支持与其他操作系统兼容的多种文件系统格式。进程间通信模块子系统用于支持多种进程间的信息交换方式。网络接口模块提供对多种网络通信标准的访问并支持许多网络硬件。

这几个模块之间的依赖关系如下图

由图可以看出，所有的模块都与进程调度模块存在依赖关系。因为它们都需要依赖进程调度程序来挂起(暂停)或重新运行它们的进程。通常，一个模块会在等待硬件操作期间被挂起，而在操作作完后才继续运行。

2.3 中断机制

在使用80x86组成的PC机种，采用了两片8259A可编程中断控制芯片。每片可以管理8个中断源。通过多片级联方式，能构成最多管理64个中断向量的系统。在PC/AT系列兼容机中，使用了两片8259A芯片，共可管理15级中断向量。其级连示意图见下面的图。其中从芯片的INT引脚连接到主芯片的IR2引脚上。主8259A芯片的端口基地址是

0x20，从芯片是0xA0。

在总线控制器控制下，8259A芯片可以处于编程状态和操作状态。编程状态是CPU使用INT或OUT指令对8259A 芯片进行初始化编程的状态。一旦完成了初始化编程，芯片即进入操作状态，此时芯片即可随时相应外部设备提出的中断请求(IRQ0-IRQ15)。通过中断判优选择，芯片可将选中当前最高优先级的中断请求作为中断服务对象，并通过CPU

引脚INT通知CPU外中断请求的到来，CPU响应后，芯片从数据总线D7-D0将编程设定的当前服务对象的中断号送出，CPU由此获取对应的中断向量值，并执行中断服务程序。

对于Linux内核来说，中断信号通常分为两类：硬件中断和软件中断(异常)。每个中断是由0-255之间的一个数组来标识。对于中断int0--int31，每个中断的的功能由Intel公司固定设定或者保留用，属于软件中断，但Intel公司称之为

异常。因为这些中断是在CPU执行指令时探测到异常情况而引起的。通常还可分为故障(Fault)和陷阱(traps)两类。中断int32--int255可以由用户自己设定。在Linux系统中，则将int32--int47对应于8259A中断控制芯片发出的硬件中断请求信号IRQ0-IRQ15，并把程序编程发出的系统调用(system_call)中断设置为int128。

2.4 系统定时

在Linux0.11内核中，PC机的可编程定时芯片Intel8253被设置成每隔10ms就发出一个时钟中断(IRQ0)信号。这个时间节拍就是系统运行的脉搏，我们称之为1个系统滴答。因此每经过一个滴答就会被调用一次时钟中断处理程序(timer_interrupt)。该处理程序主要用来通过jiffies变量来累计自系统启动以来经过的滴答数。每当发生一次时钟中断该值就增1。然后从被中断程序的段选择符中取得当前特权纪CPL作为参数调用do_timer()函数。

do_timer()函数则根据特权级队当前进程运行时间做累计。如果CPL=0，则表示进程是运行在内核态时被中断，因此把进程的内核运行时间统计值stime增1，否则把进程用户态运行时间统计值增1。如果程序添加过定时器，则对定时器链表进行处理。若某个定时器时间到(递减后等于0)，则调用该定时器的处理函数。然后对当前进程运行时间进行处理，把当前进程运行时间减1。如果此时当前进程时间片并

还大于0，表示其时间片还没有用完，于是就推出do_timer()继续运行当前进程。如果此时进程时间片已经递减为0，表示该进程已经用完了此次使用CPU的时间片，于是程序就会根据被中断程序的级别来确定进一步处理的方法。若被中断的当前进程是工作的用户态的(特权级别大于0)，则do_timer()就会调用调度程序schedule()切换到其他进程去运行。如果被中断的当前进程工作在内核态，也即在内核程序中运行时被中断，则do_timer()会立即退出。因此这样的处理方式决定了Linux系统在内核态运行时不会被调度程序切换。内核态程序是不可抢占的，但当处于用户态程序中运行时则是可以被抢占的。

2.5 Linux进程控制

程序是一个可执行的问题建，而进程(process)是一个执行中的程序实例。利用分时技术，在Linux操作系统上同时可以运行多个进程。分时技术的基本原理是把CPU的运行时间划分成一个个规定长度的时间片，让每个进程在一个时间片内运行。当进程的时间片用完时系统就利用调度程序切换到另一个进程去运行。因此实际上对于具体单个CPU的机器来说某一个时刻只能运行一个进程。但由于每个进程运行的时间片很短(例如15个系统滴答=150ms)，所以表面看起来好像所有进程子阿同时运行着。

对于Linux0.11内核来讲，系统最多可由64个进程同时

存在。除了第一个进程是"手工"建立以外，其余的都是进程使用系统调用fork创建的新进程，被创建的进程成为子进程(Child Process)，创建者，则称为父进程(parent process)。内核程序使用进程标识号(process ID,pid)来标识每个进程。进程由可执行的指令代码，数据和堆栈区组成。进程中的代码和数据部分分别对应一个可执行文件中的代码段，数据段。每个进程只能执行自己的代码和访问自己的数据及堆栈区。进程之间相互之间的通信需要通过系统调用来进行。对于只有一个CPU的系统，在某一个时刻只能有一个进程正在运行。内核通过进程调度程序分时调度各个进程运行。

Linux系统中，一个进程可以在内核态(Kerneo mode)或者用户态(user mode)下执行，因此Linux内核堆栈和用于堆栈是分开的。用户堆栈用于进程在用户态下临时保存调用函数的参数，局部变量等数据。内核堆栈则含有内核程序执行函数调用时的信息。

2.5.1任务数据结构

内核程序通过进程表对进程进行管理，每个进程在进程表中占有一项。在Linux系统中，进程表项是一个task_struct 任务结构指针。任务数据结构定义在头文件

include/linux/sched.h中。有些书上称其为进程控制块

PCB(Process Control Block)或者进程描述符PD(Processor Descriptor)。其中保存着用于控制和管理进程的所有信息。

主要包括进程当前运行的状态信息，信号，进程号，父进程号，运行时间累计值，正在使用的文件和本任务的局部描述符以及任务状态段信息。该结构每个字段的含义如下所示。

当一个进程在执行时，CPU的所有寄存器中的值，进城的状态以及堆栈中的内容被称为该进程的上下文。当内核需要切换(switch)至另一个进程时，它就需要保存当前进程的所有状态，也即保存当前进程的上下文，以便在再次执行该进程时，能够恢复到切换时的状态执行下去。在Linux中，当前进程上下文均保存在进程的任务数据结构中。在发生中断时，内核就在被中断进程的上下文中，在内核状态下执行中断服务例程。但同时会保留所有需要用到的资源，以便中断服务结束时能恢复被中断进程的执行。

2.5.2进程运行状态

一个进程在其生存期内，可处于一组不同的状态下，称为进程状态。见下图2-6所示。进程状态保存在进程任务结构的state字段中。当进程正在等待系统中的资源而处于等待状态时，则称奇处于睡眠等待状态。在Linux系统中，睡眠等待状态被分为可中断的和不可中断的等待状态。

运行状态(TASK_RUNNING)

当进程正在被CPU执行，或已经准备就绪随时可以由调度程序执行，则称该进程为处于运行状态(running)。进程可以在内核态运行，也可以在用户态运行。当系统资源已经可用时，进程就被唤醒而进入准备运行状态，该状态称为就绪态。这些状态在内核中表示方法相同，都被称为处于

TASK_RUNNING状态。

可中断睡眠状态(TASK_INTERRUPTIBLE)

当进程处于可中断等待状态时，系统不会调度该进程执行。当系统产生一个中断或者释放了进程正在等待的资源，或者进程收到一个信号，都可以唤醒进程转换到就绪状态(运行状态)。

不可中断睡眠状态(TASK_UNINTERRUPTIBLE)

与可中断睡眠状态类似。但处于该状态的进程只有被使用wake_up()函数明确唤醒时才能被转换到可运行就绪状态。

暂停状态(TASK_STOPPED)

当进程收到信号SIGSTOP,SIGTSTP,SIGTTIN或SIGTTOU时就会进入暂停状态。可向其发送SIGCONT信号让进程转换到可运行状态。在Linux0.11中，还为实现对该状态的转换处理。处于该状态的进程将被作为进程终止来处理。

僵死状态(TASK_ZOMBIE)

当进程已停止运行，但其父进程还没有询问其状态时，

则称该进城处于僵死状态。

当一个进程的运行时间片用完，系统就会使用调度程序强制切换到其他的进程去执行。另外，如果进程在内核态执行时需要等待系统的某个资源，此时该进城就会调用sleep_on()或者sleep_on_interruptible()自愿放弃CPU使用权，而让调度程序去执行其他程序。进程则进入睡眠状态

(TASK_UNINTERRUPTIBLE或TASK_INTERRUPTIBLE)。

只有当进程从"内核运行态"转移到"睡眠状态"时，内核才会进行进城切换操作。在内核态下运行的进程不能被其他进程抢占，而且一个进程不能改变另一个进程的状态。为了避免进程切换时造成内核数据错误，内核在执行临街区代码时禁止一切中断。

Linux内核崩溃原因分析及错误跟踪技术

Linux内核崩溃原因分析及错误跟踪技术随着嵌入式Linux系统的广泛应用，对系统的可靠性提出了更高的要求，尤其是涉及到生命财产等重要领域，要求系统达到安全完整性等级3级以上[1]，故障率（每小时出现危险故障的可能性）为10-7以下，相当于系统的平均故障间隔时间（MTBF）至少要达到1141年以上，因此提高系统可靠性已成为一项艰巨的任务。对某公司在工业领域14 878个控制器系统的应用调查表明，从2004年初到2007年9月底，随着硬软件的不断改进，根据错误报告统计的故障率已降低到2004年的五分之一以下，但查找错误的时间却增加到原来的3倍以上。这种解决问题所需时间呈上升的趋势固然有软件问题，但缺乏必要的手段以辅助解决问题才是主要的原因。通过对故障的统计跟踪发现，难以解决的软件错误和从发现到解决耗时较长的软件错误都集中在操作系统的核心部分，这其中又有很大比例集中在驱动程序部分[2]。因此，错误跟踪技术被看成是提高系统安全完整性等级的一个重要措施[1]，大多数现代操作系统均为发展提供了操作系统内核“崩溃转储”机制，即在软件系统宕机时，将内存内容保存到磁盘[3]，或者通过网络发送到故障服务器[3]，或者直接启动内核调试器[4]等，以供事后分析改进。基于Linux操作系统内核的崩溃转储机制近年来有以下几种： (1) LKCD（Linux Kernel Crash Dump）机制[3]; (2) KDUMP（Linux Kernel Dump）机制[4]； (3) KDB机制[5]； (4) KGDB机制[6]。综合上述几种机制可以发现,这四种机制之间有以下三个共同点： (1) 适用于为运算资源丰富、存储空间充足的应用场合； (2) 发生系统崩溃后恢复时间无严格要求； (3) 主要针对较通用的硬件平台，如X86平台。在嵌入式应用场合想要直接使用上列机制中的某一种，却遇到以下三个难点无法解决： (1) 存储空间不足嵌入式系统一般采用Flash作为存储器，而Flash容量有限，且可能远远小于嵌入式系统中的内存容量。因此将全部内存内容保存到Flash不可行。

设备驱动加到Linux内核中

7.2.3 设备驱动加到Linux内核中设备驱动程序编写完后将该驱动程序加到内核中。这需要修改Linux 的源代码，然后重新编译内核。 ①将设备驱动程序文件（比如mydriver.c)复制到/Linux/drivers/char目录下。该目录保存了Linux下字符设备的设备驱动程序。修改该目录下mem.c 文件，在int chr_dev_init()函数中增加如下代码： #ifdef CONFIG_MYDRIVER device_init(); #endif 其中CONFIG_MYDRIVER是在配置Linux内核时赋值。 ②在/linux/drivers/char目录下Makefile中增加如下代码： ifeq ($(CONFIG_MYDRIVER),y) L_OBJ + = mydriver.o endif 如果在配置Linux内核时选择了支持新定义的设备，则在编译内核时会编译mydriver.c生成mydriver.o文件。 ③修改/linux/drivers/char目录下config.in文件，在 comment Character devices 语句下面加上 bool suppot for mydriver CONFIG_MYDRIVER 这样，若编译内核，运行make config,make menuconfig或make xconfig,那么在配置字符设备时就会有选项： Support for mydriver 当选中这个设备时，设备驱动就加到了内核中了。重新编译内核，在shell中将当前目录cd 到Linux目录下，然后执行以下代码： # make menuconfig # make dep # make 在配置选项时要注意选择支持用户添加的设备。这样得到的内核就包含用户的设备驱动程序。 Linux通过设备文件来提供应用程序和设备驱动的接口，应用程序通过标准的文件操作函数来打开、关闭、读取和控制设备。查看Linux文件系统下的/proc/devices,可以看到当前的设备信息。如果设备驱动程序已被成功加进，这里应该由该设备对应的项。/proc/interrupts纪录了当时中断情况，可以用来查看中断申请是否正常；对于DMA和I/O口的使用，在/proc下都有相应的文件进行记录；还可以在设备驱动程序中申请在/proc 文件系统下创建一个文件，该文件用来存放设备相关信息。这样通过查看该文件就可以了解设备的使用情况。总之，/proc文件系统为用户提供了查

Linux内核结构详解教程

Linux内核结构详解教程 ─────Linux内核教程 linux内核就像人的心脏，灵魂，指挥中心。内核是一个操作系统的核心,它负责管理系统的进程，内存，设备驱动程序，文件和网络系统，决定着系统的性能和稳定性。内核以独占的方式执行最底层任务，保证系统正常运行。协调多个并发进程，管理进程使用的内存，使它们相互之间不产生冲突,满足进程访问磁盘的请求等等. 严格说Linux并不能称做一个完整的操作系统.我们安装时通常所说的Linux,是有很多集合组成的.应称为GNU/Linux. 一个Linux内核很少1.2M左右,一张软盘就能放下. 内容基础，语言简短简洁红联Linux论坛是致力于Linux技术讨论的站点，目前网站收录的文章及教程基本能满足不同水平的朋友学习。红联Linux门户： https://www.360docs.net/doc/2b4773582.html, 红联Linux论坛： https://www.360docs.net/doc/2b4773582.html,/bbs 红联Linux 论坛大全，所有致力点都体现在这 https://www.360docs.net/doc/2b4773582.html,/bbs/rf/linux/07.htm

目录 Linux内核结构详解 Linux内核主要五个子系统详解各个子系统之间的依赖关系系统数据结构 Linux的具体结构 Linux内核源代码 Linux 内核源代码的结构从何处开始阅读源代码海量Linux技术文章

Linux内核结构详解发布时间:2006-11-16 19:05:29 Linux内核主要由五个子系统组成：进程调度，内存管理，虚拟文件系统，网络接口，进程间通信。

Linux内核主要五个子系统详解发布时间:2006-11-16 19:05:54 1.进程调度（SCHED）:控制进程对CPU的访问。当需要选择下一个进程运行时，由调度程序选择最值得运行的进程。可运行进程实际上是仅等待CPU资源的进程，如果某个进程在等待其它资源，则该进程是不可运行进程。Linux使用了比较简单的基于优先级的进程调度算法选择新的进程。 2.内存管理（MM）允许多个进程安全的共享主内存区域。Linux的内存管理支持虚拟内存，即在计算机中运行的程序，其代码，数据，堆栈的总量可以超过实际内存的大小，操作系统只是把当前使用的程序块保留在内存中，其余的程序块则保留在磁盘中。必要时，操作系统负责在磁盘和内存间交换程序块。内存管理从逻辑上分为硬件无关部分和硬件有关部分。硬件无关部分提供了进程的映射和逻辑内存的对换；硬件相关的部分为内存管理硬件提供了虚拟接口。 3.虚拟文件系统（VirtualFileSystem,VFS）隐藏了各种硬件的具体细节，为所有的设备提供了统一的接口，VFS提供了多达数十种不同的文件系统。虚拟文件系统可以分为逻辑文件系统和设备驱动程序。逻辑文件系统指Linux所支持的文件系统，如ext2,fat等，设备驱动程序指为每一种硬件控制器所编写的设备驱动程序模块。 4.网络接口（NET）提供了对各种网络标准的存取和各种网络硬件的支持。网络接口可分为网络协议和网络驱动程序。网络协议部分负责实现每一种可能的网络传输协议。网络设备驱动程序负责与硬件设备通讯，每一种可能的硬件设备都有相应的设备驱动程序。 5.进程间通讯(IPC) 支持进程间各种通信机制。处于中心位置的进程调度，所有其它的子系统都依赖它，因为每个子系统都需要挂起或恢复进程。一般情况下，当一个进程等待硬件操作完成时，它被挂起；当操作真正完成时，进程被恢复执行。例如，当一个进程通过网络发送一条消息时，网络接口需要挂起发送进程，直到硬件成功地完成消息的发送，当消息被成功的发送出去以后，网络接口给进程返回一个代码，表示操作的成功或失败。其他子系统以相似的理由依赖于进程调度。

探究linux内核,超详细解析子系统

探究linux内核,超详细解析子系统 Perface 前面已经写过一篇《嵌入式linux内核的五个子系统》，概括性比较强，也比较简略，现在对其进行补充说明。仅留此笔记，待日后查看及补充！Linux内核的子系统内核是操作系统的核心。Linux内核提供很多基本功能，如虚拟内存、多任务、共享库、需求加载、共享写时拷贝（Copy-On-Write）以及网络功能等。增加各种不同功能导致内核代码不断增加。 Linux内核把不同功能分成不同的子系统的方法，通过一种整体的结构把各种功能集合在一起，提高了工作效率。同时还提供动态加载模块的方式，为动态修改内核功能提供了灵活性。系统调用接口用户程序通过软件中断后，调用系统内核提供的功能，这个在用户空间和内核提供的服务之间的接口称为系统调用。系统调用是Linux内核提供的，用户空间无法直接使用系统调用。在用户进程使用系统调用必须跨越应用程序和内核的界限。Linux内核向用户提供了统一的系统调用接口，但是在不同处理器上系统调用的方法

各不相同。Linux内核提供了大量的系统调用，现在从系统调用的基本原理出发探究Linux系统调用的方法。这是在一个用户进程中通过GNU C库进行的系统调用示意图，系统调用通过同一个入口点传入内核。以i386体系结构为例，约定使用EAX寄存器标记系统调用。当加载了系统C库调用的索引和参数时，就会调用0x80软件中断，它将执行system_call函数，这个函数按照EAX 寄存器内容的标示处理所有的系统调用。经过几个单元测试，会使用EAX寄存器的内容的索引查system_call_table表得到系统调用的入口，然后执行系统调用。从系统调用返回后，最终执行system_exit，并调用resume_userspace函数返回用户空间。 linux内核系统调用的核心是系统多路分解表。最终通过EAX寄存器的系统调用标识和索引值从对应的系统调用表中查出对应系统调用的入口地址，然后执行系统调用。 linux系统调用并不单层的调用关系，有的系统调用会由

如何安装Linux内核源代码

如何获取Linux内核源代码下载Linux内核当然要去官方网站了，网站提供了两种文件下载，一种是完整的Linux 内核，另一种是内核增量补丁，它们都是tar归档压缩包。除非你有特别的原因需要使用旧版本的Linux内核，否则你应该总是升级到最新版本。使用Git 由Linus领头的内核开发队伍从几年前就开始使用Git版本控制系统管理Linux内核了（参考阅读：什么是Git？），而Git项目本身也是由Linus创建的，它和传统的CVS不一样，Git是分布式的，因此它的用法和工作流程很多开发人员可能会感到很陌生，但我强烈建议使用Git下载和管理Linux内核源代码。你可以使用下面的Git命令获取Linus内核代码树的最新“推送”版本： $ git clone git://https://www.360docs.net/doc/2b4773582.html,/pub/scm/linux/kernel/git/torvalds/linux-2.6.git 然后使用下面的命令将你的代码树与Linus的代码树最新状态同步： $ git pull 安装内核源代码内核包有GNU zip（gzip）和bzip2格式。Bzip2是默认和首选格式，因为它的压缩比通常比gzip更好，bzip2格式的Linux内核包一般采用linux-x.y.z.tar.bz2形式的文件名，这里的x.y.z是内核源代码的具体版本号，下载到源代码包后，解压和抽取就很简单了，如果你下载的是bzip2包，运行： $ tar xvjf linux-x.y.z.tar.bz2 如果你下载的是gzip包，则运行： $ tar xvzf linux-x.y.z.tar.gz 无论执行上面哪一个命令，最后都会将源代码解压和抽取到linux-x.y.z目录下，如果你使用Git下载和管理内核源代码，你不需要下载tar包，只需要运行git clone命令，它就会自动下载和解压。内核源代码通常都会安装到/usr/src/linux下，但在开发的时候最好不要使用这个源代码树，因为针对你的C库编译的内核版本通常也链接到这里的。应用补丁

Linux内核驱动加载顺序

Linux内核驱动加载顺序【问题】背光驱动初始化先于LCD驱动初始化，导致LCD驱动初始化时出现闪屏的现象。【解决过程】 1 mach-xxx.c中platform devices列表如下 /* platform devices */ static struct platform_device *athena_evt_platform_devices[] __initdata = { //&xxx_led_device, &xxx_rtc_device, &xxx_uart0_device, &xxx_uart1_device, &xxx_uart2_device, &xxx_uart3_device, &xxx_nand_device, &xxx_i2c_device, &xxx_lcd_device, &xxxpwm_backlight_device, ... }; LCD（xxx_lcd_device）设备先于PWM（xxxpwm_backlight_device）设备。可见驱动的初始化顺序并不是和这个表定义的顺序始终保持一致的。（记得PM操作 - resume/suspend 的顺序是和这个表的顺序保持一致的） 2 怀疑和编译顺序有关 Z:\kernel\drivers\video\Makefile：背光驱动（backlight/)的编译限于LCD驱动（xxxfb.o）的编译 obj-$(CONFIG_VT) += console/ obj-$(CONFIG_LOGO) += logo/ obj-y += backlight/ display/ ... obj-$(CONFIG_FB_xxx) += xxxfb.o ak_logo.o obj-$(CONFIG_FB_AK88) += ak88-fb/ 这样编译生成的System.map中的顺序为： 906 c001f540 t __initcall_pwm_backlight_init6 907 c001f544 t __initcall_display_class_init6 908 c001f548 t __initcall_xxxfb_init6 Makefile更改为： obj-$(CONFIG_VT) += console/ obj-$(CONFIG_LOGO) += logo/ obj-y += display/

Linux设备驱动模型之platform总线深入浅出

Linux设备驱动模型之platform总线深入浅出在Linux2.6以后的设备驱动模型中，需关心总线，设备和驱动这三种实体，总线将设备和驱动绑定。在系统每注册一个设备的时候，会寻找与之匹配的驱动；相反，在系统每注册一个驱动的时候，会寻找与之匹配的设备，而匹配由总线完成。对于依附在USB、PCI、I2C、SPI等物理总线来这些都不是问题。但是在嵌入式系统里面，在Soc系统中集成的独立外设控制器，挂接在Soc内存空间的外设等却不依附在此类总线。基于这一背景，Linux发明了一种总线，称为platform。相对于USB、PCI、I2C、SPI等物理总线来说，platform总线是一种虚拟、抽象出来的总线，实际中并不存在这样的总线。 platform总线相关代码：driver\base\platform.c 文件相关结构体定义：include\linux\platform_device.h 文件中 platform总线管理下最重要的两个结构体是platform_device和platform_driver 分别表示设备和驱动在Linux中的定义如下一：platform_driver //include\linux\platform_device.h struct platform_driver { int (*probe)(struct platform_device *); //探测函数，在注册平台设备时被调用int (*remove)(struct platform_device *); //删除函数，在注销平台设备时被调用void (*shutdown)(struct platform_device *); int (*suspend)(struct platform_device *, pm_message_t state); //挂起函数，在关机被调用int (*suspend_late)(struct platform_device *, pm_message_t state); int (*resume_early)(struct platform_device *); int (*resume)(struct platform_device *);//恢复函数，在开机时被调用struct device_driver driver;//设备驱动结构}; 1 2 3 4 5 6 7 8

linux内核IMQ源码实现分析

本文档的Copyleft归wwwlkk所有，使用GPL发布，可以自由拷贝、转载，转载时请保持文档的完整性，严禁用于任何商业用途。 E-mail: wwwlkk@https://www.360docs.net/doc/2b4773582.html, 来源: https://www.360docs.net/doc/2b4773582.html,/?business&aid=6&un=wwwlkk#7 linux2.6.35内核IMQ源码实现分析（1）数据包截留并重新注入协议栈技术 (1) （2）及时处理数据包技术 (2) （3）IMQ设备数据包重新注入协议栈流程 (4) （4）IMQ截留数据包流程 (4) （5）IMQ在软中断中及时将数据包重新注入协议栈 (7) （6）结束语 (9) 前言：IMQ用于入口流量整形和全局的流量控制，IMQ的配置是很简单的，但很少人分析过IMQ的内核实现，网络上也没有IMQ的源码分析文档，为了搞清楚IMQ的性能，稳定性，以及借鉴IMQ的技术，本文分析了IMQ的内核实现机制。首先揭示IMQ的核心技术： 1.如何从协议栈中截留数据包，并能把数据包重新注入协议栈。 2.如何做到及时的将数据包重新注入协议栈。实际上linux的标准内核已经解决了以上2个技术难点，第1个技术可以在NF_QUEUE机制中看到，第二个技术可以在发包软中断中看到。下面先介绍这2个技术。（1）数据包截留并重新注入协议栈技术

（2）及时处理数据包技术 QoS有个技术难点：将数据包入队，然后发送队列中合适的数据包，那么如何做到队列中的数

激活状态的队列是否能保证队列中的数据包被及时的发送吗？接下来看一下，激活状态的队列的证了数据包会被及时的发送。这是linux内核发送软中断的机制，IMQ就是利用了这个机制，不同点在于：正常的发送队列是将数据包发送给网卡驱动，而IMQ队列是将数据包发送给okfn函数。

史上最全linux内核配置详解

对于每一个配置选项，用户可以回答"y"、"m"或"n"。其中"y"表示将相应特性的支持或设备驱动程序编译进内核；"m"表示将相应特性的支持或设备驱动程序编译成可加载模块，在需要时，可由系统或用户自行加入到内核中去；"n"表示内核不提供相应特性或驱动程序的支持。只有<>才能选择M 1. General setup（通用选项） [*]Prompt for development and/or incomplete code/drivers，设置界面中显示还在开发或者还没有完成的代码与驱动，最好选上，许多设备都需要它才能配置。 [ ]Cross-compiler tool prefix，交叉编译工具前缀，如果你要使用交叉编译工具的话输入相关前缀。默认不使用。嵌入式linux更不需要。 [ ]Local version - append to kernel release，自定义版本，也就是uname -r可以看到的版本，可以自行修改，没多大意义。 [ ]Automatically append version information to the version string，自动生成版本信息。这个选项会自动探测你的内核并且生成相应的版本，使之不会和原先的重复。这需要Perl的支持。由于在编译的命令make-kpkg 中我们会加入- –append-to-version 选项来生成自定义版本，所以这里选N。 Kernel compression mode (LZMA)，选择压缩方式。 [ ]Support for paging of anonymous memory (swap)，交换分区支持，也就是虚拟内存支持，嵌入式不需要。 [*]System V IPC，为进程提供通信机制，这将使系统中各进程间有交换信息与保持同步的能力。有些程序只有在选Y的情况下才能运行，所以不用考虑，这里一定要选。 [*]POSIX Message Queues，这是POSIX的消息队列，它同样是一种IPC(进程间通讯)。建议你最好将它选上。 [*]BSD Process Accounting，允许进程访问内核，将账户信息写入文件中，主要包括进程的创建时间/创建者/内存占用等信息。可以选上，无所谓。 [*]BSD Process Accounting version 3 file format，选用的话统计信息将会以新的格式（V3）写入，注意这个格式和以前的v0/v1/v2 格式不兼容，选不选无所谓。 [ ]Export task/process statistics through netlink (EXPERIMENTAL)，通过通用的网络输出工作/进程的相应数据，和BSD不同的是，这些数据在进程运行的时候就可以通过相关命令访问。和BSD类似，数据将在进程结束时送入用户空间。如果不清楚，选N（实验阶段功能，下同）。 [ ]Auditing support，审计功能，某些内核模块需要它（SELINUX），如果不知道，不用选。 [ ]RCU Subsystem，一个高性能的锁机制RCU 子系统，不懂不了解，按默认就行。 [ ]Kernel .config support，将.config配置信息保存在内核中，选上它及它的子项使得其它用户能从/proc/ config.gz中得到内核的配置,选上，重新配置内核时可以利用已有配置Enable access to .config through /proc/config.gz，上一项的子项，可以通过/proc/ config.gz访问.config配置，上一个选的话，建议选上。 (16)Kernel log buffer size (16 => 64KB, 17 => 128KB) ，内核日志缓存的大小，使用默认值即可。12 => 4 KB，13 => 8 KB，14 => 16 KB单处理器，15 => 32 KB多处理器，16 => 64 KB，17 => 128 KB。 [ ]Control Group support（有子项），使用默认即可，不清楚可以不选。 Example debug cgroup subsystem，cgroup子系统调试例子 Namespace cgroup subsystem，cgroup子系统命名空间 Device controller for cgroups，cgroups设备控制器

(完整版)linux内核技术

一、教学目的 SMP、多核系统、高性能浮点处理器和新型总线等创新技术，带动操作系统不断发展。本课程使硕士生了解linux的基本原理和结构特征，提高应用现代操作系统的水平、能开发特定的内核功能、设备驱动程序和复杂应用软件的能力。二、教学内容与要求 1掌握处理器在进程地址空间上的三种运行位置，了解内核编程不能使用C库函数和FPU，以及可能产生内存故障、核心栈溢出和四种内核竞争情形的原因。（2学时）2熟悉进程描述符的组织，进程上下文和进程状态转换，和fork，exec，wait，exit，clone，linux线程和内核线程的实现原理和应用。了解COW和避免出现孤儿进程技术。（4小时） 3介绍支持SMP的O(1)调度，用户和内核抢占和进程上下文切换，了解优先级复算，睡眠和唤醒机制，SMP的负载均衡。（4小时） 4掌握在x86体系结构上系统调用的具体实现原理，接口参数传递，用户地址空间和核心地址空间之间的数据传输，和增加新的系统功能的方法。（2小时）5熟悉在x86体系结构上Linux中断和异常的处理原理，中断注册、共享、控制，和中断上下文的意义，中断和设备驱动程序的关系，以及设备驱动程序结构和用户接口。（4小时） 6中断处理程序被分解为top half和bottom half的原因，介绍linux的softirq，tasklet，ksoftirqd和work queue，分析进程与top half，bottom half的竞争情形和同步。（4小时）7掌握内核同步原理和方法：原子操作，自旋锁，（读—写）信号量，完成变量，bkl，seqlock和延迟内核抢占。了解指令“路障”。（4小时） 8介绍系统时钟和硬件定时器，单处理器和多处理器上的linux计时体系结构，定时的时间插补原理，单处理器和多处理器上的时钟中断处理，动态定时器的数据结构和算法原理，定时器竞争情形，延迟函数。Time，gettimeofday，adjtimex，setitimer，alarm 的实现原理和应用。（4小时） 9熟悉进程地址空间的区和页，分配和释放物理页，物理地址与逻辑地址、虚地址之间的映射，slub分配原理和方法，高端物理内存的映射。（4小时） 10介绍VFS原理，超级块，inode结构和方法，dentry结构和方法，file结构和方法，以及进程打开文件表，linux中的文件系统。（2小时） 11讲解块设备缓冲，bio结构，I/O请求队列，和有最终期限的块I/O调度算法。（２小时） 12熟悉进程地址空间的分区，mm_struct结构，vm_area_struct结构和操作，，进程的页表文件映射接口mmap原理和方法。（2小时） 13熟悉页cache和radix_tree，缓冲区cache，和pdflush内核线程原理。（2小时）三、教学方式教学方式：课堂讲授考试方式：堂上考试、考查都采用笔试。

Linux kernel内核升级全过程,教你一次成功

序言由于开发环境需要在linux-2.6内核上进行，于是准备对我的虚拟机上的Linux系统升级。没想到这一弄就花了两天时间( 反复装系统，辛苦啊~~)，总算把Linux系统从2.4.20-8内核成功升级到了2.6.18内核。网上虽然有很多介绍Linux内核升级的文章，不过要么过时，下载链接失效；要么表达不清，不知所云；更可气的是很多文章在转载过程中命令行都有错误。刚开始我就是在这些“攻略”的指点下来升级的，以致于浪费了很多时间。现在，费尽周折，升级成功，心情很爽，趁性也来写个“升级攻略”吧！于是特意又在虚拟机上重新安装一个Linux系统，再来一次完美的升级，边升级边记录这些步骤，写成一篇Linux内核升级记实录(可不是回忆录啊！)，和大家一起分享 ~~！一、准备工作首先说明，下面带#号的行都是要输入的命令行，且本文提到的所有命令行都在终端里输入。启动Linux系统，并用根用户登录，进入终端模式下。 1、查看Linux内核版本 # uname -a 如果屏幕显示的是2.6.x，说明你的已经是2.6的内核，也用不着看下文了，该干什么干什么去吧！~~~如果显示的是 2.4.x，那恭喜你，闯关通过，赶快进行下一步。 2、下载2.6内核源码下载地址：https://www.360docs.net/doc/2b4773582.html,/pub/linux/kernel/v2.6/linux-2.6.18.tar.bz2 3、下载内核升级工具 (1)下载module-init-tools-3.2.tar.bz2 https://www.360docs.net/doc/2b4773582.html,/pub/linux/utils/kernel/module-init-tools/module-init-tools-3.2.tar.bz2 (2)下载mkinitrd-4.1.18-2.i386.rpm https://www.360docs.net/doc/2b4773582.html,/fedora/linux/3/i386/RPMS.core/mkinitrd-4.1.18-2.i386.rpm (3)下载lvm2-2.00.25-1.01.i386.rpm https://www.360docs.net/doc/2b4773582.html,/fedora/linux/3/i386/RPMS.core/lvm2-2.00.25-1.01.i386.rpm (4)下载device-mapper-1.00.19-2.i386.rpm https://www.360docs.net/doc/2b4773582.html,/fedora/linux/3/i386/RPMS.core/device-mapper-1.00.19-2.i386.rpm (2.6.18内核和这4个升级工具我都有备份，如果以上下载地址失效，请到https://www.360docs.net/doc/2b4773582.html,/guestbook留下你的邮箱，我给你发过去)

Linux内核驱动模块编写概览-ioctl,class_create,device_create

如果你对内核驱动模块一无所知，请先学习内核驱动模块的基础知识。如果你已经入门了内核驱动模块，但是仍感觉有些模糊，不能从整体来了解一个内核驱动模块的结构，请赏读一下这篇拙文。如果你已经从事内核模块编程N年，并且道行高深，也请不吝赐教一下文中的疏漏错误。本文中我将实现一个简单的Linux字符设备，旨在大致勾勒出linux内核模块的编写方法的轮廓。其中重点介绍ioctl的用途。我把这个简单的Linux字符设备模块命名为hello_mod. 设备类型名为hello_cl ass 设备名为hello 该设备是一个虚拟设备，模块加载时会在/sys/class/中创建名为hello_class 的逻辑设备，在/dev/中创建hello的物理设备文件。模块名为hello_mod，可接受输入字符串数据（长度小于128），处理该输入字符串之后可向外输出字符串。并且可以接受ioctl（）函数控制内部处理字符串的方式。例如： a.通过write函数写入“Tom”，通过ioctl函数设置langtype=chinese，通过read函数读出的数据将会是“你好！Tom/n” b.通过write函数写入“Tom”，通过ioctl函数设置langtype=english，通过read函数读出的数据将会是“hello！Tom/n” c.通过write函数写入“Tom”，通过ioctl函数设置langtype=pinyin，通过read函数读出的数据将会是“ni hao！Tom/n” 一般的内核模块中不会负责设备类别和节点的创建，我们在编译完之后会得到.o或者.k o文件，然后insmod之后需要mk nod来创建相应文件，这个简单的例子中我们让驱动模块加载时负责自动创建设备类别和设备文件。这个功能有两个步骤， 1）创建设备类别文件class_cr eate(); 2）创建设备文件dev ice_create(); 关于这两个函数的使用方法请参阅其他资料。 linux设备驱动的编写相对wi ndows编程来说更容易理解一点因为不需要处理IR P，应用层函数和内核函数的关联方式浅显易懂。比如当应曾函数对我的设备调用了open()函数，而最终这个应用层函数会调用我的设备中的自定义open()函数，这个函数要怎么写呢，我在我的设备中定义的函数名是hello_mod_open，注意函数名是可以随意定义，但是函数签名是要符合内核要求的，具体的定义是怎么样请看 static int hello_mod_open(struct inode *, struct file *); 这样就定义了内核中的open函数，这只是定义还需要与我们自己的模块关联起来，这就要用到一个结构 struct file_operations 这个结构里面的成员是对应于设备操作的各种函数的指针。我在设备中用到了这些函数所以就如下定义，注意下面的写法不是标准ANSI C的语法，而是GNU扩展语法。 struct file_operations hello_mod_fops = { .owner = THIS_MODULE, .open = hello_mod_open,

Linux内核分析-网络[五]：网桥

看完了路由表，重新回到netif_receive_skb ()函数，在提交给上层协议处理前，会执行下面一句，这就是网桥的相关操作，也是这篇要讲解的容。 view plaincopy to clipboardprint? 1. s kb = handle_bridge(skb, &pt_prev, &ret, orig_dev); 网桥可以简单理解为交换机，以下图为例，一台linux机器可以看作网桥和路由的结合，网桥将物理上的两个局域网LAN1、LAN2当作一个局域网处理，路由连接了两个子网1.0和2.0。从eth0和eth1网卡收到的报文在Bridge模块中会被处理成是由Bridge收到的，因此Bridge也相当于一个虚拟网卡。 STP五种状态 DISABLED BLOCKING LISTENING LEARNING FORWARDING 创建新的网桥br_add_bridge [net\bridge\br_if.c] 当使用SIOCBRADDBR调用ioctl时，会创建新的网桥br_add_bridge。首先是创建新的网桥： view plaincopy to clipboardprint?

1. d ev = new_bridge_dev(net, name); 然后设置dev->dev.type为br_type，而br_type是个全局变量，只初始化了一个名字变量 view plaincopy to clipboardprint? 1. S ET_NETDEV_DEVTYPE(dev, &br_type); 2. s tatic struct device_type br_type = { 3. .name = "bridge", 4. }; 然后注册新创建的设备dev，网桥就相当一个虚拟网卡设备，注册过的设备用ifconfig 就可查看到： view plaincopy to clipboardprint? 1. r et = register_netdevice(dev); 最后在sysfs文件系统中也创建相应项，便于查看和管理： view plaincopy to clipboardprint? 1. r et = br_sysfs_addbr(dev); 将端口加入网桥br_add_if() [net\bridge\br_if.c] 当使用SIOCBRADDIF调用ioctl时，会向网卡加入新的端口br_add_if。创建新的net_bridge_port p，会从br->port_list中分配一个未用的port_no，p->br会指向br，p->state设为BR_STATE_DISABLED。这里的p实际代表的就是网卡设备。 view plaincopy to clipboardprint? 1. p = new_nbp(br, dev); 将新创建的p加入CAM表中，CAM表是用来记录mac地址与物理端口的对应关系；而刚刚创建了p，因此也要加入CAM表中，并且该表项应是local的[关系如下图]，可以看到，CAM表在实现中作为net_bridge的hash表，以addr作为hash值，链入 net_bridge_fdb_entry，再由它的dst指向net_bridge_port。

Linux内核十个版本性能对比

【IT168 评论】从2008年1月底至今，Linux Kernel系统内核已经先后升级了十次，版本号也从2.6.24上升到2.6.33，并且下个版本2.6.34也已进入开发阶段。今天我们就看看过去两年内这十个版本在性能上有何差异。测试平台是一套工作站系统，硬件配置包括AMD Opteron 2384 2.7GHz四核心处理器(“上海”)、泰安Thunder n3600B S2927主板(NVIDIA nForce 3600PRO 芯片组)、4GB DDR2 ECC Reg内存、希捷ST3300622AS 300GB硬盘、ATI FirePro V8700显卡，软件上采用Ubuntu 8.04.4 LTS 64位操作系统，组件有GNOME 2.22.3、https://www.360docs.net/doc/2b4773582.html, Server 1.4.0.90、GCC 4.2.4、EXT3。 Linux Kernel 2.6.24-2.6.33的每个版本都从Ubuntu PPA源上获取，而且均为64位版本。除了替换内核之外，系统其他设置均保持默认。 Apache Benchmark(静态网页服务)：2.6.33成绩大幅提升，但事实最早的2.6.24版反而才是好的，之后八个版本都差得很多，最新版终于基本正常了。

PostgreSQL pgbench(每秒钟TPC-B交易数)：2.6.30的成绩比上个版本骤然提升了多达770%，但之后2.6.32迅速下滑，最新的2.6.33却又完全不如2.6.30之前的六个版本了。

7-Zip Compression(文件压缩速度)：不同版本有所波动，最新的2.6.33成了赢家，这才是我们最希望看到的。 LZMA Compression(256MB文件压缩)：十个版本几乎没什么区别。

Linux的版本与内核

Linux的版本与内核 Linux有两种版本，一个是核心（kernel)版，一个是发行(distribution)版。核心版的序号由三部分数字构成，其形式为：major.minor.patchlevel，其中，majoro为主版本号，minor为次版本号，二者共同构成了当前核心版本号。patchlevel表示对当前版本的修订次数。例如，2.2.11表示对核心作用2.2 版本的第11次修订。根据约定，次版本号为奇数时，表示该版本加入新内容，但不一定稳定，相当于测试版；次版本号为偶数时，表示这是一个可以使用的稳定版本。鉴于Linux内核开发工作的连续性，内核的稳定版本与在此基础上进一步开发的不稳定版本总是同时存在的。建议采用稳定的核心版本。 Linux的内核具有两种不同的版本号，实验版本和产品化版本。要确定LINUX版本的类型，只要查看一下版本号：每一个版本号由三位数字组成，第二位数字说明版本类型。如果第二位数字是偶数则说明这种版本是产品化版本，如果是奇数说明是实验版本。如2.6.20是产品化版本，2.6.16是实验版本。LINUX的两种版本是相互关联的。实验版本最初是产品化产品的拷贝,然后产品化版本只修改错误，实验版本继续增加新功能，到实验版本测试证明稳定后拷贝成新的产品化版本，不断循环，这样一方面可以方便广大软件人员加入到LINUX的开发和测试工作中来，另一方面又可以让一些用户使用上稳定的LINUX版本。真是做到开发和实用两不误。现在LINUX的内核的最新版本是2.6.20。 Linux内核 Linux是最受欢迎的自由电脑操作系统内核。它是一个用C语言写成，符合POSIX标准的类Unix操作系统。Linux最早是由芬兰黑客 Linus Torvalds为尝试在英特尔x86架构上提供自由免费的类Unix操作系统而开发的。该计划开始于1991年，这里有一份Linus Torvalds 当时在Usenet新闻组comp.os.minix所登载的贴子，这份著名的贴子标志着Linux计划的正式开始。在计划的早期有一些Minix 黑客提供了协助，而今天全球无数程序员正在为该计划无偿提供帮助。技术上说Linux是一个内核。“内核”指的是一个提供硬件抽象层、磁盘及文件系统控制、多任务等功能的系统软件。一个内核不是一套完整的操作系统。一套基于Linux内核的完整操作系统叫作Linux操作系统，或是GNU/Linux架构。今天Linux是一个一体化内核（monolithic kernel）系统。设备驱动程序可以完全访问硬件。Linux内的设备驱动程序可以方便地以模块化（modularize）的形式设置，并在系统运行期间可直接装载或卸载。Linux不是微内核（microkernel）架构的事实曾经引起了Linus Torvalds与Andy Tanenbaum之间一场著名的争论。 Linux内核简史操作系统是一个用来和硬件打交道并为用户程序提供一个有限服务集的低级支撑软件。一个计算机系统是一个硬件和软件的共生体，它们互相依赖，不可分割。计算机的硬件，含有外围设备、处理器、内存、硬盘和其他的电子设备组成计算机的发动机。但是没有软件来操作和控制它，自身是不能工作的。完成这个控制工作的软件就称为操作系统，在Linux 的术语中被称为“内核”，也可以称为“核心”。Linux内核的主要模块(或组件)分以下几个部分：存储管理、CPU和进程管理、文件系统、设备管理和驱动、网络通信，以及系统的初始化(引导)、系统调用等。

Linux驱动框架及驱动加载

本讲主要概述Linux设备驱动框架、驱动程序的配置文件及常用的加载驱动程序的方法；并且介绍Red Hat Linux安装程序是如何加载驱动的，通过了解这个过程，我们可以自己将驱动程序放到引导盘中；安装完系统后，使用kudzu自动配置硬件程序。 Linux设备驱动概述 1. 内核和驱动模块操作系统是通过各种驱动程序来驾驭硬件设备，它为用户屏蔽了各种各样的设备，驱动硬件是操作系统最基本的功能，并且提供统一的操作方式。正如我们查看屏幕上的文档时,不用去管到底使用nVIDIA芯片，还是ATI芯片的显示卡，只需知道输入命令后，需要的文字就显示在屏幕上。硬件驱动程序是操作系统最基本的组成部分，在Linux内核源程序中也占有较高的比例。 Linux内核中采用可加载的模块化设计（LKMs ，Loadable Kernel Modules），一般情况下编译的Linux内核是支持可插入式模块的，也就是将最基本的核心代码编译在内核中，其它的代码可以选择是在内核中，或者编译为内核的模块文件。如果需要某种功能，比如需要访问一个NTFS分区，就加载相应的NTFS模块。这种设计可以使内核文件不至于太大，但是又可以支持很多的功能，必要时动态地加载。这是一种跟微内核设计不太一样，但却是切实可行的内核设计方案。我们常见的驱动程序就是作为内核模块动态加载的，比如声卡驱动和网卡驱动等，而Linux最基础的驱动，如CPU、PCI总线、TCP/IP协议、APM（高级电源管理）、VFS等驱动程序则编译在内核文件中。有时也把内核模块就叫做驱动程序，只不过驱动的内容不一定是硬件罢了，比如ext3文件系统的驱动。理解这一点很重要。因此，加载驱动时就是加载内核模块。下面来看一下有关模块的命令，在加载驱动程序要用到它们：lsmod、modprob、insmod、rmmod、modinfo。 lsmod