链接器和加载器04

合集下载

学习C语言必看书籍

一部分大概与大学课程：计算机组成原理、计算机系统结构、汇编
等等相关，就是较浅地讲了讲组原、系统结构、汇编的内容，说
浅，是因为这本书讲的绝对没有课上讲的深。第二部分讲了链接、
虚存等等。第三部分讲了些应用的东西。这书是CMU的导论性质的
课的教材。个人最喜欢程序的机器级表示和虚拟存储器这两章。另
外，这本书和操作系统也基本上没关系，对比一下操作系统教材和
可以作为学习C的第二本书
C++语言
C缺陷和陷阱
可以作为学习C的第三或第四本书
C专家编程
可以作为学习C的第三或第四本书
数组与指针的艺术
C语言深度解剖
supermegaboy写的。不错。程正冲编著，石虎审阅。
C99标准
有问题时查一查，很多问题可迎刃而解。
C的初级读物。如果读过C与指彻底搞定C指针针，可忽略。
阅读材料
有些书，想读。可惜现在没有时间。只能断断续续的读。在淘宝上找了个卖盗版书的店，因为价格比正版便宜很多，所以买了很多。先放在桌子上，有时间再读。
1: C++ Primer中文版第四版。好好学这本书，秒杀趋势
华为中兴的笔试的C++部分。没有C语言基础的人，C++ Primer Plus 或许是更好的选择。
深入理解计算机系统英文版
好书
深入理解计算机系统中文版
好书
专业相关的东西：
计算机协议的设计与验证
比较专业的东西，英文的，design and validation of computer protocols，学过计算机网络，TCP/IP再看应该没有问题。第八章讲的是有限状态机，不错

对load_start,load_end, run_start汇编伪指令的理解

`load_start`, `load_end`, 和 `run_start` 是 ARM 汇编伪指令，通常用于描述一个代码段的加载和运行开始/结束位置。

这些伪指令通常在嵌入式系统或低级系统编程中使用，以帮助链接器或加载器确定如何加载和运行代码。

1. load_start: 这个伪指令标记了代码段的开始位置，这个位置是在程序被加载到内存中时确定的。

这个标签通常用于确定程序在内存中的基地址。

2. load_end: 这个伪指令标记了代码段的结束位置。

这个标签可以帮助确定程序的大小，从而可以在加载时为其分配足够的内存。

3. run_start: 这个伪指令标记了代码段的运行开始位置。

这通常是在程序开始执行之前，由链接器或加载器确定的地址。

这个地址通常会被用作程序的入口点。

这些伪指令通常在链接脚本中使用，链接脚本是用来描述如何链接程序的各个部分的文件。

通过使用这些伪指令，链接器或加载器可以确定程序在内存中的位置，并正确地执行它。

需要注意的是，这些伪指令的行为可能会根据不同的链接器和加载器而有所不同，因此具体行为可能需要参考相关工具的文档或手册。

链接器和加载器09

第9章共享库$Revision: 2.3 $$Date: 1999/06/15 03:30:36 $程序库的产生可以追溯到计算技术的最早期，因为程序员很快就意识到通过重用程序的代码片段可以节省大量的时间和精力。

随着如Fortran and COBOL等语言编译器的发展，程序库成为编程的一部分。

当程序调用一个标准过程时，如sqrt()，编译过的语言显式地使用库，而且它们也隐式地使用用于I/O、转换、排序及很多其它复杂得不能用内联代码解释的函数库。

随着语言变得更为复杂，库也相应地变复杂了。

当我在20年前写一个Fortran 7 7编译器时，运行库就已经比编译器本身的工作要多了，而一个Fortran 77库远比一个C++库要来得简单。

语言库的增加意味着：不但所有的程序包含库代码，而且大部分程序包含许多相同的库代码。

例如，每个C程序都要使用系统调用库，几乎所有的C程序都使用标准I/O库例程，如printf，而且很多使用了别的通用库，如math，networking，及其它通用函数。

这就意味着在一个有一千个编译过的程序的UNIX系统中，就有将近一千份printf的拷贝。

如果所有那些程序能共享一份它们用到的库例程的拷贝，对磁盘空间的节省是可观的。

（在一个没有共享库的UNIX系统上，单printf的拷贝就有5到10M。

）更重要的是，运行中的程序如能共享单个在内存中的库的拷贝，这对主存的节省是相当可观的，不但节省内存，也提高页交换。

所有共享库基本上以相同的方式工作。

在链接时，链接器搜索整个库以找到用于解决那些未定义的外部符号的模块。

但链接器不把模块内容拷贝到输出文件中，而是标记模块来自的库名，同时在可执行文件中放一个库的列表。

当程序被装载时，启动代码找到那些库，并在程序开始前把它们映射到程序的地址空间，如图1。

标准操作系统的文件映射机制自动共享那些以只读或写时拷贝的映射页。

负责映射的启动代码可能是在操作系统中，或在可执行体，或在已经映射到进程地址空间的特定动态链接器中，或是这三者的某种并集。

动态链接器原理

动态链接器原理动态链接器是操作系统中一个非常重要的组件，它的作用是在程序执行过程中将程序中用到的外部函数库中的函数动态地链接到程序中，以便程序能够正常运行。

动态链接器是一个独立的模块，负责在程序执行过程中将程序中的未定义函数引用链接到相应的函数库中。

动态链接器的实现原理主要包括动态链接库加载、符号解析、重定位和重定位的过程。

动态链接库加载是指在程序运行的过程中，动态链接器需要将程序中用到的动态链接库加载到内存中，以便程序能够正常访问这些库中的函数。

动态链接库通常以共享库的形式存在，不同的操作系统有不同的共享库格式，如Linux系统中的.so 文件、Windows系统中的.dll文件等。

动态链接器会在程序加载的过程中检查程序中的动态链接库依赖关系，然后按照依赖关系将相应的库加载到内存中。

符号解析是动态链接器的另一个重要功能，它的作用是将程序中的符号与库中的函数进行匹配。

当程序中调用一个未定义的函数时，动态链接器会在程序的符号表中查找这个函数的符号，并在动态链接库中查找对应的函数。

如果找到了匹配的函数，动态链接器将函数的地址替换为实际的函数地址，以便程序能够正常执行。

重定位是动态链接器的另一个核心功能，它的作用是将程序中的函数调用的地址进行重定位，以确保程序能够正确访问库中的函数。

在程序加载的过程中，动态链接器会对程序中的函数调用的地址进行修正，将这些地址指向动态链接库中的函数的实际地址。

这样，程序就可以正确地调用库中的函数，实现程序的正常执行。

动态链接器的实现原理涉及到程序的加载、符号的解析和重定位的过程，这些过程是动态链接器能够正确链接程序的关键。

动态链接器的设计能够极大地提高程序的灵活性和可移植性，使程序能够在不同的环境中正常运行。

因此，了解动态链接器的原理对程序员来说是非常重要的，能够帮助他们更好地理解程序的执行过程，提高程序的性能和可维护性。

linux下静态链接和动态链接的原理及应用

linux下静态链接和动态链接的原理及应用静态链接和动态链接是软件开发中常用的两种链接方式，用于将程序中的函数库和外部库文件与可执行文件进行关联。

本文将介绍静态链接和动态链接的原理和应用。

一、静态链接静态链接是指将程序中依赖的函数库和外部库文件的代码全部编译进最终生成的可执行文件中。

在静态链接的过程中，编译器会将源代码中的函数库和外部库文件的符号引用替换为符号定义，并将它们的机器码放入可执行文件中的相应位置。

静态链接的原理：1.链接器在进行静态链接时，将需要的函数库和外部库文件的代码复制到可执行文件的代码段中。

2.链接器将符号引用替换为符号定义，使得程序在执行时可以正确找到需要的函数库和外部库文件的代码。

3.链接器会解析符号的重定位信息，确定符号在可执行文件中的具体地址。

静态链接的优点：1.可执行文件中包含了所有需要的代码，因此在运行时不需要依赖外部函数库和动态链接器，可以独立运行。

2.静态链接可以减少程序的依赖性，使得程序更加稳定和可靠。

3.静态链接可以提高程序的执行性能，因为不需要在运行时加载外部库文件。

静态链接的缺点：1.可执行文件会变得较大，因为需要包含所有依赖的函数库和外部库文件的代码。

2.静态链接每次都需要将依赖的库代码复制到可执行文件中，因此每次编译都需要重新链接，导致编译时间较长。

3.如果多个可执行文件都依赖同一个函数库和外部库文件，会导致文件系统中存在多个相同的代码副本，浪费存储空间。

静态链接的应用：1.部署独立的可执行文件，不依赖任何外部库文件和动态链接器。

2.保证程序的稳定性和可靠性，避免由于外部库文件版本的变化导致程序错误。

3.减少系统中相同代码副本的数量，节省存储空间。

二、动态链接动态链接是指将程序中依赖的函数库和外部库文件的代码存放在独立的共享库文件中，程序在运行时通过动态链接器将共享库文件加载到内存中，并与可执行文件建立起关联。

动态链接的原理：1.可执行文件中只包含函数库和外部库文件的符号引用，不包含实际的代码。

qnx系统编译原理

qnx系统编译原理QNX操作系统是一种实时操作系统，具有高可靠性和高安全性。

了解QNX系统的编译原理对于开发人员和系统管理员来说非常重要，因为它能帮助他们理解系统的内部工作原理，并加以利用和优化。

QNX系统的编译原理涉及到编译器、链接器和加载器三个主要组件。

编译器是将源代码转换为机器可执行代码的工具。

在QNX系统中，常用的编译器有QCC （QNX C Compiler）和GNU编译器套件。

这些编译器支持多种编程语言，如C、C++和Objective-C。

开发人员可以使用这些编译器来编译他们的应用程序。

链接器是将多个目标文件合并成一个可执行文件的工具。

在QNX系统中，常用的链接器有QCC和GNU链接器。

链接器将各个目标文件中的符号解析和重定位，生成最终的可执行文件。

在链接过程中，还可以进行库的链接，以便程序可以调用库中的函数和资源。

加载器是将可执行文件加载到内存中并执行的工具。

加载器负责将可执行文件中的指令和数据加载到适当的内存地址，并设置好程序的执行环境。

在QNX系统中，加载器会根据可执行文件的格式进行解析和加载，以便正确地执行程序。

除了编译器、链接器和加载器，QNX系统的编译原理还涉及到一些其他的概念和技术。

其中包括语法分析、词法分析、优化技术等。

这些技术的应用可以提高编译器的效率和生成的代码质量。

总之，了解QNX系统的编译原理对于开发人员和系统管理员来说是非常重要的。

它可以帮助他们理解系统内部的工作原理，优化代码的性能，提高系统的可靠性和安全性。

通过研究和应用QNX系统的编译原理，我们可以更好地理解和利用这个强大的实时操作系统。

链接器的使用

PAGEn：name n[(attr)]：origin=constant, length=constant；
}
存储区间说明语句
书写方式：① 已大写MEMORY指令字开始； ② 由大括号括起来的存储器区间说明。
存储区间：存储页面区间名称区间属性起始地址区间长度
2023年10月17日7时30分
DSP原理及应用
在链接命令文件中，可使用MEMORY和SECTIONS伪指令，为实际应用指定存储器结构和地址的映射。
MEMORY——用来指定目标存储器结构。
SECTIONS——用来控制段的构成与地址分配。
2023年10月17日7时30分
DSP原理及应用
10
2 链接器命令文件的编写与使用
链接命令文件为ASCⅡ文件，可包含以下内容： (1) 输入文件名，用来指定目标文件、存档库或其他命令文件。 (2) 链接器选项，它们在命令文件中的使用方法与在命令行中相同。 (3) MEMORY和SECTIONS链接伪指令，用来指定目标存储器结构和地址分配。 (4) 赋值说明，用于给全局符号定义和赋值。
DSECT len
f
length
fill
LENGTH
FILL
load
group LOAD
GROUP MEMORY
l(小写L) NOLOAD
o
run
org RUN
origin SECTIONS
ORIGIN spare
page type
PAGE TYPE
range UNION
2023年10月17日7时30分
DSP原理及应用
16
4 MEMORY指令存储区间说明语句：
name: 存储器区间名称。可由用字母、$、.、_

简述编译程序的主要构成成分及各自的主要功能

简述编译程序的主要构成成分及各自的主要功能编译程序是将高级语言代码转换为机器语言代码的程序。

它主要由以下几个构成成分组成：预处理器、编译器、汇编器、链接器和加载器。

每个构成成分都有其独特的功能，下面将详细介绍。

一、预处理器预处理器是编译程序的第一个阶段，主要负责对源代码进行预处理。

它会根据源代码中的指令，进行宏替换、条件编译、头文件包含等操作，生成新的源代码文件。

这些操作可以使得源代码更加规范化和易于维护。

二、编译器编译器是编译程序的核心部分，主要负责将高级语言代码转换为汇编语言代码。

它会对源代码进行语法分析和语义分析，并生成对应的中间代码。

然后将中间代码转换为汇编语言代码，并生成目标文件。

三、汇编器汇编器是将汇编语言代码转换为机器语言代码的工具。

它会读取目标文件中的汇编码，并将其转换为机器码。

同时还会生成符号表和重定位表等辅助信息，以便后续链接操作使用。

四、链接器链接器主要负责将多个目标文件合并成一个可执行文件。

在这个过程中，它会将各个目标文件中的符号进行链接，并解决符号重定义问题。

同时还会进行地址重定位和库函数的链接等操作。

五、加载器加载器是将可执行文件加载到内存中并执行的程序。

它会将可执行文件从磁盘读取到内存中，并根据可执行文件中的指令进行相应的操作。

例如，初始化程序堆栈、分配内存空间等。

综上所述，编译程序是由预处理器、编译器、汇编器、链接器和加载器等构成成分组成的。

每个构成成分都有其独特的功能，在整个编译过程中起着不可或缺的作用。

通过这些构成成分的协同工作，我们可以将高级语言代码转换为机器语言代码，并最终实现程序的运行。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

--------------------------------------------------------------------------图 4-1：单独段的存储空间分配
从位置 0 开始的多个段按照一个跟着另一个的方式重定位
---------------------------------------------------------------------------
如果文本和数据被加载到独立的内存页中，这也是通常的情况，文本段的大小必须扩
充为一个整页，相应的数据和 BSS 段的位置也要进行调整。很多 UNIX 系统都使用一种技巧
来节省文件空间，即在目标文件中数据紧跟在文本的后面，并将那个（文本和数据共存的）
页在虚拟内存中映射两次，一次是只读的文本段，一次是写时复制（copy-on-write）的数
链接器或加载器依次检查各个模块，按顺序分配存储空间。模块 Mi 的起始地址为从 L1
到 Li-1 相加的总和，链接得到的程序长度为从 L1 到 Ln 相加的总和。
多数体系结构要求数据必须对齐于字边界，或至少在对齐时运行速度会更快些。因此
链接器通常会将 Li 扩充到目标体系结构最严格的对齐边界（通常是 4 或 8 个字节）的倍数。
C++重复代码消除
在某些编译系统中，C++编译器会由于虚函数表、模板和外部 inline 函数而产生大量的重复代码。这些特性的设计是隐含的期望那种程序所有部分都可以被运行的环境。一个虚函数表（通常简称为 vtbl）包含一个类的所有虚函数（可以被子类覆盖的例程）的地址。每个带有任何虚函数的类都需要一个 vtbl。模板本质上就是以数据类型为参数的宏，并能够根据特定的类型参数集可以扩展为特定的例程。确保是否存在一个对普通例程的引用可供调用是程序员的责任，就是说对如 hash(int)和 hash(char *)每一类 hash 函数都有确定的定义， hash(T)模板可以根据程序中使用 hash 函数时不同的参数数据类型创建对应的 hash 函数。
-------------------------------------------------------------
main
1017
320
50
calif
920
217
100
mass
615
300
840
newyork
1390
1213
1400
（均为 16 进制数字）
链接器首先分配文本段，然后是数据段，接着是 BSS。注意这里数ቤተ መጻሕፍቲ ባይዱ段起始于页边界 0x
现在每一个模块 Mi 具有大小为 Ti 的文本段，大小为 Di 的数据段，以及大小为 Bi 的 BSS 段，如图 2 所示。
--------------------------------------------------------------------------图 4-2：多种段的存储分配按类型将文本、数据和 BSS 段分别归并
与链接的其它方面情况相似，存储分配的基本问题是很简单的，但处理计算机体系结构和编程语言语义特性的细节让问题复杂起来。存储分配的大多数工作都可以通过优雅和相对架构无关的方法来处理，但总有一些细节需要特定机器的专门技巧来解决。
段和地址
每个目标或可执行文件都会采用目标地址空间的某种模式。通常这里的目标是目标计算机的应用程序地址空间，但某些情况下（例如共享库）也会是其它东西。在一个重定位链接器或加载器中的基本问题是要确保程序中的所有段都被定义并具有地址，并且这些地址不能发生重叠（除非有意这样）。
的结果可能是：
名称
位置
-------------------------
main
1000 - 2016
calif
2018 - 2937
mass
2938 - 2f4c
newyork
2f50 - 42df
由于对齐的原因，2017 处的一个字节和 2f4d 处的三个字节被浪费了，但无须忧虑。
多种段类型
除最简单格式外所有的目标格式，都具有多种段的类型，链接器需要将所有输入模块中相应的段组合在一起。在具有文本和数据段的 UNIX 系统上，被链接的文件需要将所有的文本段都集中在一起，然后跟着的是所有的数据，在后面是逻辑上的 BSS（即使 BSS 在输出文件中不占空间，它仍然需要分配空间来解析 BSS 符号，并指明当输出文件被加载时要分配的 BSS 空间尺寸）。这就需要两级存储分配策略。
的大小 Ttot，Dtot 和 Btot。由于数据段跟在文本段之后，链接器将 Ttot 加到每一个数据段所分配的地址上，接着，由于 BSS 跟在文本和数据段之后，所以链接器会将 Ttot、Dtot 的和加到每一个 BSS 段分配的地址上。
同样，链接器通常会将分配的大小按照对齐要求扩充补齐。
段与页面的对齐
--------------------------------------------------------------------------在读入每个输入模块时，链接器为每个 Ti，Di，Bi 按照（就像是）每个段都各自从位置
0 处开始的方式分配空间。在读入了所有的输入文件后，链接器就可以知道这三种段各自总
在最初的 40 年中，Fortran 不支持动态存储分配，公共块是 Fortran 程序用来绕开这个限制的首要工具。标准 Fortran 允许在不同例程中声明不同大小的空白公共块，其中最大的尺寸最终生效。Fortran 系统们无一例外的都将它扩展为允许以不同的大小来声明所有类型的公共块，同样还是最大的尺寸最终生效。
5000，但 BSS 紧跟在数据的后面，这是因为在运行时数据和 BSS 在逻辑上是一个段。
名称
文本段
数据段
BSS 段
-------------------------------------------------------------
main
1000-2016
5000-531f
695c-69ab
据段。这种情况下，数据段在逻辑上起始于文本段末尾紧接着的下一页，这样就不需扩充文
本段，数据段也可对齐于紧接着文本段后的 4K（或者其它的页尺寸）页边界。
例 2：我们将例 1 扩展，使得每个例程都有文本、数据和 BSS 段。字对齐要求还是 4 个
字节，但页大小为 0x1000 字节。
名称
文本段
数据段
BSS 段
存储布局是一个“两遍”的过程，这是因为每个段的地址在所有其它段的大小未确定前是无法分配的。
简单的存储布局
在一种简单而不现实的情形下，链接器的输入文件包含一系列的模块，将它们称为 M1, M2, ... Mn，每一个模块都包含一个单独的段，从位置 0 开始长度依次为 L1, L2, ... Ln，并且目标地址空间也是从 0 开始。如图 1 所示。
大型的 Fortran 系统经常会超过它们所运行系统的内存容量限制，在没有动态内存分配时，程序员不得不频繁的重新创建软件包，压缩尺寸来解决软件包遇到的此类问题。在一个软件包中除一个之外的其它子程序都将公共块声明为只有一个元素的数组。剩下的那个子程序声明所有公共块的实际大小，并在程序启动时将这些尺寸都保存在其余软件包可以使用的（在另一个公共块中的）变量中。这样就可以通过修改和重新编译定义这些公共块的一个例程，来调整公共块的尺寸，然后再重新链接。
UNIX 链接器总是一贯支持公共块，甚至从最早版本的 UNIX 都具有一个 Fortran 子集的编译器，并且 UNIX 版本的 C 语言传统上会将未初始化的全局变量作为公共块对待。但在 ELF 之前的 UNIX 目标文件只有文本、数据和 BSS 段，没有办法直接声明一个公共块。作为一个特殊技巧，链接器将未定义但具有非零初值的符号当作是公共块，而该值就是公共块的尺寸。链接器将遇到的此类符号中最大的数值作为该公共块的尺寸。对于每一个公共块，它在输出文件的 BSS 段中定义了相应的符号，在每一个符号的后面分配所需要的空间。
每一个链接器输入文件都包含一系列各种类型的段。不同类型的段以不同的方式来处理。通常，所有相同类型的段，诸如可执行代码段，会在输出文件中被合并为一个段。有时候段是在其它段的基础上合并得到的（如 Fortran 的公共块），以及在越来越多的情况下（如共享库和 C++专有特性），链接器本身会创建一些段并将其放置在输出中。
在那些使用简单链接器的系统上，某些 C++系统使用了一种迭代链接的方法，并采用独立的数据库来管理将哪些函数扩展到哪些地方，或者添加 progma（向编译器提供信息的程序源代码）向编译器反馈足够的信息以仅仅产生必须的代码。我们将在第 11 章涉及这些。
从 60 年代开始 Fortran 增加了 BLOCK DATA 数据类型来为任意公共块（空白公共块除外，这是为数不多的限制）的部分或全部来指明局部初始数据值，这在某种程度上更复杂了。通常用来初始化公共块的在 BLOCK DATA 中的公共块尺寸，也在链接时被用来当作该公共块的实际大小。
在处理公共块时，链接器会将输入文件中声明的每个公共块当作一个段来处理，但并不会将这些段串联起来，而是将相同名称的公共块重叠在一起。这里会将声明的最大的尺寸作为段的大小，除非在某一个输入文件中存在该段的已初始化的版本。在某些系统上，已初始化的公共块是一个单独的段类型，而在另一些系统上它可能只是数据段的一部分。
公共块和其它特殊段
上面这种简单的段分配策略在链接器处理的 80%的存储分配中都工作的很好，但剩下的那些情况就需要用特殊的技巧来处理了。这里我们来看看比较常见的几个。
公共块
公共块存储是一个可以追溯到 50 年代 Fortran I 时的特性。在最初的 Fortran 系统中，每一个子程序（主程序、函数或者子例程）都有各自局部声明和分配的标量和数组变量。同时还有一个各例程都可以使用的存储标量和数组的公共区域。公共块存储被证明是非常有用的，并且在后续 Fortran 中单一的公共块（就是我们现在知道的空白公共块，即它的名称是空白的）已经普及为多个可命名的公共块，每一个子程序都可以声明它们所用的公共块。