编译原理概念总结

合集下载

（完整版）编译原理名词解释

（完整版）编译原理名词解释1.源语⾔：书写源程序所使⽤的语⾔2.源程序：⽤程序设计语⾔书写的程序3.⽬标语⾔：计算机的机器指令。

⽬标语⾔可以是机器语⾔，也可以是汇编语⾔，或者是其他中间语⾔，但最终结果必是机器语⾔。

4.⽬标程序:由机器指令构成的程序。

⽬标程序是经过翻译程序加⼯后⽤⽬标语⾔表⽰的程序。

5.翻译程序：能够把某⼀种语⾔程序（源程序）改造成另⼀种语⾔程序（⽬标程序）将源程序译成逻辑上等价的⽬标程序的程序。

翻译程序有两种⼯作⽅式：编译和解释。

6.编译程序：也称翻译程序7.解释程序：有些翻译程序在翻译过程中并不产⽣完整的⽬标程序，⽽是翻译⼀句，解释执⾏⼀句，这样的称为解释程序。

8.汇编程序：由汇编语⾔写成的程序9.词法分析：执⾏词法分析的程序成为词法分析器，词法分析依据的是语⾔构词规则。

词法分析器从⽂件读⼊源程序，由字符拼接单词。

每当识别出⼀个单词，词法分析器就输出这个单词的内部码。

10.语法分析：执⾏语法分析的程序叫做语法分析器。

语法分析的任务就是根据语⾔的规则，将词法分析器所提供的单词种别分成各类语法范畴。

11.中间代码⽣成：中间代码产⽣有时称为语义分析，执⾏中间代码产⽣的程序称为中间代码⽣成器。

他的任务时按照语法分析器所识别出的语法范畴产⽣相应的中间代码，并建⽴符号表、常数表，等各种表格。

12.⽬标代码⽣成：执⾏⽬标代码⽣成的程序称为⽬标代码⽣成器。

他的任务是根据中间代码和表格信息，确定各类数据在内存中的位置，选择合适的指令代码，将中间代码翻译成汇编语⾔或机器指令，这部分⼯作与计算机硬件有关。

13.符号表：⽤于记录源程序中出现的标识符，⼀个标识符往往具有⼀系列的语义值，她包括标识符的名称、种属、类型、值存放的地址等等。

14.常数表：⽤于记录在源程序中出现的常数。

15.编译程序前端：是由词法分析器、语法分析器和中间代码产⽣器组成的。

她的特点是依赖于被编译的源程序，输出结果⽤中间代码描述，和⽬标机器⽆关。

编译原理复习整理(电子科大版)

三种语言涉及的三类人：源语言（设计者），编译语言（实现者），目标语言（使用者）变量：对存储单元的抽象（变量是对一个(或若干个)存储单元的抽象，赋值语句则是修改存储单元内容的抽象。

）。

属性：变量的作用域，变量的生存期，值，类型静态绑定：凡是在编译时能确定的属性，称为静态属性；若绑定在编译时完成，运行时不改变，称为静态绑定。

动态绑定：凡是在运行时才能确定的属性称为动态的。

若绑定在运行时完成，称为动态绑定。

定义：虚拟机是由软件实现的机器。

（实际机器+程序）程序单元：1,程序单元: 程序执行过程中的独立调用单元；2.单元的表示在编译时，单元表示是该单元的源程序。

运行时，单元表示由一个代码段和一个活动记录组成，称为单元实例。

3.活动记录:执行单元所需要的信息,以及该单元的局部变量所绑定的数据对象的存储区。

4.非局部变量:一个程序单元可以引用未被本单元说明而被其它单元说明的变量。

5.引用环境:局部变量+非局部变量。

6.别名:同一单元的引用环境中有两个变量绑定于同一数据对象，称这些变量具有别名。

7.副作用:对绑定于一个非局部变量的对象进行修改时，将产生副作用。

8.程序单元可以递归激活,从而一个单元可以有很多个实例,但代码段相同。

不同的仅仅是活动记录（所以绑定必须是动态的）。

数据类型：数据类型实质上是对存储器中所存储的数据进行的抽象。

它包含了一组值的集合和一组操作。

数据类型的作用1.实现了数据抽象2.使程序员从机器的具体特征中解脱出来3.提高了编程效率聚合的六种方式：笛卡尔积，有限映像，序列，判定或，递归，幂集2.抽象数据类型的定义：满足下述特性的用户定义类型称为抽象数据类型:1.在实现该类型的程序单元中,建立与表示有关的基本操作;2.对使用该类型的程序单元来说,该类型的表示是隐蔽的。

类型等价：若T1和T2是两个类型，且T1的任何值都可以赋予T2类型的变量，T1类型的实参可以对应类型T2的形参，反之亦然，则称T1和T2是相容的，或等价的；有两种类型的相容性概念：①名字等价②结构等价两种相容性实现时的比较①名字等价的实现比较简单②结构等价的实现需要的模式匹配过程可能十分复杂编译时与类型相关的三个重要工作：1.类型检查12.类型转换3.类型等价语句级控制：顺序，选择，重复四种单元级控制结构：显式调用异常处理协同程序并发单元语言的定义：程序设计语言是用来描述计算机所执行的算法的形式表示；语言＝语法＋语义语法:用以构造程序及其成分的一组规则的集合语义:用以规定语法正确的程序或其成分的含义的一组规则的集合文法定义：文法是描述语言的语法结构的形式规则, 必须准确,易于理解,且描述能力强。

编译原理与技术

编译原理与技术编译原理与技术是计算机科学与技术中的一门重要课程，旨在教授学生如何设计、实现和优化编译器以及相关的编程工具和技术。

本文将介绍编译原理与技术的基本概念、主要任务以及在实际应用中的作用和挑战，并探讨编译原理与技术在不同编程语言和开发环境中的应用。

一、编译原理与技术的基本概念编译原理与技术研究的对象是编译器，而编译器是一种从一种语言（源语言）到另一种语言（目标语言）的程序转换工具。

编译器的主要任务是将源程序转换为等价的目标程序，以便计算机能够执行。

编译原理与技术的基本概念包括词法分析、语法分析、语义分析、中间代码生成、代码优化和代码生成等。

1. 词法分析词法分析是编译器的第一个阶段，它将源程序的字符流转换为有意义的词法单元序列。

词法单元是编程语言中具有独立含义的最小单元，例如关键字、标识符、运算符和常量等。

词法分析器通常通过有限自动机或正则表达式来实现。

2. 语法分析语法分析是编译器的第二个阶段，它通过对词法单元序列的分析来构造语法树。

语法树反映了源程序的语法结构，其中每个节点代表一个语法单元，每个子节点代表一个子表达式。

语法分析器通常使用上下文无关文法和分析方法（如递归下降分析和LR分析）来实现。

3. 语义分析语义分析是编译器的第三个阶段，它对语法树进行静态检查以确定源程序是否符合语义规则。

语义分析器通常处理类型检查、作用域分析和语义动作等任务，以确保生成的中间代码具有准确的语义含义。

4. 中间代码生成中间代码生成是编译器的第四个阶段，它将语法树转换为一种中间表示形式，以便后续的优化和目标代码生成。

中间代码通常是一种抽象的、与机器无关的形式，例如三地址码、虚拟机代码或中间表示IR。

5. 代码优化代码优化是编译器的第五个阶段，它利用各种优化技术来改进中间代码的性能和效率。

常见的代码优化技术包括常量传播、公共子表达式消除、循环优化和内联展开等。

6. 代码生成代码生成是编译器的最后一个阶段，它将优化后的中间代码转换为目标代码。

编译原理期末总结复习

编译原理期末总结复习编译原理期末总结复习篇一：一、简答题1.什么是编译程序？答：编译程序是一种将高级语言程序(源程序)翻译成低级语言(目标程序)的程序。

将高级程序设计语言程序翻译成逻辑上等价的低级语言(汇编语言,机器语言)程序的翻译程序。

2.请写出文法的形式定义？答：一个文法G抽象地表示为四元组 G=（Vn,Vt,P,S）–其中Vn表示非终结符号– Vt表示终结符号，Vn∪Vt=Ｖ(字母表)，Vn∩Vt=φ– S是开始符号，–P是产生式，形如：α→β(α∈V+且至少含有一个非终结符号，β∈V*)3.语法分析阶段的功能是什么？答：在词法分析的基础上，根据语言的语法规则，将单词符号串分解成各类语法短语(例：程序、语句、表达式)。

确定整个输入串是否构成语法上正确的程序。

4.局部优化有哪些常用的技术？答：优化技术1—删除公共子表达式优化技术2—复写传播优化技术3—删除无用代码优化技术4—对程序进行代数恒等变换（降低运算强度）优化技术5—代码外提优化技术6—强度削弱优化技术7—删除归纳变量优化技术简介——对程序进行代数恒等变换（代数简化）优化技术简介——对程序进行代数恒等变换（合并已知量）5．编译过程分哪几个阶段？答：逻辑上分五个阶段：词法分析、语法分析、语义分析与中间代码生成、代码优化、目标代码生成。

每个阶段把源程序从一种表示变换成另一种表示。

6. 什么是文法？答：文法是描述语言的语法结构的形式规则。

是一种工具，它可用于严格定义句子的结构；用有穷的规则刻划无穷的集合；文法是被用来精确而无歧义地描述语言的句子的构成方式；文法描述语言的时候不考虑语言的含义。

7. 语义分析阶段的功能是什么？答：对语法分析所识别出的各类语法范畴分析其含义，进行初步的翻译(翻译成中间代码)；并对静态语义进行审查。

8.代码优化须遵循哪些原则？答：等价原则：不改变运行结果有效原则：优化后时间更短，占用空间更少合算原则：应用较低的代价取得较好的优化效果9.词法分析阶段的功能是什么？答：逐个读入源程序字符并按照构词规则切分成一系列单词任务：读入源程序，输出单词符号—滤掉空格，跳过注释、换行符—追踪换行标志，指出源程序出错的行列位置—宏展开，……10.什么是符号表？答：符号表在编译程序工作的过程中需要不断收集、记录和使用源程序中一些语法符号的类型和特征等相关信息。

编译原理课程期末总结

编译原理课程期末总结一、引言编译原理是计算机科学与技术专业必修的一门课程，主要讲授计算机程序语言的组织规则和程序的翻译方法。

本学期的编译原理课程，从基本概念开始，逐渐深入到词法分析、语法分析、语义分析和代码生成等内容。

通过学习编译原理，我对程序的编写和翻译有了更深入的理解，并且提高了编写高效程序的能力。

本文将对本学期编译原理课程的学习内容以及个人体会进行总结和归纳。

二、课程学习内容1. 基本概念在编译原理的第一节课中，老师给我们介绍了编译原理的基本概念。

编译器是将源语言程序翻译成目标语言程序的一种软件。

它包括词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等阶段。

我们学习了编译器的整体结构和各个阶段的作用。

2. 词法分析词法分析是编译器的第一阶段，它负责将源程序分割成一个个单词（Token）。

在本学期的编译原理课程中，我们学习了正则表达式、DFA（Deterministic Finite Automaton）和NFA（Nondeterministic Finite Automaton）的概念。

通过实践，我了解了如何用正则表达式描述词法单元的集合，并将正则表达式转化为NFA和DFA。

3. 语法分析语法分析是编译器的第二阶段，它负责将词法分析得到的单词序列解析成语法树。

在本学期的编译原理课程中，我们学习了上下文无关文法和语法分析算法。

我通过实现LL（1）语法分析器和LR（1）语法分析器，深入理解了语法分析的原理与方法。

4. 语义分析语义分析是编译器的第三阶段，它负责对语法树进行静态检查和语义处理。

在本学期的编译原理课程中，我们学习了符号表的管理和使用、类型检查和类型转换等内容。

通过实践，我掌握了如何设计和实现一个简单的语义分析器。

5. 中间代码生成中间代码生成是编译器的第四阶段，它负责将语法树转化为中间代码。

在本学期的编译原理课程中，我们学习了三地址码和四元式的表示方法，以及中间代码的生成和优化等内容。

《编译原理》课件

代码生成
编译器可以将高级语言编写的源代码转换成机器语言或低级语言，以便在特定的硬件平台上运行。编译器还可以生成可执行文件或动态链接库等二进制文件。
编译器在人工智能领域的应用
机器学习编译器
机器学习编译器可以将机器学习模型转换成可执行代码，以便在嵌入式设备或边缘计算设备上运行。这种编译器可以优化模型的计算性能和内存占用，提高模型的运行效率。
3
缺点
对于某些复杂文法，可能导致大量的无用推导和状态爆炸。
自底向上的语法分析
分析步骤
从输入符号序列的最后一个符号开始，逐步向上构建语法树，直到找到与文法中的某个产生式右部匹配的符号串。
优点
可以充分利用已知信息，避免不必要的推导和状态爆炸。
缺点
对于某些复杂文法，可能导致大量的无用归约和状态爆炸。
04
中间代码生成
中间代码生成的定义和任务
定义
中间代码生成是编译器的一个阶段，将源代码转换成中间代码的过程。
任务
将源代码转换成一种中间表示形式，以便进行后续的优化和目标代码生成。
三地址代码的生成
01
三地址代码是一种中间代码形式，由一系列的三元式组成。
02
三元式的形式为(op, arg1, arg2)，表示执行一个操作(op) 并产生一个结果，操作数arg1 和arg2来自寄存器、常数或之前的计算结果。
语义分析
检查AST是否有语义错误，如类型错误、未定义的变量等。
中间代码生成
将AST转换为中间代码，通常是三地址代码。
代码优化
对中间代码进行优化，提高执行效率。
代码生成
将中间代码转换为机器语言代码，能够在特定硬件上执行。
编译器的分类

编译原理复习汇总

复习汇总一、第一章概述1.文法与自动机的等价1)0型文法—图灵机2)1型文法—线性有界非确定图灵机3)2型文法—非确定下推自动机4)3型文法—有限状态自动机2.编译技术的应用1)语法制导的结构化编辑器2)程序格式化工具3)软件测试工具4)程序理解工具5)高级语言的翻译工具6)等等3.从面向机器的语言到面向人类的语言（结合第二章第9小点理解）1)面向机器的语言：机器指令，汇编语言2)面向人类的语言：通用程序设计语言，数据查询语言，形式化描述语言（正规式,产生式）等等。

4.各语言的分类（结合第二章第9小点理解）1)过程式语言，面向对象语言：通用程序设计语言。

2)函数语言：面向特点领域的，递归特性。

例如LISP语言3)说明性，非算法式语言：LEX/YACC,SQL。

4)脚本式语言：Shell语言5.语言之间的转换（李静PPT41）1)高级语言之间的转换一般称为预处理或转换。

2)高级语言翻译成汇编语言或机器语言称之为编译。

3)把汇编语言翻译成机器语言称之为汇编。

4)将一个汇编语言程序汇编为可在另一台机器上运行的机器指令称之为交叉汇编。

5)把机器语言翻译成汇编语言称之为反汇编。

6)把汇编语言翻译成高级语言称之为反编译。

6.编译器和解释器1)编译器●源程序的翻译和翻译后的程序的运行是两个不同的阶段。

◆编译阶段：用户输入源程序，经过编译器的处理，生成目标程序。

◆目标程序的运行阶段：根据要求输入数据，得出结果。

2)解释器（凡是可以采用编译器的地方均可以采用解释器）●解释器把翻译和运行结合到一起，编译一段源程序，紧接着就执行它。

这种方式称为解释。

7.解释器的优点（对比与编译器）1)具有较好的动态特性。

2)具有较好的移植特性。

8.解释器的缺点（对比于编译器）1)相比于编译器需花费大量的时间。

2)占用更多的内存空间。

9.编译器的工作阶段（结合第二章6小点红色部分理解）1)源程序->词法分析器->语法分析器->语义分析器->中间代码生成器->代码优化器->目标代码生成器->目标代码2)工作过程中的每个阶段均采用了符号表管理器，出错处理器。

编译原理

编译原理第一章：1．编译程序是现代计算机系统的基本组成部分之一2．一个计算机系统中通常配置多个高级语言的编译程序3．在一个计算机系统中可为某些高级语言配置多个不同性能的编译程序4．编译程序是一种语言翻译程序，其功能是把一种语言编写的程序翻译成另一种语言的等价程序5．被编译的程序称为源程序，编译后的等价程序称为目标程序6．编译程序的任务就是将源语言程序翻译成等价的目标语言程序7．通常将编译过程分为六个阶段：词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成。

8．词法分析的主要任务是从左至右扫描字符序列，并按照此法规则识别出一个个的单词9．单词是指逻辑上紧密相连的一组字符，这些字符具有集体含义。

10．计算机语言中，单词的种类通常有保留字、标识符、数、算符、界符等11．语法分析的主要任务是：按照语言的语法规则，把词法分析所得的单词序列分解成各类语法成分。

12．词法分析和语法分析都是对源程序进行结构分析，但二者是有区别的。

13．语义分析的主要功能是审查源程序有无语义错误，伪代码生成阶段收集类型信息。

14．中间代码生成阶段的主要任务是，把源程序转换成一种中间代码15．中间代码是一种结构简单、含义明确的记号系统16．中间代码可以设计成多种形式，其设计原则有两点：一是容易生成，二是容易转换成目标代码17．代码优化的主要任务是对中间代码进行改造，使生成的目标代码更为高效18．目标代码生成阶段的任务是把中间代码转换成特定机器上的绝对指令代码或者可重定位的指令代码或者汇编指令代码19．在编译过程的每个阶段中都含有出错处理和表格管理的工作20．编译程序的结构可以按功能分为八个模块，即词法分析程序、语法分析程序、语义分析程序、中间代码生成程序、代码优化程序和目标代码生成程序，此外还有与上述每个阶段都有关系的出错处理程序和表格管理程序。

21．按照编译程序的工作主要是与源语言有关还是与目标机有关，编译过程也可前端和后端22．前端的工作主要依赖于源语言而与目标机无关，包括词法分析、语法分析、语义分析、中间代码生成以及每个阶段中的出错处理和表格管理工作，还包括代码优化阶段的部分工作23．后端的工作主要与目标机有关而与源语言无关，主要是代码生成及相关的出错处理和表格管理工作24．编译过程中，对源程序或者中间语言程序从头至尾扫描一次并完成相应工作的过程称为“一遍”或者“一趟”25．解释程序是另一种语言处理程序，其工作特点是边分析边执行，不生成目标代码。

编译原理复习

编译原理复习《编译原理》第⼀章：绪论1.翻译器：把⼀种语⾔变换到另外⼀种语⾔的软件。

这两种语⾔分别称为源语⾔和⽬标语⾔。

2.编译器：⼀种翻译器，它的⽬标语⾔⽐源语⾔低级。

3.典型的编译器可以划分成6个逻辑阶段：词法分析，语法分析，语义分析，中间代码⽣成，代码优化，代码⽣成。

4.按照对⽬标机器的依赖性，把编译过程分成前端（依赖于源语⾔，独⽴于⽬标机器）和后端（依赖于⽬标机器，独⽴于源语⾔,只与中间语⾔有关（从中间代码⽣成⽬标代码））。

5.前端包括：词法分析，语法分析，语义分析，中间代码⽣成。

6.后端包括：代码优化，代码⽣成。

7.解释器：不同于编译器的另⼀类语⾔处理器，直接执⾏源程序所指定的运算。

解释器的执⾏效率⽐编译器低，因为解释器⽆法解开循环。

8.遍：编译的⼏个阶段常⽤⼀遍（pass）扫描实现，⼀遍扫描包括读⼀个输⼊⽂件和写⼀个输出⽂件。

《编译原理》第⼆章：词法分析⼀些概念：1.词法单元：⼜称单词，是编程语⾔中合法的字符串。

2.词法记号：满⾜某种规则的词法单元，采⽤同⼀种记法——词法记号。

该规则称为模式。

3.模式：描述词法单元与词法记号对应关系的规则。

是描述源程序中某个记号的词法单元集合的规则。

4.字母表：符号的有限集合，例：∑={0,1}串：符号的有穷序列，例：0110,ε语⾔：字母表上的⼀个串集{ε,0,00,000,…},{ε},?正规式（运算符的优先级：*>连接运算>|）N F A是这样⼀个数学模型，包括1)状态集合S2)输⼊字母表∑3)转换函数m o v e:S?(∑?{ε})→P(S)4)唯⼀的初态s∈S5)终态集合F?SD F A是这样⼀个数学模型，包括1)状态集合S2)输⼊字母表∑3)转换函数m o v e:S?∑→S4)唯⼀的初态s∈S5)终态集合F?S第三章语法分析3.1 上下⽂⽆关⽂法上下⽂⽆关⽂法是四元组（V T , V N, S , P ）1) V T: 终结符集合(⾮空有限集合，记号名是其同义词)2) V N: ⾮终结符集合（⾮空有限集合）3) S : 开始符号4) P : 产⽣式集合，产⽣式形式 : A →α上下⽂⽆关⽂法没有强制的顺序关系。

编译原理文字总结

编译原理文字总结编译原理文字总结1.高级程序设计语言的翻译主要有两种方式：编译和解释。

2.编译过程概述：(1)词法分析：输入源程序，对构成源程序的字符串进行扫描和分解，识别出一个个的单词（亦称单词符号或符号）如基本字，标识符，常数，算符和界符。

(2)语法分析：在词法分析的基础上，根据语言的语法规则，把单词符号串分解成各类语法单位（语法范畴），如短语，子句，句子，程序段和程序等(3)语义分析与中间代码产生：对语法分析所识别出的各类语法范畴，分析其含义，并进行初步翻译（产生中间代码）。

包括静态语义检查和中间代码的翻译。

(4)优化：对前段产生的中间代码进行加工变换，以期在最后阶段能产生出更为高效（省时间和空间）的目标代码。

(5)目标代码生成：把中间代码（或经优化处理之后）变换成特定机器上的低级语言代码。

编译程序结构框图3．文法是表述语言的语法结构的形式规则。

4.所谓上下文无关文法是这样一种文法，它所定义的语法范畴（或语法单位）是完全独立于这种范畴可能出现的环境的。

一个上下文无关文法G包括四个组成部分：一组终结符号，一组非终结符号，一个开始符号，以及一组产生式。

5.形式上说，一个上下文无关文法G是一个四元式（VT,VN,S,＆）其中VT是一个非空有限集，它的每个元素称为终结符号；VN是一个非空有限集，它的每个元素称为非终结符号，VT∩VN=；S是一个非终结符号，称为开始符号；&是一个产生式集合，每个产生式的形式是P→a，其中P属于VN，a属于（VT∪VN）*。

开始符号S至少必须在某个产生式的左部出现一次。

6.推导每前进一步总是引用一条规则（产生式）。

7.假定G是一个文法，S是它的开始符号。

如果Sa，则称a是一个句型（0步或若干步）。

仅含终结符号的句型是一个句子。

文法G所产生的句子的全体是一个语言，将它记为L(G)。

L(G)=｛a|Sa&a∈VT*｝例如终结符号串（i*i+i）是文法（2.1）的一个句子。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第一章引论
• 为什么要用编译器 • 与编译器相关的程序 • 翻译步骤
• 编译器中的主要数据结构
1、语言处理器 1、简单的说，一个编译器就是一个程序，它可以阅读以某一种语言（源语言）编写的程序，并把该程序翻译成一个等价的、用另一种语言（目标语言）编写的程序。

2、编译器的重要任务之一就是报告它在翻译过程中发现的源程序中的错误。

3、使用编译器是为了提高编程的速度和准确度。

4、与编译器相关的程序：解释程序（interpreter ）、汇编程序（assembler ）、连接程序（linker ）、装入程序（loader ）、预处理器（preprocessor ）、编辑器（editor ）、调试程序（debugger ）、描述器（profiler ）、项目管理程序（project manager ）。

5、解释器是另一种常见的语言处理器。

它并不通过翻译的方法生成目标程序。

从用户的角度来看，解释器直接利用用户提供的输入执行源程序中指定的操作。

6、一个源程序可能被分割成多个模块，并存放于独立的文件中。

把源程序聚合在
一起的任务有时会由一个被称为预处理器（preprocessor ）的程序独立完成。

预处理器还负责把那些称为宏的缩写形式转换为源语言的语句。

7、连接器（linker ）能够解决外部内存地址的问题。

8、加载器（loader ）把所有的可执行目标文件放到内存中执行。

2、一个编译器的结构
Output
Source
Program
Front end
Back end
Object
1、将编译器看成黑盒，则源程序映射为在语义上等价的目标程序，而这个映射由两部分组成：分析部分和综合部分。

2、分析部分把源程序分解成多个组成要素，并在这些要素之上加上语法结构。

3、综合部分根据中间表示和符号表中的信息来构造用户期待的目标程序。

4、编译器的第一个步骤：词法分析（lexical）或扫描（scanning）。

词法分析器读入组成源程序的字符流，并且将它们组成有意义的词素（lexeme）的序列。

词法分析器产生词法单元（token）。

5、分隔词素的空格会被词法分析器忽略掉。

6、编译器的第二个步骤：语法分析（syntax）或解析（parsing）。

语法分析器使用由词法分析器生成的各个词法单元的第一个分量来创建树形的中间表示。

7、语义分析（static semantic analysis）：语义分析器使用语法树和符号表中的信息
来检查源程序是否和语言定义的语义一致。

它同时也收集类型信息，并把这些信息存放在语法树或符号表中，以便在随后的中间代码生成过程中使用。

语义分析的一个重要部分是类型检查（type checking）。

编译器检查每个运算符是否具有匹配的运算分量。

8、总的说，编译器的翻译步骤是：扫描程序----语法分析程序----语义分析程序----
源代码优化程序----代码生成器----目标代码优化程序。

3、编译器结构中的主要数据结构
1、记号（token）
2、语法树（syntax tree）
3、符号表（symbol table）
4、常数表（literal table）
5、中间代码（intermediate code）
6、临时文件（temporary file）
4、将编译器分成了只依赖于源语言（前端（ front end））的操作和只依赖于目
标语言（后端（ back end））的操作两部分。

第二章词法分析
• 扫描处理
• 正则表达式
• 有穷自动机
• 从正则表达式到D FA
• 利用L e x自动生成扫描程序
1、Tokens记号标记：identifiers、keywords、integers、floating-point、symbols、strings、comments
1、使用正则表达式去描述程序语言tokens
2、一个正则表达式是归纳确定
3、一个正则表达式R描述一组字符串集合L(R)
4、L(R) = the language defined by R
5、所有的token都能用正则表达式表示
2、正则表达式：
1、基本正则表达式：他们是字母比哦啊中的单个字符且自身匹配
2、正则表达式运算：
1、从各选择对象中选择，用元字符“|”表示
2、连结，由并置表示（不用元字符）
3、重复或“闭包”，由元字符“*”表示
3、从各选择对象中选择：
4、连结：正则表达式r和正则表达式s的连接可写作rs
5、重复：正则表达式的重复有时称为Kleene闭包（（Kleene）closure），写作r*
6、运算的优先和括号的使用：前面的内容忽略了选择、连接和重复的优先问题。

7、正则表达式的名字：为较长的正则表达式提供一个简化了的名字很有用处，这样就不再需要在每次使用正则表达式时书写常常的表达式本身了。

3、有穷自动机（有穷状态机）：是描述（或“机器”）特定类型算法的数学方法。

1、确定性有穷自动机：下一个状态由当前状态和当前输入字符惟一给出的自动机。

2、非确定性有穷自动机：由它产生的。

4、从正则表达式到DFA
1、构造一个个扫描程序的自动过程可分为3步
2、从正则表达式到NFA
3、从NFA到DFA
4、将DFA中的状态最小化
第三章上下文无关文法及分析• 分析过程
• 上下文无关文法
• 上下文无关语言的形式特性• 分析树与抽象语法树
• 二义性
1、分析过程：
2、上下文无关文法：
3、分析树与抽象语法树：
4、二义性：
可生成带有两个不同分析树的串的文法称作二义性文法（ ambiguous grammar）
有两个解决二义性的基本方法。

其一是：设置一个规则，该规则可在每个二义性情况下指出哪一个分析树（或语法树）是正确的。

另一种方法是将文法改变成一个强制正确分析树的构造的格式，这样就可以解决二义性了。

第四章自顶向下的分析
• 使用递归下降分析算法进行自顶向下的分析
• LL(1)分析
• First 集合和F o l l o w集合
1、使用递归下降分析算法进行自顶向下的分析
2、LL(1) 分析方法是这样得名的：第1个“L”指的是由左向右地处理输入（一些旧式的分析程序惯于自右向左地处理输入，但现在已不常用了）。

第2个“L”指的是它为输入串描绘出一个最左推导。

括号中的数字1意味着它仅使用输入中的一个符号来预测分析的方向。

3、定义：如果文法G相关的L L ( 1 )分析表的每个项目中至多只有一个产生式，则该文法就是L L ( 1 )文法(LL(1) grammar)。