编译原理知识点汇总

合集下载

编译原理知识点

编译原理知识点

编译原理知识点
1.1 翻译程序的三种方式
1.编译:将高级语言编写的源程序翻译成等价的机器语言或汇编语言。

2.解释:将高级语言编写的源程序翻译一句执行一句,不生成目标文件,直接执行源代码文件。

3.汇编:用汇编语言编写的源程序翻译成与之等价的机器语言。

1.2 编译程序的五个阶段
1.词法分析:对源程序的字符串进行扫描和分解,识别出每个单词符号。

2.语法分析:根据语言的语法规则,把单词符号分解成各类语法单位。

3.语义分析与中间代码生成:对各种语法范畴进行静态语义检查,若正确则进行中间代码翻译。

4.代码优化:遵循程序的等价变换规则。

5.目标代码生成:将中间代码变换成特定机器上的低级语言代码。

2.1.1 字母表
1.定义:字母表是有穷非空的符号集合。

2.表示:通常用字母表大写字母A,B,…Z和希腊字母Σ表示。

eg:A={0,1},Σ={a,b,c,d}
3.说明
1)字母表包含了语言中所允许出现的一切符号。

2)字母表中的符号也称字符。

2.1.2 符号串
1.定义:由字母表中的符号组成的有穷序列。

2.表示:通常由t,u,v,w,x,y,z等小写英文字母来表示。

3.说明
1)符号串由构成的符号的种类、数量、顺序共同决定。

2)不包含任何符号的符号串称为空符号串,简称空串,用ε表示。

4.对于给定的字母表Σ,符号串的递归定义如下:
1)ε是Σ上的一个符号串。

2)若x是Σ上的符号串,a是Σ的符号,则xa是Σ上的符号串。

并规定。

编译原理部分知识点

编译原理部分知识点

编译原理部分知识点①编译程序的工作过程一般划分为5个阶段:词法分析,语法分析,语义分析与中间代码生成,优化,目标代码生成【还有表格管理还有出错管理】②编译器常用的语法分析方法两种。

自顶向下,自下而上分析方法。

LR方法(自下而上),LL(1)属于什么方法(自上而下)、算符优先分析法(自下而上)③概念:句子(仅含终结符号的句型是一个句子)、最左素短语(语法树中最左边的素短语为最左素短语)、句柄、(一个句型的最左直接短语)二义:(如果一个文法存在某个句子对应两颗不同的语法树,则称这个文法是二义的)正规文法(左线性文法和右线性文法统称为正规文法)④程序语言的单词符号分为5种(关键字、标识符、常数、运算符、界符)⑤属性通常分为两类(综合属性)(继承属性)⑥LR分析器的实质是一个后进先出确定有限状态自动机。

⑦常用的参数传递方式(传地址),(传值),(传名)(传结果)⑧一个LL(1)文法一定是无二义的。

⑨解释程序、编译处理语言时的特点(源语言程序作为输入,但不产生目标程序,而是边解释边执行源程序本身。

①边解释边执行②有利于程序的调试③ 1次运算)⑩语法分析器作用(按文法的产生式,识别输入符号串是否为一个句子)⑪任何算符优先文法与优先函数的关系(任何算符优先文法可能有若干个优先函数,不一定存在优先函数)⑫确定有限自动机的化简是要实现目的(寻找一个状态数比M少的DFA M’,使得L(M)=L(M’))⑬间接三元式表示法的优点为(采用间接码表,节省三元式空间,便于优化处理)⑭词法分析器任务(从左到右逐个字符地对源程序进行扫描,产生一个个的单词符号,把作为字符串的源程序改造成为单词符号串的中间程序)2、设文法G(S)S→(T)|aT→T+S | S计算FIRSTVT和LASTVT;构造优先关系表。

(1) FIRSTVT(S)={a, ( }FIRSTVT(T)={+, a a, (}LASTVT(S)={a, ) }LASTVT(T)={+, a, )}(2)a + ( )a .> .>+ <. .> <. .>( <. <. <. =.) .> .> >.3、设文法G(S):S→( T ) | aS | aT→T, S | S消除左递归和提取公因子;构造相应的FIRST和FOLLOW集合;构造预测分析表。

编译原理知识点总结

编译原理知识点总结

编译原理知识点总结编译原理是计算机科学中的一个重要领域,它研究的是将高级程序语言转化为可执行目标代码的原理和方法。

在软件开发过程中,编译器起着至关重要的作用,因此了解编译原理的知识点对于理解和优化程序的性能至关重要。

1. 词法分析:词法分析是编译器的第一步,它将源代码划分为一个个的词法单元,如关键字、标识符、运算符等。

词法分析器通过正则表达式和有限自动机来实现,可以有效地将源代码转化为词法单元流。

2. 语法分析:语法分析是编译器的第二步,它通过语法规则将词法单元流转化为抽象语法树(AST)。

语法分析器使用上下文无关文法来描述语言的语法结构,并通过LL(1)分析、LR(1)分析等算法来构建抽象语法树。

3. 语义分析:语义分析是编译器的第三步,它对抽象语法树进行语义检查和类型推断。

语义分析器会检查变量的作用域、类型是否匹配等语义错误,并生成中间代码或目标代码。

4. 中间代码生成:中间代码生成是编译器的一项重要任务,它将抽象语法树转化为中间表示形式,如三地址码、四地址码等。

中间代码是一种抽象的低级语言,便于后续的优化和目标代码生成。

5. 代码优化:代码优化是编译器的关键环节,它通过对中间代码进行分析和优化,提高程序的执行效率和资源利用率。

常见的代码优化技术包括常量折叠、循环优化、函数内联等。

6. 目标代码生成:目标代码生成是编译器的最后一步,它将中间代码转化为目标机器代码。

目标代码生成器根据目标机器的特性和指令集,生成可执行的目标代码。

7. 符号表管理:符号表是编译器中用于管理变量、函数等符号信息的数据结构。

符号表包含了符号的名称、类型、作用域等信息,编译器在词法分析、语法分析和语义分析阶段使用符号表进行符号的查找和管理。

8. 错误处理:错误处理是编译器中一个重要的组成部分,它负责检测和报告源代码中的错误。

编译器需要能够准确地定位错误的位置,并给出有意义的错误信息,帮助程序员快速定位和修复错误。

编译原理涉及的知识点非常广泛,上述仅是其中的一部分。

编译原理要点整理

编译原理要点整理

编译原理要点整理//红色字体标注的是重点中的重点,大题的归宿第一章引论1.翻译器,编译器的定义2.编译器工作步骤和流程3.编译器前端后端的概念,理解为什么要有前端后端4.“遍”的概念第二章词法分析1.词法分析器的定义2.词法分析器所要完成的任务3.记号,模式,词法单元概念区分4.串的运算(和,连接,指数,闭包,正闭包)5.正规定义6.转换图(注意开始状态和结束状态以及需要将指针回退的状态)7.不确定的有限自动机(NFA)定义8.确定的有限自动机(DFA)定义9.从正规式到NFA(明确通过正规式如何构造连接运算,和运算,闭包运算的NFA)10.此方法产生的NFA的性质11.从NFA到DFA(子集构造法)12.DFA的化简(合并不可区别状态)13.从语言描述直接到DFA14.了解Lex学完本章:能语言描述改写成正规定义,能将正规定义转化为语言描述,给出一个正规式,能转换成相应的NFA,DFA并化简。

第三章语法分析1.上下文无关文法定义2.区分句子和句型3.最左推导&& 最右推导4.分析树5.文法二义性6.消除左递归&& 提左因子7.了解语言鸟瞰(0型文法:短语文法;1型文法:上下文有关文法;2型文法:上下文无关文法;3型文法:正规式)8.FIRST集合&& FOLLOW集合定义及计算方法9.LL(1)文法定义10.了解自上而下的递归下降的预测分析11.自上而下非递归的预测分析(详细明确预测分析器接受某一输入串时的具体过程,明确栈如何变化,输入输出如何变化)12.预测分析表的构造13.句柄的概念14.自下而上的分析方法:用栈实现移近-归约分析(详细明确预测分析器接受某一输入串时的具体过程,明确栈如何变化,输入输出如何变化)15.LR文法和LR分析算法16.构造SLR分析表(从文法构造识别活前缀的DFA(LR(0)项目集规范族),从DFA构造SLR分析表)17.构造规范的LR分析表(从文法构造识别活前缀的DFA(LR(1)项目集规范族),从DFA构造规范的LR分析表)18.构造LALR分析表(从文法构造识别活前缀的DFA(合并同心的LR(1)项目集),从DFA构造规范的LR分析表)(合并同心项目集可能会引起归约-归约冲突,不会引起新的移进-归约冲突)学完本章:能计算FIRST集合和FOLLOW集合;给定一个文法,能判断是否是LL(1)文法,并为其构造分析表;能构造LR(1)文法的三种预测分析表;明确移近归约分析中的每一个步骤,明确栈如何变化。

最全的编译原理知识点-完美总结

最全的编译原理知识点-完美总结

第一章1. 程序设计语言是人与计算机联系的工具,通过程序设计语言指挥计算机按照自己的意志进行运算和操作显示信息和输出运算结果。

2. 最早的计算机程序设计语言是机器语言(指令系统)。

机器语言中的指令都是用二进制代码直接表示的。

3. 机器语言和符号语言以及汇编语言都是低级程序设计语言。

4. 1954年FORTRAN I语言的问世标志计算机高级程序设计语言的诞生。

5. 计算机高级程序设计语言独立于机器,比较接近于自然语言,容易学习掌握,编写程序效率高,编写的程序易读易理解易移植。

6. 翻译程序:将高级语言编写的程序翻译成机器语言。

7. 编译程序的工作过程:编译程序这要功能是将源程序翻译成等价的目标程序,这个翻译过程分为词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成。

8. 编译程序的重要意义在于它使高级语言独立于机器语言,使程序员用高级语言编写程序时不必考虑那些直接与机器有关的琐碎的环节,这些细节由编译程序区处理。

9. 编译程序包括:词法分析程序、语法分析程序、语义分析程序、中间代码生成程序、代码优化程序和目标代码生成程序以及表格处理程序和出错处理程序。

10.编译程序的组织方式:编译过程分为六个阶段,改划分是编译程序的逻辑组织方式。

编译过程分为前端和后端。

前端包括词法分析、语法分析、语义分析、中间代码生成、代码优化。

后端包括目标代码生成,依赖于计算机的硬件系统和机器指令系统。

这种组织方式便于编译程序的移植,如果移植到不同类型的机器上只需修改编译程序的后端即可。

11.翻译方式:编译方式和解释方式。

12.源程序:用高级语言编写的程序。

源程序是编译程序加工的对象。

13.编译方式:先将源程序翻译成汇编语言程序或机器语言程序(目标程序),然后再执行。

这个翻译程序为编译程序.14.编译方式中源程序的编译和目标程序的运行时分成两个阶段完成的。

编译所的目标程序计算机暂时不能执行,必须由连接装配程序将目标程序和编译程序及系统子程序连接成一个可执行程序,这个可执行程序可直接被计算机执行。

《编译原理》重点知识总结

《编译原理》重点知识总结

《编译原理》知识点总结目录第一章引论第二章高级语言及其语法描述第三章语法分析——自上而下分析第四章属性文法和语法制导翻译第五章语义分析和中间代码产生第六章优化第一章引论一.编译程序(compiler):把某一种高级语言程序等价地转换成另一种低级语言程序(如汇编语言或机器语言程序)的程序二.编译程序的工作的五个阶段:词法分析、语法分析、中间代码产生、优化、目标代码产生1.词法分析任务: 输入源程序,对构成源程序的字符串进行扫描和分解,识别出一个个单词符号。

依循的原则:构词规则描述工具:有限自动机FOR I := 1 TO 100 DO保留字标识符等符整常数保留字整常数保留字2.语法分析任务:在词法分析的基础上,根据语言的语法规则把单词符号串分解成各类语法单位。

依循的原则:语法规则述工具:上下文无关文法3.语义分析与中间代码产生任务:对各类不同语法范畴按语言的语义进行初步翻译。

(变量是否定义、类型是否正确等)依循的原则:语义规则中间代码:三元式,四元式,逆波兰记号,树形结构等。

是一种独立于具体硬件的记号系统。

例:将Z:=X + 0.618 * Y 翻译成四元式为(1) * 0.618 Y T1(2) + X T1 T2(3) := T2 _ Z4. 优化任务:对于前阶段产生的中间代码进行加工变换,以期在最后阶段产生更高效的目标代码。

依循的原则:程序的等价变换规则FOR K:=1 TO 100 DOBEGINM := I + 10 * K;N := J + 10 * K;END4.目标代码产生任务: 把中间代码变换成特定机器上的目标代码。

依赖于硬件系统结构和机器指令的含义目标代码三种形式:a)绝对指令代码: 可直接运行b)可重新定位指令代码: 需要连接装配c)汇编指令代码: 需要进行汇编第二章高级语言及其语法描述2.1.1语法词法规则:单词符号的形成规则。

a)单词符号是语言中具有独立意义的最基本结构。

编译原理知识点

编译原理知识点

编译原理知识点(总7页) -CAL-FENGHAI.-(YICAI)-Company One1-CAL-本页仅作为文档封面,使用请直接删除1.解释程序:不生成目标代码编译程序:生成目标代码2.编译程序组成:8个分析< 前端 >:(词法分析程序、语法分析程序、语义分析程序、中间代码生成程序)综合< 后端 >:(代码优化程序、目标代码生成程序)贯穿始末:表格管理程序、出错处理程序3.文法四元组:终结符号集合Vt 、非终结符号集合Vn、产生式集合P、识别符号(开始符号)SV T∩V N=Φ文法 -> 语言(推导、规约)唯一;语言 -> 文法(凑规则)不唯一。

4.文法分类:0型文法(短语结构文法):左侧至少含有一个非终结符1型文法(上下文有关文法):左侧长度 <= 右侧长度 S->ε除外, S不能出现在右侧2型文法(上下文无关文法):左侧只能有一个非终结符 ( 语法分析 )3型文法(正规文法):A-> aB A->a 右线性; ( 词法分析 )A->Ba 或A->a 左线性(看非终结符位置)5.A*= A0 ∪A+ A0 ={ε} != { } =Φ空集A+ = AA* = A*A6.句型:符号串x是从识别符号S推导出来的,x称为一个句型句子:x仅由终结符号组成,仅含终结符号的句型是一个句子短语:子树的末端(叶子)从左至右连成的串(包括整棵语法树)简单子树:只含有单层分枝的子树直接短语( 简单短语 ):由简单子树的叶子组成句柄:最左边的直接短语(不一定含终结符)素短语:至少含有一个终结符的短语,并且除它自身之外不再含任何更小的素短语最左素短语:最左边的素短语短语:P(相对于T、E)、 P+T(相对于E)、i(相对于P、F)、P+T+i(相对于E)直接短语:P、i 句柄:P (最左边的直接短语)素短语:P+T 、i (至少含有一个终结符的短语)最左素短语:P+T7.二义性文法:有两个不同的最左推导或有两个不同的最右推导或能产生两棵语法树8.文法产生式正规式规则1 A xB B y A = xy规则2 A xA|y A = x*y 右线性A Ax|y A = yx* 左线性规则3 A x A y A = x|y9.DFA 初态唯一,转换函数为单值映射表示方式:转移矩阵、状态转换图状态转换图上若存在一条从初态到某一终态的道路,且这条路上所有弧的标记符连成的字符串为t,则称t被DFA接受。

编译原理知识点汇总

编译原理知识点汇总

编译原理编译原理编译器是什么?知识树基本过程词法分析语言正则语言正则定义如何让计算机识别用正则表达式定义的语言NFA 非确定有限自动机DFA 确定有限自动机正则表达式转 NFA直接用 NFA 识别语言直接从正则表达式转 DFA最小化 DFA 的算法语法分析语法的形式化:上下文无关文法推导推导 derivation字符串符号文法语法分析树文法的二义性文法二义性的消除消除左递归消除直接的左递归消除间接的左递归计算 first() 集合计算 follow(A) 集合LL(1) 文法的分析表自底向上的文法分析SLR 文法LR(0) 项扩充文法自动机的过程Closure of Item SetsSLR 分析表的构建(重点)LR(1) 文法构造 LR(1) 分析表缺点LALR 文法语法制导定义基本思想举例语法制导定义继承属性翻译模式再次举例:中缀转后缀扩展文法扩展语法树通过自顶向下的分析来实现先序遍历实现先序遍历Evaluation Order and Dependency Graphs 显式的语法分析树S-属性制导定义L-属性制导定义需要满足三条规则:语义分析和中间代码生成Introduction3 地址代码1. 类型和声明举例来说明翻译过程2. 赋值和表达式类型检查3. 布尔表达式和流控制流控制的语法制导定义布尔表达式的语法制导定义运行时环境内存管理stack 和活动记录活动树活动记录(帧)进程内通信堆管理多线程垃圾回收代码生成指令选择寄存器分配和赋值指令调度抽象目标状态机指令集基本块流图生存期和后续使用信息简单代码生成器代码优化窥孔优化局部优化控制流分析和循环优化消除共同子表达式✔编译器是什么?编译器是一个程序,主要是用来把源程序转换成另外一种计算机语言的程序。

语言编译的全过程:✔知识树编译原理正则语言识别 T oken上下文无关文法CFG 构建语法分析树语法制导翻译生成中间代码代码优化代码生成编译原理是一种语言处理器,它完成了很多工作。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

编译原理的复习提纲
1.编译原理=形式语言+编译技术
2.汇编程序:
把汇编语言程序翻译成等价的机器语言程序
3.编译程序:
把高级语言程序翻译成等价的低级语言程序
4.解释执行方式:
解释程序,逐个语句地模拟执行
翻译执行方式:
翻译程序,把程序设计语言程序翻译成等价的目标程序
5.计算机程序的编译过程类似,一般分为五个阶段:
词法分析、语法分析、语义分析及中间代码生成、代码优化、目标代码生成
词法分析的任务:
扫描源程序的字符串,识别出的最小的语法单位(标识符或无正负号数等)
语法分析是:
在词法分析的基础上的,语法分析不考虑语义。

语法分析读入词法分析程序识别出的符号,根据给定的语法规则,识别出各个语法结构。

语义分析的任务是检查程序语义的正确性,解释程序结构的含义,语义分析包括检查变量是否有定义,变量在使用前是否具有值,数值是否溢出等。

语法分析完成之后,编译程序通常就依据语言的语义规则,利用语法制导技术把源程序翻译成某种中间代码。

所谓中间代码是一种定义明确、便于处理、独立于计算机硬件的记号系统,可以认为是一种抽象机的程序
代码优化的主要任务是对前一阶段产生的中间代码进行等价变换,以便产生速度快、空间小的目标代码
编译的最后一个阶段是目标代码生成,其主要任务是把中间代码翻译成特定的机器指令或汇编程序
编译程序结构包括五个基本功能模块和两个辅助模块
6.编译划分成前端和后端。

编译前端的工作包括词法分析、语法分析、语义分析。

编译前端只依赖于源程序,独立于目标计算机。

前端进行分析
编译后端的工作主要是目标代码的生成和优化后端进行综合。

独立于源程序,完全依赖于目标机器和中间代码。

把编译程序分为前端和后端的优点是:
可以优化配置不同的编译程序组合,实现编译重用,保持语言与机器的独立性。

7.汇编器把汇编语言代码翻译成一个特定的机器指令序列
第二章
1.符号,字母表,符号串,符号串的长度计算P18,子符号串的含义,符号串的简单运算XY,Xn,
2.符号串集合的概念,符号串集合的乘积运算,方幂运算,闭包与正闭包的概念P19,P20A0
={ε}
3.重写规则,简称规则。

非xx(V
n),xx(V
t)的概念。

4.文法的概念。

P23识别符号.P23文法的第一个重写规则的左部符号为识别符号。

BNF表示法P6
5.直接推导和直接规约,广义推导广义规约,P24最左推导,最右推导P62
6.句型和句子P26,短语,简单短语,句柄P26,P27
7.语言的定义P31
8.递归,左递归P32
9.文法的形式化定义P36定义重点是正则文法和上下文无关文法
0型文法,短语结构语言
1型文法,上下文有关文法CSG
2型文法,上下文无关文法CFG
3型文法,正则文法RG
3型语言类(2型语言类(1型语言类(0型语言类
但四种语言之间没有必然的包含关系P38
3型语言的定义有穷状态自动机P41
2型语言下推自动机
1型语言线性界限自动机
0型语言图灵机
10.消去规则左递归P51
11.语法分析树的构造,能够根据语法书来寻找短语,直接短语,句柄。

12.文法的二义性问题P58,文法的二义性是不可判定的
-------------------------------
第三章
1.词法分析的功能P69
2.词法分析器可以有两种实现模式:
完全融合模式(大多采用)和相对独立模式,完全独立方式P71
3.有穷状态自动机的概念,如何从正则文法构造有穷状态转换自动机P72
4.
5.
6.
7.如何从有穷状态转换自动机构造正则文法P75
确定有穷状态自动机DFA五元组(K,Σ,M,S,F),五个字母的含义。

P75非确定有穷状态自动机NFA,如何将NFA转化为DFAP82
DFA的化简
8.属性字由符号类和符号值组成。

特定符号类,一个符号类对应一个符号值:
关键字、括号,运算符。

非特定符号类:
标示符,无符号整数。

符号类识别不同类的符号,符号值识别同类的不同符号P90
9.字符表,符号机内表示对照表,标示符表,无符号整数表各自的定义和作用P93词法分析程序的大致思路
------------------------------
第四章自顶向下(重点是预测分析表的构造和应用预测分析表进行字符串分析)
1.带回溯的自顶向下分析方法P121(一般采用最左或者最右推导)
2.无回溯的自顶向下分析方法:
条件,无左递归性,无回溯性。

3.预测分析技术:
消去文法左递归P51;构造first集合和follow集合P138,构造预测分析表P139进行字符串分析P134
-------------------------------------
第五章自底向上(重点是构造算符优先矩阵并进行字符串的分析)
1.规范分析:
最右推导被称为规范推导,最左规约被称为规范规约。

P145
2.分析需要解决的两个基本问题:
找出要被归约的短语u;确定归约到哪个非终结符号U
3.一个符号串的前缀是指该串的任一部分。

一个规范句型的前缀若不含句柄之后的任何符号就称为活前缀
4.基本方法:
移入规约xxP147四个动作之一:
移进归约接受出错
5.算符优先分析技术:
P150定义
5.2构造算符优先关系表P151-154算符优先识别算法P155
6.LR(k)分析技术,要知道其中定义(为什么引入LR(K)):
圆点在产生式最右端的项目称为可归约项,如E→E+T·;圆点后面是终结符的项目称为移进项,如E→E·+T;圆点后面是非终结符的项目称为待约项,如
E→E+·T。

项,项集,项集的闭包
--------------------------------------------
第六章(重点是四元式、逆波兰式、抽象语法分析树(三元式))
1.语义分析的基本功能:
确定类型;类型检查;识别含义,作相应的语意处理;其他一些静态语义检查。

P215
2.语义分析以语法分析部分的输出(语法分析树或其他等价内部中间表示)为输入,输出中间表示代码,甚至目标代码。

P215
3.语义是上下文相关的
4.语法制导翻译技术
5.抽象语法树P297
6.逆xx式P300
7.四元组P306
-------------------------------------------------
第七章
1.代码优化的定义P348,代码优化进行的是等价变换,为优化进行努力是值得的。

2.基本块的概念,对基本块的优化:
合并常量计算,消除公共子表达式,消减计算强度,删除无用代码。

对循环的优化:
循环不变表达式外提,归纳变量删除,计算强度消减。

3.代码优化的三个过程:
控制流分析,数据流分析,变化。

P350各自的含义
4.代码优化是基于中间表示代码进行的
5.窥孔优化:
定义P395包括:
四种典型优化,各自的含义、。

相关文档
最新文档