编译原理复习资料

合集下载

编译原理复习资料

(1) 简述规范归约的基本思想。

（第五章课件第5张）用一个寄存符号的先进后出栈，把输入符号一个一个地移进到栈里，当栈顶形成某个产生式的候选式时，即把栈顶的这一部分替换成(归约为)该产生式的左部符号。

(2) 阐述编译程序各个组成部分主要完成的工作。

（课本P2~P4）词法分析的任务:输入源程序，对构成源程序的字符串进行扫描和分解，识别出一个个的单词。

语法分析：在词法分析的基础上，根据语言的语法规则，把单词符号串分解成各类语法单位。

语义分析与中间代码产生：对语法分析所识别出的各类语法范畴，分析其含义，并进行初步翻译。

优化：在于对前段产生的中间代码进行加工变换，以期在最后阶段能产生出更为高效的目标代码。

目标代码生成：把中间代码变换成特定机器上的低级语言代码。

(3) 什么是编译器的前端和后端，这样划分有何意义？（课本P7）编译器粗略分为词法分析，语法分析，类型检查，中间代码生成，代码优化，目标代码生成，目标代码优化。

把中间代码生成及之前阶段划分问编译器的前端，那么后端与前端是独立的。

后端只需要一种中间代码表示，可以是三地址代码或四元式等，而这些都与前端生成的方式无关。

也就是不论你前端是用fortran 还是c/c++,只要生成了中间代码表示就可以了，后端是不管你是用哪种语言生成的。

(4) 乔姆斯基把文法分为哪几种类型？对这几种类型文法作简要说明。

（课本P34）把文法分成四种类型：0，1，2，3型。

与上下文无关文法一样，它们都由四部分组成，但对产生式的限制有所不同。

0型(短语文法，图灵机)：产生式形如：α→β其中：∈α (VT ⋃ VN)*且至少含有一个非终结符；∈β (VT ⋃ VN)*1型(上下文有关文法，线性界限自动机)：产生式形如：α→β其中：|α| ≤ |β|。

仅Sε→例外，但此时S不得出现在任何产生式的右部。

2型(上下文无关文法，非确定下推自动机)：产生式形如： A →β其中：A∈ VN；∈β (VT ⋃ VN)*。

编译原理复习材料

a+b=5 a=7 x=5 y=3 b=3 z=7
(4) 所谓传名是在进入调用段之前不对实在参数预先进行计值，而是过程中每当使用到相应的形参时才对它实行计值。因序),每当过程体中使用到相应形参时就调用这个子程序。因此，过程体执行y:=y+1;语句，实现时处理成为： a=a+1; 过程体执行z:=z+x;语句，实现时处理成为： a=a+(a+b); 执行上述两语句后，a的值是 9。因此，程序执行后输出 a的值是 9。综上所述程序执行时a的输出： (1)传值：2 (2)传地址：8 (3)得结果：7 (4)传名：9 5、几个基本概念考虑一个有穷字母表∑字符集,其中每一个元素称为一个符号,∑上的
程序是由函数或过程构成的，程序的任务是通过函数或过程之间的协作（相互调用）l来完成的，函数或过程的调用有以下4种方式：传地址（call-by-reference）、得结果（call by result）、传值（call-byvalue）和传名（call by name）。定义函数Swap，其中M、N是形式参数，简称形参。 Void Swap(int M，int N) { int t; t=N; N=M; M=t; } 函数调用： Swap（I,J）；其中I和J是实在参数，简称实参。下面我们以下面的程序为例分别讨论4种参数传递的方式。
（2）这种类型的数据对象可以具有的值；（3）可以作用于这种类型的数据对象的操作。一个程序语言必须提供一定的初等数据类型，包括这些数据类型上能进行的运算的定义。不同的语言含有不同的初等数据成分。常见的初等数据类型有：（1）数值类型：整型、实型、复数、双精度，运算：+，-，*，/等（2）逻辑类型：布尔运算：∨，∧，┑ （3）字符类型：符号处理（4）指针类型：指针式把内存地址作为其值的数据类型，通过指针可以操作内存空间。程序语言中的各种名字都是用标识符表示的。标识符是指由字母、下划线和数字组成的，以字母或下划线为开头的一个字符串。名字和标识符在形式上难于区别，标识符是一个没有意义的的字符序列，而名字则有明确的意义和属性。用计算机术语来说，每个名字可看成是代表一个抽象的存储单元，这个单元可含有一位、一字节或相继的多个字节。该单元的内容则被认为是名字的值。仅把名字看成代表一定的存储单元还是不够的，我们还必须同时指出它的属性（数据类型）。只有指定了属性的存储单元，其值才是可以理解的。一个名字的属性包括类型和作用域。名字的类型决定了它能具有什么样的值，值在计算机内部的表示方式，以及对它能施加什么运算。名字的作用域规定了它的值的存在范围。除了初等数据类型外，有些语言还提供了由初等数据构造复杂数据的手段。常见的复杂数据类型有：（1）数组。一个数组是由同一类型数据所组成的某种n维矩形结构。数组在内存中占有一块连续的空间，系统采用基地址加偏移量的方式来访问数组元素。（2）记录。从逻辑上讲，记录是由已知的数据组合起来的一种结构。一个记录通常含有若干个分量，每个分量称为记录的一个栏（或域 field）。每个分量都是一个确定类型的数据，不同的分量的数据类型可以不同。（3）字符串、表格、栈和队列。（4）抽象数据类型。抽象数据类型封装了数据和操作，在面向对象程序设计语言中，Ada通过程序包（package）提供了数据封装的支持， Smalltalk、C++和Java语言则通过类（class）对抽象数据类型提供支持。 4、函数调用的方式

编译原理复习资料

1.简要说明语义分析的基本功能。

答：语义分析的基本功能包括: 确定类型、类型检查、语义处理和某些静态语义检查。

2.考虑文法G[S]: S → (T) | a+S | a T → T,S | S 消除文法的左递归及提取公共左因子。

解：消除文法G[S]的左递归：S→(T) | a+S | a T→ST′ T′→,ST′| ε 提取公共左因子：S→(T) | aS′ S′→+S | ε T→ST′T′→,ST′| ε3.按照三种基本控制结构文法将下面的语句翻译成四元式序列：while (A<C ∧B<D) { if(A ≥ 1) C=C+1;else while (A ≤ D)A=A+2;}。

解：该语句的四元式序列如下(其中E1、E2和E3分别对应A＜C∧B＜D、A≥1和A≤D，并且关系运算符优先级高)：100 (j<,A,C,102) 101 (j,_,_,113)102(j<,B,D,104) 103 (j,_,_,113) 104 (j=,A,1,106) 105 (j,_,_,108) 106 (+, C, 1, C) 107 (j,_,_,112) 108 (j≤,A,D,110) 109 (j,_,_,112) 110 (+, A, 2, A) 111 (j,_,_,108) 112 (j,_,_,100) 11310.短语------令G是一个文法，S划文法的开始符号，假定αβδ是文法G的一个句型，如果有SαAδ且Aβ，则称β是句型αβδ相对非终结符A的短语。

15.句柄------一个句型的最左直接短语。

18.素短语------素短语是指这样一个短语，至少含有一个终结符，并且，除它自身外不再含任何更小的素短语。

3．语法树句子的树结构表示法称为语法树(语法分析树或语法推导树)。

给定文法G=(V N，V T，P，S)，对于G的任何句型都能构造与之关联的语法树。

这棵树具有下列特征：(1)根节点的标记是开始符号S。

编译原理复习

编译原理复习编译原理复习⼀、基本概念（填空15分，选择10分，简答：15分）1、编译程序按扫描源程序的遍数分类可以分为哪两类？⼀遍扫描、多遍扫描2、⾼级语⾔的单词分类有哪些？基本字、运算符、标识符、常数、界符3、⼆义性⽂法，⼆义性语⾔的定义？⼆义性⽂法：⽂法G对某句型存在⾄少两种不同的语法树。

⼆义性语⾔：某语⾔对应的任意⼀种⽂法都是⼆义性⽂法4、DFA的定义及组成：确定的有穷⾃动机； M=(K,∑,f, S,Z)K是⼀个有穷集，它的每个元素称为⼀个状态；∑是⼀个有穷字母表，它的每个元素称为⼀个输⼊符号，所以也称∑为输⼊符号表； F是转换函数，是K×∑→K上的映像S∈K，是唯⼀的⼀个初态Z K，是⼀个终极态，终态也称为接收状态或结束状态5、最左推导、规范推导的定义：最左推导：若x和y是符号串α中有两个以上的⾮终结符号时，对推导的每⼀步坚持把α中的最左⾮终结符号进⾏替换，称为最左推导。

规范推导：通常，我们把能由最左(右)推导推出的句型称为左(右)句型。

另外，也常把最右推导称为规范推导，⽽把右句型称为规范句型。

6、确定的⾃顶向下分析⽅法通常有哪两种？采⽤确定的⾃顶向下分析的前提条件是什么？递归⼦程序法、预测分析法对每⼀个⾮终结符A的两个不同产⽣式，A→α，B→β，满⾜SELECT（A→α）∩SELECT（B→β）=?，其中αβ不同时能→ε7、词法分析的常⽤⽅法有哪两种？⾃顶向下；⾃底向上。

8、简单优先分析法、算符优先分析法属于、LR(0)分析法分别属于何种归约？规范规约、⾮规范规约、规范规约9、⾼级程序设计语⾔的翻译⽅式主要有哪两种，⼆者的根本区别在于哪⾥？⽅式：编译程序、解释程序区别：⽣不⽣成⽬标代码10、词法分析程序和语法分析程序的任务分别是什么？词法分析是编译的第⼀阶段，它的主要任务是按语⾔的词法规则，从左⾄右逐个字符地对源程序进⾏扫描，从源程序中识别出每个单词，并把每个单词转换成它们的内部表⽰，即所谓的token，同时进⾏词法检查。

编译原理复习资料

第1部分一简答题1．编译程序按功能分为哪几个阶段？各个阶段的主要功能？2．实现高级语言程序的途径有哪几种？它们之间的区别？3．给出描述非0数字作为开始符的奇数字符串的正则表达式或正则式。

4．判断字符串a n b n（n >0）是否可用确定自动机识别？如果能，则画出自动机，否则说明原因5．对如下文法：G[S]：S → a b S | a a B | a dB → b b B | b分别给出句子abaabbb和ad的句柄6．有如下文法，给出每个产生式的Predict集。

P → begin S endS → id := E ; S |E → n | id7．什么是可规约活前缀？举一例说明。

8．通过合并LR（1）文法中的同心状态得到的LALR(1)文法可能会产生哪些冲突？一定不会产生哪些冲突？9．设对偶表（L，N）分别表示程序在当前位置的层数和偏移量，确定下面程序段中括号部分的内容。

假设系统规定整型(int)变量占1个单元，实型(real)变量占2个单元。

(L, N) Type at = array of [1..10] of int;(①) var x ：real;(②) function f ( ( ？,M) var a: at,(③) b: at,(④) var x: real ) : int10．给出活动记录空间结构?并给出各部分的存储对象？11．有如下文法：G[S]：S → ( L ) | aL → S PP → , S P |给出该文法的动作文法打印每个a的嵌套深度。

例如（a，（a），（a））打印1，2，2。

12．文法可分为几类；各举一例。

13．Display表的作用？14．如下是当前执行某个过程时的活动记录，设变量x的层数和偏移量分别为L和Off，说明如何访问变量x。

15．当实参为变量，形参分别为变参和值参时，传参的区别。

二、说明如下文法是否是LL（1）文法，若不是，将其转换为LL（1）文法。

编译原理总复习

中间代码生成的自动生成工具
工具介绍
自动生成工具是一种辅助编译器设计的软件工具，它可以自动生成中间代码，从而简化编译器的设计和实现过程。
工具分类
根据生成中间代码的方式不同，自动生成工具可以分为解析型和抽象语法树型两类。解析型工具将源代码直接翻译成中间代码；抽象语法树型工具则将源代码先转换为抽象语法树，然后再将抽象语法树转换为中间代码。
Antlr
一个强大的语法分析器生成器，支持多种语言和复杂的文法规则。
GOLD
一个高效的语法分析器生成器，支持多种目标语言和优化选项。
04 中间代码生成
中间代码生成的定义与任务
定义
中间代码生成是编译过程的一个阶段，将源代码转化为一种中间表示形式，这种中间表示形式称为中间代码。
任务
其任务包括控制结构的抽象、语义的消除、代码优化等，以简化后续的代码优化和目标代码生成阶段。
循环结构的优化
循环展开
将循环体中的代码复制到循环外部，以减少循环次数。
循环合并
将多个循环合并为一个循环，以减少循环次数。
循环嵌套
将一个循环嵌套在另一个循环内部，以减少循环次数。
循环展开与循环合并的优缺点
循环展开可以减少循环次数，但会增加代码量；循环合并可以减少代码量，但会增加循环次数。在实际应用中，需要根据具体情况选择合适的优化方法。
算法优化
根据问题的特点，选择合适的算法，以提高程序执行效率。
系统资源优化
根据系统资源的特点，合理分配和利用系统资源，以提高系统运行效率。
循环优化
1 2
循环展开
将循环体中的操作展开，以减少循环次数和减少循环开销。
循环合并
将多个循环合并为一个循环，以减少循环次数和减少循环开销。

编译原理总复习

2、解：改写后的文法变为 Z∷=(A) , A∷=a{abb}
过程Z INPUTSYM=’(’ N 错误
Y INPUTSYM=下一个符号
过程A INPUTSYM=’)’ Y INPUTSYM=下一个符号出口非终结符号Z的分析程序 N 错误
过程A N INPUTSYM=’a’ Y INPUTSYM=下一个符号 INPUTSYM=’a’ INPUTSYM=下一个符号 Y INPUTSYM=’b’ N 错误
q3b=ε-closure(δ(q3,b))= ε-closure({8})={8} =q6; q4a=ε-closure(δ(q4,a))= ε-closure({2,4})={2,4,6,7,9} =q1; q4b=ε-closure(δ(q4,b))= ε-closure({5,8})={5,6,7,8,9} =q2; q5a=ε-closure(δ(q5,a))=ε-closure({φ})= φ; q5b=ε-closure(δ(q5,b))= ε-closure({8})={8} =q6 q6a=ε-closure(δ(q6,a))= ε-closure({7})= {7,9}=q5; q6b=ε-closure(δ(q6,b))= ε-closure({φ})= φ；计算到此，不再有新的状态。
8、栈式符号表工作过程。
9、程序运行时存储分配方法有哪些？动态存储分配包括两种方式？ 10、代码优化常用的三种方法？
二、针对语言构造文法
1、L(G)={奇正整数}; 2、L(G)={anbm|n,m≥1};
1、A::=1|3|5|7|9|NA N::=N0|N1|N2|N3|N4|N5|N6|N7|N8|N9 N::=0|1|2|3|4|5|6|7|8|9

编译原理全复习(完整版)

1》编译程序的框架图与功能块：（1）画出编译程序的总体结构，并简述各部分的主要功能：七个部分（2）编译程序的结构分为几个阶段，各阶段的任务是什么？答编译程序总框架（1）词法分析器，又称扫描器，输入源程序，进行词法分析，输出单词符号。

（2）语法分析器，简称分析器，对单词符号串进行语法分析（根据语法规则进行推导或规约），识别出各类语法单位，最终判断输入串是否构成语法上正确的“程序”。

（3）语义分析与中间代码产生器，按照语义规则对语法分析器归约出（或推导出）的语法单位进行语义分析并把它们翻译成一定形式的中间代码。

（4）优化器，对中间代码进行优化处理。

（5）目标代码生成器，把中间代码翻译成目标程序。

（6）表格管理，登记源程序的各类信息，编译各阶段的进展状况。

（7）出错管理，把错误信息报告给用户。

编译程序的结构分为五个阶段：（1）词法分析.任务是：输入源程序，对构成源程序的字符串进行扫描和分解，识别出一个个的单词（亦称单词符号或简称符号），如基本字，标识符，常熟，算符和界符。

（2）。

语法分析，任务是：在词法分析的基础上，根据语言的语法规则，把单词符号串分解成各类语法单位（语法范畴）。

（3）语义分析与中间代码产生。

任务：对语法分析所识别出的各类语法范畴，分析其含义，并进行初步翻译（产生中间代码）。

（4）优化。

任务在于对前段产生的中间代码进行加工变换，以期在最后阶段能产生出更为高效（省时间和空间）的目标代码。

（5）目标代码生成。

任务是：把中间代码（或优化出理之后）变换成特定机械上的低级语言代码。

2》．重要概念：a. 编译程序：是指能够把源语言程序转换成逻辑上等价的目标语言程序的一个程序。

b. 单词符号：是语言的基本组成成分，是人们理解和编写程序的基本要素，是语言中具有独立意义的最基本结构，它一般包括：基本字、标识符、常数、运算符和界符等c. 中间代码：是一种含义明确，便于处理的记号系统，它通常独立于具体的硬件。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第3章文法和语言
第1题
文法G＝({A,B,S},{a,b,c},P,S)其中P为：
S→Ac|aB
A→ab
B→bc
写出L(G[S])的全部元素。

答案：
L(G[S])={abc}
第 11题
令文法 G[E]为：
E→T|E+T|E-T
T→F|T*F|T/F
F→(E)|i
证明 E+T*F是它的一个句型，指出这个句型的所有短语、直接短语和句柄。

答案：
此句型对应语法树如右，故为此文法一个句型。

或者：因为存在推导序列: E=>E+T=>E+T*F，所
以E+T*F句型
此句型相对于E的短语有:E+T*F；相对于 T的短语
有 T*F
直接短语为：T*F
句柄为：T*F
第 13题
一个上下文无关文法生成句子abbaa的推导树如下：
(1)给出串abbaa最左推导、最右推导。

(2)该文法的产生式集合 P可能有哪些元素？
(3)找出该句子的所有短语、直接短语、句柄。

A
S
a S
B
B B A
S
a
《编译原理》课后习题答案第三章
答案：
(1)串abbaa最左推导:
S=>ABS=>aBS=>aSBBS=>aBBS=>abBS=>abbS=>abbAa=>abbaa
最右推导：
S=>ABS=>ABAa=>ABaa=>ASBBaa=>ASBbaa=>ASbbaa=>Abbaa=>abbaa (2)产生式有：S→ABS |Aa|ε A→a B→SBB|b
abbaa aaabbaa ⋯
可能元素有：ε aa ab
(3)该句子的短语有：
a是相对 A的短语
ε是相对 S的短语
b是相对 B的短语
εbb是相对 B的短语
aa是相对 S的短语
aεbbaa是相对 S的短语
直接短语有：a ε b
句柄是：a
第 14题
给出生成下述语言的上下文无关文法：
（1）{ a n b n a m b m| n，m>=0}
（2）{ 1n0m 1m0n| n，m>=0}
（3）{WaWr|W属于{0|a}*，Wr表示W的逆}
答案：
（１）
S→AA
A→aAb|ε
（２）
S→1S0|A
A→0A1|ε
（３）
S→0S0|1S1|ε
第 16题
给出生成下述语言的三型文法：
(1){an|n >=0 }
(2) { a n b m|n,m>=1 }
(3){a n b m c k|n,m,k>=0 }
答案：
(1) S→aS|ε
(2)
S→aA
A→aA|B
B→bB|b
(3)
A→aA|B
B→bB|C
问题 6：
已知文法G[E]:
E→ET+|T
T→TF* | F
F→F^ | a
试证：FF^^*是文法的句型，指出该句型的短语、简单短语和句柄. 答案：
该句型对应的语法树如下：
该句型相对于E的短语有FF^^*
相对于T的短语有FF^^*,F
相对于F的短语有F^;F^^
简单短语有F;F^
句柄为 F.
C→cC|ε
第4章词法分析
第1题
（３）a((a|b)*|ab*a)*b
（４）b((ab)*|bb)*ab 答案：
(1)先构造NFA：
用子集法将 NFA确定化
. X A AB AC ABY
.
A
AC
A
AC
1
A
AB
AB
ABY
AB
除X，A外，重新命名其他状态，令AB为B、AC为C、ABY为D，因为D含有Y（NFA 的终态），所以 D为终态。

.01
X.
AA A
BB C
BC A
DD C
B
DFA的状态图：:
盛威网（）专业的计算机学习网站 1
(2)先构造 NFA：
0 ε
X 1 A ε
ε
B 1
C 0
ε
D 1
E ε
ε
L 0 Y F
用子集法将 NFA确定化1 G 0 H 1 I 0
ε
J 1 K ε
X
T0=X
A
T1= ABFL
Y
CG
T2= Y
T3= CGJ
DH
K
T4= DH
EI
T5= ABFKL
T6= ABEFIL EJY
T7= ABEFGJLY EHY
CGK
T8= ABEFHLY EY
CGI
T9= ABCFGJKL DHY
T10= ABEFLY T11= CGJI
DHJ
T12= DHY
T13= DHJ
EIK
T14= ABEFIKL ε
X
ABFL
Y
CGJ
DH
ABFKL
ABEFIL
ABEFGJLY
ABEFHLY
ABCFGJKL
ABEFLY
CGJI
DHY
DHJ
ABEFIKL
Y
DH
Y
EJY
EHY
EY
DHY
EY
DHJ
EJY
1
A
CG
K
EI
CG
CG
CGK
CGI
CGK
CG
K
EI
EIK
CG
将T0、T1、T2、T3、T4、T5、T6、T7、T8、T9、T10、T11、T12、T13、T14重新命名，分别用0、1、2、3、4、5、6、7、8、9、10、11、12、13、14表示。

因为2、7、8、10、12中含有Y，所以它们都为终态。

0 1 2 3 4 5 6 7 8 9
10
11
12
13
14
2
4
2
7
8
10
12
10
13
7
1
13
5
633
9
11
9356
14
3
1
1
1
1
3
4
1
1
1
1
1
2
5
6
1
1
10
7
8
1
1
9
11
1
12
13
1
14
《编译原理》课后习题答案第四章
(3)先构造NFA：
先构造 NFA：
a,b
X a ε
A
ε
ε
B
D a E
b
a
ε
F
ε
C
ε
b
Y
用子集法将 NFA确定化
X
T0=X
A
T1=ABCD BE
BY
T2=ABCDE BEF
BEY
T3=ABCDY T4=ABCDEF T5=ABCDEY ε
X
ABCD
ABCDE
ABCDY
ABCDEF
ABCDEY
a
A
BE
BEF
BE
BEF
BEF
b
BY
BEY
BY
BEY
BEY
将T0、T1、T2、T3、T4、T5重新命名，分别用0、1、2、3、4、5表示。

因为3、5中含有Y，所以它们都为终态。

1
2
3
4
5
0 a a
1
2
4
2
4
4
1 b 3
b
b
3
535
5 2
a a
a 4
a
bb
a
b
5
《编译原理》课后习题答案第四章(4)先构造NFA：
X b
ε
A
ε
ε
ε
B
a
C
b
ε
D ε
E a I b Y
F b
G b
Hεε
用子集法将 NFA确定化：
εa b
X
T0=X
A
T1=ABDEF CI
G
T2=CI
DY
T3=G
H
T4=ABDEFY T5=ABEFH X
ABDEF
CI
G
ABDEFY
ABEFH
CI
CI
CI
A
G
DY
H
G
G
将T0、T1、T2、T3、T4、T5重新命名，分别用0、1、2、3、4、5表示。

因为4中含有Y，
所以它为终态。

a b
0112
3243
542
3523
DFA的状态图：
5
《编译原理》课后习题答案第四章
b
1
2
a
b
b
3
b
b
b
5
用子集法将 NFA确定化：。