汇编语言中间代码生成讲解

合集下载

07-第7章-中间代码生成-编译原理PDF精讲课件-中国科技大学(共13讲)

编译原理和技术
中国科学技术大学计算机科学与技术学院陈意云
第七章中间代码生成
记号分析流器本章内容
–介绍几种常用的中间表示：后缀表示、图形表示和三地址代码 –用语法制导定义和翻译方案来说明源语言的各种构造怎样被翻译成中间形式
静态检查器
中间代码中间代码生成代码生成器器
7.1 中间语言
7.1.2 图形表示 • 语法树是一种图形化的中间表示 • 有向无环图也是一种中间表示
assign a + + a assign +
+ c uminus d uminus c c d d b b (b) DAG (a) 语法树 a = (b + cd) + cd的图形表示
7.1 中间语言
7.1.4 静态单赋值形式 • 一种便于某些代码优化的中间表示 • 和三地址代码的主要区别
– 所有赋值指令都是对不同名字的变量的赋值 – 一个变量在不同路径上都定值的解决办法 if (flag) x = 1; else x = 1; y = x a; 改成 if (flag) x1 = 1; else x2 = 1; x3 = (x1, x2); //由flag的值决定用x1还是x2
E E1 E2 E.nptr = mkNode( ‘’, E1.nptr, E2.nptr) E.nptr = mkUNode( ‘uminus’, E1.nptr) E E1 E (E1) F id E.nptr = E1.nptr E.nptr = mkLeaf (id, id.entry)
符号表实例
7.2 声明语句
• 符号表的特点
–各过程有各自的符号表 –符号表之间有双向链 –构造符号表时需要符号表栈 –构造符号表需要活动记录栈 sort var a:…; x:…; readarray var i:…; exchange quicksort var k, v:…; partition var i, j:…;

编译原理课件-第7章中间代码生成

2023/6/1
● example
例2 suppose the function f has been defined in C as in the previous example. Then, the call
f ( 2+3, 4) 请写出the call三地址码。
解： translates to the three-address code begin_args t1 = 2 + 3 arg t1 arg 4 call f
2023/6/1
● If Statements if ( E ) S1 else S2
Three-Address Code ：
If语句前的代码 If测试的代码
<code to evaluate E to t1>
条件
if_false t1 goto L1
<code for S1> goto L2
True情况下的代码
(sub, x, 1, t3 ) (asn, t3, x, _ ) (eq, x, 0, t4 ) (if_f, t4, L2, _) (wri, fact, _, _ ) (lab, L1, _ , _ ) halt, _, _, _ )
2023/6/1
例2 请写出TINY program三地址码的三元式表示。
7.4 Code Generation of Procedure and Function Calls 过程和函数调用的代码生成
2023/6/1
7.1 Intermediate Code and Data Structures for Code Generation 中间代码和用于代码生成的数据结构
{ AddrKind kind; Union

编译原理课件-中间代码生成

6/75
Wensheng Li BUPT @ 2008
賦值語句a:=b*-c+b*-c的圖表示法
語法樹表示： assign
dag圖形表示： assign
a
+
a
+
*
*
b uminus b uminus
c
c
* b uminus
c
Wensheng Li BUPT @ 2008
7/75
二、三地址代碼
三地址代碼
賦值語句a:=b*-c+b*-c的三元式表示
Wensheng Li BUPT @ 2008
op
arg1
arg2
(14) uminus
c
(15)
*
b
(14)
(16) uminus
c
(17)
*
b
(16)
(18)
+
(15)
(17)
(19)
:=
a
(18)
12/75
語句x[i]:=y和x:=y[i]的三元式序列
EE1+E2
{ E.place=newtemp; if (E1.type==integer) && (E2.type==integer) { emit(E.place := E1.place + E2.place); E.type=integer; }; else if (E1.type==real) && (E2.type==real) { emit(E.place := E1.place real+ E2.place); E.type=real; }; else if (E1.type==integer) && (E2.type==real) { u=newtemp; emit(u := inttoreal E1.place); emit(E.place := u real+ E2.place); E.type=real; }; else if (E1.type==real) && (E2.type==integer) { u=newtemp; emit(u := inttoreal E2.pace); emit(E.place := E1.place real+ u); E.type=real; }; else E.type=type_error; }

编译原理第七章中间代码生成汇编

assign a + a assign + * uminus c b uminus
*
b
*
b
uminus
c
a= b*-c + b*-c
c abc uminus * bc numinus *+ assign
抽象语法树
• 构造赋值语句语法树的语法制导定义：产生式
S→id = E E→E1 + E2 E→E1 * E2 E→- E1 E→(E1)
• param x1 • param x2 • …… • param x2 • call p, n n表示实参个数。return y中y为过程返回的一个值
– 形如x = y[i]及x[i] = y的索引赋值。
– 形如x = &y, x = *y和*x = y的地址和指针赋值。象形式。 • 这些语句可以以带有操作符和操作数域的记录来实现。四元式、三元式及间接三元式是三种这样的表示。
x = y op z
其中，x、y和z是名字，常量或编译器生成的临时变量 op代表任何操作符（定点运算符、浮点运算符、逻辑运算符等）
• 像x+y*z这样的表达式要翻译为:
T1 = y * z
T2 = x + T1 其中T1 ，T2为编译时产生的临时变量。
三地址语句的类型
• 三地址语句类似于汇编语言代码。语句可以有符号标号，而且存在各种控制流语句。
– 临时变量也要填入符号表中。
三元式
• 为了避免把临时变量填入符号表，可以通过计算临时值语句的位置来引用该临时变量。 • 这样三地址代码的记录只需要三个域op, arg1 和arg。
• 对于单目运算符op, arg1和arg2只需用其一。

编译原理中间代码生成

编译原理中间代码生成在编译原理中，中间代码生成是编译器的重要阶段之一、在这个阶段，编译器将源代码转换成一种中间表示形式，这种中间表示形式通常比源代码抽象得多，同时又比目标代码具体得多。

中间代码既能够方便地进行优化，又能够方便地转换成目标代码。

为什么需要中间代码呢？其一，中间代码可以方便地进行编译器优化。

编译器优化是编译器的一个核心功能，它能够对中间代码进行优化，以产生更高效的目标代码。

在中间代码生成阶段，编译器可以根据源代码特性进行一些优化，例如常量折叠、公共子表达式消除、循环不变式移动等。

其二，中间代码可以方便地进行目标代码生成。

中间代码通常比较高级，比目标代码更具有表达力。

通过中间代码，编译器可以将源代码转换成与目标机器无关的形式，然后再根据目标机器的特性进行进一步的优化和转换，最终生成目标代码。

中间代码生成的过程通常可以分为以下几步：1.词法分析和语法分析：首先需要将源代码转换成抽象语法树。

这个过程涉及到词法分析和语法分析两个步骤。

词法分析将源代码划分成一个个的词法单元，例如标识符、关键字、运算符等等。

语法分析将词法单元组成树状结构，形成抽象语法树。

2.语义分析：在语义分析阶段，编译器会对抽象语法树进行静态语义检查，以确保源代码符合语言的语义规定。

同时，还会进行类型检查和类型推导等操作。

3.中间代码生成：在中间代码生成阶段，编译器会将抽象语法树转换成一种中间表示形式，例如三地址码、四元式、特定的中间代码形式等。

这种中间表示形式通常比较高级，能够方便进行编译器的优化和转换。

4.中间代码优化：中间代码生成的结果通常不是最优的，因为生成中间代码时考虑的主要是功能的正确性，并没有考虑性能的问题。

在中间代码生成之后，编译器会对中间代码进行各种优化，以产生更高效的代码。

例如常量折叠、循环优化、死代码删除等等。

5.中间代码转换：在完成了中间代码的优化之后，编译器还可以对中间代码进行进一步的转换。

这个转换的目的是将中间代码转换成更具体、更低级的形式，例如目标机器的汇编代码。

编译原理第七章中间代码生成(1)

c
++*ad*bce
抽象语法树
由Token序列生成后缀式（1）

(1)初始化: S1和S2为空; (2) 读token: tk=ReadOne(); (3) Switch tk of (i) #: if (S1为空) exit; else while (S1不为空) /*产生剩余操作符的后缀表示*/ {op = pop(S1); (str1, str2)=pop(2); push(S2, str2 + str1+ “op”);} (ii)运算分量: push(tk, S2); goto (2); (iii)运算符: if (S1为空 || tk优先级大于Top(S1)) { push (tk, S1); goto(2);} else { while(tk小于等于Top(S1) && S1不为空)) { op = pop(S1); (str1, str2)=pop(2); push(S2, str2+str1 + “op”); } push(tk, S1); goto (2); }

+ +
a*c + a*c + e
e
+ +
e
* a
c a AST
* c a
* c
* a
DAG c
7.1 常见的中间表示

三地址中间代码
三地址:两个操作分量和一个结果的抽象地址; 为方便起见, 通常用变量名代替抽象地址; 三元式 No. (op, operand1, operand2) 编号 (操作符, 操作分量1, 操作分量2) 其中操作分量可以是变量名(抽象地址)或者编号四元式 (op, operand1, operand2, result) (操作符, 操作分量1, 操作分量2, 结果) 其中操作分量可以是变量名(抽象地址)或者临时变量 (抽象地址)

编译原理实验三：中间代码生成

编译原理——语义分析成员：杨霞 030802107王日日 030802139方艳丽 030802102实验三：语义分析：生成中间代码一、实验目的通过语法制导或翻译模式生成中间代码。

二、实验内容在自底向上语法分析基础上设计语义规则（语法制导翻译），将源程序翻译为四元式输出.三、实验环境Windows microsoft visual c++ 6.0四.实验原理三地址码的几种常见指令：1．X=Y OP Z 的赋值指令，其中OP 是一个双目运算符或逻辑运算符。

2．X= Y 的复制指令。

3．无条件转移指令 GOTO L 把下一步要执行的带有标号L的三地址指令4．IF X GOTO L 或 IF FALSE X GOTO L的条件转移指令5．IF X RELOP Y GOTO L的条件转移指令。

三地址码四元式实验环境：windows microsoft visual c++语法制导定义：控制流语句的语法制导定义：实验代码分析：struct midcode//四元式结构;{int label;//存放标号；char op;//存放操作符；char arg1;//存放操作数1；char arg2;//存放操作数2；char result;//存放目的操作数（转移标号）}m_midcode[100];如何实现语句的跳转：主要利用了语义规则与规约过程的结合；例如：Label为四元式产生的新标号；Mnew 为四元式中最新的标号；case 9:tab1=t-1;while(tab1--){if(m_midcode[tab1].op=='>'&& (int)(m_midcode[tab1].result)==0){m_midcode[tab1].result=(char)m_midcode[tab1+2].label;/E.true=newlabelm_midcode[tab1+1].result=(char)(m_midcode[tab1+2].label+1);/E.false=newlabeltab2=tab1;for(;tab2<t;tab2++)if(m_midcode[tab2].op=='g'&&(int)m_midcode[tab2].result==0)m_midcode[tab2].result=(char)(mnew-1);//S1.next=s2.next=S.nextbreak ;}实验结果：心得体会：四元式序列是编译原理最后一个实验，最后的实验也要建立在之前两个实验的基础上。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

7.1.3 三地址代码一般形式：x = y op z
表达式x + y z翻译成的三地址语句序列是 t1 = y z t2 = x + t1
7.1 中间语言
三地址代码是抽象语法树或dag的一种线性表示
a = (b + cd ) + cd 抽象语法树的代码
t1 = b t2 = c d t3 = t1 + t2 t4 = c d t5 = t3 + t4 a = t5
7.1 中间语言
赋值语句生成三地址代码的属性文法
产生式
语义规则
S id :=E S.code=E.code || gen(id.place‘=‘ E.place)
E E1 +E2 E E1 E2
E.Place = newtemp;
E.Code = E1.code || E2.code || gen(E.place ‘=‘ E1.place ‘+’ E2.place)
E本身。 • 如果E是形式为E1 opE2的表达式，那么E的后
缀表示是E1 E2 op，其中E1和E2分别是E1和 E2的后缀表示。 • 如果E是形式为(E1)的表达式，那么E1的后缀表示也是E的后缀表示。
7.1 中间语言
• 后缀表示不需要括号 (8 4) + 2 的后缀表示是8 4 2 +
E.Code = E1.code || E2.code || gen(E.place ‘=‘ E1.place ‘*’ E2.place)
第七章中间代码生成
本章内容
–介绍几种常用的中间表示：后缀表示、图形表示和三地址代码
–用语法制导定义和翻译方案的方法来说明程序设计语言的结构怎样被翻译成中间形式
记代码
代码生成器
7.1 中间语言
7.1.1 后缀表示表达式E的后缀表示可以如下归纳定义 • 如果E是变量或常数，那么E的后缀表示就是
E E1 E2 E.nptr = mknode( ‘’, E1.nptr, E2.nptr)
E E1 E.nptr = mkunode( ‘uminus’, E1.nptr)
E (E1) E.nptr = E1.nptr
F id
E.nptr = mkleaf (id, id.entry)
7.1 中间语言
E本身。
7.1 中间语言
7.1.1 后缀表示表达式E的后缀表示可以如下归纳定义 • 如果E是变量或常数，那么E的后缀表示就是
E本身。 • 如果E是形式为E1 opE2的表达式，那么E的后
缀表示是E1 E2 op，其中E1和E2分别是E1和 E2的后缀表示。
7.1 中间语言
7.1.1 后缀表示表达式E的后缀表示可以如下归纳定义 • 如果E是变量或常数，那么E的后缀表示就是
7.1 中间语言
赋值语句生成三地址代码的属性文法
产生式
语义规则
S id :=E S.code=E.code || gen(id.place‘=‘ E.place)
E E1 +E2 E E1 E2
E.Place = newtemp;
E.Code = E1.code || E2.code || gen(E.place ‘=‘ E1.place ‘+’ E2.place) E.Place = newtemp;
• 索引赋值x = y[i]和 x[i] = y
• 地址和指针赋值x = &y，x = y和x = y
7.1 中间语言
赋值语句生成三地址代码的属性文法
产生式
语义规则
S id :=E S.code=E.code || gen(id.place‘=‘ E.place)
E E1 +E2
E E1 E2
7.1 中间语言
• 后缀表示不需要括号 (8 4) + 2 的后缀表示是8 4 2 +
• 后缀表示的最大优点是便于计算机处理表达式
7.1 中间语言
• 后缀表示不需要括号 (8 4) + 2 的后缀表示是8 4 2 +
• 后缀表示的最大优点是便于计算机处理表达式
• 后缀表示很容易拓广到含一元算符的表达式
assign
a
+
+
uminus c
d
c
d
b (a) 语法树
a = (b + cd ) + cd的图形表示
7.1 中间语言
7.1.2 图形表示
• 抽象语法树是一种图形化的中间表示
• 有向无环图也是一种中间表示
assign
assign
a
+
a
+
+
+
uminus c
d
uminus
c
d
c
d
b (a) 语法树
assign
a
+
+
uminus
c
d
b
7.1 中间语言
本书常用的三地址语句
• 赋值语句x = y op z， x = op y，
x= y
• 无条件转移goto L
• 条件转移if x relop y goto L
• 过程调用param x 和call p , n
• 过程返回 return y
7.1 中间语言
• 后缀表示不需要括号 (8 4) + 2 的后缀表示是8 4 2 +
• 后缀表示的最大优点是便于计算机处理表达式
• 后缀表示很容易拓广到含一元算符的表达式 • 后缀表示也可以拓广到表示赋值语句和控制
语句，但很难用栈来描述它的计算
7.1 中间语言
7.1.2 图形表示 • 语法树是一种图形化的中间表示
uminus
7.1 中间语言
三地址代码是语法树或dag的一种线性表示
a = (b + cd ) + cd
语法树的代码 dag的代码
t1 = b t2 = c d t3 = t1 + t2 t4 = c d t5 = t3 + t4 a = t5
t1 = b t2 = c d t3 = t1 + t2 t4 = t3 + t2 a = t4
b (b) dag
a = (b + cd ) + cd的图形表示
7.1 中间语言
构造赋值语句抽象语法树的语法制导定义
产生式
语义规则
S id :=E S.nptr = mknode(‘assign’, mkleaf (id, id.entry), E.nptr)
E E1 +E2 E.nptr = mknode( ‘+’, E1.nptr, E2.nptr)