汇编语言中间代码生成讲解

合集下载

07-第7章-中间代码生成-编译原理PDF精讲课件-中国科技大学(共13讲)

07-第7章-中间代码生成-编译原理PDF精讲课件-中国科技大学(共13讲)
编译原理和技术
中国科学技术大学 计算机科学与技术学院 陈意云
第七章 中间代码生成
记号 分析 流 器 本章内容
–介绍几种常用的中间表示:后缀表示、图形表示 和三地址代码 –用语法制导定义和翻译方案来说明源语言的各种 构造怎样被翻译成中间形式
静态 检查 器
中间 代码 中间 代码 生成 代码 生成 器 器
7.1 中 间 语 言
7.1.2 图形表示 • 语法树是一种图形化的中间表示 • 有向无环图也是一种中间表示
assign a + + a assign +
+ c uminus d uminus c c d d b b (b) DAG (a) 语法树 a = (b + cd) + cd的图形表示
7.1 中 间 语 言
7.1.4 静态单赋值形式 • 一种便于某些代码优化的中间表示 • 和三地址代码的主要区别
– 所有赋值指令都是对不同名字的变量的赋值 – 一个变量在不同路径上都定值的解决办法 if (flag) x = 1; else x = 1; y = x a; 改成 if (flag) x1 = 1; else x2 = 1; x3 = (x1, x2); //由flag的值决定用x1还是x2
E E1 E2 E.nptr = mkNode( ‘’, E1.nptr, E2.nptr) E.nptr = mkUNode( ‘uminus’, E1.nptr) E E1 E (E1) F id E.nptr = E1.nptr E.nptr = mkLeaf (id, id.entry)
符号表实例
7.2 声 明 语 句
• 符号表的特点
–各过程有各自的符号表 –符号表之间有双向链 –构造符号表时需要符号表栈 –构造符号表需要活动记录栈 sort var a:…; x:…; readarray var i:…; exchange quicksort var k, v:…; partition var i, j:…;

编译原理课件-第7章中间代码生成

编译原理课件-第7章中间代码生成
2023/6/1
● example
例2 suppose the function f has been defined in C as in the previous example. Then, the call
f ( 2+3, 4) 请写出the call三地址码。
解: translates to the three-address code begin_args t1 = 2 + 3 arg t1 arg 4 call f
2023/6/1
● If Statements if ( E ) S1 else S2
Three-Address Code :
If语句前的代码 If测试的代码
<code to evaluate E to t1>
条件
if_false t1 goto L1
<code for S1> goto L2
True情况下的代码
(sub, x, 1, t3 ) (asn, t3, x, _ ) (eq, x, 0, t4 ) (if_f, t4, L2, _) (wri, fact, _, _ ) (lab, L1, _ , _ ) halt, _, _, _ )
2023/6/1
例2 请写出TINY program三地址码的三元式表示。
7.4 Code Generation of Procedure and Function Calls 过程 和函数调用的代码生成
2023/6/1
7.1 Intermediate Code and Data Structures for Code Generation 中间代码和用于代码生成的数据结构
{ AddrKind kind; Union

编译原理课件-中间代码生成

编译原理课件-中间代码生成
6/75
Wensheng Li BUPT @ 2008
賦值語句a:=b*-c+b*-c的圖表示法
語法樹表示: assign
dag圖形表示: assign
a
+
a
+
*
*
b uminus b uminus
c
c
* b uminus
c
Wensheng Li BUPT @ 2008
7/75
二、三地址代碼
三地址代碼
賦值語句a:=b*-c+b*-c的三元式表示
Wensheng Li BUPT @ 2008
op
arg1
arg2
(14) uminus
c
(15)
*
b
(14)
(16) uminus
c
(17)
*
b
(16)
(18)
+
(15)
(17)
(19)
:=
a
(18)
12/75
語句x[i]:=y和x:=y[i]的三元式序列
EE1+E2
{ E.place=newtemp; if (E1.type==integer) && (E2.type==integer) { emit(E.place := E1.place + E2.place); E.type=integer; }; else if (E1.type==real) && (E2.type==real) { emit(E.place := E1.place real+ E2.place); E.type=real; }; else if (E1.type==integer) && (E2.type==real) { u=newtemp; emit(u := inttoreal E1.place); emit(E.place := u real+ E2.place); E.type=real; }; else if (E1.type==real) && (E2.type==integer) { u=newtemp; emit(u := inttoreal E2.pace); emit(E.place := E1.place real+ u); E.type=real; }; else E.type=type_error; }

编译原理第七章中间代码生成汇编

编译原理第七章中间代码生成汇编
assign a + a assign + * uminus c b uminus
*
b
*
b
uminus
c
a= b*-c + b*-c
c abc uminus * bc numinus *+ assign
抽象语法树
• 构造赋值语句语法树的语法制导定义: 产生式
S→id = E E→E1 + E2 E→E1 * E2 E→- E1 E→(E1)
• param x1 • param x2 • …… • param x2 • call p, n n表示实参个数。return y中y为过程返回的一个值
– 形如x = y[i]及x[i] = y的索引赋值。
– 形如x = &y, x = *y和*x = y的地址和指针赋值。象形式。 • 这些语句可以以带有操作符和操作数域的记录 来实现。四元式、三元式及间接三元式是三种 这样的表示。
x = y op z
其中,x、y和z是名字,常量或编译器生成的临时变量 op代表任何操作符(定点运算符、浮点运算符、逻辑运算 符等)
• 像x+y*z这样的表达式要翻译为:
T1 = y * z
T2 = x + T1 其中T1 ,T2为编译时产生的临时变量。
三地址语句的类型
• 三地址语句类似于汇编语言代码。语句可以有 符号标号,而且存在各种控制流语句。
– 临时变量也要填入符号表中。
三元式
• 为了避免把临时变量填入符号表,可以通过计 算临时值语句的位置来引用该临时变量。 • 这样三地址代码的记录只需要三个域op, arg1 和arg。
• 对于单目运算符op, arg1和arg2只需用其一。

编译原理中间代码生成

编译原理中间代码生成

编译原理中间代码生成在编译原理中,中间代码生成是编译器的重要阶段之一、在这个阶段,编译器将源代码转换成一种中间表示形式,这种中间表示形式通常比源代码抽象得多,同时又比目标代码具体得多。

中间代码既能够方便地进行优化,又能够方便地转换成目标代码。

为什么需要中间代码呢?其一,中间代码可以方便地进行编译器优化。

编译器优化是编译器的一个核心功能,它能够对中间代码进行优化,以产生更高效的目标代码。

在中间代码生成阶段,编译器可以根据源代码特性进行一些优化,例如常量折叠、公共子表达式消除、循环不变式移动等。

其二,中间代码可以方便地进行目标代码生成。

中间代码通常比较高级,比目标代码更具有表达力。

通过中间代码,编译器可以将源代码转换成与目标机器无关的形式,然后再根据目标机器的特性进行进一步的优化和转换,最终生成目标代码。

中间代码生成的过程通常可以分为以下几步:1.词法分析和语法分析:首先需要将源代码转换成抽象语法树。

这个过程涉及到词法分析和语法分析两个步骤。

词法分析将源代码划分成一个个的词法单元,例如标识符、关键字、运算符等等。

语法分析将词法单元组成树状结构,形成抽象语法树。

2.语义分析:在语义分析阶段,编译器会对抽象语法树进行静态语义检查,以确保源代码符合语言的语义规定。

同时,还会进行类型检查和类型推导等操作。

3.中间代码生成:在中间代码生成阶段,编译器会将抽象语法树转换成一种中间表示形式,例如三地址码、四元式、特定的中间代码形式等。

这种中间表示形式通常比较高级,能够方便进行编译器的优化和转换。

4.中间代码优化:中间代码生成的结果通常不是最优的,因为生成中间代码时考虑的主要是功能的正确性,并没有考虑性能的问题。

在中间代码生成之后,编译器会对中间代码进行各种优化,以产生更高效的代码。

例如常量折叠、循环优化、死代码删除等等。

5.中间代码转换:在完成了中间代码的优化之后,编译器还可以对中间代码进行进一步的转换。

这个转换的目的是将中间代码转换成更具体、更低级的形式,例如目标机器的汇编代码。

最新第六章-中间代码生成教学讲义ppt课件

最新第六章-中间代码生成教学讲义ppt课件
第六章-中间代码生成
第六章:中间代码生成
❖ 编译器分析综合模型
前端:源程序=》中间代码 (和源语言相关细节)
后端:中间代码=》目标代码 (和目标语言相关细节)
❖ 本章内容
中间代码表示
静态类型检查
中间代码生成
❖ 如何实现?描述用SDD、实现用SDT
所有翻译方案都可以通过生成并遍历抽象语法树来实现
临时名字在生成时一定要被写入符号表
❖ 图6-10:三地址代码及其四元式表示
10
6.2 三地址代码
❖ 三地址语句的实现
三元式
❖ 为了避免临时名字在生成时被写入符号表中,可以通过计算临 时值的语句的位置来引用它
❖ 带有三个域的记录结构:op,arg1,arg2
arg1,arg2指向符号表(对于程序员定义的名字或常量)的指针 或者三元组结构(对于临时变量)的指针
三地址码
❖ 可高可低(通过选择不同的运算符)
高级语言,如C语言
❖C语言灵活通用、可编译成高效机器代码
3
6.2 三地址代码(6.2)
❖ 三地址代码的一般形式
x = y op z 三地址代码是抽象语法树或DAG的线性表示
❖ 图6-8:一个DAG及其对应的三地址代码
7
6.2 三地址代码
❖ 三地址语句的类型(通用)
x = y op z
x = op y
x = y
goto L
if x goto L
if x relop y goto L
x = y[i],x[i] =y
x = &y,x = *y,*x := y
p(x1,x2…xn)
❖ param x1;param x2;…;param xn;

编译原理第七章 中间代码生成(1)

编译原理第七章 中间代码生成(1)

c
++*ad*bce
抽象语法树
由Token序列生成后缀式(1)



(1)初始化: S1和S2为空; (2) 读token: tk=ReadOne(); (3) Switch tk of (i) #: if (S1为空) exit; else while (S1不为空) /*产生剩余操作符的后缀表示*/ {op = pop(S1); (str1, str2)=pop(2); push(S2, str2 + str1+ “op”);} (ii)运算分量: push(tk, S2); goto (2); (iii)运算符: if (S1为空 || tk优先级大于Top(S1)) { push (tk, S1); goto(2);} else { while(tk小于等于Top(S1) && S1不为空)) { op = pop(S1); (str1, str2)=pop(2); push(S2, str2+str1 + “op”); } push(tk, S1); goto (2); }

+ +
a*c + a*c + e
e
+ +
e
* a
c a AST
* c a
* c
* a
DAG c
7.1 常见的中间表示

三地址中间代码
三地址:两个操作分量和一个结果的抽象地址; 为方便起见, 通常用变量名代替抽象地址; 三元式 No. (op, operand1, operand2) 编号 (操作符, 操作分量1, 操作分量2) 其中操作分量可以是变量名(抽象地址)或者编号 四元式 (op, operand1, operand2, result) (操作符, 操作分量1, 操作分量2, 结果) 其中操作分量可以是变量名(抽象地址)或者临时变量 (抽象地址)

编译原理实验三:中间代码生成

编译原理实验三:中间代码生成

编译原理——语义分析成员:杨霞 030802107王日日 030802139方艳丽 030802102实验三:语义分析:生成中间代码一、实验目的通过语法制导或翻译模式生成中间代码。

二、实验内容在自底向上语法分析基础上设计语义规则(语法制导翻译),将源程序翻译为四元式输出.三、实验环境Windows microsoft visual c++ 6.0四.实验原理三地址码的几种常见指令:1.X=Y OP Z 的赋值指令,其中OP 是一个双目运算符或逻辑运算符。

2.X= Y 的复制指令。

3.无条件转移指令 GOTO L 把下一步要执行的带有标号L的三地址指令4.IF X GOTO L 或 IF FALSE X GOTO L的条件转移指令5.IF X RELOP Y GOTO L的条件转移指令。

三地址码四元式实验环境:windows microsoft visual c++语法制导定义:控制流语句的语法制导定义:实验代码分析:struct midcode//四元式结构;{int label;//存放标号;char op;//存放操作符;char arg1;//存放操作数1;char arg2;//存放操作数2;char result;//存放目的操作数(转移标号)}m_midcode[100];如何实现语句的跳转:主要利用了语义规则与规约过程的结合;例如:Label为四元式产生的新标号;Mnew 为四元式中最新的标号;case 9:tab1=t-1;while(tab1--){if(m_midcode[tab1].op=='>'&& (int)(m_midcode[tab1].result)==0){m_midcode[tab1].result=(char)m_midcode[tab1+2].label;/E.true=newlabelm_midcode[tab1+1].result=(char)(m_midcode[tab1+2].label+1);/E.false=newlabeltab2=tab1;for(;tab2<t;tab2++)if(m_midcode[tab2].op=='g'&&(int)m_midcode[tab2].result==0)m_midcode[tab2].result=(char)(mnew-1);//S1.next=s2.next=S.nextbreak ;}实验结果:心得体会:四元式序列是编译原理最后一个实验,最后的实验也要建立在之前两个实验的基础上。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7.1.3 三地址代码 一般形式:x = y op z
表达式x + y z翻译成的三地址语句序列是 t1 = y z t2 = x + t1
7.1 中 间 语 言
三地址代码是抽象语法树或dag的一种线性表示
a = (b + cd ) + cd 抽象语法树的代码
t1 = b t2 = c d t3 = t1 + t2 t4 = c d t5 = t3 + t4 a = t5
7.1 中 间 语 言
赋值语句生成三地址代码的属性文法
产生式
语义规则
S id :=E S.code=E.code || gen(id.place‘=‘ E.place)
E E1 +E2 E E1 E2
E.Place = newtemp;
E.Code = E1.code || E2.code || gen(E.place ‘=‘ E1.place ‘+’ E2.place)
E本身。 • 如果E是形式为E1 opE2的表达式,那么E的后
缀表示是E1 E2 op,其中E1和E2分别是E1和 E2的后缀表示。 • 如果E是形式为(E1)的表达式,那么E1的后缀 表示也是E的后缀表示。
7.1 中 间 语 言
• 后缀表示不需要括号 (8 4) + 2 的后缀表示是8 4 2 +
E.Code = E1.code || E2.code || gen(E.place ‘=‘ E1.place ‘*’ E2.place)
第七章 中间代码生成
本章内容
–介绍几种常用的中间表示:后缀表示、图 形表示和三地址代码
–用语法制导定义和翻译方案的方法来说明 程序设计语言的结构怎样被翻译成中间形式
记 代码
代码 生成 器
7.1 中 间 语 言
7.1.1 后缀表示 表达式E的后缀表示可以如下归纳定义 • 如果E是变量或常数,那么E的后缀表示就是
E E1 E2 E.nptr = mknode( ‘’, E1.nptr, E2.nptr)
E E1 E.nptr = mkunode( ‘uminus’, E1.nptr)
E (E1) E.nptr = E1.nptr
F id
E.nptr = mkleaf (id, id.entry)
7.1 中 间 语 言
E本身。
7.1 中 间 语 言
7.1.1 后缀表示 表达式E的后缀表示可以如下归纳定义 • 如果E是变量或常数,那么E的后缀表示就是
E本身。 • 如果E是形式为E1 opE2的表达式,那么E的后
缀表示是E1 E2 op,其中E1和E2分别是E1和 E2的后缀表示。
7.1 中 间 语 言
7.1.1 后缀表示 表达式E的后缀表示可以如下归纳定义 • 如果E是变量或常数,那么E的后缀表示就是
7.1 中 间 语 言
赋值语句生成三地址代码的属性文法
产生式
语义规则
S id :=E S.code=E.code || gen(id.place‘=‘ E.place)
E E1 +E2 E E1 E2
E.Place = newtemp;
E.Code = E1.code || E2.code || gen(E.place ‘=‘ E1.place ‘+’ E2.place) E.Place = newtemp;
• 索引赋值x = y[i]和 x[i] = y
• 地址和指针赋值x = &y,x = y和x = y
7.1 中 间 语 言
赋值语句生成三地址代码的属性文法
产生式
语义规则
S id :=E S.code=E.code || gen(id.place‘=‘ E.place)
E E1 +E2
E E1 E2
7.1 中 间 语 言
• 后缀表示不需要括号 (8 4) + 2 的后缀表示是8 4 2 +
• 后缀表示的最大优点是便于计算机处理表达 式
7.1 中 间 语 言
• 后缀表示不需要括号 (8 4) + 2 的后缀表示是8 4 2 +
• 后缀表示的最大优点是便于计算机处理表达 式
• 后缀表示很容易拓广到含一元算符的表达式
assign
a
+
+
uminus c
d
c
d
b (a) 语法树
a = (b + cd ) + cd的图形表示
7.1 中 间 语 言
7.1.2 图形表示
• 抽象语法树是一种图形化的中间表示
• 有向无环图也是一种中间表示
assign
assign
a
+
a
+
+
+
uminus c
d
uminus
c
d
c
d
b (a) 语法树
assign
a
+
+
uminus
c
d
b
7.1 中 间 语 言
本书常用的三地址语句
• 赋值语句x = y op z, x = op y,
x= y
• 无条件转移goto L
• 条件转移if x relop y goto L
• 过程调用param x 和call p , n
• 过程返回 return y
7.1 中 间 语 言
• 后缀表示不需要括号 (8 4) + 2 的后缀表示是8 4 2 +
• 后缀表示的最大优点是便于计算机处理表达 式
• 后缀表示很容易拓广到含一元算符的表达式 • 后缀表示也可以拓广到表示赋值语句和控制
语句,但很难用栈来描述它的计算
7.1 中 间 语 言
7.1.2 图形表示 • 语法树是一种图形化的中间表示
uminus
7.1 中 间 语 言
三地址代码是语法树或dag的一种线性表示
a = (b + cd ) + cd
语法树的代码 dag的代码
t1 = b t2 = c d t3 = t1 + t2 t4 = c d t5 = t3 + t4 a = t5
t1 = b t2 = c d t3 = t1 + t2 t4 = t3 + t2 a = t4
b (b) dag
a = (b + cd ) + cd的图形表示
7.1 中 间 语 言
构造赋值语句抽象语法树的语法制导定义
产生式
语义规则
S id :=E S.nptr = mknode(‘assign’, mkleaf (id, id.entry), E.nptr)
E E1 +E2 E.nptr = mknode( ‘+’, E1.nptr, E2.nptr)
相关文档
最新文档