第5章语义分析与中间代码生成

合集下载

编译原理课件05语法制导翻译技术和中间代码生成

5.4 中间代码
四元式的特点: 1. 四元式出现的顺序和语法成份的计值顺序相一致. 2. 四元式之间的联系是通过临时变量实现的,这样易于调整和变动四元式. 3. 便于优化处理.
5.4 中间代码
编译系统中,有时将四元式表示成另一种更直观,更易理解的形式——三地址代码或三地址语句. 三地址代码形式定义为: result := arg1 OP arg2 三地址语句:语句中是三个量的赋值语句, 三地址语句每个量占一个地址.
5.5 自下而上的语法制导翻译
例3 简单算术表达式翻译到四元式的语义描述例如,设有简单算术表达式的文法: E→E+E | E*E | (E) | i
T R / S T
c S a c
c R S
输入是bR / bTc / bSc /ac 输出为: 1 4 5 314 24 31 给出相应语义动作(翻译方案) S→bTc { print "1"} { print "2"} S→a R T→R { print "3"} R→R/S { print "4"} R→S { print "5"}
5.1 概述
例如: 表达式 A+B*C 对运算对象进行类型检查, 对变量进行先定义后使用检查执行真正的翻译如果静态语义正确, 语义处理则要执行真正的翻译, 即生成程序的某种中间代码的形式或直接生成目标代码.
5.1 概述
目前多数编译程序进行语义分析的方法是采用语法制导翻译法 .它不是一种采用语法制导翻译法形式系统, 但它比较接近形式化. 语法制导翻译法使用属性文法为工具来描述程序设计语言的语义.
5.4 中间代码

编译原理语义分析与中间代码生成

编译原理语义分析与中间代码生成在编译原理中，语义分析是编译器的重要组成部分之一，它负责验证和处理源代码中的语义信息，为后续的中间代码生成做准备。

本文将介绍语义分析的基本概念和流程，并探讨中间代码生成的相关技术。

一、语义分析的基本概念和流程语义分析是指对源代码进行语义检查和语义信息提取的过程。

其主要目标是确保源代码在语义上是正确的，并从中提取出各种语义信息，以便后续阶段使用。

语义分析的基本流程如下：1. 词法分析和语法分析：在进行语义分析之前，需要先对源代码进行词法分析和语法分析，以便将代码转化为具有结构的中间表示形式（如抽象语法树）。

2. 符号表的构建：符号表是语义分析的重要数据结构，用于存储程序中出现的各种标识符及其相关信息，如类型、作用域等。

在语义分析阶段，需要构建符号表并实时更新。

3. 类型检查：类型检查是语义分析的核心任务之一。

它通过对表达式、赋值语句、函数调用等进行类型推导和匹配，来验证程序是否存在类型错误。

4. 语义规则检查：除了类型检查外，语义分析还需要检查程序是否符合语言规范中的其他语义规则，如变量是否已声明、函数调用是否正确等。

5. 语义信息提取：语义分析还负责提取源代码中的各种语义信息，如函数调用关系、变量的定义和引用关系、控制流信息等。

这些信息将为后续的代码优化和代码生成提供依据。

二、中间代码生成的相关技术中间代码是指某种形式的中间表示形式，通常与源代码和目标代码之间存在一定的映射关系。

它在编译过程中起到连接前后两个阶段的桥梁作用，并且可以进行一些优化。

常见的中间代码形式之一是三地址码。

三地址码是一种低级的代码表示形式，每条指令最多包含三个操作数。

它具有简洁明了的特点，适合进行后续的优化工作。

在进行中间代码生成时，需要考虑以下几个方面的技术：1. 表达式的翻译：在将源代码转化为中间代码时，需要将源代码中的表达式进行翻译。

这包括对表达式的计算顺序、运算符优先级等方面的处理。

2. 控制流的处理：在编译过程中，需要将源代码中的控制流转化为中间代码中的条件分支和循环结构。

编译原理陈意云版答案

编译原理陈意云版答案一. 引言编译原理是计算机科学中的一门重要课程，它研究的是将高级语言源代码转换为机器能够理解和执行的目标代码的方法和技术。

编译原理的学习对于理解计算机系统的运行原理和提高程序开发效率具有重要意义。

本文将以陈意云版的答案作为参考，向大家介绍编译原理的相关知识。

二. 词法分析词法分析是编译的第一个阶段，它将源代码分解成一个个单词（Token）。

在陈意云版中，常用的词法分析方法有正则表达式和有限自动机。

正则表达式可以方便地描述语言的词法规则，而有限自动机可以用于实现对输入的扫描和匹配。

词法分析器还可以将未识别的字符输入报告为错误。

三. 语法分析语法分析是编译的第二个阶段，它将词法分析器产生的Token序列转化为语法树。

在陈意云版中，常用的语法分析方法是上下文无关文法和递归下降分析。

上下文无关文法用于描述语言的语法规则，而递归下降分析是一种自顶向下的语法分析方法。

语法分析器还可以检查语法错误，并生成错误报告。

四. 语义分析语义分析是编译的第三个阶段，它对语法树进行语义检查和语义处理。

在陈意云版中，常用的语义分析方法有类型检查和符号表管理。

类型检查用于检查表达式和语句中的类型错误，而符号表管理用于管理变量和函数的定义和引用。

语义分析器还可以生成中间代码。

五. 中间代码生成中间代码生成是编译的第四个阶段，它将源代码转化为一种中间形式的代码。

在陈意云版中，常用的中间代码形式有三地址码和虚拟机代码。

中间代码是一种介于源代码和目标代码之间的形式，它可以方便地进行优化和生成目标代码。

六. 代码优化代码优化是编译的第五个阶段，它对中间代码进行优化，以提高程序的执行效率和减少代码的大小。

在陈意云版中，常用的代码优化技术有常量传播、公共子表达式消除和循环优化等。

代码优化器可以根据优化规则对中间代码进行优化，并生成优化后的中间代码。

七. 目标代码生成目标代码生成是编译的最后一个阶段，它将中间代码转化为目标代码。

编译原理与中间代码生成技术

编译原理与中间代码生成技术编译原理是计算机科学中的重要理论基础，它研究的是将高级语言翻译成机器语言的转换过程。

而中间代码生成技术则是编译原理中的一个关键环节，它负责将源代码转换为中间表示形式，为后续的优化和目标代码生成做准备。

本文将介绍编译原理的基本概念和中间代码生成技术的原理与应用。

一、编译原理基础编译原理是计算机科学中的一个重要分支，它研究的是高级语言程序如何转换为机器语言的过程。

编译原理包括词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等多个阶段。

其中，中间代码生成是编译原理的一个关键环节，它将源代码转换为中间表示形式，以便后续的优化和目标代码生成。

二、中间代码生成技术的原理中间代码是源代码与目标代码之间的一种中间表示形式。

它既比源代码更容易理解，又比目标代码更容易生成和优化。

中间代码生成技术的目的是将源代码转换为中间代码，为后续的优化和目标代码生成做准备。

中间代码生成技术的原理可以用以下步骤来描述：1. 词法分析：将源代码分割成一个个语法单元，比如标识符、关键字、操作符等。

词法分析器会根据事先定义好的词法规则，将源代码转换为词法单元序列。

2. 语法分析：将词法单元序列转换为抽象语法树（AST）。

语法分析器会根据事先定义好的语法规则，分析词法单元序列所组成的语法结构，并构建出相应的抽象语法树。

3. 语义分析：对抽象语法树进行语义检查和类型推断。

语义分析器会检查语法结构中是否存在语义错误，并为表达式推导出对应的类型信息。

4. 中间代码生成：将语法树转换为中间代码表示形式。

中间代码生成器会根据语义信息和事先定义好的转换规则，将语法树转换为中间代码表示形式。

三、中间代码生成技术的应用中间代码生成技术广泛应用于编译器、解释器和虚拟机等领域。

以下是中间代码生成技术在这些领域的具体应用场景：1. 编译器：编译器是将高级语言程序转换为机器语言的工具。

中间代码生成技术在编译器中起到了至关重要的作用，它能够将源代码转换为中间代码表示形式，为后续的代码优化和目标代码生成做准备。

编译原理目录

编译原理目录一、引言。

1.1 编译原理概述。

1.2 编译器的作用和原理。

二、词法分析。

2.1 词法分析的任务和原理。

2.2 正规表达式和有限自动机。

2.3 词法分析器的实现。

三、语法分析。

3.1 语法分析的任务和原理。

3.2 自顶向下分析和自底向上分析。

3.3 语法分析器的实现。

四、语义分析。

4.1 语义分析的任务和原理。

4.2 语义动作和语法制导翻译。

4.3 语义分析器的实现。

五、中间代码生成。

5.1 中间代码的作用和原理。

5.2 三地址码和四元式。

5.3 中间代码生成器的实现。

六、代码优化。

6.1 代码优化的目标和原理。

6.2 基本块和流图。

6.3 代码优化器的实现。

七、目标代码生成。

7.1 目标代码生成的任务和原理。

7.2 寄存器分配和指令选择。

7.3 目标代码生成器的实现。

八、汇编与链接。

8.1 汇编的作用和原理。

8.2 静态链接和动态链接。

8.3 汇编器和链接器的实现。

九、实践与应用。

9.1 编译原理在实际开发中的应用。

9.2 前端与后端的协同工作。

9.3 实践案例分析。

十、总结与展望。

10.1 编译原理的发展历程。

10.2 未来编译原理的发展趋势。

10.3 结语。

在编译原理的学习过程中，我们将深入了解编译器的工作原理和实现方法。

从词法分析到目标代码生成，每个环节都承担着特定的任务，而它们又相互协作，共同完成将源代码翻译成目标代码的过程。

通过本文档的学习，读者将能够全面了解编译原理的核心概念和具体实现，为日后的编译器开发和优化工作打下坚实的基础。

第5章语法制导翻译和中间代码生成

剩余串 3＋ 45# ＋45# ＋45# ＋45# ＋45# 5# 5# 5# 5# 5# #
主要动作
r6 r4 r2
r6 r4
r6 # # r3 r1 acc
表达式3 ＋ 4 5的语法语义分析和计值过程
§5.3
中间语言
所谓中间语言，也称中间代码，是复杂性介于源程序语言和机器语言的一种记号系统。一般来说，快速编译程序直接生成目标代码，没有将中间代码翻译成目标代码的额外开销。但是为了使编译程序结构在逻辑上更为简单明确，使生成的的目标代码更为高效，通常采用中间语言。编译程序所使用的中间语言形式较多。常见的逆波兰式、三元式、四元式和树形表示等。来自bcd
3. 间接三元式为了尽量不改变三元式表，可以另设一张间接码表来表示有关三元式在三元式表的计值顺序。用这种方法获得的中间代码称为间接三元式。
例如，表达式a := x＋y z b := t－y z 的间接三元式表示如图所示。
三元式列表（1）（，y，z）（2）（＋，x，（1））（3）（:=，a，（2））（4）（－，t，（1））（5）（:=，—，（4））
§5.4 自底向上语法制导翻译
语法制导翻译分为自底向上和自底向下两种。自底向上语法制导翻译方法就是在自底向上语法分析过程中逐步执行语义规则。也就是在每次归约的同时执行相应的语义动作。
5.4.1 简单算术表达式和赋值语句的翻译
简单算术表达式和赋值语句是指不含数组元素、记录等复杂数据结构的算术表达式和赋值语句。
简单算术表达式求值的属性文法。例5.1 ：
规则 1.S→E 2.E→E1＋T 3.E→T 4.T→T1 F 5.T→T1 6.F→（E） 7.F→digit 语义规则 print（E.val） E.val := E1.val＋T.val E.va1 := T.valv T.val := T1.val F.val T.val := T1.val F.val := E.val F.val := digit.lexval

第5章语法制导翻译技术和中间代码生成

编译原理
2024年8月7日
25
逆波兰表示法（后缀式）
特点：运算符直接写在其运算对象之后。 • 不再有括号 • 运算对象出现的次序未变 • 求值过程简单，宜于用栈实现
后缀式的计算用一个栈实现。一般的计算过程是：自左至右扫描后缀式，每碰到运算量就把它推进栈。每碰到k目运算符就把它作用于栈顶的k个项，并用运算结果代替这k 个项。
④相关名字检查。有的语言中有时规定，同一名字必须出现两次或多次。例如，Ada语言中，循环或程序块可以有一个名字，它出现在这些结构的开头和结尾，如同语句括号一般，编译程序必须检查它们的配对情况。
编译原理
2024年8月7日
6
5.2 属性文法
附加了一组语属义性信和息运算（语义）规则的文法
1. 属性的表示
3
语义分析的任务
根据语义规则对识别出的各种语法成分析其含义，进行初步翻译，生成相应的中间代码或直接生成目标代码。
第一，审查每个语法结构的静态语义，即检查语法结构合法的程序是否真正有意义。也称静态语义检查。（类型检查、控制流的检查、一致性检查、相关名字的检查）第二，如果静态语义正确，语义处理则要执行真正的翻译，要么生成中间代码，要么生成实际的目标代码。（说明性语句：填符号表；可执行性语句：生成中间代码）
编译原理
2024年8月7日
12
翻译步骤
（1）分析输入符号串，建立分析语法树（２）从分析树得到描述结点属性间依赖关系的依赖图，由依赖图得到语义规则的计算次序（３）进行语义规则的计算，得到翻译结果
输入符号串分析树执行语义规则
翻译结果
编译原理
2024年8月7日
13
语法制导定义

java编译原理

java编译原理Java编译原理。

Java编译原理是指Java程序在编译过程中所遵循的规则和原理。

了解Java编译原理对于理解Java程序的运行机制和优化程序性能具有重要意义。

本文将从词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等方面介绍Java编译原理的相关知识。

首先，词法分析是编译器的第一步，它将源代码分解成一个个的词素，即标识符、关键字、运算符等。

词法分析器会去除掉源代码中的注释，并将源代码转换成一个个的标记，以便后续的处理。

词法分析的结果是一个标记流，它是语法分析的输入。

接着，语法分析是词法分析的下一步，它将标记流转换成抽象语法树。

抽象语法树是一种树状结构，它反映了源代码的语法结构。

语法分析器会根据语法规则对标记流进行分析，如果源代码不符合语法规则，语法分析器会报告错误。

一旦语法分析完成，就可以进行语义分析。

语义分析是编译器的下一步，它对抽象语法树进行分析，检查源代码中是否存在语义错误。

语义分析器会对标识符的声明和使用进行检查，以及类型的匹配等。

如果源代码存在语义错误，语义分析器会报告错误。

一旦语义分析完成，就可以进行中间代码生成。

中间代码生成是编译器的下一步，它将抽象语法树转换成一种中间表示形式，以便后续的处理。

中间代码是一种抽象的机器语言，它反映了源代码的计算过程。

中间代码生成器会根据源代码生成中间代码，并将中间代码传递给代码优化器。

代码优化是编译器的下一步，它对中间代码进行优化，以提高程序的性能。

代码优化器会对中间代码进行各种优化，如常量折叠、死代码删除、循环展开等。

优化后的中间代码将传递给目标代码生成器。

目标代码生成是编译器的最后一步，它将优化后的中间代码转换成目标机器的机器语言。

目标代码生成器会根据目标机器的特性生成机器语言，并将机器语言输出到目标文件中。

一旦目标代码生成完成，编译过程就结束了。

综上所述，Java编译原理涉及词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等方面的知识。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

5.1
语义分析的任务
根据语义规则对识别出的各种语法成分析其含义，进行初步翻译，生成相应的中间代码或直接生成目标代码。
（1）确定数据类型（2）语义检查动态语义检查：在运行时刻进行静态语义检查：在编译时完成（3）识别含义，进行真正的翻译
静态语义检查
①类型检查。
②控制流检查，确保控制语句有合法的转向点。例如，C语言中的break语句使控制跳离包括该语句的最小的switch，while或for语句。如果不存在包括它的这样的语句，则应报错。
例5.２
综合属性
产生式 L E E E1+T 语义规则
print(E.val) E.val=E1.val+T.val E.val=T.val
T.val=T1.val F.val T.val=F.val F.val=E.val F.val=i.lexval
E T T F F
T T1 * F F (E) i
语法制导翻译的实现
自底向上语法制导翻译
自顶向下语法制导翻译
语法制导翻译分为两种处理方法：
（1）语法制导定义（自底向上）：
对每个产生式编制一个语义子程序，在进行语法分析的过程中，当一个产生式获得匹配时，就调用相应的语义子程序实现语义检查与翻译。这种实现方案隐藏了其中语义规则的计算次序等实现细节，不必规定翻译顺序。
１．种类
（1）x = y op z形式的赋值语句，其中op是二元运算符。
（2）x = op y形式的赋值语句，其中op是一元运算符。
（3）x = y形式的赋值语句。（4）无条件转移语句goto L，表示下一个要执行的语句是标号为L的语句。（5）条件转移语句if x rop y goto L中，rop为关系运算符，如果x和y满足关系rop，就转而执行标号为L的语句，否则顺序执行下一个语句。
• 一个结点的继承属性值是由其父结点或兄弟结点的某些属性决定的
D T.type=int int L.in= int ， L.in= int id2 L.in= int ， id3
.
int id1,id2,id3
id1
几点说明：
1、文法非终结符既有综合属性，也可有继承属性； 2、开始符号没有继承属性；
+, +, *, -, =,
A, B, C, D, T1, T2, T3, E, T4, 一,
T1 T2 T3 T4 X
T4=T3-E
X=T4
T1,T2,T3,T4为临时变量，由四元式优化比较方便
三元式操作符左操作符数右操作数
表达式的三元式：w*x+(y+z)
(1) *, w, x (2) +, y, z (3) +, (1), (2)
0165
0163 0169 01697 016975 01697 10 0169 01
#E+3
#E+F #E+T #E+T* #E+T*4 #E+T*F #E+T #E
−2−−
−2−3 −2−3 −2−3− −2−3−− −2−3−4 −2− (12) − (14)
*4#
*4# *4# 4# # # # #
F.val = 4 i.lexval = 4
通常使用自底向上的分析方法 •在每个结点处使用语义规则来计算综合属性值 •当一个产生式获得匹配时，就调用相应的语义子程序 •从叶结点到根结点进行计算
*
２+3*4的注释分析树
5.2.5 S属性定义与自底向上翻译
• LR分析器可以改造为一个翻译器，在对输入串进行语法分析的同时对属性进行计算 • LR分析器增加属性值（语义）栈
（8）地址和指针赋值：
x=&y，把y的地址赋给x。 x= y，把y指示的地址单元中的内容赋给x。 x = y，把x指向的存储单元的值置为y。
2．具体实现
四元式操作符操作数1 操作数2 结果
结果：通常是由编译引进的临时变量例: X=(A+B)*(C+D)-E
T1=A+B
T2=C+D T3=T1*T2
步 1 2
骤
状态栈 0 05
符号栈 # #2
属性值栈 − −
剩余符号串 2+3*4# +3*4#
分析动作移进用F→i归约
3
4 5 6
03
02 01 016
#F
#T #E #E+
−2
−2 −2 −2−
+3*4#
+3*4# 3*4# *4#
用T→F归约
用E→T归约移进移进
7
8 9 10 11 12 13 14
静态语义检查
③一致性检查。很多情况下要求对象只能被定义一次。例如，Ｃ语言中规e语句的标号不能相同，枚举类型的元素不能重复出现等。
④相关名字检查。有的语言中有时规定，同一名字必须出现两次或多次。例如，Ada语言中，循环或程序块可以有一个名字，它出现在这些结构的开头和结尾，如同语句括号一般，编译程序必须检查它们的配对情况。
E.val=T.val
T.val=T1.val F.val T.val=F.val F.val=E.val F.val=i.lexval
5.2.2 语法制导翻译的过程
语法制导翻译：将语义规则与语法规则相结合，在语法分析的过程中通过执行语义动作，计算语义属性值，从而完成预定的翻译工作。
Yacc利用的就是语法制导翻译方法，它使用符号$$表示产生式左端的属性，$n表示存取产生式右端第n个文法符号相联的属性 expr : expr '+' expr { $$ = $1 + $3; }
L E.val = 14 E.val = 2 T.val = 2 F.val = 2 i.lexval = 2 + T.val = 3 F.val = 3 i.lexval = 3 n T.val = 12
• 一个结点的综合属性值是其子结点的某些属性来决定的只含有综合属性的语法制导定义称为S属性定义
（2）翻译方案（自顶向下）：
在产生式右部的适当位置，插入相应的语义动作，按照分析的进程，执行遇到的语义动作。这是一种动作与分析交错的实现方案。
翻译步骤
（1）分析输入符号串，建立分析语法树（２）从分析树得到描述结点属性间依赖关系的依赖图，由依赖图得到语义规则的计算次序
（３）进行语义规则的计算，得到翻译结果
分别给出下列表达式的后缀表示
1. -a+b*(-c+d) 2. X:=-(a+b)/(c-d)-(a+b*c) 3. a=c ∧ b=d 4. a≤b+c ∧ a>d∨a+b≠e a-bc-d+*+ Xab+-cd-/abc*+-:= ac= bd=∧ abc+ ≤ad >∧ab+e ≠ ∨
5.3.2 三地址代码
若把语义子程序改成产生某种中间代码的动作，就能在语法分析制导下，随着分析的进展逐步生成中间代码。若把语义子程序改成产生某种机器的汇编语言指令，就能随着分析的进展逐步生成某机器的汇编语言代码。
输入符号串分析树
执行语义规则
翻译结果
5.2.3 语法制导定义
对每个产生式编制一个语义子程序在进行语法分析的过程中，当一个产生式获得匹配时，就调用相应的语义子程序实现语义检查与翻译
综合属性
继承属性
自底向上传递信息
自顶向下（自左向右）传递信息
• print(E.val)打印由E产生的算术表达式的值，可认为这条规则定义了L的一个虚属性。
用F→i归约
用T→F归约移进移进用F→i归约用T→T*F归约用 E→E+T 归约 acc
例5.3
产生式 D TL
继承属性L.in
语义规则 D.in=T.type
T int T float L L1,id
L id
D.in=T.in
T.type=int T.type=float L1.in=L.in enter(id.entry,L.in) enter(id.entry,L.in)
5.2
语法制导翻译
实际应用中比较流行的语义分析方法：基于属性文法的语法制导翻译方法
5.2.1 属性文法
附加了一组属性和运算（语义）规则的文法语义信息
1. 属性的表示
文法符号X的属性t常用X.t来表示
语义之间的关系
2.语义规则的表示
•语义规则是根据产生式所蕴涵的语义操作建立起来的，并与语义分析的目标有关 •不同的产生式对应不同的语义规则静态语义检查、符号 •不同的分析目标也对应不同的语义规则表操作、代码生成及
5.3.3 图形表示
抽象语法树
= x + + － y y (a) 抽象语法树 z y (b) 有环无向图 y z － y x
有环无向图
=
+ + z
例：x =y +yz + yz
语义子程序
写法：语义子程序写在该产生式后面的花括号内。在一个产生式中同一个文法符号可能出现多次，但他们代表的是不同的语义值，要区分可以加上角标。语义值
打印各种错误信息
例5.1
• 非终结符E、T及F都有一个综合属性val,符号 i有一个综合属性，它的值由词法分析器提供。 • 某些非终结符加下标是为了区分一个产生式中同一非终结符多次出现
产生式 E E1+T
语
义
规
则
E.val=E1.val+T.val