静态语义分析和中间代码生成

合集下载

程序设计语言编译原理第三版第7章

N→ Є
D →id: T { enter(top(tblptr), , T.type, top(offset)); top(offset):= top(offset) +T.width } 24
§7.2
说明语句
2.含嵌套说明的翻译模式：
(1)语义规则中的操作: Mktable (previous): 创建一张新符号表,并返回指向新表的一个指针; Enter (table, name, type, offset):
(2)置相对地址为当前offset之值， (3)使offset加上该名字所表示的数据对象的域宽。
20
§7.2 说明语句
3. 相应的翻译模式：
PD { offset:=0 } { enter (, T.type,offset);
DD;D
Did:T
offset:=offset+t.width } Tinteger
(0) (1) (2) (3) (4) (5)
(2) (3) (4)
16
§7.１中间语言
4.间接三元式：便于代码优化处理
方法：间接码表+三元式表
按运算的先后顺序列出有关三元式在三元表中的位置例: 语句X:=(A+B)*C;Y:=D↑(A+B)的间接三元式表示如下所示: 间接代码三元式表 (1) (2) (3) (1) (4) (5)
30
已归约串
PLACE
输入串
语义动作
# #X # X:= # X:= # X:= # X:= # X:=
X:= -B*(C+D)# X := -B*(C+D)# X_ -B*(C+D)# X__ B*(C+D)# -B X__B *(C+D)# -E X__B *(C+D)# { E.place:=p=<B>} E1 X_T1 *(C+D)# {E1.place:=newtemp=T1; 生成四元式(1) } … … … … # X:=E*(C X_T1__C +D)# # X:=E*(E1 X_T1__C +D)# { E1.place:=p=<C> } … … … …

编译原理语义分析与中间代码生成

编译原理语义分析与中间代码生成在编译原理中，语义分析是编译器的重要组成部分之一，它负责验证和处理源代码中的语义信息，为后续的中间代码生成做准备。

本文将介绍语义分析的基本概念和流程，并探讨中间代码生成的相关技术。

一、语义分析的基本概念和流程语义分析是指对源代码进行语义检查和语义信息提取的过程。

其主要目标是确保源代码在语义上是正确的，并从中提取出各种语义信息，以便后续阶段使用。

语义分析的基本流程如下：1. 词法分析和语法分析：在进行语义分析之前，需要先对源代码进行词法分析和语法分析，以便将代码转化为具有结构的中间表示形式（如抽象语法树）。

2. 符号表的构建：符号表是语义分析的重要数据结构，用于存储程序中出现的各种标识符及其相关信息，如类型、作用域等。

在语义分析阶段，需要构建符号表并实时更新。

3. 类型检查：类型检查是语义分析的核心任务之一。

它通过对表达式、赋值语句、函数调用等进行类型推导和匹配，来验证程序是否存在类型错误。

4. 语义规则检查：除了类型检查外，语义分析还需要检查程序是否符合语言规范中的其他语义规则，如变量是否已声明、函数调用是否正确等。

5. 语义信息提取：语义分析还负责提取源代码中的各种语义信息，如函数调用关系、变量的定义和引用关系、控制流信息等。

这些信息将为后续的代码优化和代码生成提供依据。

二、中间代码生成的相关技术中间代码是指某种形式的中间表示形式，通常与源代码和目标代码之间存在一定的映射关系。

它在编译过程中起到连接前后两个阶段的桥梁作用，并且可以进行一些优化。

常见的中间代码形式之一是三地址码。

三地址码是一种低级的代码表示形式，每条指令最多包含三个操作数。

它具有简洁明了的特点，适合进行后续的优化工作。

在进行中间代码生成时，需要考虑以下几个方面的技术：1. 表达式的翻译：在将源代码转化为中间代码时，需要将源代码中的表达式进行翻译。

这包括对表达式的计算顺序、运算符优先级等方面的处理。

2. 控制流的处理：在编译过程中，需要将源代码中的控制流转化为中间代码中的条件分支和循环结构。

第8章+语义分析和中间代码生成

（2）数组形式：三列（操作符或操作对象、左儿子位置和右儿子位置）
的二维数组，一结点一行，行号表示结点的位置。【例】 a=b*c+b*d
1 2 a = 1 3 4 7 6 5 8 9
3
4 5 6 7 8 9
第8章语义分析和中间代码生成
b
* c + b * d
8.2 中间代码
8.2.3 三地址码
1. 三地址码（i）x := y op z (1) (2) (3) (4) t1:=b*c t2:=b*d t3:=t1+t2 a:=t3
(c,real)填入符号表，D.t =real
10
D
#
结束
8.3 自底向上语法制导翻译
第8章语义分析和中间代码生成
8.3.2 说明语句的翻译
2. 数组说明的翻译
数组内情向量：存放数组的相关信息。
内情向量的地址存于符号表中。
数组引用的关键问题 —— 数组元素的地址计算

第8章语义分析和中间代码生成
语义： E.val=T1.val+T2.val
E （E.val= T1.val+T2.val=12）
T1（T1.val=5）
第8章语义分析和中间代码生成
T2（T1.val=7）
8.1 语义分析
8.1.2 语义的描述
（2）继承属性一个文法符号N在产生式的右边出现，若它的t属性由该产生式的左部非终结符或右部的其他符号的属性决定，则N.t为N的继承属性。
第8章语义分析和中间代码生成
8.1 语义分析
8.1.2 语义的描述
例：变量说明语句的文法 D→TL T→real | int L→id | L1, id T.type由real或int决定；标识符表类型L.in由T.type确定，且依次传给表中的每一个标识符。

编译程序的结构

编译程序的结构一、引言编译程序是将高级语言代码转换为机器语言代码的重要工具，它的结构决定了编译过程的执行顺序和方式。

本文将介绍编译程序的基本结构，主要包括词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等几个关键步骤。

二、词法分析词法分析是编译程序的第一步，它将源代码划分为一个个的词法单元。

这些词法单元可以是关键字、标识符、常量、运算符等。

词法分析器会根据预先定义的词法规则，将源代码中的字符序列转换为词法单元序列。

三、语法分析语法分析是编译程序的第二步，它将词法单元序列转换为语法树。

语法树是一种树状结构，它表示了源代码的语法结构。

语法分析器会根据预先定义的语法规则，对词法单元序列进行分析，并构建相应的语法树。

四、语义分析语义分析是编译程序的第三步，它对语法树进行语义检查和语义分析。

语义检查包括类型检查、作用域检查、语法错误检查等。

语义分析器会根据预先定义的语义规则，对语法树进行分析，并生成相应的语义信息。

五、中间代码生成中间代码生成是编译程序的第四步，它将语法树转换为中间代码。

中间代码是一种介于源代码和目标代码之间的代码表示形式。

它可以是一种抽象的中间语言，也可以是一种类似于汇编语言的形式。

六、代码优化代码优化是编译程序的第五步，它对中间代码进行优化，以提高目标代码的执行效率和质量。

代码优化器会对中间代码进行分析和优化，例如常量折叠、循环优化、代码重排等。

七、目标代码生成目标代码生成是编译程序的最后一步，它将中间代码转换为目标机器语言代码。

目标机器语言代码是与特定硬件平台相关的代码，可以直接在目标机器上执行。

目标代码生成器会根据目标机器的指令集和寻址方式等特性，将中间代码转换为相应的目标代码。

八、总结编译程序的结构决定了编译过程的执行顺序和方式。

词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等步骤相互配合，完成了将高级语言代码转换为机器语言代码的任务。

每个步骤都有其特定的功能和算法，通过优化和转换，最终生成高效且可执行的目标代码。

java编译原理

java编译原理Java编译原理。

Java编译原理是指Java程序在编译过程中所遵循的规则和原理。

了解Java编译原理对于理解Java程序的运行机制和优化程序性能具有重要意义。

本文将从词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等方面介绍Java编译原理的相关知识。

首先，词法分析是编译器的第一步，它将源代码分解成一个个的词素，即标识符、关键字、运算符等。

词法分析器会去除掉源代码中的注释，并将源代码转换成一个个的标记，以便后续的处理。

词法分析的结果是一个标记流，它是语法分析的输入。

接着，语法分析是词法分析的下一步，它将标记流转换成抽象语法树。

抽象语法树是一种树状结构，它反映了源代码的语法结构。

语法分析器会根据语法规则对标记流进行分析，如果源代码不符合语法规则，语法分析器会报告错误。

一旦语法分析完成，就可以进行语义分析。

语义分析是编译器的下一步，它对抽象语法树进行分析，检查源代码中是否存在语义错误。

语义分析器会对标识符的声明和使用进行检查，以及类型的匹配等。

如果源代码存在语义错误，语义分析器会报告错误。

一旦语义分析完成，就可以进行中间代码生成。

中间代码生成是编译器的下一步，它将抽象语法树转换成一种中间表示形式，以便后续的处理。

中间代码是一种抽象的机器语言，它反映了源代码的计算过程。

中间代码生成器会根据源代码生成中间代码，并将中间代码传递给代码优化器。

代码优化是编译器的下一步，它对中间代码进行优化，以提高程序的性能。

代码优化器会对中间代码进行各种优化，如常量折叠、死代码删除、循环展开等。

优化后的中间代码将传递给目标代码生成器。

目标代码生成是编译器的最后一步，它将优化后的中间代码转换成目标机器的机器语言。

目标代码生成器会根据目标机器的特性生成机器语言，并将机器语言输出到目标文件中。

一旦目标代码生成完成，编译过程就结束了。

综上所述，Java编译原理涉及词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等方面的知识。

编译原理符号表的原理及典型实例

05
符号表的设计与实现
符号表的数据结构设计
符号表的数据结构应满足高效、易扩展和易维护的要求，通常采用哈希表、二叉树等数据结
构实现。
符号表应包含符号名称、符号类型、符号属性等信息，以便在编译过程中快速查找
和识别符号。
符号表还应支持动态添加、删除和修改等操作，以适应源代
码中符号的变化。
符号表的实现算法
常量名的符号表实例
总结词
常量名符号表实例展示了如何使用符号表来管理程序中的常量。
详细描述
常量名符号表记录了常量的名称、类型和值等信息。通过符号表，编译器能够方便地查找常量的定义和使用，并进行相应的语义分析和代码生成。在处理常量时，符号表有助于编译器优化程序的性能，例如常量折叠和常量传播等。
04
编译原理符号表的原理及典型实例
目录
• 编译原理符号表概述 • 符号表的原理 • 符号表的典型实例 • 符号表在编译过程中的应用 • 符号表的设计与实现
01
编译原理符号表概述
符号表的概念
符号表是一种用于存储程序中标识符信息的数据结构，主要用于编译过程中对标识符进行跟踪和管理。
符号表中的每个条目都包含有关标识符的信息，如名称、类型、作用域等。
如果符号表中存在该标识符的信息，编译器就可以使用这些信息来生成相应的代码。
符号表的更新
01
在编译过程中，符号表可能会被更新以反映源代码的变化。
02
当源代码中添加、删除或修改标识符时，符号表中的相关信息
也需要相应地更新。
更新符号表的过程通常涉及到在哈希表中插入、删除或修改相
03
应的条目。
03
符号表的典型实例
典型实例

第08章语法制导翻译和中间代码生成

28
常用的中间语言
• 三地址代码（四元式）三地址代码（四元式） • 语法结构树（三元式）语法结构树（三元式） • 后缀式
特点
• 形式简单、语义明确、便于翻译形式简单、语义明确、 • 独立于目标语言
29
三元式和树形表示
• 每个三元式由三个部分组成，分别是：算符op，每个三元式由三个部分组成，分别是：算符op， op 第一运算对象ARG1和第二运算对象ARG2 ARG1和第二运算对象ARG2。第一运算对象ARG1和第二运算对象ARG2。运算对象可能是源程序中的变量，对象可能是源程序中的变量，也可能是某个三元式的结果，用三元式的编号表示。元式的结果，用三元式的编号表示。 • 表达式的树形表示很容易实现：简单变量或常表达式的树形表示很容易实现：数的树就是该变量或常数自身，如果表达式e1 数的树就是该变量或常数自身，如果表达式e1 e2的树分别为T1和T2，那么e1+e2 e1*e2，的树分别为T1 e1+e2，和e2的树分别为T1和T2，那么e1+e2，e1*e2， e1的树分别为的树分别为：－e1的树分别为：
9
–lexval 是单词 digit 的属性 lexval
例8-3 3*5+4 的
语法树与属性计算
Ｌ Print(19) E.val=19
E.val=15 T.val=15 T.val=3 F.val=3 digit.lexval=3 ＊
＋
T.val=4 F.ቤተ መጻሕፍቲ ባይዱal=4
F.val=5 dgit.lexval=5
• 用中间语言过渡的好处：用中间语言过渡的好处：
–便于编译系统的实现、移植、代码优化便于编译系统的实现、移植、便于编译系统的实现

语义分析与中间代码生成PPT资料(正式版)

执行语义规则
L E print(E.val) a≤b+c ∧ a>d∨a+b≠e
1、运算对象出现的顺序和原有顺序（从左到右）相同
(4) =, A, (3)
E E +T 要求明确语义分析的任务
（2）翻译方案（自顶向下）： 1
E.val=E1
E T E E1+T
2、开始符号没有继承属性；
T T * F T.val=T .val a+b
语义规则 E.val=E1 T.val=T1.val
4.2.2 语法制导翻译的过程
语法制导翻译：将语义规则与语法规则相结合，在
语法分析的过程中通过执行语义动作，计算语义属
int id1,id2,id3
性值，从而完成预定的翻译工作。分别给出下列表达式的后缀表示
语义规则是根据产生式所蕴涵的语义操作建立起来的，并与语义分析的目标有关
静态语义检查
③一致性检查。很多情况下要求对象只能被定义一次。例如，Ｃ语言中规定一个标识符在同一作用域中只能被说明一次，同一case语句的标号不能相同，枚举类型的元素不能重复出现等。
④相关名字检查。有的语言中有时规定，同一名字必须出现两次或多次。例如，Ada语言中，循环或程序块可以有一个名字，它出现在这些结构的开头和结尾，如同语句括号一般，编译程序必须检查它们的配对情况。
(2) +, y, z
通常使用自底向上的分析方法
(1) *, w, x
(3) +, B, (2)
（4）无条Y件a转c移c语利句go用to L，的表示就下一是个要语执行法的语制句是导标号翻为L译的语方句。法，它使用符号$$表示
分别给出下列表达式的后缀表示

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

T 是上述积类型表达式
专用类型表达式
• type_error 专用于有类型错误的程序单元
• ok
专用于没有类型错误的程序单元
2 类型检查
类型检查程序的设计
语法制导的方法可实现语言的一个类型系统 • 将类型表达式作为属性值赋给程序各个部分 • 设计实现类型检查的属性文法/翻译模式
语法制导的类型检查程序举例-1
2 类型检查
一个简单语言的上下文无关文法G[P] ：
2 类型检查
类型表达式和类型系统
类型表达式（type expressions）
•为程序单元的类型进行解释 •由基本类型，类型名字，类型变量，及类型构造子（type constructor）通过归纳定义得到的表达式
类型系统（type systems）
• 将类型表达式赋给程序各个部分的规则集合
类型表达式举例
类型表达式分四类定义
基本数据类型表达式，积类型表达式，过程类型表达式，专用类型表达式
基本数据类型表达式
• 纯量类型表达式：bool, int, real • 有界数组类型表达式：array(I,T)
T { bool, int, real }；I 代表一个整数区间，如 1..10
符号表
符号表的作用符号表是连接声明与引用的桥梁。一个名字在声明时，相关信息被填写进符号表，而在引用时，根据符号表中的信息进行语义检查，进而生成中间代码。它的作用主要有： ➢ 辅助语义的正确性检查 ➢ 辅助代码生成
2. 符号表的设计如何有效记录各类符号的属性，以便在编译的各个阶段对符号表进行快速、有效的查找、插入、修改、删除等操作，是符号表设计的基本目标。符号表的组成表项分两部分，其中前者是标识符的名字，而后者是属性部分（不同种类的标识符属性不同）。符号表的组织方式和查找方法
1 静态语义分析的主要任务
代码生成前程序合法性检查的最后阶段 •控制流检查
控制流语句必须使控制转移到合法的地方（如跳转语句要有合法的跳转目标，break 语句必须有合法的语句包围它）
•唯一性检查
很多场合要求对象只能被定义一次（如枚举类型的元素不能重复出现）
1 静态语义分析的主要任务
代码生成前程序合法性检查的最后阶段 • 名字的上下文相关性检查
第八章静态语义分析和中间代码生成
学习目标： ❖ 掌握：
语法制导的语义分析常见的中间代码形式；常见语法成分的属性文法或翻译方案 ❖ 理解：
源程序词法分析
语法分析
表格
语义分析
出错
Байду номын сангаас
管
处
理
中间代码生成
理
代码优化目标代码生成
目标程序
静态语义分析和中间代码生成
语法制导翻译方法使用属性文法/翻译模式为描述工具定义程序设计语言的语义及代码生成方法。
➢ 符号表的信息将在词法分析、语法分析的过程中陆续填入，将用于语义检查、中间代码生成以及目标代码生成等不同的阶段。
8.2 静态语义分析
与语义分析相关的工作
静态语义检查
• 编译期间所进行的语义检查
动态语义检查
• 所生成的代码在运行期间进行的语义检查
收集语义信息 • 为语义检查收集程序的语义信息 • 为代码生成等后续阶段收集程序的语义信息
语义分析在处理程序的声明部分时构造标识符的符号表在处理程序的语句部分时完成静态语义检查
静态语义分析和中间代码生成
8.1 符号表 8.2 静态语义分析 8.3 中间代码生成 8.4 多遍的方法
符号表
1. 符号表及其作用符号表(Symbol Table) 符号表是存放标识符信息的一种表，其中的信息是标识符的属性(语义)。如：种类，类型，偏移地址，占用空间等
符号表的组织方式可以是数组也可以是链表等等
查找算法可以是顺序查表法、平分查表法、散列查
表法等
合理的组织和查找，将使得符号表的操作更高效
过程的说明部分：
CONST A=35,B=49;
VAR C,D,E; PROCEDURE P;
变量相对本过程基地址的偏移量
VAR G 符号表中的信息
NAME:A Kind :CONSTANT
• 指针数据类型表达式：pointer(T)
T { bool, int, real } 指向类型为T的对象的指针类型
类型表达式举例 (续)
积类型表达式
• <T1, T2, …, Tn>
T1, T2, …, Tn 为上述数据类型表达式；若n=0，则表示为 < >
过程类型表达式
• fun（T）
例如：变量在使用前必须声明；在外部不能访问私有变量；名字的定义和使用之间要满足一定的上下文相关性
• 类型检查
检查每个操作是否遵守语言类型系统的定义
2 类型检查
类型检查程序（type checker）负责类型检查 • 验证程序的结构是否匹配上下文所期望的类型 • 为代码生成阶段搜集及建立必要的类型信息 • 实现某个类型系统（type system）
NAME:B Kind :CONSTANT
NAME:C Kind :VARIBALE
NAME:D Kind :VARIBALE
NAME:E Kind :VARIBALE
NAME:P Kind :PROCEDUR
NAME:G Kind :VARIBALE
…
…
VAL:35 VAL:49 LEVEL:LEV LEVEL:LEV LEVEL:LEV LEVEL:LEV LEVEL:LEV+1 …
ADR: DX ADR: DX+1 ADR: DX+2 ADR: ADR: DX …
SIZE:4
符号表
符号表的生存期
➢ 在编译过程中，每当遇到标识符时，就要查填符号表：
➢ 若是新的标识符时，就向符号表中填入一个新的表项；
➢ 否则，根据情况向符号表中的已有表项增填信息（如填入存储地址）或者查获信息（如进行语义检查等）
处理声明的翻译模式
作用：计算变量声明相关语法单位的类型信息，并保存标识符的类型信息到符号表 V V1 ; T { L.in := T.type } L { V.type := make_product_3 (V1.type, T.type, L.num) }
V
{ V.type := <> }
T integer { T.type := int }
T boolean { T.type := bool }