编译原理第5章-语义分析

合集下载

编译原理课件05语法制导翻译技术和中间代码生成

5.4 中间代码
四元式的特点: 1. 四元式出现的顺序和语法成份的计值顺序相一致. 2. 四元式之间的联系是通过临时变量实现的,这样易于调整和变动四元式. 3. 便于优化处理.
5.4 中间代码
编译系统中,有时将四元式表示成另一种更直观,更易理解的形式——三地址代码或三地址语句. 三地址代码形式定义为: result := arg1 OP arg2 三地址语句:语句中是三个量的赋值语句, 三地址语句每个量占一个地址.
5.5 自下而上的语法制导翻译
例3 简单算术表达式翻译到四元式的语义描述例如,设有简单算术表达式的文法: E→E+E | E*E | (E) | i
T R / S T
c S a c
c R S
输入是bR / bTc / bSc /ac 输出为: 1 4 5 314 24 31 给出相应语义动作(翻译方案) S→bTc { print "1"} { print "2"} S→a R T→R { print "3"} R→R/S { print "4"} R→S { print "5"}
5.1 概述
例如: 表达式 A+B*C 对运算对象进行类型检查, 对变量进行先定义后使用检查执行真正的翻译如果静态语义正确, 语义处理则要执行真正的翻译, 即生成程序的某种中间代码的形式或直接生成目标代码.
5.1 概述
目前多数编译程序进行语义分析的方法是采用语法制导翻译法 .它不是一种采用语法制导翻译法形式系统, 但它比较接近形式化. 语法制导翻译法使用属性文法为工具来描述程序设计语言的语义.
5.4 中间代码

编译原理之语法分析与语义分析

编译原理之语法分析与语义分析
语法分析（英语：syntactic analysis，也叫 parsing）是根据某种给定的对由单词序列（如英语单词序列）构成的输⼊⽂本进⾏分析并确定其语法结构的⼀种过程。

语法分析器使⽤由词法分析器⽣成的各个词法单元的第⼀个分量来创建树形的中间表⽰。

语义分析是审查源程序有⽆语义错误，为代码⽣成阶段收集类型信息。

语义分析器（semantic analyzer）使⽤语法树和符号表中的信息来检查源程序是否和语⾔定义的语义⼀致。

它同时也收集类型信息，并把这些信息存放在语法树或符号表中，以便在随后的中间代码⽣成过程中使⽤。

编译原理题——简答题

编译原理A1.简要说明语义分析的基本功能。

2. 考虑文法 G[S]:S → (T) | a+S | aT → T,S | S消除文法的左递归及提取公共左因子。

3试为表达式 w+(a+b)*(c+d/(e-10)+8) 写出相应的逆波兰表示。

4. 按照三种基本控制结构文法将下面的语句翻译成四元式序列：while (A<C ∧ B<D){if (A ≥ 1) C=C+1;else while (A ≤ D)A=A+2;}。

5. 已知文法 G[S] 为S → aSb|Sb|b，试证明文法 G[S] 为二义文法。

A答案1答：语义分析的基本功能包括: 确定类型、类型检查、语义处理和某些静态语义检查。

2解：消除文法G[S]的左递归：S→(T) | a+S | aT→ST′T′→,ST′| ε提取公共左因子：S→(T) | aS′S′→+S | εT→ST′T′→,ST′| ε3答：w a b + c d e 10 - / + 8 + * +4答：该语句的四元式序列如下(其中E1、E2和E3分别对应A＜C∧B＜D、A≥1和A≤D，并且关系运算符优先级高)：100 (j<,A,C,102)101 (j,_,_,113)102 (j<,B,D,104)103 (j,_,_,113)104 (j=,A,1,106)105 (j,_,_,108)106 (+, C, 1, C)107 (j,_,_,112)108 (j≤,A,D,110) 109 (j,_,_,112)110 (+, A, 2, A)111 (j,_,_,108)112 (j,_,_,100)1135答：证明：由文法G[S]：S→aSb|Sb|b，对句子aabbbb对应的两棵语法树为：因此，文法G[S]为二义文法。

编译原理B1.什么是句子？什么是语言 ?2. 写一文法，使其语言是偶正整数的集合,要求：(1)允许0打头；(2) 不允许0打头。

编译原理第5章语法制导的翻译

属性和文法符号相关联规则和产生式相关联

根据需要，将文法符号和某些属性相关联，并通过语义规则来描述如何计算属性的值

E→E1+T E.code=E1.code || T.code || ‘+’ code表示了我们关心的表达式的逆波兰表示，规则说明加法表达式的逆波兰表示由两个分量的逆波兰表示并置，然后加上‘+’得到。
digitlexval=3
18
适用于自顶向下分析的SDD

前面的表达式文法存在直接左递归，因此无法直接用自顶向下方法处理。消除左递归之后，无法直接使用属性val 进行处理：

比如规则：T→FT’ T’→*FT’ T对应的项中，第一个因子对应于F，而运算符在T’中。
19
相同表达式的不同文法的比较
38
例5.15 分析栈实现的例子

假设语法分析栈存放在一个被称为stack 的记录数组中，下标top指向栈顶；

stack[top]指向这个栈的栈顶；stack[top-1] 指向栈顶下一个位置；如果不同的文法符号有不同的属性集合，我们可以使用union来保存这些属性值。（归约时，我们知道栈顶向下的各个符号分别是什么）
语义翻译的流程
输入符号串分析树依赖图
语
义
规
则
的计
实际上，编译中语义翻译的实现并不是按图中的流程处理的；而是随语法分析的进展，识别出一个语法结构，就对它的语义进行分析和翻译。
算
9
5.1 语法制导定义

4.什么是语法制导定义（SDD）上下文无关文法和属性/规则的结合；

软件工程编译原理第五章自顶向下的语法分析方法

PROCEDURE T； BEGIN F；T END PROCEDURE T； IF SYM=‘*’ THEN BEGIN ADVANCE； F；T END；
例:文法G(E):
E→TE E→+TE | T→FT PROCEDURE F； T→*FT | IF SYM=‘i’ THEN ADVANCE F→(E) | i ELSE 对应的递归下降子程序为: IF SYM=‘(’ THEN
其中不以P开头。
可以把P的规则等价地改写为如下的非直接左递归形式：左递归变 P→P 右递归 P→P|
一般而言，假定P关于的全部产生式是 P→P1 | P2 | … | Pm | 1 | 2|…|n 其中，每个都不等于，每个都不以P开头那么，消除P的直接左递归性就是把这些规则改写成：
第5章自顶向下的语法分析方法
语法分析的作用是识别由词法分析给出的单词符号序列是否是给定文法的正确句子(程序)。目前语法分析常用的方法有: 1、自顶向下（自上而下）分析 2、自底向上（自下而上）分析
5.3非LL(1)文法到LL(1)文法的等价转换
确定的自顶向下分析要求给定语言的文法必
须是 LL(1)形式。然而，不一定每个语言都是 LL(1)文法，对一个语言的非LL(1)文法是否能变
换为等价的LL(1)形式以及如何变换是我们讨论
的主要问题。由LL(1)文法的定义可知若文法中含有左递归或含有左公共因子，则该文法肯定不是LL(1)文法，因而，我们设法消除文法中的左递归，提取左公共因子对文法进行等价变换。
1、提取公共左因子
若文法中含有形如：A→αβ|αγ的产生式，这导致了对相同左部的产生式其右部的FIRST集相交，也就是 SELECT(A→αβ)∩SELECT(A→αγ) ≠ φ ，不满足 LL(1)文法的充分必要条件。

编译原理第5章--代码优化

(2) 确定满足以下条件的出口语句：确定满足以下条件的出口语句出口语句：下一个入口语句的前导语句入口语句的前导语句； ① 下一个入口语句的前导语句；转移语句包括转移语句自身)；语句(包括转移语句自身 ② 转移语句包括转移语句自身；停语句包括停语句自身包括停语句自身)。 ③ 停语句(包括停语句自身。
第5章
代码优化
(3) 图中各个结点上可能附加一个或多个标识符，表示这些图中各个结点上可能附加一个或多个标识符附加一个或多个标识符，变量具有该结点所代表的值。变量具有该结点所代表的值。
一个基本块由一个四元式序列组成四元式都可以用相应的一个基本块由一个四元式序列组成，且每一个四元式都可以用相应的基本块由一个四元式序列组成，每一个四元式都可以用 DAG结点表示。结点表示。结点表示给出了不同四元式和与其对应的DAG结点形式。图中，各结点圆圈结点形式。图5–1给出了不同四元式和与其对应的给出了不同四元式和与其对应的结点形式图中，中的ni是构造构造DAG过程中各结点的编号，过程中各结点的编号，中的过程中各结点的编号而各结点下面的符号(运算符、标识符或常数)是各结点的标记，是各结点的标记而各结点下面的符号运算符、标识符或常数是各结点的标记，各结点右运算符边的标识符是结点上的附加标识符。边的标识符是结点上的附加标识符。附加标识符除了对应转移语句的结点右边可附加一语句位置来指示转移目标外，除了对应转移语句的结点右边可附加一语句位置来指示转移目标外，其余对应转移语句的结点右边可附加一语句位置来指示转移目标外各类结点的右边只允许附加标识符。各类结点的右边只允许附加标识符。除对应于数组元素赋值的结点标记为继外，除对应于数组元素赋值的结点(标记为 ]=)有三个后继外，其余结点最多只应于数组元素赋值的结点标记为[ 有三个后继外有两个后继。两个后继。后继

编译原理答案第五章

练习5.1解答：输入(4*7+1)*2n,带注释的分析树如下：练习5.2解答: (1)根据表5.3中的语法制导定义建立表达式((a)+(b))的分析树和语法树(2)根据图5.17的翻译模式构造((a)+(b))的分析树和语法树练习5.3解答:设置下面的函数和属性：expr1||expr2:把表达式expr2拼写在表达式expr1后面。

deletep(expr):去掉表达式expr左端的‘（’和右端的‘)’。

E.expr,T.expr,F.expr:属性变量，分别表示E，T，F的表达式。

E.add,T.add,F.add,属性变量，若为true，则表示其表达式中外层有‘＋’号，否则无‘＋’号。

E.pmark,T.pmark,F.pmark,属性变量，若为true，表示E,T,F的表达式中左端为‘（’，右端是‘）’。

语法制导定义如下：产生式语义规则E -> E1 +T if(T.pmark==true)THEN E.expr=E1.expr||'+'||deletep(T.expr) ELSE E.expr:=E1.expr||'+'||T.expr;E.add:=true;E.pmark:=false;E -> T if(T.pmark==true)THEN E.expr:=deletep(T.expr)ELSE E.expr:=T.expr;E.add:=T.add;E.pmark:=false;T -> T1*F T.expr:=T1.expr||'*'||F.expr; T.add:=false;T.pmark:=false;T -> F T.expr:=F.expr; T.add:=F.add;T.pmark:=F.pmark;F -> (E) if(E.add==false)THEN BEGINF.expr:=E.expr;F.add:=false;F.pmark:=false;ENDELSE BEGINF.expr:='('||E.expr||')';F.add:=true;F.pmark:=true;END;F -> id F.expr:=id.lexval;F.add:=false;F.pmark:=false;练习5.4解答: (1)语法制导定义如下：产生式语义规则E -> E1+T if(E1.type==int) AND (T.type==int) THEN E.type:=intELSE E.type:=real;E -> T E.type:=T.type;T -> num T.type:=int;T -> num.num T.type:=real;(2)设E.pf和T.pf分别是E和T的前缀形式，||是两个字符串的连接，语法制导定义如下：产生式语义规则E -> E1+T if(E1.type==int) AND (T.type==int)THEN E.type:=intELSE BEGINE.type:=real;if(E1.type==int) AND (T.type==real)THEN E1.pf:='inttoreal'||E1.pfELSE if(E1.type==real)AND(T.type==int)THEN T.pf:='inttoreal'||T.pfEND;E.pf:='+'||E1.pf||T.pf;E -> T E.type:=T.type; E.pf:=T.pf;T -> num T.type:=int; T.pf:=int.lexval;T ->num.numT.type:=real; T.pf:=real.lexval;练习5.5解答: (1)用综合属性决定s.val的语法制导定义：产生式语义规则S -> L S.val:=L.val;S ->L1.L2S.val:=L1.val+L2.val*L2.p;L -> B L.val:=B.val; L.p:=2-1;L -> L1B L.val:=L1.val*2+B.val; L.p:=L.p*2-1;B -> 0 B.val:=0;B -> 1 B.val:=1;注：L.p表示恢复L.val的因子。

编译原理-语法分析

03
自顶向下的语法分析方法简单直观，易于实现，但可能存在左递归和回溯的问题。
自底向上的语法分析
01
自底向上的语法分析方法从源代码中的每个符号出发
，逐步归约到文法的起始符号。
02
该方法通常采用LR(0)、SLR(1)、LALR(1)等算法进行
实现。
03
自底向上的语法分析方法可以避免回溯问题，但需要
• 随着人工智能和机器学习技术的不断发展，可以利用这些技术来辅助语法分析过程，提高语法分析的准确性和效率。例如，可以使用机器学习算法来自动识别和处理语法规则和歧义问题。
• 另外，随着软件工程和代码质量的重视程度不断提高，对编译器和语法分析器的要求也越来越高。未来的研究需要更加注重编译器和语法分析器的可维护性和可扩展性，以满足不断变化的软件需求。
词法分析的算法
自底向上算法
自底向上算法是从源代码的左向右进行扫描，并从下到上构建语法结构。常见的自底向上算法有预测分析法和移进-规约法。
自顶向下算法
自顶向下算法是从语法结构的顶层开始，向下进行推导，直到找到与源代码相匹配的语法结构。常见的自顶向下算法有规范分析法和贪婪分析法。
语法分析概述
语法分析是编译过程的核心环节，其任务是将源代码分解成一系列的语法结构，以便后续的语义分析和代码生成。
自底向上的算法，通过构建归约表进行移进和规约操作。
LALR(1)算法
扩展的LR(0)算法，能够处理更广泛的文法，生成更小的归约表。
03
语义分析
语义分析概述
01
Байду номын сангаас02
03
语义分析是编译过程的一个阶段，它是在语法
分析之后进行的。
语义分析的主要任务是检查源代码的语义是否正确，例如变量是否已经声明，类型是否匹配

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

语义分析概述
时间
语义分为静态语义和动态语义类型是重要的静态语义，静态语义问题主要是类型相容问题语义分析可在语法分析或中间代码生成阶段进行
($id，idname)
语义分析
($id，Entry)
语义分析概述
方法*
语义分析包括对分析的描述和对分析算法的实常使用的描述语义分析的方法是属性文法语义分析依赖语法分析，因此语义分析器分为自顶向下和自底向上两种本章采用递归下降法描述语义分析过程
TYPE vector=ARRAY[1..10] OF integer;
VAR x, y : real ;
r, s : vector ;
设当前层数和可用offset值分别为L和0，构造标识符 pai, vector, x, y, r 和s 的属性表示,假设整数类型占1个单元，实数类型占2个单元。
类型的内部表示
sub: Size Kind HostType Low Up
enum: array:
Size
Kind Elems Leng
Size Kind IndexType ElemType
record: Size Kind FixBody VariBody
FixBody:
id FixUnitType Off Next
每当遇到使用性标识符时，查整个符号表(从后往前)，若查不到同名标识符，则表示有错，否则找出相应语义信息并将它传给有关部分。
每当结束一个局部化区时，“删除”本层符号表
符号表局部化处理的实现
真删除法：当退出一个局部化单位时，删除掉相应的符号表部分(即当前层的符号表)； s := Scope[ℓ] -1 ℓ := ℓ -1;
VariBody:
CaseUnit VariUnits
FixBody VariBody Next
id CaseType Off
set: Size file: Size pointer: Size
Kind
BaseType
Kind CompType
Kind TypeName
例有如下的类型定义： at = ARRAY [1..10] OF ARRAY[1..100] OF integer; rt = RECORD x : real ; a : at; CASE u: boolean OF false:(k : integer); true:(y: real; b: boolean) END 构造类型的内部表示。
有关符号表的操作：添加、查询、局部化处理
标识符的特点
标识符的出现：定义性出现和使用性出现
标识符的作用域：标识符在程序中起作用的范围。
嵌套作用域规则：当存在标识符的嵌套声明时，最近定义
的属性为标识符的当前属性
局部化单位：允许有声明的程序段
P: Var x ,y,z x:=0;
Q Var x,m,n :
x:=1;
{int x,y; {float x,y; x = x*y; } x = x *y;}
m:=x+y;
y:=x+1;
符号表局部化处理的基本思想
每当进入局部化区时，记住本层符号表的始地址。每当遇到定义性标识符时，构造其语义信息并查
本层符号表，若查到同名标识符，则表示有错，
否则往符号表里填写标识符和语义信息。
类型的种类：标准、子界、枚举、数组、记录、集合、文件、指针类型等等。 TypeKind=(intTy,boolTy,charTy,realTy,enumTy, subTy,arrayTy,recordTy,setTy,fileTy,pointerTy)
内部表示：(TypeIR)
标准类型： Size Kind
•
ord(D)=0,ord(A)=1,ord(B)=2
• 子界常量：设有子界类型C1..C2,则值空间
•
为[ord(C1)...ord(C2)]
符号表
符号表的作用：为语义检查和代码生成提供标识符的语义信息
符号表的框架： (id，Attribute(id))
线性表结构(顺序查表法)；二叉树结构(二分查表法)； Hash表(散列查表法)；
值的内部表示
结构类型没有值
非结构类型值的内部表示：
实数和整数有直接对应的机器表示有序类型均可表示为整数形式
• 整型常量：ord(N) = N
• 布尔常量：ord(false)=0, ord(true) = 1
• 字符常量：ord(C) = ASCⅡ(C)
• 枚举常量：设有枚举类型(D,A,B),则有
…… x(a,b);
语义分析概述
任务
进行语义检查和构造标识符的符号表语义检查包括类型检查和一般的语义检查类型检查：运算分量的类型是否相容、赋值语句左右部的类型是否相容、
形参和实参的类型是否相容、函数说明中函数类型和返回值的类型是否相容等；一般的语义检查：V[E]、V.id、V↑、y+f(a,b)、使用性标识符有否声明、定义性标识符有否重复声明、标号有否重复声明和重复定位错误等；
Value
• 类型 TypePtr Kind
• 变量 TypePtr Kind
• 域名*
• 过/函 TypePtr Kind
Forward
Access Level Off
Off
HostType
Code Size Forward TypePtr Kind Level Parm Class Off
例有声明如下： CONST pai= 3.14 ;
第五章语义分析
语义分析基础
意义、任务、时间、方法标识符、类型、值的内部表示
符号表类型表达式声明的语义分析执行体的语义分析
语义分析概述
意义
词法分析检查程序拼写上的错误 begin: begn 123x
语法分析检查程序结构上的错误 x = x +y; y = z;
语义分析检查程序含义上的错误 int x;
标识符、类型、值的内部表示
标识符的内部表示
标识符的种类：常量标识符、类型标识符、变量标识符、函数标识符、过程标识符、记录域标识符
TYPE idkind=( consKind, typeKind, varKind,
fieldKind, procKind,funcKind )
内部表示：
• 常量 TypePtr Kind