语法分析—自上而下分析
编译原理张晶版 第四章 自上而下语法分析

1、消除左递归
•1) 什么是左递归 —左递归:文法存在产生式 P + Pa —直接左递归: P —间接左递归:P Pa Aa ,A + Pb
•2)消除左递归
—消除直接左递归 —消除间接左递归
第四章 自上而下语法分析(23)
第二节 自上而下分析法的一般问题 三、不带回溯的自上而下分析算法
2、消除直接左递归
第四章 自上而下语法分析(44)
第三节 预测分析程序与LL(1)文法 二、求串a的终结首符集和非终结符A的随符集
例:对如下文法G(已加上编号)
1. E
4. T 7. F
TE’
FT’ i
2. E’
5. T’ 8. F
+TE’
*FT’ (E)
3.E’
6.T’
e
e
求各非终结符号的终结首符集和随符集
第四章 自上而下语法分析(45)
第四章 自上而下语法分析(47)
第三节 预测分析程序与LL(1)文法 二、求串a的终结首符集和非终结符A的随符集
例:对如下文法G(已加上编号)
1. E
4. T 7. F
TE’
FT’ i
2. E’
5. T’ 8. F
+TBiblioteka ’*FT’ (E)3.E’
6.T’
e
e
求各非终结符号的终结首符集和随符集
第四章 自上而下语法分析(48)
第四章 自上而下语法分析(40)
第三节 预测分析程序与LL(1)文法 三、构造预测分析表
1. 基本思想 1)若A a是一个产生式,a ∈ First(a),那么当A 是栈顶符号且将读入a时,选择a取代A匹配成功的 希望最大,故,M[A,a]元素为A a 2)若A a而a=e,或a + e;当A是栈顶符号且将读 入a时,若a ∈ Follow(A),则栈顶的A应被e匹配; 此时读头不前进,让A的随符与读头下的符号进行 匹配,这样输入串匹配成功的可能最大,故M[A,a] 元素为A a(这里a=e或a + e)
04 语法分析-自上而下分析

待分析的输入串: 待分析的输入串:i+i
只有当a 只有当a是允许出 现在非终结符A 现在非终结符A后 面的终结符时, 面的终结符时, 才可能允许A 才可能允许A自动 匹配。 匹配。
尾随集的定义: VN尾随集的定义:
=*>…Aa Aa…, FOLLOW(A)={a|S =*> Aa , a∈VT}; 特别地,如果S=*> S=*>…A 那么# FOLLOW(A)。 特别地,如果S=*> A,那么# ∈FOLLOW(A)。
例子
文法: S→xAy A→**|* 文法: 输入串:x*y 输入串: S => => => => xAy x**y xAy x*y (S→ xAy) (A→**) 回溯) (回溯) (A→*)
带回溯自上而下分析面临的问题
问题: 问题: 文法的左递归问题 回溯问题 虚假匹配问题 出错位置不确定 低效
实现思想: 实现思想:
分析程序由一组递归过程组成。 分析程序由一组递归过程组成。每一过程 对应于一个非终结符号。 对应于一个非终结符号。 每一个过程的功能是:选择正确的右部。 每一个过程的功能是:选择正确的右部。 在右部中有非终结符号时, 在右部中有非终结符号时,调用该非终结 符号对应的过程。 符号对应的过程。
消除文法的左递归
文法不含回路(形如P=+> P推导 推导) 文法不含回路(形如P=+> P推导) 不含回路 前提: 前提: 不含以ε 也不含以ε 为右部的产生式 结论: 那么可以通过执行消除文法左递 结论: 那么可以通过执行消除文法左递 归的算法消除文法的一切左递归 归的算法消除文法的一切左递归 改写后的文法可能含有以ε (改写后的文法可能含有以ε 为右部的产生式)。 为右部的产生式)。
第四章 语法分析——自上而下分析

解二: 规定顺序:S、Q、R
则等价的无左递归的文法: SQc | c QRb| b RbcaR’ | caR’ | aR’ R’bcaR’ |
RSa | a RQca | ca | a
RRbca|bca | ca | a
RbcaR’|caR’ | aR’ R’ bcaR’|
(因为不需要试探某个候选式,而是准确地指派 某个候选式)
17
终结首符集FIRST
令文法G不含左递归,对它的所有非终结符的每 个候选式定义终结首符集 FIRST(): * FIRST()={a | a , a∈VT }
特别地 * 若 ,则规定 ∈ FIRST()
显然, FIRST()是从推导出的所有可能的开头终 结符a或 。
3
§4.2 自上而下分析面临的问题
一、带‚回溯‛的自上而下分析方法:
自上而下分析方法,就是对任何输入串,试 图用一切可能的方法,从文法的开始符号出发, 自上而下地为输入串建立一个语法树(或最左推 导)。 这种分析过程实质上是一种试探过程,即反 复使用不同的产生式以求能匹配输入串。
4
例4.1 设有文法: SxAy
解: S iCtSA | a
A | eS
C b
22
4.3.3 LL(1)分析条件 当一个文法不含左递归,并且满足每个非终结 符的所有候选首符集两两不相交,是不是一定能进 行有效的自上而下的语法分析呢?
若存在 ∈ FIRST() ,则问题较复杂,需要进 一步考虑。 定义:非终结符A的 FOLLOW 集:
* FOLLOW(A)= { a| S …Aa… ,a∈VT } 特别地, * 若S …A,则规定,构造FIRST(X)
a) 若X∈VT,则 FIRST(X)={X}。
第五章自上而下语法分析

第五章⾃上⽽下语法分析第五章⾃上⽽下语法分析1、教学⽬的及要求:本章介绍编译程序的第⼆个阶段语法分析的设计⽅法和实现原理,包括⾃上⽽下分析的⽆回朔的递归下降分析、 LL(1)分析法。
要求理解递归下降分析、LL(1)⽂法的基本概念;掌握⽆回朔的递归下降分析的设计和实现、LL(1)分析表的构造与分析⽅法。
◇能够对⼀个给定的⽂法判断是否是LL(1)⽂法;◇能构造预测分析表;◇能⽤预测分析⽅法判断给定的输⼊符号串是否是该⽂法的句⼦;◇能对某些⾮LL(1)⽂法做等价变换:①消除左递归②提取左公共因⼦可能会变成LL(1)⽂法。
这样可扩⼤⾃顶向下分析⽅法的应⽤。
2、教学内容:语法分析器的功能,⾃上⽽下语法分析(递归下降分析法,预测分析程序),LL(1)分析法,递归下降分析程序构造,预测分析程序。
3、教学重点:递归下降⼦程序,预测分析表构造,LL(1)⽂法。
4、教学难点:对⼀个⽂法如何判断是否是LL(1)⽂法,由于在判断 LL(1)⽂法时⽤到⽂法符号串的开始符号集合(FIRST集)和⾮终结符后跟符号集合(FOLLOW集)的计算,⽽⼀般学⽣往往因概念不清或不够细⼼对这两个集合的计算常常出错,导致判断和分析结果的错误。
5、课前思考为了了解⾃顶向下(⾃上⽽下)分析的⼀般过程和问题,请学⽣⾸先回顾本章之前介绍的有关基本概念:◇句⼦、句型和语⾔的定义是什么?◇什么叫最左推导?◇什么叫最右推导和规范推导?◇什么叫确定的⾃顶向下语法分析?◇⾃顶向下语法分析是从⽂法的开始符号出发,反复使⽤各种产⽣式,寻找与输⼊符号匹配的推导。
◇确定的⾃顶向下语法分析中⽤的是哪种推导?◇在确定的⾃顶向下语法分析过程中,当以同⼀个⾮终结符为左部的产⽣式有多个不同右部时,如何选择⽤哪个产⽣式的右部替换当前的⾮终结符?◇确定的⾃顶向下语法分析对⽂法有何限制?6、章节内容第⼀节概述第⼆节 LL(1)分析⽅法第三节递归下降分析法5.1 概述LL分析法确定的⾃上⽽下分析⾃上⽽下分析递归下降分析法语法分析不确定的⾃上⽽下分析——即带回溯的分析⽅法算符优先分析⾃下⽽上分析LR分析⼀、带回溯的⾃顶向下分析⽅法是⾃顶向下分析的⼀般⽅法,即对任⼀输⼊符号串,试图⽤⼀切可能的办法,从树根结点(识别符号)出发,根据⽂法⾃上⽽下地为输⼊串建⽴⼀棵语法树,或者说,从识别符号开始,根据⽂法为输⼊串建⽴⼀个推导序列,这种分析过程本质上是⼀种试探过程,是反复使⽤不同规则谋求匹配输⼊串的过程。
语法分析—自上而下分析

9
§4.2 自上而下面临的问题
例:文法 SxAy A**|*
输入串α :x*y
S x Ay
S x Ay **
S x Ay
*
10
注:
• 回溯法也称试探法,它的基本思想是:从问题的 某一种状态(初始状态)出发,搜索从这种状态 出发所能达到的所有“状态”,当一条路走到“ 尽头”的时候(不能再前进),再后退一步或若 干步,从另一种可能“状态”出发,继续搜索, 直到所有的“路径”(状态)都试探过。这种不 断“前进”、不断“回溯”寻找解的方法,就称 作“回溯法”。
三、分析条件
1.当一个文法不含左递归,并且满足每个非终结符的 所有候选首符集两两不相交的条件,是不是就一定能 进行有效的自上而下分析了呢?
28
§4.3 LL(1)分析法
例:文法
EE+T|T TT*F|F F(E)|i
E T E’
经消去直接左递归后变成 ETE’ E’+TE’|ℇ TFT’ T’*FT’|ℇ F(E) |i
FIRST(A)
2.A→ε
3.A→X1 X2......XK
*
(1) * a..X2....... FIRST(X1)/{ε}
(2) * ε X2.......
FIRST(X2)/{ε}
ε
(3) * εε......ε
36
FIRST集
1.First(X)集合构造,X∈VT∪VN
例:求下题的FIRST集
25
§4.3 LL(1)分析法
3.提取公共左因子 A.事实上,许多文法均存在这样的非终结符,
其所有候选的终结首符集并非两两不相交。
编译原理-自上而下的语法分析

高效性
由于从文法的最顶端开始分析, 一旦发现不匹配,就可以立即终 止当前分支的搜索,避免不必要 的计算,提高了编译器的效率。
易于处理左递归文
法
自上而下的分析方法可以很方便 地处理含有左递归的文法,而左 递归是许多实际编程语言的重要 特征。
局限性
无法处理左边界问题
自上而下的分析方法在处理某些含有左边界的文法时可能 会遇到问题,因为这种方法会优先匹配最左边的符号,而 左边界问题需要从右往左匹配符号。
案例三
在编译器优化中,自上而下的语法分析被用 于识别和修改源代码中的冗余和低效的语法 成分。例如,在C编译器的实现中,自上而 下的语法分析可以用于优化循环结构,减少 不必要的循环次数,提高程序的执行效率。
自上而下的语法分析还可以用于代码生成和 代码生成器的实现。通过识别和解析源代码 中的语法成分,可以生成更高效、更安全的 机器代码或字节码,提高程序的执行效率和
安全性。
THANKS
感谢观看
详细描述:递归下降分析算法易于理解,每个产生式规 则对应一个函数,函数的实现相对简单明了。
详细描述:对于每个产生式规则,需要编写相应的递归 函数,可能会导致代码冗余。
移入-规约分析算法
总结词
基于栈的算法
详细描述
移入-规约分析算法是一种自上而下的语法分 析算法,它将目标语句从左到右依次读入, 并根据文法的产生式规则进行移入或规约操 作,直到找到目标语句的语法结构。
词法分析
词法分析是编译过程的第一步,也称为扫描或词法扫描。它的任务是从左 到右读取源代码,将其分解成一个个的记号或符号。
词法分析器通常使用正则表达式或有限自动机来识别和生成记号,这些记 号可以是关键字、标识符、运算符、标点符号等。
语法分析自下而上分析

LASTVT(P),就能够构造文法G的优先 表。构造优先表的算法是:
.
FOR 每条产生式P→X1X2…Xn DO FOR i:=1 TO n-1 DO
BEGIN
IF Xi和Xi+1均为终结符 THEN 置Xi Xi+1
.
文法G(E) (1) E→E+T | T (2) T→T*F | F (3) F→P F | P (4) P→(E) | i
的优先函数如下表
+ *↑( ) i # F2440660 G1 3 5 5 0 5 0
.
有许多优先关系表不存在优先函数,如:
ab a b
不存在对应的优先函数f和g 假定存在f和g,则有
TN
LA ( P ) S { a |P T a , 或 V P T a ,a Q V T 而 Q V N }
.
有了这两个集合之后,就可以通过检查每
所有终结符对。
➢假定有个产生式的一个候选形为 …aP…
那么,对任何bFIRSTVT(P),有 a b。 ➢假定有个产生式的一个候选形为
…Pb… 那么,对任何aLASTVT(P),有 a b。
栈STACK,把所有初值为真的数组元素F[P, a]的符号对(P,a)全都放在STACK之中。
.
运算:
如果栈STACK不空,就将顶项逐出,记此 项为(Q,a)。对于每个形如 P→Q… 的产生式,若F[P,a]为假,则变其值为真 且将(P,a)推进STACK栈。
上述过程必须一直重复,直至栈STACK拆 空为止。
17
ELSE ERROR /*调用出错诊察程序*/
语法分析最常用的两类方法

LL分析法和LR分析法。
1、自上而下语法分析方法(LL分析法)
给定文法G和源程序串r。
从G的开始符号S出发,通过反复使用产生式对句型中的非终结符进行替换(推导),逐步推导出r 。
是一种产生的方法,面向目标的方法。
分析的主旨为选择产生式的合适的侯选式进行推导,逐步使推导结果与r匹配。
2、自下而上语法分析方法(LR分析法)
从给定的输入串r开始,不断寻找子串与文法G中某个产生式P的候选式进行匹配,并用P的左部代替(归约)之,逐步归约到开始符号S。
是一种辨认的方法,基于目标的方法。
分析的主旨为寻找合适的子串与P的侯选式进行匹配,直到归约到G的S为止。
扩展资料
LALR分析器可以对上下无关文法进行语法分析。
LALR即“Look-AheadLR”。
其中,Look-Ahead为“向前看”,L代表对输入进行从左到右的检查,R代表反向构造出最右推导序列。
LALR分析器可以根据一种程序设计语言的正式语法的产生式而对一段文本程序输入进行语法分析,从而在语法层面上判断输入程序是否合法。
实际应用中的LALR分析器并不是由人手工写成的,而是由类似于yacc和GNU Bison之类的LALR语法分析器生成工具构成。
由机器自动生成的代码相比较于程序员手工的代码,拥有更好的运行效率而且减少了程序员的工作量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
递归文法
A→Ba B→Ab
间接递归文法
4.3.1 左递归的消除
直接消除见诸于产生式中的左递归:假 定关于非终结符P的规则为
P→P | 其中不以P开头。
我们可以把P的规则等价地改写为如下的 非直接左递归形式: P→P 左递归变 P→P| 右递归
一般而言,假定P关于的全部产生式是 P→P1 | P2 | … | Pm | 1 | 2|…|n 其中,每个都不等于,每个都不以P开头
<句子> => <主语><谓语><宾语>
=> <代词><谓语><宾语> => he <动词><宾语>
=> he has <宾语>
=> he has <冠词><名词>
<句子> ::= <主语><谓语><宾语> <主语> ::= <代词> <代词> ::= he <冠词> ::= a <名词> ::= pen <谓语> ::= <动词> <动词> ::= has <宾语> ::= <冠词><名词> <名词> ::= pen
文法和语法分析
高级语言的语法结构适合使用 上下文无关文法描述。
文法及语言的形式定义
文法是对语言结构的定义与描述(或 称为“语法”),即用适当条数的规 则把语言的全部句子描述出来。 文法是以有穷的集合刻划无穷的集合 的工具。
文法
文法能清晰地描述程序设计语言的语法构 成易于理解。
文法能自动地构造有效的语法分析器,检 查源程序是否符合语言规定的语法形式。 文法定义可以了解程序设计语言的结构, 有利于将源程序转化为目标代码,以及检 查出语法错误。 基于文法实现的语言易于扩展。
S ·
a c A d b
完成进一步推导Acd 检查,c-c匹配,b-d不匹配(失败) 但是还不能冒然宣布α L(G[S]) 4.回溯 即砍掉A的子树 改选A的第二右部 Ac 检查 c-c匹配 b-b匹配
S ·
a A b α=acb G[S]: S→aAb A→cd|c
建立语法树,末端结点为acb与输入acb相匹配, c 建立了推导序列 SaAbacb ∴acbL(G[S])
2. 如果语言是无穷的,描述语言有两种途径:
制定有限条规则,用于产生所要描述的语言的 全部句子(可无限多),这些规则构成了该语
言的文法。
设计一种装置(算法或过程),它以某字母表
上的符号串为输入,判别该符号串是否为所描
述语言的句子。此装置称为自动机。
语言概述
程序设计语言——形式化的内容提取
程序设计语言(Programming
基本思想:从输入串开始,逐步进行“
归
约”,直到文法的开始符号。即从树末端
开始,构造语法树。所谓归约,是指根据 文法的产生式规则,把产生式的右部替换 成左部符号。 算符优先分析法:按照算符的优先关系和 结合性质进行语法分析。适合分析表达式。 LR分析法:规范归约
G(E): E i| E+E | E-E | E*E | E/E | (E) i*i+i E*i+i E*E+i E+i E+E E E E + E
P→1P | 2P |… | mP |
例如文法G(S): S→Qc|c Q→Rb|b R→Sa|a
SQcRbcSabc
(4.3)
虽没有直接左递归,但S、Q、R都是左递归的
一个文法消除左递归的条件: 不含以为右部的产生式 不含回路。
P P
消除左递归的算法:
1. 把文法G的所有非终结符按任一种顺序排列成P1, P2,…,Pn;按此顺序执行; 2. FOR i:=1 TO n DO
=> he has a <名词>
=> he has a pen
上下文无关文法的形式定义
一个上下文无关文法G是一个四元式 G=(VT,VN,S,P),其中
VT:终结符集合(非空) VN:非终结符集合(非空),且VT S:文法的开始符号,SVN P:产生式集合(有限),每个产生式形式为
4.
4.3 LL(1)分析法
构造不带回溯的自上而下分析算法
要消除文法的左递归性 克服回溯
递归文法
1.递归规则:产生式右部有与左部相同的符号
左递归规则:A→A… 右递归规则:A→…A 自嵌入递归规则:A→…A…
递归文法
2.递归文法:含有递归规则的文法,为 直接递归文法
G[S]: S→L|SL|SD L→a|b|…|z D→0|1|…|9
计算机系统间、人机间通讯工具 严格的语法(Grammar)、语义
(Semantics) ——易于形式化:严格 语言是用来交换信息的工具——功能性描述
什么是语言
语言
单词(Token):满足一定规则字符(Character)串
句子(Sentence):满足一定规则单词序列
语言(Language):满足一定条件的句子集合
V N=
P, PVN, (VT VN)* 开始符S至少必须在某个产生式的左部出现一 次。
例,定义只含+,*的算术表达式的文法 G=<{i,+,*,(,)},{E},E, P>, 其 中,P由下列产生式组成: Ei E E+E E E*E E (E)
4.1 语法分析器的功能
【例4.1】 α=acb G[S]: S→aAb A→cd|c
分析过程是设法建立一 棵语法树,使语法树的末端结 点与给定符号串相匹配.
1.开始:令S为根结点 2.用S的右部,符号串去匹配输入串
S S ·
·
完成一步推导SaAb a A 检查 a-a匹配 A是非终结符,将匹配任务交给A
b
3.选用A的右部符号串匹配输入串 A有两个右部,选第一个
E i
* E
i
i
语法分析的方法: 自上而下分析法(Top-down)
基本思想:它从文法的开配"的推
导。
递归下降分析法 预测分析程序
优点:直观、简单和宜于手工实现。
4.2
自顶向下分析法
4.2.1 自顶向下分析的一般过程
从S出发采用最左推导,试图逐步推出输入串 α,αL(G[S])? S作为语法树的根,试图自上而下地为α构造一棵语法 树 •若叶结点从左向右排列恰好α,则表示α是文法的 句子,而这棵语法树就是句子α的语法结构 •若构造不出语法树,则α不是文法的句子
产生式集合P = {句子 → 主语谓语 ,……}
开始符号S = 句子
句子的推导___根据规则
由规则推导句子:有了一组规则之 后,可以按照一定的方式用它们去 推导或产生句子。
推导方法:从一个要识别的符号开 始推导,即用相应产生式的右部来 替代产生式的左部,每次仅用一条 规则去进行推导。
左递归文法会使自顶向下分析法陷入死循环
如果文法具有间接左递归,则也将发生上述问题,只不过循 环的圈子兜的更大
要实行自顶向下分析,必须要消除文法的左递归
3.
在上述自上而下分析过程中,当一个非终 结符用某一候选式匹配成功时,这种成功 可能只是暂时的。由于这种虚假现象,我 们需要采用更复杂的回溯。 当最终报告分析不成功时,我们难于知道 输入串中出错的确切位置。
BEGIN FOR j:=1 TO i-1 DO
根据语言的语法规则 ,分析源程序的语法结 构,即分析如何由这些单词组成各种语法范畴 (如下标变量、各种表达式、各种语句、程序段 或分程序,乃至整个源程序等等),并在分析过 程中,对源程序进行语法检查。
作为语法分析程序的输出,可以有多种不 同的形式。在下面的讨论中,为简便起见, 我们假定语法分析程序的输出,是用某种 方法表示的语法树
那么,消除P的直接左递归性就是把这些规 则改写成: P→1P | 2P | … | nP P→1P | 2P |… | mP |
左递归变 右递归
例 文法G(E): E→E+T | T T→T*F | F F→(E) | i
经消去直接左递归后变成: E→TE (4.2) E→+TE | P→P1 | P2 | … | Pm | 1 | T→FT 2|…|n T→*FT | P→1P | 2P | … | nP F→(E) | i
Language):组
成程序的所有语句的集合
程序(Program):满足语法规则的语句序列 语句(Sentence) 单词(Token)
:满足语法规则的单词序列
:满足词法规则的字符串
文法和语法分析
正规式的局限性:不能用于描述配 对或嵌套的结构
固定次数的重复或者没有 指定次数的重复 例2:{wcw | w是a和b的串} 适合描述和识别语言 的单词符号; 仅能表示给定结构的 例1:配对括号串的集合
语言是字和组合字的规则——结构性描述
例:去吃我们中汉堡午
中午我们去吃汉堡
如何描述一种语言?
1. 如果语言是有穷的(只含有有穷多
个句子),可以通过枚举法将语言所有
的句子列出表示。
例如,只含两个句子的语言:{“I am
a teacher”, “You are students”};
如何描述一种语言?
语法分析的任务是分析一个文法的句子 结构。 语法分析器的功能:按照文法的产生式 (语言的语法规则),识别输入符号串是 否为一个句子(合式程序)。