自顶向下语法分析

合集下载

编译原理第6节课第二章

n n m m n m m n
为一先天二义性语言。为一先天二义性语言。 • CFL的先天二义性也是不可判定的。的先天二义性也是不可判定的。的先天二义性也是不可判定的
2.3.3 短语和句柄
• 问题：在自底向上问题：的语法分析中，的语法分析中，对于每一步直接归约，于每一步直接归约，应如何正确地确定当前句型中应被归约的最左子串约的最左子串? 最左子串 F i E T + T F i T * F i E
E(2) + T(2)
• 但是对一句型而言，其直接短语可能不唯一。但是,对一句型而言，其直接短语可能不唯一。对一句型而言为了让分析能够机械地进行，我们只考虑最左为了让分析能够机械地进行，我们只考虑最左归约。归约。 E E T F i + T F i T * F i E + T F i
* +
归约时被替换子串的选择
• 从句型 η=E+T*F+i 的语法树可知 E+T 绝不是的语法树可知, 它的一个直接短语因为虽然它的一个直接短语,因为虽然 E→E+T 是 G2[E] 直接短语的一个产生式,但不存在从的推导。的一个产生式但不存在从 E 到 E*F+i 的推导。 E E(1) E(2) + T(3) T(2) * F(3) + T(1) F(1) i
E + T F T * F i
i • 对一语法树而言，其构造过程不同对应了不对一语法树而言，同的推导（归约）过程。同的推导（归约）过程。推导
文法的二义性
• 存在这样的文法，其某个句子 w ∈ L(G) ，存在这样的文法G，可对应结构不同的语法树，可对应结构不同的语法树，即 w 对应了多个不同的最左（右）推导，这类文法称为二义不同的最左* +

语法分析-自顶向下分析

例 S::=aABbcd|ε A::=ASd|ε B::=SAh|eC|ε C::=Sf|Cg|ε 求此文法的每一个非终结符号的FIRST集。
解： FIRST(S)=FIRST(aABbcd)∪FIRST(ε) ={a}∪{ε}={a,ε} FIRST(A)=FIRST(ASd)∪FIRST(ε) ={a,d}∪{ε}={a,d,ε} FIRST(B)=FIRST(SAh)∪FIRST(eC) ∪FIRST(ε) ={a,d,h}∪{e}∪{ε}={a,d,h,e,ε} FIRST(C)=FIRST(Sf)∪FIRST(Cg) ∪FIRST(ε) ={a,f}∪{a,f,g}∪{ε}={a,f,g,ε}
4.1自顶向下的分析方法（P61）
开始符号输入符号串
自顶向下的分析方法就是从文法的开始符号出发，按最左推导方式向下推导，试图推导出要分析的输入串。即：
开始符号输入符号串
自底向上的分析方法从输入符号串开始，按最左归约方式向上归约到文法的开始符号。即：
+ 归约 ←
自底向上
文法符号的FIRST集合构造方法：
对于文法中的符号X∈V，其FIRST(X)集合可反复应用下列规则计算，直到其FIRST(X)集合不再增大为止：若X为终结符，则将X加入FIRST(X)集合中。若X为非终结符，且具有形如X→aα的产生式(a∈Vt)，或具有形如X→ε的产生式，则把a或ε加进FIRST(X)。设X为非终结符且有形如X→Y1Y2…Yk的产生式，若Y1∈Vn，则把FIRST(Y1)中的一切非ε符号加进FIRST(X)；对于一切2≤i≤k，若Y1，Y2，…，Yi-1均为非终结符号，且ε∈FIRST(Yj)，1≤j≤i-1，则将FIRST(Yi)中的一切非ε符号加进FIRST(X)；但若对一切1≤i≤k，均有ε∈FIRST(Yi)，则将ε符号加进FIRST(X)。

第5章-自顶向下语法分析方法

第5章自顶向下语法分析方法
语法分析的主要工作：是识别由词法分析给出的单词序列是否是给定的
正确句子（程序）。
பைடு நூலகம்语法分析常用的方法：自顶向下的语法分析和自底向上的语法分析两大
类。
自顶向下分析思想
自顶向下的方法：从文法的开始符号（设为〈程序〉）开始进行分析，
逐步推导的往下构造语法树，使其树叶正好构造出所给定的源程序串(输入串)。
例5.1若有文法G[S]：
S → pA S → qB
A → cAd A→a
若有输入串w = pccadd.
考察自顶向下的推导过程。
解：推导过程为：
S pA pcAd pccAdd pccadd 其相应的语法树见右图：
S pA
cAd c Ad
a
这个文法的特点：
[1]每个产生式的右部都由终结符号开始。 [2]如果两个产生有相同的左部，那么它们的右部由不同的终结符开始。
FOLLOW(A)的元素。
因此当文法中含有形如： A→α和 A→β的产生式时，其中 A∈VN ,α,β∈V*,当α和β不同时推导出空串时，设α * ε，β\ * ε，则当FIRST(α) ∩(FIRST(β)∪FOLLOW(A))=φ时，对于非终结符 A的替代仍可唯一地确定候选。
定义5.3：
定义选择符集合SELECT如下：对于给出上下文无关文法的产生式
自顶向下方法的关键：是在推导过程中确定的选择候选式的问题。
自顶向下的主要思想：从开始符出发导出句型并一个符号一个符号地与
给定输入串 (终结符串)进行匹配。如果全部匹配成功，则表示开始符号可推导出给定的终结符串。因此判定给定终结符号串是正确句子。
自顶向下的缺点:

第4章自顶向下的语法分析

6
分析中出现的问题2：回溯问题
从各种可能的选择中随机挑选一种，并希望它是正确的。如果以后发现它是错误的，必须退回去，再试另外的选择这种方式称为回溯。回溯代价极高，效率很低。
7
在自上而下的分析方法中如何选择使用哪个产生式进行推导？假定要被替换的最左非终结符号是B，且有n条规则：B→A1|A2|…|An，那么如何确定用哪个右部去替代B？从文法的开始符号出发，如何根据当前的输入符号（单词符号）唯一地确定选用哪个产生式替换相应非终结符往下推导，或构造一棵相应的语法树。
8
§4.2 FIRST和FOLLOW集合的构造
9
例1:输入串w=pccadd是否是合法的句子？
G：S→pA|qB A→cAd|a B→dB|b
S=>pA=>pcAd=>pccAdd=>pccadd 总结：本题中对于一个非终结符，存在若干个候选式，即产生式形如：P→α1|α2|……|αn 每个候选式的第一个字符都是终结符，且都不相同。这时可直接选用与当前输入符号相同的那个候选式来替换P。
42
3. 若X为一非终结符，则查分析表M。若M[X，a]中为A—产生式，将A自栈顶弹出，将产生式右部符号串按逆序逐一推入栈中；当产生式为A时，则只将 A→ε弹出即可。若M[X，a]中为空,则调用出错处理程序。
43
算法实现
当前字符匹配成功。要对栈顶的非终结符进行替换。
44
初始化
注意一定要逆序入栈。
48
49
通过表4-9可以看到，每个非终结符对应产生式的各个候选式的交集如下：
可以验证，此文法是LL(1)文法。
50
递归下降语法分析程序如下：

《编译原理》课后习题答案第5章

《编译原理》课后习题答案第5章《编译原理》课后习题答案第5章.pdf《编译原理》课后习题答案第5章.pdf第5章自顶向下语法分析方法第1题对文法G[S] S→a|∧|(T) T→T,S|S(1) 给出(a,(a,a))和(((a,a),∧,(a)),a)的最左推导。

(2) 对文法G，进行改写，然后对每个非终结符写出不带回溯的递归子程序。

(3) 经改写后的文法是否是LL(1)的?给出它的预测分析表。

(4) 给出输入串(a,a)#的分析过程，并说明该串是否为G的句子。

答案：(1) 对(a,(a,a)的最左推导为：S(T) (T,S) (S,S) (a,S) (a,(T)) (a,(T,S)) (a,(S,S)) (a,(a,S)) (a,(a,a))对(((a,a),∧,(a)),a) 的最左推导为：S(T) (T,S) (S,S) ((T),S) ((T,S),S) ((T,S,S),S) ((S,S,S),S) (((T),S,S),S) (((T,S),S,S),S) (((S,S),S,S),S) (((a,S),S,S),S) (((a,a),S,S),S) (((a,a),∧,S),S) (((a,a),∧,(T)),S)(((a,a),∧,(S)),S)《编译原理》课后习题答案第5章.pdf《编译原理》课后习题答案第5章.pdf(((a,a),∧,(a)),S) (((a,a),∧,(a)),a)(2) 改写文法为：0) S→a 1) S→∧ 2) S→( T ) 3) T→S N 4) N→, S N 5) N→ε非终结符FIRST集FOLLOW集S {a,∧,(} {#,,,)} T {a,∧,(} {)} N {,,ε} {)}对左部为N的产生式可知：FIRST （→, S N）={，} FIRST （→ε）={ε} FOLLOW （N）={)}由于SELECT(N →, S N)∩SELECT(N →ε) ={，}∩ { )}= 所以文法是LL(1)的。

软件工程编译原理第五章自顶向下的语法分析方法

PROCEDURE T； BEGIN F；T END PROCEDURE T； IF SYM=‘*’ THEN BEGIN ADVANCE； F；T END；
例:文法G(E):
E→TE E→+TE | T→FT PROCEDURE F； T→*FT | IF SYM=‘i’ THEN ADVANCE F→(E) | i ELSE 对应的递归下降子程序为: IF SYM=‘(’ THEN
其中不以P开头。
可以把P的规则等价地改写为如下的非直接左递归形式：左递归变 P→P 右递归 P→P|
一般而言，假定P关于的全部产生式是 P→P1 | P2 | … | Pm | 1 | 2|…|n 其中，每个都不等于，每个都不以P开头那么，消除P的直接左递归性就是把这些规则改写成：
第5章自顶向下的语法分析方法
语法分析的作用是识别由词法分析给出的单词符号序列是否是给定文法的正确句子(程序)。目前语法分析常用的方法有: 1、自顶向下（自上而下）分析 2、自底向上（自下而上）分析
5.3非LL(1)文法到LL(1)文法的等价转换
确定的自顶向下分析要求给定语言的文法必
须是 LL(1)形式。然而，不一定每个语言都是 LL(1)文法，对一个语言的非LL(1)文法是否能变
换为等价的LL(1)形式以及如何变换是我们讨论
的主要问题。由LL(1)文法的定义可知若文法中含有左递归或含有左公共因子，则该文法肯定不是LL(1)文法，因而，我们设法消除文法中的左递归，提取左公共因子对文法进行等价变换。
1、提取公共左因子
若文法中含有形如：A→αβ|αγ的产生式，这导致了对相同左部的产生式其右部的FIRST集相交，也就是 SELECT(A→αβ)∩SELECT(A→αγ) ≠ φ ，不满足 LL(1)文法的充分必要条件。

自顶向下的语法分析

自顶向下的语法分析语法分析是语言学中一个重要的领域，它主要研究语言的结构，特别是句子的结构和语义。

自顶向下的语法分析是一种常用的语法分析方法，也称为“顶向句法”或“句法下行”。

它被定义为根据语言的上层构造来推断下层构造的一种策略。

自顶向下的语法分析的基本思想是，从一个句子的最顶层（或最外层）开始，从上而下逐层分解它，直至分解出个别单词或元素为止。

它通常利用语言语法的上下文无关性原则。

它允许类似于模糊推理，从而可以利用语言树结构来推测表达的额外信息和更深层次的意思。

自顶向下的语法分析的过程通常如下：首先，通过自动识别技术，识别语料中句子的成分，这是一个可以自动完成的过程；其次，从句子的最顶层，开始依次断出句子结构的层次，这是一个人工完成的过程；最后，根据推测出的层次，分析句子语义，并做出相应的判断。

自顶向下的语法分析也可用来处理句子中的歧义。

它也可用于处理复杂句子，比如复合句、从句等。

除此之外，它还可以处理冗余句，比如重复、拖尾等，从而进一步分解语句。

自顶向下的语法分析是一种非常有效的方法，也是计算机语言处理的基础。

近年来，随着计算机的发展，自顶向下的语法分析技术得到了进一步的改进和发展，应用于更多的领域，如自然语言处理、机器翻译、人机对话、智能搜索、智能问答等。

自顶向下的语法分析不仅可以用于机器理解，而且还可以用于人类理解。

它可以帮助人们更快、更全面地理解句子的结构，也可以加深人们对语言抽象类概念的理解。

此外，它还可以帮助学生和教师更有效地学习和教学，更好地掌握文法的规则，更好地掌握语言的抽象概念，并培养学生的语言素养。

自顶向下的语法分析方法确实具有重要的理论和实用价值，但它也存在一些缺点。

不同语言有不同的语法规则，而自顶向下的语法分析方法假定语言具有一些共同的规则，而这种规则可能不一定适用于所有语言。

此外，自顶向下的语法分析也不太灵活，往往不能很好地处理复杂的语句，也容易受到歧义的影响。

总的来说，自顶向下的语法分析是一种有效的语法分析方法，它不仅可以用于计算机语言处理，而且可以用于人类理解，帮助人们更好地理解语言结构，也可以加强人们对语言抽象概念的理解，有利于学习和教学。

编译原理(3)语法_4(自顶向下语法分析：LL(1)分析法)

2first集确定了每一个非终结符在扫描输入串时所允许遇到的输入符号及所应采用的推导产生式集确定了每一个非终结符在扫描输入串时所允许遇到的输入符号及所应采用的推导产生式该非终结符所对应的产生式中的哪一个候选式33自顶向下的语法分析式中的哪一个候选式3follow集是针对文法中形如a这样的产生式的即在使用这样的产生式的即在使用a的产生式进行推导时面临输入串中哪些输入符号时有一空字的产生式进行推导时面临输入串中哪些输入符号时有一空字即匹配而不出错
课本例题3.8 第二步：计算非终结符的FOLLOW集合
G[E]: E→TE' E'→ + TE' | ε T→FT' T'→*FT' | ε F→(E) | i ③由E→TE' 知FOLLOW(E) ⊂ FOLLOW(E' )，即FOLLOW(E' ) = {),#}；由E→TE ' 且E ' → ε知FOLLOW(E)FOLLOW(T)，即 FOLLOW(T) = {+,),#}；
特别是当Y1～Yk均含有ε产生式时，应把ε也加到FIRST(X)中。
课本例题3.8 第一步：计算非终结符的FIRST集合例3.8 试构造表达式文法G[E]的LL(1)分析表，其中： G[E]: E→TE' E'→ + TE' | ε T→FT' T'→*FT' | ε F→(E) | i
[解答] 首先构造FIRST集，步骤如下： ① FIRST(E') = {+, ε}； FIRST(T') = {*, ε}； FIRST(F) = {(, i}； ② T→F… 和E→T…知:FIRST(F) ⊂ FIRST(T) ⊂ FIRST(E) 即有FIRST(F) = FIRST(T) = FIRST(E) = {(,i}。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

这个文法的特点：
1、每个产生式的右部都由终结符号开始
2、如果两个产生式有相同的左部，那么它们的右部由不同的终结符开始
编译原理
2020年5月23日
【例】 G2[S]:
S → Ap |Bq
A →a|cA
B →b|dB 识别输入串w= ccap是否是G2[S]的句子
❖试探推导过程：
➢S Ap cAp ➢试探成功
编译原理
2020年5月23日
自顶向下分析方法分类确定的
回溯不确定的
编译原理
2020年5月23日
【例】 G1[S]:
S → pA |qB
A →cAd|a
B →d B |c 识别输入串w= pccadd是否是G1[S]的句子
❖试探推导过程：
➢S pA pcAd pccAdd pccadd
➢试探3日
【例】 G2[S]:
S → Ap |Bq
A →a|cA
B →b|dB 识别输入串w= ccap是否是G2[S]的句子
❖试探推导过程：
➢S Ap cAp ccAp ccap
➢试探成功
✓FIRST（Ap）＝｛a，c｝ ✓FIRST（Bq）＝｛b，d｝
编译原理
2020年5月23日
2. FOLLOW集
对于文法G的非终结符的后继符号集称为 FOLLOW集，定义如下：
FOLLOW(A) ={a|S …Aa…，a ∈VT} 若S …A，则规定#∈FOLLOW(A) FOLLOW(A)：是所有句型中紧接A之后的终结符号或#
E→TE'
E'→+TE'|
E
T→FT'
T'→*FT'|
编译原理
2020年5月23日
自顶向下分析算法的基本思想为：
若xG+[SS]
则xL(G[S]) 否则xL(G[S])
存在主要问题: 回溯问题,左递归问题
主要方法：递归子程序法、 LL分析法
自底向上分析算法的基本思想为：
若xG+[S]S
则xL(G[S]) 否则xL(G[S])
存在主要问题:“可归约串”的识别问题
（2）若α=Xβ ，X∈VN，且有产生式X→b…，则把b加入到FIRST(α)中；
例： FIRST(FT')={ ( , i } ??
编译原理
2020年5月23日
E→TE'
（13≤）i若≤nα；=X1X2 … Xn，其中Xi∈VN , 例：FIRST(FT')= FIRST(F)-{ε}={(,i}
FIRST()={a| a …，a∈VT 若，则规定∈FIRST()
FIRST(α)：从α可能推导出的所有开头终结符号或ε
【例】 S→aAb A→cd|c
FIRST(aAb) ={a} FIRST(cd) ={c} FIRST(c) ={c}
【例】
S→Aa A→a|
FIRST(a) ={a} FIRST() = {} FIRST(Aa) ={a}
FIRST(S) ={a} FIRST(A) ={c}
编译原理
FIRST(S) ={a} FIRST(A) ={a, }
2020年5月23日
构造FIRST集的算法
（1）若α=aβ ，且a∈VT ，则 a∈FIRST(α)；例： FIRST(i)={ i } FIRST(+TE')={ + }
E→TE' E'→+TE'| T→FT' T'→*FT'| F→(E)|i
S.P 词法分析程序
符号表管理
语法分析程序
语义分析、生成中间代码代码优化
错误处理
生成目标程序 O.P
编译原理
2020年5月23日
知识结构
编译原理
2020年5月23日
语法分析的任务
任务：根据文法规则，从源程序单词符号串中识别出语法成分，并进行语法检查。
两大类分析方法：
自顶向下分析自底向上分析
主要方法：算符优先分析法、 LR分析法
编译原理
2020年5月23日
5.1 自顶向下分析法
自顶向下分析的一般过程从S出发采用最左推导，试图逐步推出输入串α,αL(G[S])?
S作为语法树的根，试图自上而下地为α构造一棵语法树 o 若叶结点从左向右排列恰好α，则表示α是文法的句子，而这棵语法树就是句子α的语法结构 o 若构造不出语法树，则α不是文法的句子
F→(E)|i
编译原理
T+TE ' ，则+∈FOLLOW(T)
2020年5月23日
构造集合FOLLOW的算法
E→TE' E'→+TE'|
（1）若A为开始符号，则把“#”加入FOLLOW(A)中；T→FT'
#∈FOLLOW(E)
T'→*FT'|
F→(E)|i
（2）若B→A (≠)，则把FIRST()-{}加入FOLLOW(A)中；
ccAp ccap 这个文法的特点：
1、产生式的右部不全是由终结符开始
2、如果两个产生式有相同的左部，它们的右部是由不同的终结符或非终结符开始
编译原理3、文法中无空产生式2020年5月23日
1. FIRST集
对于文法G的所有非终结符的每个候选式，其终结首符号集称为FIRST集，定义如下：
2020年5月23日
【例】 G[E] E→TE' E'→+TE'| T→FT' T'→*FT'| F→(E)|i
计算文法中非终结符的First集合
FIRST(F)={(,i} FIRST(T’)={*,ε} FIRST(T)=FIRST(F)-{ε}={(,i} FIRST(E’)={+,ε} FIRST(E)= FIRST(T)-{ε}={(,i}
E'→+TE'| T→FT' T'→*FT'|
①F将IRFSITR(SαT)(；X1)中的一切非ε的终结符加进 F→(E)|i ②终若结ε∈符F加IR进SFTI(RXS1)T,(则α将)；FIRST(X2)中的一切非ε的 ③中若的ε∈一F切IR非SεT的(X终1)结且符ε∈加F进IRFSITR(SXT2()α,则)；将FIRST(X3) ④则依将此ε类加推进，FI若RS对T(于α注一)意。切：1要≤顺i≤序n往,ε下∈做F，IR一S旦T(不X满i)，足条件，
编译原理
2020年5月23日
【例】 G3[S]: S → aA|d A →bAS|ε 识别输入串w= abd是否是G3[S]的句子
❖试探推导过程： ➢S aA abAS abS ➢试探成功
编译原理
ab这d 个文法的特点： 1、含有空产生式 2、非空产生式右部首符号集合两两不相交 3、紧跟该非终结符右边可能出现的终结符集合也不相交