自顶向下的语法分析
编译原理第6节课第二章

为一先天二义性语言。 为一先天二义性语言。 • CFL的先天二义性也是不可判定的。 的先天二义性也是不可判定的。 的先天二义性也是不可判定的
2.3.3 短语和句柄
• 问题:在自底向上 问题: 的语法分析中, 的语法分析中,对 于每一步直接归约, 于每一步直接归约, 应如何正确地确定 当前句型中应被归 约的最左子串 约的最左子串? 最左子串 F i E T + T F i T * F i E
E(2) + T(2)
• 但是 对一句型而言,其直接短语可能不唯一。 但是,对一句型而言,其直接短语可能不唯一。 对一句型而言 为了让分析能够机械地进行,我们只考虑最左 为了让分析能够机械地进行,我们只考虑最左 归约。 归约。 E E T F i + T F i T * F i E + T F i
* +
归约时被替换子串的选择
• 从句型 η=E+T*F+i 的语法树可知 E+T 绝不是 的语法树可知, 它的一个直接短语 因为虽然 它的一个直接短语,因为虽然 E→E+T 是 G2[E] 直接短语 的一个产生式,但不存在从 的推导。 的一个产生式 但不存在从 E 到 E*F+i 的推导。 E E(1) E(2) + T(3) T(2) * F(3) + T(1) F(1) i
E + T F T * F i
i • 对一语法树而言,其构造过程不同对应了不 对一语法树而言, 同的推导(归约)过程。 同的推导(归约)过程。 推导
文法的二义性
• 存在这样的文法 ,其某个句子 w ∈ L(G) , 存在这样的文法G, 可对应结构不同的语法树, 可对应结构不同的语法树,即 w 对应了多个 不同的最左(右)推导,这类文法称为二义 不同的最左* +
语法分析-自顶向下分析

解: FIRST(S)=FIRST(aABbcd)∪FIRST(ε) ={a}∪{ε}={a,ε} FIRST(A)=FIRST(ASd)∪FIRST(ε) ={a,d}∪{ε}={a,d,ε} FIRST(B)=FIRST(SAh)∪FIRST(eC) ∪FIRST(ε) ={a,d,h}∪{e}∪{ε}={a,d,h,e,ε} FIRST(C)=FIRST(Sf)∪FIRST(Cg) ∪FIRST(ε) ={a,f}∪{a,f,g}∪{ε}={a,f,g,ε}
4.1自顶向下的分析方法(P61)
开始符号 输入符号串
自顶向下的分析方法就是从文法的开始符号出发,按最左推导方式向下推导,试图推导出要分析的输入串。即:
开始符号 输入符号串
自底向上的分析方法从输入符号串开始,按最左归约方式向上归约到文法的开始符号。即:
+ 归约 ←
自底向上
文法符号的FIRST集合构造方法:
对于文法中的符号X∈V,其FIRST(X)集合可反复应用下列规则计算,直到其FIRST(X)集合不再增大为止: 若X为终结符,则将X加入FIRST(X)集合中。 若X为非终结符,且具有形如X→aα的产生式(a∈Vt),或具有形如X→ε的产生式,则把a或ε加进FIRST(X)。 设X为非终结符且有形如X→Y1Y2…Yk的产生式,若Y1∈Vn,则把FIRST(Y1)中的一切非ε符号加进FIRST(X);对于一切2≤i≤k,若Y1,Y2,…,Yi-1均为非终结符号,且ε∈FIRST(Yj),1≤j≤i-1,则将FIRST(Yi)中的一切非ε符号加进FIRST(X);但若对一切1≤i≤k,均有ε∈FIRST(Yi),则将ε符号加进FIRST(X)。
第5章-自顶向下语法分析方法

语法分析的主要工作: 是识别由词法分析给出的单词序列是否是给定的
正确句子(程序)。
பைடு நூலகம்语法分析常用的方法: 自顶向下的语法分析和自底向上的语法分析两大
类。
自顶向下分析思想
自顶向下的方法: 从文法的开始符号(设为〈程序〉)开始进行分析,
逐步推导的往下构造语法树,使其树叶正好构造出所给 定的源程序串(输入串)。
例5.1若有文法G[S]:
S → pA S → qB
A → cAd A→a
若有输入串w = pccadd.
考察自顶向下的推导过程。
解:推导过程为:
S pA pcAd pccAdd pccadd 其相应的语法树见右图:
S pA
cAd c Ad
a
这个文法的特点:
[1]每个产生式的右部都由终结符号开始。 [2]如果两个产生有相同的左部,那么它们的右部由不同的终 结符开始。
FOLLOW(A)的元素。
因此当文法中含有形如: A→α和 A→β的产生式时,其中 A∈VN ,α,β∈V*,当α和β不同时推导出空串时,设α * ε,β\ * ε, 则当FIRST(α) ∩(FIRST(β)∪FOLLOW(A))=φ时,对于非终结符 A的替代仍可唯一地确定候选。
定义5.3:
定义选择符集合SELECT如下: 对于给出上下文无关文法的产生式
自顶向下方法的关键: 是在推导过程中确定的选择候选式的问题。
自顶向下的主要思想: 从开始符出发导出句型并一个符号一个符号地与
给定输入串 (终结符串)进行匹配。如果全部匹配成功, 则表示开始符号可推导出给定的终结符串。因此判定 给定终结符号串是正确句子。
自顶向下的缺点:
第4章 自顶向下的语法分析

6
分析中出现的问题2:回溯问题
从各种可能的选择中随机挑选一种, 并希望它是正确的。 如果以后发现它是错误的,必须退 回去,再试另外的选择这种方式称为回 溯。 回溯代价极高,效率很低。
7
在自上而下的分析方法中如何选择使 用哪个产生式进行推导? 假定要被替换的最左非终结符号是B, 且有n条规则:B→A1|A2|…|An,那么如何 确定用哪个右部去替代B? 从文法的开始符号出发,如何根据当前 的输入符号(单词符号)唯一地确定选用哪 个产生式替换相应非终结符往下推导,或构 造一棵相应的语法树。
8
§4.2 FIRST和FOLLOW集合的构造
9
例1:输入串w=pccadd是否是合法的句子?
G:S→pA|qB A→cAd|a B→dB|b
S=>pA=>pcAd=>pccAdd=>pccadd 总结:本题中对于一个非终结符,存在若干 个候选式,即产生式形如:P→α1|α2|……|αn 每个候选式的第一个字符都是终结符, 且都不相同。这时可直接选用与当前输入符 号相同的那个候选式来替换P。
42
3. 若X为一非终结符,则查分析表M。 若M[X,a]中为A—产生式,将A自栈 顶弹出,将产生式右部符号串按逆序逐 一推入栈中;当产生式为A时,则只将 A→ε弹出即可。若M[X,a]中为空,则调 用出错处理程序。
43
算法实现
当前字符匹 配成功。 要对栈顶的 非终结符进 行替换。
44
初始化
注意一 定要逆 序入栈。
48
49
通过表4-9可以看到,每个非终结符对应 产生式的各个候选式的交集如下:
可以验证,此文法是LL(1)文法。
50
递归下降语法分析程序如下:
软件工程 编译原理 第五章 自顶向下的语法分析方法

例:文法G(E):
E→TE E→+TE | T→FT PROCEDURE F; T→*FT | IF SYM=‘i’ THEN ADVANCE F→(E) | i ELSE 对应的递归下降子程序为: IF SYM=‘(’ THEN
其中不以P开头。
可以把P的规则等价地改写为如下的非直接左递归 形式: 左递归变 P→P 右递归 P→P|
一般而言,假定P关于的全部产生式是 P→P1 | P2 | … | Pm | 1 | 2|…|n 其中,每个都不等于,每个都不以P开头 那么,消除P的直接左递归性就是把这些规则改写 成:
第5章 自顶向下的语法分析方法
语法分析的作用是识别由词法分析给出 的单词符号序列是否是给定文法的正确句 子(程序)。 目前语法分析常用的方法有: 1、自顶向下(自上而下)分析 2、自底向上(自下而上)分析
5.3非LL(1)文法到LL(1)文法的等价转换
确定的自顶向下分析要求给定语言的文法必
须是 LL(1)形式。然而,不一定每个语言都是 LL(1)文法,对一个语言的非LL(1)文法是否能变
换为等价的LL(1)形式以及如何变换是我们讨论
的主要问题。由LL(1)文法的定义可知若文法中 含有左递归或含有左公共因子,则该文法肯定不 是LL(1)文法,因而,我们设法消除文法中的左 递归,提取左公共因子对文法进行等价变换。
1、提取公共左因子
若文法中含有形如:A→αβ|αγ的产生式,这导 致了对相同左部的产生式其右部的FIRST集相交, 也就是 SELECT(A→αβ)∩SELECT(A→αγ) ≠ φ ,不满足 LL(1)文法的充分必要条件。
自顶向下的语法分析

自顶向下的语法分析语法分析是语言学中一个重要的领域,它主要研究语言的结构,特别是句子的结构和语义。
自顶向下的语法分析是一种常用的语法分析方法,也称为“顶向句法”或“句法下行”。
它被定义为根据语言的上层构造来推断下层构造的一种策略。
自顶向下的语法分析的基本思想是,从一个句子的最顶层(或最外层)开始,从上而下逐层分解它,直至分解出个别单词或元素为止。
它通常利用语言语法的上下文无关性原则。
它允许类似于模糊推理,从而可以利用语言树结构来推测表达的额外信息和更深层次的意思。
自顶向下的语法分析的过程通常如下:首先,通过自动识别技术,识别语料中句子的成分,这是一个可以自动完成的过程;其次,从句子的最顶层,开始依次断出句子结构的层次,这是一个人工完成的过程;最后,根据推测出的层次,分析句子语义,并做出相应的判断。
自顶向下的语法分析也可用来处理句子中的歧义。
它也可用于处理复杂句子,比如复合句、从句等。
除此之外,它还可以处理冗余句,比如重复、拖尾等,从而进一步分解语句。
自顶向下的语法分析是一种非常有效的方法,也是计算机语言处理的基础。
近年来,随着计算机的发展,自顶向下的语法分析技术得到了进一步的改进和发展,应用于更多的领域,如自然语言处理、机器翻译、人机对话、智能搜索、智能问答等。
自顶向下的语法分析不仅可以用于机器理解,而且还可以用于人类理解。
它可以帮助人们更快、更全面地理解句子的结构,也可以加深人们对语言抽象类概念的理解。
此外,它还可以帮助学生和教师更有效地学习和教学,更好地掌握文法的规则,更好地掌握语言的抽象概念,并培养学生的语言素养。
自顶向下的语法分析方法确实具有重要的理论和实用价值,但它也存在一些缺点。
不同语言有不同的语法规则,而自顶向下的语法分析方法假定语言具有一些共同的规则,而这种规则可能不一定适用于所有语言。
此外,自顶向下的语法分析也不太灵活,往往不能很好地处理复杂的语句,也容易受到歧义的影响。
总的来说,自顶向下的语法分析是一种有效的语法分析方法,它不仅可以用于计算机语言处理,而且可以用于人类理解,帮助人们更好地理解语言结构,也可以加强人们对语言抽象概念的理解,有利于学习和教学。
编译原理(3)语法_4(自顶向下语法分析:LL(1)分析法)

课本例题3.8 第二步:计算非终结符的FOLLOW集合
G[E]: E→TE' E'→ + TE' | ε T→FT' T'→*FT' | ε F→(E) | i ③由E→TE' 知FOLLOW(E) ⊂ FOLLOW(E' ), 即FOLLOW(E' ) = {),#}; 由E→TE ' 且E ' → ε知FOLLOW(E)FOLLOW(T),即 FOLLOW(T) = {+,),#};
特别是当Y1~Yk均含有ε产生式时,应把ε也加到FIRST(X)中。
课本例题3.8 第一步:计算非终结符的FIRST集合 例3.8 试构造表达式文法G[E]的LL(1)分析表,其中: G[E]: E→TE' E'→ + TE' | ε T→FT' T'→*FT' | ε F→(E) | i
[解答] 首先构造FIRST集,步骤如下: ① FIRST(E') = {+, ε}; FIRST(T') = {*, ε}; FIRST(F) = {(, i}; ② T→F… 和E→T…知:FIRST(F) ⊂ FIRST(T) ⊂ FIRST(E) 即有FIRST(F) = FIRST(T) = FIRST(E) = {(,i}。
自顶向下的语法分析

自顶向下的语法分析自顶向下的语法分析是指一种从上至下地分析文法的方法,它的分析处理过程将从最高层的语法约束开始,并以不断的递归方式来拆解语法结构,直到最底层的语言符号细节为止。
这种从上而下的语法分析方法主要以文法规则为基础,特别是非确定的文法规则,它们描述了一系列可能的文法分析解决方案。
自顶向下的语法分析可以用于解决自然语言处理问题,其中包括机器翻译、自动问答、语义分析等。
在自然语言处理中,自顶向下的语法分析可以提供有用的线索,帮助我们建立起自然语言与其他形式的信息之间的对应关系,使之能够按照特定的语义规则进行理解和解释。
另外,自顶向下的语法分析可以帮助我们建立起文本与自然语言之间的框架,用以理解文本的结构组合、词语的意义及句子的表达方式,以及表达者如何把握文本的实际内容。
自顶向下分析会包括一些基本步骤,其中最主要的是首先分析出句子的语法结构。
除此之外,还需要对语法结构进行句法编码,以便识别各个句子的具体结构、词性分类、词语语义,以及句子的整体表达意义。
基于自顶向下的语法分析,可以提出一些结构性的文法抽象,以便更好地分析文本。
如果我们对文本分析进行抽象,可以找出共性的结构,从而使得文本的语义分析和翻译更加准确和快速。
此外,自顶向下分析还可以帮助我们构建一些文法模型,这些模型可以更加精确地描述语言,以及句子或文本在特定环境下的用法。
自顶向下的语法分析还可以在语言学习中使用,它可以用来帮助语言学习者更好地理解语言及其结构。
从句法的角度看,学习者可以把句子分解为一系列的结构性单元,从而使他们更容易地理解其中的语法结构、句子的表达和词语的意义,以及句子或文本在特定环境下的用法。
由于自顶向下的语法分析在自然语言处理中有着重要的应用,因此,在研究者和工程师们经常采用它来开发一些有用的应用程序,帮助人们更好地理解自然语言,提高自然语言处理的效率。
然而,自顶向下的语法分析也有一些缺点,例如从复杂的结构性内容中提取出有用的信息和线索可能会很困难,并且需要大量的数据来适配各种不同的语言形式。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如if 语句文法 S→ if E then S
|if E then S else S |other
改写为: S→ if E then SS’|other
S'→ε|else S
26
提取左公因子
更一般的,可将形如
SELECT(A→bAS)={b} SELECT(A→ε)={a, d, #}
SELECT(S→aA)∩SELECT(S→d)={a}∩{d}=Ø SELECT(A→bAS)∩SELECT(A→ε)={b}∩{a,d,#}= Ø 文法为LL(1)文法,可对输入串进行确定的自顶向下分析。
17
例文法G[S]:S→aAS|b A→bA|ε
识别输入串 w= pccadd# 是否是G1[S]的句子
自顶向下的推导 过程为:
S#pA pcAd pccAdd pccadd #
6
S →pA |qB A →cAd|a B →dB |c
文法特点:
每个产生式右部都由终结符号开始 如果两个产生式有相同的左部,那么它们的右部由不同的
由x的归属决定选择A的哪个候选式对非终结符A
进行替换。
13
Select集(Predict集)
给定上下文无关文法的产生式A→,A∈VN, ∈V*,若 =* >ε,则 SELECT(A→)= FIRST()
如果 =*>ε,则
SELECT(A→)=(FIRST()-{ε})∪FOLLOW(A)
22
不确定的自顶向下分析
分析过程是一种试探过程,分析过程需进行 回溯,语义分析,回溯代 价高,在实际的编译程序设计中很少使用。
23
5.3 非LL(1)文法的改造
若文法中含有左公因子或左递归,则文法肯定不是 LL(1)文法,不能进行确定的自顶向下语法分析。
FOLLOW(A)= {a S =*> A ,a∈VT,a∈FRIST(),∈V*,∈V+ }
若S =*> A,且 =*>ε,则#∈FOLLOW(A)
也可定义为:
FOLLOW(A)={a*S => …Aa…,且a∈VT } 若有S =* > …A,则规定#∈FOLLOW(A)
交集 为空
使得面向非终结符S为某一输入符号x寻求匹配时,可由x与两 集合的归属关系确定选用哪个产生式进行推导。(文法1同)
无空产 生式 10
例3(含空产生式的文法)
文法G[S]:S → aA |d A →bAA-S>b|εAS|db|ε
识别输入串 w= abd#
推导过程:
S aA abAS abS
(1)A→ad (2)A→aAc (3)A→bBc (4)B→aA (5)B→bB
B→aA
B→bB
引入新终结符A’
(1) A→aA’
(2) A→bBc
(3) A’→d
(4) A’→Ac
(5) B→aA
(6) B→bB
(LL(1)文法)
☺ 注意:
☺ 有些文法不能在有限步骤内提取左公因子。(P86例5.9)
• 不确定的自顶向下分析方法是带回溯的分析方 法,实际是一种穷举的试探方法,效率低,代 价高,使用较少。
3
自顶向下的语法分析
5.1 确定的自顶向下分析思想 5.2 不确定的自顶向下分析 5.3 非LL(1)文法的等价变换 5.4 LL(1)文法的判别 5.5 确定的自顶向下分析方法
4
5.1 确定的自顶向下分析思想
31
表达式文法消除左递归
G[E]: E→E+T|T
T→T*F|F F→i|(E)
消除左递归后为:
E→ T E’ E’→ + T E’|ε T→ F T’ T’→* F T’|ε
F→ ( E )|i
将A→Aα|β替换为 A→βA’ A’→αA’|ε
32
消除直接左递归
(用“#”作为输入串的结束符,或称输入串括号)
12
结论
当文法中含有形如 A→ A→ (A∈VN,,∈V*) 的产生式时,若和不能同时推导出空,假定 =*>ε, =>*ε则当 FIRST()∩(FIRST()∪FOLLOW(A))= Ø 时,若当前非终结符为A,面临某一输入符号x,可
一般而言,假定关于P的全部产生式是 P→P1 | P2 | … | Pm | 1 | 2|…|n
则消除P的直接左递归之后为: P→1P | 2P | … | nP P→1P | 2P |… | mP |
左递归变 右递归
33
消除间接左递归
间接左递归
S Aa | b
如if语句的文法
S→ if E then S |if E then S else S |other
存在左公因子 if E then S 影响:遇到 if 时难以判断用哪一个产生式进行匹配(推导)
25
提取左公因子
可将文法中的Aβ|变换为:
AB Bβ| (B为新引入的非终结符)
第1个L: 自顶向下分析时从左向右扫描输入串 第2个L: 分析过程中将用最左推导 1:只需向右看一个符号便可决定如何推导即选择哪个产
生式(进行)推导
类似也可以有LL(k)文法,也就是需向前查看k个 符号才可确定选用哪个产生式。
16
例文法G[S]:S→aA|d A→bAS|ε
SELECT(S→aA)={a} SELECT(S→d)={d}
通过提取左公共因子、消除左递归对文法进行等价 变换,在某些特殊情况下可使非LL(1)文法变为 LL(1)文法。
提取左公因子,消除左递归之后文法只是满足LL(1)文法 的必要条件,而不是充分条件,所以不一定是LL(1)文法。
24
提取左公因子
若文法中含有形如Aβ|的产生式,则称文法中含有左公 因子。这将导致关于同一非终结符的不同产生式右部的FIRST 集交集不为空,不满足LL(1)文法的充要条件。
20
第二种情况
关于同一非终结符的不同产生式右部存在能 =* >ε的产生式,且该非终结符的FOLLOW集 与其它产生式右部FIRST集的交集不为空。
如文法G[S]:S→aAS|b A→bA|ε
First(bA)与Follow(A)的交集不为空。对输 入串W=ab的分析存在回溯(前面已经证 明)。
21
第三种情况
文法中含有左递归。
文法G,存在U∈Vn,如果有U->U…, 则G为左递归文 法(直接左递归)
类似的:U->V… V->U…(间接左递归)
如:S->Sa S->b 输入串W=baa的分析:
S=>b =>Sa=>ba
=>Saa=>baa (回溯)
不难证实,若文法中含有间接左递归,也会引起回 溯。
19
第一种情况
关于同一非终结符的不同产生式右部FIRST
集交集不为空而引起回溯: S
S
如:文法S->xAy A->ab|a
xAy xAy
输入串w=xay,分析过程可能为:a b
a
关于同一非终结符的不同产生式右部以相同的符
号串开始(A->|),称为具有左公因子。 左公因子的存在必定会使FIRST集交集不为空。
8
S →Ap |Bq A →cA |a B →dB |b
具有相同左部的产生式向下推导 时能够推导出不同的终结符
文法特点:
产生式的右部不全是由终结符开始 如果两个产生式有相同的左部,它们的右部由不同的
终结符或非终结符开始
文法中无空产生式
对于产生式中相同左部含有非终结符开始的产 生式时,可通过考察产生式向下推导时能够推 导出的第一个终结符唯一确定该用哪个产生式 进行替换。
确定的自定向下分析方法,是从文法的开始 符号出发,考虑如何根据当前的输入符号 (单词符号)惟一的确定选用哪个产生式替 换相应非终结符向下推导,或如何构造一棵 相应的语法树。
什么样的文法能够进行确定的自顶向下语法 分析?
5
例1
文法G1[S]:
S →pA|qB A →cAd|a B →dB |c
终结符开始
文法在推导过程中完全可以根据当前的输入 符号决定选择哪个产生式往下推导,分析过 程唯一确定。
7
例2
文法G2[S]:
S →Ap |Bq A →cA |a B →dB |b
识别输入串
w= ccap# 是否是G2[S]的句
子
推导过程: S# Ap# cAp# ccAp# ccap#
14
LL(1)文法
一个上下文无关文法能进行确定的自顶向下语法分 析的充分必要条件是:对每个非终结符A的两个不同 产生式,A→,A→,满足
SELECT(A→)∩SELECT(A→)= Ø 其中、不同时能=* >ε,这样的文法称为LL(1)文法。
LL(1)文法
能够使用自顶向下分析技术的文法是LL(1)文法。 LL(1)的含义
☺ 提取左公因子后若不含空产生式和左递归则文法是LL(1)文法,否 则需进一步判定。
30
消除直接左递归
直接左递归 若文法中含有形如A→Aα|β的产生式,则 称文法中含有直接左递归(生成的串的形式为
. . . )
直接左递归的消除: 将A→Aα|β替换为 A→βA’ A’→αA’|ε 文法S->Sa|b改写后对输入串baaa#是否 可进行确定分析?
(1)(2)
A Sd |
(非LL(1)文法)
28
左公共因子可能是隐式的