第四章_语法分析(4)

合集下载

第四章语法分析

现代汉语语法第四章

3.两类短语的语法性质和句法功能
• 状心和心补短语一般以动词和形容词为核心构件，是动词短语或形容词短语。 • 就七八个人 • 多年夫妻 • 夫妻多年 • 状心短语有时以名词、数量词或数量名结构为核心构件，心补短语有时以名词为核心构件，是特殊的名词短语
• 句法功能上，状心短语或心补短语带上特定语气语调，可以成为非主谓句。 • 向左拐！
3.联合短语的语法性质和句法功能
• • • • 名名联合——名词联合短语动动联合短语——动词联合短语形形联合短语——形容词联合短语一般情况下，，联合短语的句法功能，跟联合项的词性一致
• 名词和名名联合短语都可以做宾语，有的名名联合短语可以带 “地”做状语，单独一个名词却不行： •
• 有些形容词和形形联合短语都可以用在谓语部分，但形形联合短语可以带“地”做状语，单独一个形容词却不行： •

• 句法功能上，定心短语带上特定语气语调，可以成为非主谓句。 • 卑鄙的小人！ • 野兽的嚎叫！ • 在句子中，定心短语的基本功能是充当主语和宾语。以名词为核心构件的，还可以充当其他成分。 • • • • • 这本书的出版讲求高质量。高质量是第一位的要求。这是一批高质量的书。成果高质量。一定要高质量地完成任务。
• • • •
不同的联合标志，在结构成分之间所表示的具体关系不完全相同表示并列：和、及、并、而、而又表示选择：或、或者表示递进：且、而且
• 有的联合标志，即使所处语法环境相同，在具体表意上也有差异 • 张三、李四和王五 • 张三李四及王五 • “和”和“及”都可以用在名名之间表示并列关系，但“及”强调前后联合项有主次之分 • “而又”前后两个联合项是同一个形容词，强调的说法
• 从充当结构成分的语法单位看，定心短语的两个结构成分可以是词，也可以是短语。

语言学概论_第四章语法

1.语法形式：能够体现一类意义或有共同作用的形式。
2.语法意义：通过一类共同功能所获得的意义。语法意义不等于词汇意义。
如：英语中名词加词尾“- s”表示复数， “- s” 就是语法形式，“表示复数”就是语法意义。
3、根据语法形式的共同特点把它们归并为几个基本类型，这种语法形式的类就叫做“语法手段”。
如：“一张动物园”，看起来是量词误用，其实是“我要买一张去动物园的票”这句话的成分省略现象。
初中，某数学老师讲方程式变换，在讲台上袖子一挽大声喝道：同学们注意！我要变形了！……
5.语法和逻辑
逻辑是语言表现内容的规律，语法是语言表达形式的规律，二者的关系非常紧密。逻辑对语法的影响主要表现为对语言成分之间搭配关系的制约。从基本要求看，一般人们说话不但要合语法，也要合逻辑。个别不合逻辑的，只要大家都这么说，都懂得是什么意思，就不能完全用逻辑来苛求了。
“科学”本为名词，后产生出“具有科学属性的”这一意义，用该词修饰或描写此属
严密的系统性相对的稳定性
语法的高度抽象性
小明喝牛奶。妈妈已经吃过饭了。老师在黑板上写字。
语法规则具有强大的递归性
学生在看书。隔壁的学生在看他的书。隔壁在xx小学读书的学生在家里看他的辅
导书。隔壁在xx小学读书的学生在家里看他昨天
从新华书店买来的他一直想要的辅导书。
语法规则具有严密的系统性
江西人不怕辣湖南人辣不怕四川人怕不辣
（4）语调是通过整个句子的音高、重音、停顿等来表示一定语法意义的形式。语调实际上已经是表达层面上的一种语法手段了。
如：滚蛋！
6.根据语法手段的不同可把人类语言分为：
语言
综合性语言：主要使用词形变化、词的轻重音等语法手段的语言。如俄语、德语

编译原理-第四章语法分析-4.2上下文无关文法

博客园用户登录代码改变世界密码登录短信登录忘记登录用户名忘记密码记住我登录第三方登录/注册没有账户, 立即注册
编译原理 -第四章语法
1.形式语言 2.例
二、推导
1.定义 2.基本概念 3.例
三、语法分析树
1.定义推导的图形表示形式，过滤掉了推导过程中对非终结符应用产生式的顺序，描述如何从文法的开始符号推导出其语言中的一个语句 2.性质 3.例
四、二义性
1.定义 2.原因在产生句子的过程中某些直接推导有多于一种选择 3.注意 4.例
五、验证文法产生的语言
六、上下文无关文法和正则表达式
1.文法 2.正则表达式 3.正则表达式到上下文无关文法转换例：
参考——慕课-苏州大学

第四章语法

例句分析：
（1）太阳升起在浩荡的平原上。（2）我们充分利用本地资源制造农业机械化的道路。（3）在参观期间发生的令人感动的美丽事情层出不穷。（4）其实对这一点我也以前不十分清楚。（5）尽管天塌下来，我也能顶得住。（6）我看书的入神时，不时门开了，好几个同学进来。
二、语法的组合规则和聚合规则
2. 划分词类应注意的问题 ①在鉴别词类时可以参照词的意义，但不能完全根据意义，而要有句法功能和形式上的实证。 ②在同一个词类当中，具体的成员有典型与非典型之分。 ③一个词可以兼属两个或两个以上的词类。
3.划分词类对句法描写的意义划分词类是概括句法格式、发现组合规则的基础。词类之于句法描写的重要性还表现为，给词分小类可以大大深化句法描写。
第四章语法
第一节语法和语法单位第二节组合规则第三节聚合规则第四节变换第五节语言的结构类型和普遍特征
第一节语法和语法单位
一语言结构是有规则的
所谓语法，是指用词造句的规则。我们说话写文章都必须遵守规则，否则的话，就会让对方感到别扭甚至产生误会。作为母语的语法规则是潜存于大脑的，通过说话可以表现出来，但是规则具体是怎样的，一般人却难以说明白。语法分析的主要任务就是把人们心知其意而难以言状的规则整理出来，以便人们自觉的运用。语法学家的任务只是归纳、整理客观存在的规则，选择恰当的方式进行描写，对于语法规则，语法学家是无权做硬性的规定的。
四、语法范畴
由词的变化形式所表示的意义方面的聚合，即语法意义的类就叫做语法范畴。（一）语法范畴的类：体词属性范畴和谓词属性范畴 1. 体词属性范畴就是由名词的词性变化形式表示的意义。印欧语系的语言中的名词大都有词形变化，主要表示三种范畴意义：性、数、格。

04 语法分析-自上而下分析

待分析的输入串：待分析的输入串：i+i
只有当a 只有当a是允许出现在非终结符A 现在非终结符A后面的终结符时，面的终结符时，才可能允许A 才可能允许A自动匹配。匹配。
尾随集的定义： VN尾随集的定义：
=*>…Aa Aa…, FOLLOW(A)={a|S =*> Aa , a∈VT}；特别地，如果S=*> S=*>…A 那么# FOLLOW(A)。特别地，如果S=*> A，那么# ∈FOLLOW(A)。
例子
文法: S→xAy A→**|* 文法: 输入串：x*y 输入串： S => => => => xAy x**y xAy x*y (S→ xAy) (A→**) 回溯) (回溯) (A→*)
带回溯自上而下分析面临的问题
问题: 问题: 文法的左递归问题回溯问题虚假匹配问题出错位置不确定低效
实现思想：实现思想：
分析程序由一组递归过程组成。分析程序由一组递归过程组成。每一过程对应于一个非终结符号。对应于一个非终结符号。每一个过程的功能是：选择正确的右部。每一个过程的功能是：选择正确的右部。在右部中有非终结符号时，在右部中有非终结符号时，调用该非终结符号对应的过程。符号对应的过程。
消除文法的左递归
文法不含回路（形如P=+> P推导推导）文法不含回路（形如P=+> P推导）不含回路前提：前提：不含以ε 也不含以ε 为右部的产生式结论：那么可以通过执行消除文法左递结论：那么可以通过执行消除文法左递归的算法消除文法的一切左递归归的算法消除文法的一切左递归改写后的文法可能含有以ε （改写后的文法可能含有以ε 为右部的产生式）。为右部的产生式）。

语法分析

23
if(Yi∈VN) { if(i=n or 任一j(i+1≤j≤n)null(Yj)=true) FOLLOW(Yi)=FOLLOW(Yi)∪FOLLOW(A); if(Yi+1∈VT) Yi+1∈FOLLOW(Yi); else for(k=i+1;k<=n;k++) if(k=i+1 or i+1≤j≤k-1)null(Yj)=true ) FOLLOW(Yi)=FOLLOW(Yi)∪FIRST(Yk) }/*end of if*/ }/*end of for*/ } /*end of for*/ while FIRST,FOLLOW,nullable 不再改变
1、思路：对任一输入符号串，通过一切可能的办法，从树根结点(识别符号)出发，根据文法自上而下地为输入串建立一棵语法树；或者说，从识别符号开始，根据文法试图为输入串建立一个推导序列。 2、特点：是自顶向下分析的一般方法，分析过程的本质是一种试探过程。
4
例∶假定有文法G[S]:(1)S->cAd (2)A->ab|a 对输入串w=cad。要求自上而下地构造w的语法树。解决过程： S c a S c A a d A b d －对于输入串w，从文法的开始符号出发，反复使用不同的产生式谋求匹配输入串。当用某个非终结符号的候选式进行匹配失败时，则推翻分析退回到适当位置再重新试探其它候选式，直到把所有可能的推导序列都试探完仍不成功才能确认输入串不是该文法的句子而报错。称为带回溯的自顶向下分析。－回溯需要推导记住现场，浪费了大量的时间和空间，必须设法消除。
在推导过程中，可以完全根据向前看符号唯一决定选择哪个产生式往下推导，因此，分析过程是完全确定的。这种分析称为确定的自顶向下分析方法。

第04章-语法分析自上而下分析

否符合语法规则。 ▪ 语法分析器的工作本质：按文法的产生式，识别
输入符号串是否为一个句子。 ▪ 语法分析器在编译器中的地位：
源程序
单词符号
词法分析器
取下一个单词符号
语法分析器
语法分析树
编译器的后继部分
2021/4/6
符号表
3
4.1 语法分析器的功能
▪ 语法分析方法
➢ 自上而下分析法
从文法的开始符号出发，反复使用文法的产生式，寻找与输入符号串匹配的推导。
分析输入串x*y(记为)。
xx**yy
SS
IPIPIP xx A y * **
2021/4/6
7
4.2 自上而下分析面临的问题
▪ 当某个非终结符有多个产生式候选时，可能带来如下问题：
➢ 1.分析过程中，当一个非终结符用某一个候选匹配成功时，这种匹配可能是暂时的。这时，不得不“回溯”。
➢ 2.文法左递归问题。一个文法是含有左递归的，如果存在非终结符P
➢ 最后所得的无左递归文法是： S→Qc | c Q→Rb | b R→bcaR | caR |a R R→ bca R |
➢ 不同排序所得的文法的等价性是显然的。
2021/4/6
17
4.3.2 消除回溯、提左因子
▪ 为了消除回溯就必须保证：对文法的任何非终结符，当要它去匹配输入串时，能够根据它所面临的输入符号准确地指派它的一个候选去执行任务，并且此候选的工作结果应是确信无疑的。
2021/4/6
14
4.3.1 左递归的消除
▪ 例4.3 考虑文法G(S)
S→Qc|c Q→Rb|b R→Sa|a
➢ 令它的非终结符的排序为R、Q、S。 ➢ 对于R，不存在直接左递归。 ➢ 把R代入到Q的有关候选后，把Q的规则变为

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

编译原理
I3 :
I4:
SR ·
L* · R R · L L · *R L · id Lid ·
I6:
SL= · R R · L L · *R L · id
L*R ·
I7:
I1: I2:
I5:
I8 :
I9:
RL ·
SL=R ·
4
I0
S' S S L=R SR L *R L id RL id R L id
编译原理
23
算法4.38 LR(1)项目集的构造
输入：拓广文法G。输出： LR(1)项目集规范族，是对G 的一个或多个可行前缀有效的项目集。方法：如图4-40所示。
编译原理
24
Fig4.40 Sets of LR(1) items construction for G
function closure(I) begin repeat for each [A B, a] in I each production B of G and each terminal b in FIRST(a) such that [B. , b]is not in I do add [B , b] to I until no more items can be added to I return I end
编译原理 27
例4.39
构造文法 S S SCC CcC|d 的LR(1)和SLR分析表。
计算[S.S,$]的闭包 I0：S.S, $ S.CC, $ C.cC, c/d C.d, c/d c/d FIRST(C$)
编译原理
28
S.S,$ S S.CC,$ C.cC,c/d C.d,c/d I0 C
据假设，存在一个规范推导S *Aw 1B2w 设2w * xw，则对任何B 有规范推导 S *Aw 1 B 2w 1 Bxw 1 xw 所以 B . 对可行前缀 1 也是有效的。
编译原理 13
一个项目可能对好几个可行前缀都是有效的。 E ·E+T对和(这两个可行前缀都有效 E E E+T (，1都为空) E E (E) (E+T) ( =“(”，1为空) DFA读入和(后到达不同的状态，那么项目E ·E+T就出现在不同的项目集中
S BB BaB Bab aBab aaBab aaaBab
rm rm rm
从最右推导S *rm aaBab rm aaaBab看出： [Ba · a]对可行前缀 = aaa是有效的； B, 从最右推导S *rm BaB rm BaaB看出： [Ba · $]对可行前缀 = Baa是有效的。 B,
编译原理
14
一个可行前缀可能有多个有效项目。可能存在动作冲突一个可行前缀的有效项目集就是从这个DFA的初态出发，沿着标记为的路径到达的那个项目集（状态）。
编译原理
15
例4.35
串E + T *是可行前缀，读完它后，DFA处于状态I7 I7: TT *· F · E ), F · F, ( id
编译原理 22
构造有效的LR(1)项目集
考虑对可行前缀有效的项目[A · , a]，必 B 定存在最右推导S *rm Aax rm Bax，其中 = 。假设ax能推出by，那么， [B · , b]对有效， b是从能推出的第一个终结符，或当可空时， b就是a。bFIRST(a)。
SS.,$ I1 SC.C,$ C.cC,$ C.d,$ I2 c C
SCC.,$ I5 c
C d CcC.,$ I9
Cc.C,$ C.cC,$ C.d,$ I6 Cd.,$ I7
d c c
d
Cc.C, c/d C C.cC, c/d C.d, c/d I3 d Cd.,c/d 编译原理 I4
编译原理
17
图4.36 识别可行前缀的 DFA
I0
E
I1
+
I6
T
I2 I3 (
*
I7
T F ( id F (
I9 to I3 to I4 to I5 I10
*
to I7
F
(
id E T F ) + to I2 to I3
编译原理
to I4 to I5 I11
to I6
I4
I8
id id I5
18
4.7 构造规范的LR分析表
第四章语法分析(4)
4.7 LR(1)、LALR
1
4.6.4 构造SLR分析表
算法 4.32 构造SLR分析表输入：一个拓广文法G 输出：G 的SLR分析表的函数action和goto 方法： 1. 构造G 的LR(0)项目集规范族C = {I0, I2, …, In}。 2. 对于状态Ii的分析动作如下： (a) 若A . aB Ii且 goto (Ii ,a)= Ij action[i, a] = “shift j” (b) 若A . Ii, 对于所有a FOLLOW(A) action[i, a] = “reduce A” , A S (c) 若SS. Ii, action[i, $]= “accept” 3. 若goto(Ii, A) = Ij, AVN , 则 goto[i,A] = j 4. 分析表其余位置为error 编译原理
编译原理
6
4.6.5 可行前缀（viable prefix）
对于一个文法G，构造一个LR（0）自动机，它能识别所有可能出现在分析栈中的文法符号串，栈中的文法符号串一定是某个右句型的前缀。
S x
rm *
不是右句型的所有前缀都会出现在栈中。
E F * id ( E ) * id
11 S · a 12. S a·
编译原理
10
识别可行前缀的NFA

start
3
S
S
4

S
5
+
6
1
2
7 11

S

8
S
9
*
10
a
12编译原理
11
识别可行前缀的DFA
S SSS . + SSS . * SS. S+ SS. S* S.SS+ S.SS* S.a I3
编译原理
8
识别G的所有可行前缀的NFA
1. 2. NFA的状态是一个LR(0)项目。从每个形如B · 的状态出发画一条标记为X X 的弧到状态BX · ， 3. 从每个形如B · 的状态出发画一条标记为的 A 弧到所有形如A · 的状态。这个NFA通过子集构造法得到的DFA和前面构造的LR(0)自动机是相同的。
2
例4.34 每个SLR(1)文法都不是二义的，但是，有许多非二义的文法不是SLR(1)。
例如，下面的产生式文法
S L=R SR L *R L id RL
编译原理
3
拓广文法G的LR(0)项目集规范族为：
I0: S' · S S · L=R S · R L · *R L · id R · L S'S · SL · =R RL ·
例 I2有两个项目SL · =R和RL · 当下一个输入为‘=’时用RL · 归约，但是文法没有以R=…开始的右句型，只有以*R=…开始的右句型，可见，仅仅知道可行前缀L不应当进行归约。扩充项目的定义！
编译原理
19
LR(1)项目
重新定义项目，让它带上搜索符(向前看符号)，成为如下形式 LR(1)项目: 由LR(0)项目和一个lookahead符号组成 [ A., a ] 对于项目[ A· a ]，搜索符a表示只有当下一 , 个输入符号是a时，才能进行归约。这样的a的集合一定是FOLLOW(A)的一个子集，可能是真子集。
编译原理 5
S
I1
I4 S R
SLR(1)文法的描述能力有限
I0 S' S S L=R SR L *R L id RL
L
S L =R I2 R L
第一个项目使得 action[2, = ] 为shift 第二个项目使得 action[2, = ]为reduce，因为 = Follow(R)。 S L=R *R=R 但是，不存在以R=…开始的右句型，只有* R = …开始的右句型。
CcC.,c/d I8
29
算法4.40 规范LR(1)语法分析表的构造
输入：拓广文法G。输出：文法G的规范LR语法分析表函数action和goto。方法： 1. 构造G 的LR(1)项目集规范族C={I0, I1, …, In}。 2. 从Ii构造分析器的状态i，状态i的action函数确定如下：若[A · , b]在Ii中，且goto(Ii, a) = Ij，则置action[i, a a]为“shift j”；若[A · a]在Ii中，且A S，则置action[i, a]为 , “reduce j”，j是产生式A 的序号；若[SS·$]在Ii中，则置action[i, $]为“accept”。 ,
I3
R I6 S L= R S L=R RL I9 id L *R L I3 S L =R = L id I2 R L L * * L * R I5 R L L R L I7 L id R id L * R L *R I8 S' S *
编译原理 20
LR(1)项目[A· a]对可行前缀有效，如果 , 存在着推导 S *rm Aw rm w，其中： 1. = ，且 2. a是w的第一个符号，或者w为且a是$。