编译原理第二章(2-2)

合集下载

编译原理第二章文法和语言

语言的语法结构
总结词
语言的语法结构是语言形成和发展的核心要素，决定了语言的表达方式和意义。
详细描述
语言的语法结构是指语言的组织规律和规则，包括词法、句法、语义等方面的规则。词法规定了词汇的构成和变化规则，如名词、动词、形容词等词类的划分；句法规定了句子结构的规则，如主语、谓语、宾语等句子的成分及其排列顺序；语义则涉及到词汇和句子的意义和解释。语言的语法结构是语言理解和生成的基础，也是语言演变和发展的关键因素。
文法和语言的应用前景
1 2
人工智能领域
文法和语言是人工智能领域的重要基础，可用于自然语言处理、机器翻译、语音识别等技术的研究和应用。
计算机科学教育
文法和语言是计算机科学专业的重要课程之一，对于培养计算机科学人才具有重要意义。
3
软件工程领域
文法和语言可用于软件工程领域中的编译器设计和开发，提高软件开发的效率和可靠性。
05
文法和语言的未来发展
文法和语言的研究方向
形式语言理论
深入研究形式语言的基本理论，包括语法、语义和语用等方面，为自然语言处理和人工智能等领域提供理论基础。
自然语言处理
结合自然语言处理技术，研究自然语言的语法、语义和语用规律，提高自然语言处理的准确性和效率。
计算语言学
将计算语言学与形式语言理论相结合，研究语言处理算法和模型，为机器翻译、语音识别等领域提供技术支持。
文法和语言的发展趋势
深度学习与文法和语言的结合
01
随着深度学习技术的发展，文法和语言的研究将更加注重与深
度学习的结合，以提高语言处理的性能和效率。
跨媒体语言处理
02
随着多媒体数据的普及，文法和语言的研究将逐渐扩展到跨媒

编译原理课件第二章

递归子程序法
递归子程序法：对应每个非终结符语法单元，，编一个独立的处理过程（或子程序）。语法分析从读入第一个单词开始，由非终结符<程序>（即开始符）出发，沿语法描述图箭头所指出的方向进行分析。当遇到非终结符时，则调用相应的处理过程，从语法描述图看，也就进入了一个语法单元，再沿当前所进入的语法单元所指箭头方向继续进行分析。当遇到描述图中是终结符时，则判断当前读入的单词是否与图中的终结符相匹配，若匹配，再读取下一个单词继续分析。遇到分支点时，将当前的单词与分支点上多个终结符逐个相比较，若都不匹配时可能是进入下一个非终结符语法单位或是出错。
N ö í ³ ´
ò ¡ í ó ´ Ó ´ Î
á ÷ ½ Ê
PL/0编译程序语义分析的设计与实现
PL/0编译程序语法、语义分析的的核心程序是BLOCK过程，说明部分的分析与处理表格管理过程体(语句）的分析与处理
jmp jmp int lod lit opr sto opr int opr sto lod lit opr jpc cal lit lod opr opr opr opr sto jmp opr
0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
8 2 3 3 10 2 4 0 5 16 3 3 0 9 24 2 2 4 4 14 15 16 3 11 0
3 5 7 9 10 12 13 14
£ ¹ <
= =
Ç = ²
>
11
=
Ç = ²
, + - ( ¡ ¡
PL/0编译程序语法语义分析
PL/0编译程序语法分析的设计与实现

编译原理第二章文法和语言资料

第二章文法和语言本章讲述目前广泛使用的上下文无关文法。

即用上下文无关文法作为程序设计语言语法的描述工具。

阐明语法的一个工具是文法。

本章将介绍文法和语言的概念。

本章重点：上下文无关文法及其句型分析中的有关问题。

第一节文法的直观概念当我们表述一种语言时，无非是说明这种语言的句子，如果语言只含有有穷多个句子，则只需列出句子的有穷集就行了，但对于有无穷句子的语言来讲，存在着如何给出它的有穷表示的问题。

以自然语言为例，人们无法列出全部句子，但是人们可以给出一些规则，用这些规则来说明（或者定义）句子的组成结构，比如：“我是大学生”。

是汉语的一个句子。

这些规则成为我们判别句子结构合法与否的依据。

一旦有了一组规则以后，我们可以按照如下方式用它们去推导或产生句子。

我们开始去找∷＝左端的带有〈句子〉的规则并把它表示成∷＝右端的符号串，这个动作表示成：〈句子〉⇒〈主语〉〈谓语〉，然后在得到的串〈主语〉〈谓语〉中，选取〈主语〉或〈谓语〉，再用相应的规则∷＝右端代替之。

比如，选取了〈主语〉,并采用规则〈主语〉∷＝〈代词〉，那么得到：〈主语〉〈谓语〉⇒〈代词〉〈谓语〉，重复做下去，我们得到句子：“我是大学生”的全部动作过程是：〈句子〉⇒〈主语〉〈谓语〉⇒〈代词〉〈谓语〉⇒我〈谓语〉⇒我〈动词〉〈直接宾语〉⇒我是〈直接宾语〉⇒我是〈名词〉⇒我是大学生符号⇒的含义是，使用一条规则，代替⇒左边的某个符号，产生⇒右端的符号串。

显然，按照上述办法，不仅生成“我是大学生”这样的句子，还可以生成“王明是大学生”，“王明学习英语”，“我学习英语”，“他学习英语”，“你是工人”，“你学习王明”等几十个句子。

编译原理第二章课件

例1：文法G: S aSb | ab
L(G)={anbn|n≥1}
28
2.2.2 文法的分类
3型文法（又称线性文法、正则文法、正规文法）
➢ 如果对文法G中的任一产生式均限制为形如： AB 或 A
其中： A，B∈VN , ∈VT 则称文法G为3型文法。 ➢ 上述形式的3型文法也称为右线性文法。 ➢ 如果对文法G中的任一产生式均限制为形如：
Ａ0 ＝ { } Ａ1 ＝ { a,b } Ａ2 ＝ AA ＝{ aa,ab,ba,bb } Ａ3 ＝ A2A ＝{ aaa,aab,aba,abb,baa,bab,bba,bbb }
……
Ａn ＝Ａn-1A ＝ AAA……A
12
2.1 基本概念
10.符号串集合的正闭包
设A为符号串的集合，则称Ａ＋为符号串集Ａ的正闭包．具体定义如下：
文法
字符串集合
16
2.2 .1 文法的定义
2.2.1 文法（Grammar）的定义文法的定义
一个文法G是一个四元组: G = ( VN, VT, S, P )
其中：
➢ VT (Terminal Vocabulary)是一个非空的有限集合，
它的每个元素称为终极符号或终极符，一般用小写字母表示。从语法分析的角度看，终极符号是一个语言不可再分的基本符号。
可合并为一个，缩写为:
P 1 | 2 | … | n
其中，每个i 称为 P 的一个候选式，符号“|” 读作“或” 。
21
⑥一个文法的核心是产生式。一般约定:
用< >括起来或大写字母：非终结符不用< >括起来或小写字母：终结符
22
例1
G =（VN,VT, S, P）其中：VN={ S , A}

编译原理―第2章前后文无关文法和语言课件

?一组终结符号不能被替换的符号单词符号?一组非终结符号能够被替换为终结符号或非终结符号语法单位?一个开始符号从这个符号开始替换最大语法单位程序?一组产生式替换规则把左边的字符串替换为右边的字符串222文法和语言的形式定义19?关键思路?从文法的开始符号出发?反复使用产生式对非终结符进行替换展开?直到整个字符串中不再包含非终结符?这时得到了这个文法的一个句子一个程序?这个过程称为推导222文法和语言的形式定义20?文法的形式定义?产生式规则?产生式是一个有序对通常写作或
符号串集合的方幂：设A是符号串的集合，则称Ai为符号串集A的方幂，其中i是非负整数。具体定义如下：
A0 ={ε} A1 =A, A2=AA Ak= AA......A(k个)
11
2.2.1 基本概念和术语
集合的闭包
闭包
集合Σ的闭包Σ*定义如下：Σ*=Σ0∪Σ1∪Σ2∪Σ3∪… 例：设有字母表Σ={0,1}，则
从文法的开始符号出发反复使用产生式，对非终结符进行替换（展开）直到整个字符串中不再包含非终结符这时，得到了这个文法的一个句子（一个程序）这个过程称为推导
19
2.2.2 文法和语言的形式定义
文法的形式定义
产生式（规则）
产生式是一个有序对(α, β)，通常写作α→β（或α::=β）
Σ*=Σ0∪Σ1∪Σ2∪…={ε,0,1,00,01,10,11,000,…}，即Σ*表示Σ上所有有穷长的串的集合。
正闭包
Σ+ = Σ1∪Σ2∪Σ3∪…称为Σ的正闭包。 +表示上的除ε外的所有用穷长串的集合。
Σ*= Σ0∪Σ+ Σ+=ΣΣ*=Σ*Σ
12
2.2.1 基本概念和术语
例题定义标识符是由字母开头、后跟字母或数字的任意组合构成，设A={a,b,…,z}，B={0,1,…,9}，将所有标识符的集合用A和B的运算来表示。

《编译原理》第2章编译基础-形式语言与有穷自动机

整理课件
句型、推导
G[E]： E→E+T|T T→T*F|F F→(E)|a
对于句子a+a*a 有不同的推导
EE+T T+T F+T a+T a+T*F a+F*F a+a*F a+a*a
EE+T E+T*F E+T*a E+F*a E+a*a T+a*a F+a*a a+a*a
整理课件
例：奇偶测试器
0
0
1
q0
q1
∈
1
自动机：Ｍ＝（Q，∑ ，δ ，q0，Z）
Q＝｛ q0, q1}
∑ ={0,1}
q0=q0 Z={q1}
整理课件
映射函数：
δ（ q０,０)= q０ 0
0
δ（ q０,１)= q１
1
δ（ q1,０)= q１ q0
q1
δ（ q1,１)= q０
1
例：０００１１０００１
整理课件
第四节正规文法与有穷自动机 1、正规文法产生的语言的推导例：文法 G=（VN，VT，P，S）其中： VN={A，B，C}
VT={a,b,c} S=A P:A →aB A →aA
B →bB B →bC C →cC C →c
整理课件
A=>aA=>aaA=>…..=>aa…aB =>aa…abB=>aa…abb…bC =>aa…abb…bcC=> aa…abb…bccC => aa…abb…bcc…c
D→ε
Aa→bD
自然语言属于上下文有关文法
整理课件
文法的类型

编译原理chapter2

•12
{ A, B, …, Z, a, b, …, z }, D: { 0, 1, …, 9 }
L D, LD, L6, L*, L(L D )*, D+
2.2 词法记号的描述与识别
2.2.2 正规式正规式用来表示简单的语言，叫做正规集正规式定义的语言 {} {a} 备注
•13
2.1 词法记号及属性
2.1.3 词法错误
词法分析器对源程序采取非常局部的观点难以发现下面的错误 fi (a == f (x) ) … 在实数是a.b格式下，可以发现下面的错误 123. 紧急方式的错误恢复错误修补
•9
回顾
源程序词法分析器记号 (token) 取下一个记号符号表
•25
delim
开始 delim other 22 *
20
21
2.3
有限自动机
•26
语言的识别是一个程序，它取串x作为输入，当x是语言句子的时候，它回答“是”，否则回答“不是”。可以通过构造称为有限自动机的更一般的转换图，把正规式翻译成识别器。有限自动机分为确定和不确定两种情况。“不确定”的含义是，存在这样的状态，对于某个输入符号，它存在不止一种转换。确定和不确定的有限自动机能识别的语言正好是正规式所能 a 表达的语言。
•6
for
relation id
for
< , < = , = , … sum, count, D5 “seg. error”
字符f,o,r
< 或 <= 或 = 或 … 由字母开头的字母数字串
number
literal
3.1, 10, 2.8 E12
任何数值常数

蒋立源编译原理第三版第二章习题与答案(修改后)

第2章习题2-1 设有字母表A1 ={a,b,c,…,z}，A2 ={0,1,…,9}，试回答下列问题：(1) 字母表A1上长度为2的符号串有多少个？(2) 集合A1A2含有多少个元素？(3) 列出集合A1(A1∪A2)*中的全部长度不大于3的符号串。

2-2 试分别构造产生下列语言的文法：（1）{a n b n|n≥0}；（2）{a n b m c p|n,m,p≥0}；（3）{a n#b n|n≥0}∪{c n#d n|n≥0}；（4）{w#w r# | w∈{0,1}*,w r是w的逆序排列 }；（5）任何不是以0打头的所有奇整数所组成的集合；（6）所有由偶数个0和偶数个1所组成的符号串的集合。

2-5 对于下列的文法S→AB|c A→bA|a B→aSb|c试给出句子bbaacb的最右推导，并指出各步直接推导所得句型的句柄；指出句子的全部短语。

2-6 化简下列各个文法(1) S→aABS|bCACd A→bAB|cSA|cCC B→bAB|cSB C→cS|c(2) S→aAB|E A→dDA|e B→bE|fC→c AB|dSD|a D→eA E→fA|g(3) S→ac|bA A→c BC B→SA C→bC|d2-7 消除下列文法中的ε-产生式(1) S→aAS|b A→cS|ε(2) S→aAA A→bAc|dAe|ε2-8 消除下列文法中的无用产生式和单产生式(1) S→aB|BC A→aA|c|aDb B→DB|C C→b D→B(2) S→SA|SB|A A→B|(S)|( ) B→[S]|[ ](3) E→E+T|T T→T*F|F F→P↑F|P P→(E)|i第2章习题答案2-1 答：(1) 26*26=676(2) 26*10=260(3) {a,b,c,...,z, a0,a1,...,a9, aa,...,az,...,zz, a00,a01,...,zzz},共有26+26*36+26*36*36=34658个2-2 解：(1) 对应文法为G(S)=({S},{a,b},{ S→ε| aSb },S)(2) 对应文法为G(S)=({S,X,Y},{a,b,c},{S→aS|X,X→bX|Y,Y→cY|ε },S)(3)对应文法为G(S)=({S,X,Y},{a,b,c,d,#}, {S→X,S→Y,X→aXb|#, Y→cYd|# },S)(4) G(S)=({S,W,R},{0,1,#}, {S→W#, W→0W0|1W1|# },S)(5) G(S)=({S,A,B,I,J},{0,1,2,3,4,5,6,7,8,9},{S→J|IBJ,B→0B|IB|ε, I→J|2|4|6|8, J→1|3|5|7|9},S)(6)对应文法为S→0A|1B|ε，A→0S|1C，B→0C|1S，C→1A|0B2-3 解：(1) 本文法构成的语言集为：L(G)={(10)n ab m a0n|n,m≥0}。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

北京交通大学于双元 4
算法2.1,文法G=(Vn,Vt,P,S)(假定L(G)≠Φ),得到等价文法G1=(Vn①,Vt,P ①,S),对于每个X∈Vn① ,都有 w1∈Vt*,满足X=*>w1; 步骤: (1)分别置Vn①和P①为Φ; (2)对P中的每一个产生式A→δ,若δ∈Vt*,则将A置于 V n①中 ;
B→Bb︱b }
∪{A→aAb︱ab} ∪{B→Bb︱b}
为所求,G[S]与 G1[S]等价.
北京交通大学于双元
17
§2.4.4 文法的其它表示方法
一、扩充的BNF表示 BNF:元符号 < , > , ::=(→), ∣ 扩充的BNF(EBNF): < , > , ::=(→), ∣, ( , ) ,{,},[,] 1、{ }
北京交通大学于双元 21
Vt (2) B ∈Vn
a
B
(3)形如U →x1 |x2 |…… |xn x1 x2 …… xn
北京交通大学于双元 22
X=y1y2……yn
X={y}
y1
y2
… …
yn
y
例：G[Z]: Z →x |(B) x ( Z Z 例C语言中的 <复合语句> { 语句 ;
Wk+1(Ai)=Wk(Ai)∪{D︱C →D ∈P,C∈Wk(Ai),D ∈Vn} k≧1
则必存在一个j,使Wj(Ai)=Wj+1(Ai)=… 令 W(i)=Wj(Ai) (i=1,2,…,n) 即W(i)={B︱Ai*=>B,B ∈Vn} Ai本身在集合中
北京交通大学于双元 15
算法2.6 (2)构造产生式集合
G＇执行算法2.4 得G1 G1[S① ]: S① →cS︱AB︱c︱A︱B︱ε S→ cS︱AB︱c︱A︱B A→aAb︱ab B→Bb︱b 为所求
北京交通大学于双元
14
§2.4.3 单产生式的消除
设G=(Vn,Vt ,P,S)是一文法,假定G中不含ε-产生式, 执行算法2.6得到不含单产生式的文法G′. 算法2.6 (1)设Vn={A1,A2,..,An},对每个Ai(1≦i≦n), 作集合序列 W1(Ai)={Ai}
北京交通大学于双元
10
算法2.５
设G=(Vn,Vt,P,S), 且ε属于L(G)，则按下述算法构造 G1=(Vn①,Vt,P①,S①), 使L(G1)=L(G),且除S ① → ε外, P ①不含另外ε产生式．此外, S ①不出现在任何产生式的右部.
情况1:S不出现在原文法任何产生式的右部设G=(Vn,Vt,P,S), 且ε属于L(G)，S属于W, 执行算法2.4得 G′=(Vn,Vt,P′,S), 但S→ε属于G′ 令P①=P′∪{S→ε}, Vn① = Vn, S① = S 则G1=(Vn①,Vt,P①,S①)为所求.
北京交通大学于双元
9
算法2.4
设G=(Vn,Vt,P,S), 且ε不属于L(G)，则按下述算法构造 G′=(Vn,Vt,P′,S), 使L(G′)=L(G),且不含ε产生式．
①按算法2.3将Vn分为两个不相交的子集，W及Vn－W ②设X →X1X2…Xm是P中的任一产生式，按下述规则将所有形 X→Y1Y2…Ym的产生式放入P′中，对于一切1<=i<=m (ⅰ)若Xi不属于W,即Xi属于（Vn－W）∪Vt,则取Yi=Xi ; (ⅱ)若Xi属于W,则Yi分别取为Xi和ε,即如果Y1Y2…Ym中有j 个符号属于W，则将有２j个形如Y→Y1Y2…Ym的产生式放入P′ 中，但若所有的Xi均属于W,却不能把所有的Yi都取ε 。
北京交通大学于双元 23
B →ZC C →{+Z}
) + }
§2.5 文法和语言的Chomsky分类文法是一个四元组G=（Vn，Vt，P，Z）乔姆斯基根据文法中P的不同，将文法分为四类,每一种文法对应一种语言. 0型文法：文法G中规则呈 α→β α∈V+，β∈V* 也称短语结构文法（PSG）确定的语言为0型语言L0
(不含左递归)
<无符号整数>→<数字> { <数字>} <数字> →0 ∣1 ∣2 ∣3 ∣… … ∣ 9
北京交通大学于双元
19
例: BNF: G[<标识符>] <标识符>→<字母>|<标识符><字母> |<标识符><数字> < >|<标字>|< 数>) <标>→<字字母>→a|b| …>(< |z|A| …|Z <字>→a|b|…|z|A|…|Z <数字>→0|1|2|…|9 <数>→0|1|2|…|9 ENBF:G[<标识符>] 标>=><标>(<字>|< 数 >) > |<数字>} << 标识符>→<字母 >{< 字母 =+><标>(<字>|<数>)…… (<字>|<数>) <字母>→a|b| … |z|A| … |Z (<字>|<数>) =><字>(<字 >|< 数>) …… < > =><字>{(<字 <标数字>→0|1|2| …>|< |9 数>)}
§2.4 文法的化简与改造
§2.4.1 文法的实用限制（无用符号和无用产生式的消除） §2.4.2 ε -产生式的消除 §2.4.3 单产生式的消除 §2.4.4 文法的其它表示方法
北京交通大学于双元
1
§2.4 文法的化简与改造
§2.4.1文法的实用限制 1、不含无用产生式 G[S]: 设G=（Vn，Vt，P，S）是一文法，G中的符号 S →aA A →aA |d x∈Vn∪Vt是有用的，则x 必满足 ①存在α、β∈V*，有S=*> αxβ ②存在ω∈Vt* 使αxβ=*> ω 称符号x是有用的，否则是无用的。
0
0
S
1
1
0 S 1
0 1
3
北京交通大学于双元
3. 无用符号和无用产生式的消除
算法2.1 算法2.2
满足②存在ω∈Vt* 使αxβ=*> ω 满足①存在α、β∈V*，有S=*> αxβ
x∈Vt∪Vn
算法2.1,文法G=(Vn,Vt,P,S)(假定L(G)≠Φ),得到等价文法G1=(Vn①,Vt,P ①,S),对于每个X∈Vn① ,都有 w1∈Vt*,满足X=*>w1; 算法2.2,文法G=(Vn,Vt,P,S)(假定L(G)≠Φ),得到等价文法G′=(Vn′,Vt′,P′,S),对于任一X∈V′,都存在α、 β∈(V′)* ,有S=*> αxβ; x∈Vt′∪Vn′ 消除步骤: 1.对文法G,执行算法2.1得到文法G1; 2.对文法G1,执行算法2.2得到文法G2,为所求.
(3)对P中的每一个产生式A→X1X2…Xm,若每个Xi都属于Vt 或Vn①,则将A置于Vn①中; (4)重复步骤(3),直到Vn①不再增大为止; (5)对P中的每一个产生式B→Y1Y2…Yn,若B及每个Yi都属于Vn①∪Vt,则将此产生式B→Y1Y2…Yn置于P①中.
北京交通大学于双元 5
算法2.2,文法G=(Vn,Vt,P,S)(假定L(G)≠Φ),得到等价文法G′=(Vn′,Vt′,P′,S),对于任一x∈V′,都存在α、 β∈(V′)* ,有S=*> αxβ; 步骤: (1)分别置Vn′、 Vt′和P′为Φ; (2)将文法的开始符号S置于Vn ′中;
无用产生式:产生式的左部或右部含有无用符号。
北京交通大学于双元 2
G[S]: S →aA |Bb A →aA |d B →bB C →cC |d
2、不含有害规则
形如 U→ U 的规则 (原因①不必要②引起二义性) 例：G1[S]：S→0S1|01 G 1无二义性文法 G2[S]：S→0S1|01|S G2二义性文法 L（G1）=L(G2)={0n 1n|n>=1} G2文法句子0011 的两棵不同语法树. S S S
例G[S]:
Vn={S,W,U,V} Vt={a,b,c } P={S→aS︱W︱U, U→a,V→bV︱ac,
对G[S]执行算法2.1得到G1[S]:
Vn①={U,V,S} P①={S→aS︱U, U→a, Vt={a,b,c } G1[S]执行算法2.2得到G2[S] Vn′={S,U} V→bV︱ac }
北京交通大学于双元 8
算法2.3
找出G中满足A=＊>ε的所有A,构成集合W
设G=(Vn,Vt ,P,S) ①作集合W1={A︱A→ε∈P} ②作集合序列Wk+1= Wk∪{B︱B→β∈P且β∈ Wk＋｝显然Wk≦ Wk+1（K>=1), 由于Vn有限，故必存在某i,使得Wi=Wi+1=…., 令W=Wi,对每个A∈W, A=＊>ε 特别：当S∈W,则ε∈L(G);否则，ε不属于L(G).
{t}n {t}
m
t∈V*,
t∈V*,
符号串t自重复n到m次.
符号串t自重复0到无穷次.
北京交通大学于双元 18
例:BNF: G[<无符号整数>]
(含左递归) <无符号整数>→<数字> ∣ <无符号整数> <数字> <数字> →0 ∣1 ∣2 ∣3 ∣… … ∣ 9
扩充的BNF: G[<无符号整数>]