实现LR分析法(P147,例4.6

合集下载

第讲LR分析法

第讲LR分析法LR分析法是一种常用的语法分析方法，可以用于生成语法树，它是自底向上的语法分析方法。

在LR分析法中，L表示“自左向右扫描输入串的方式”，R表示“反向构建和规约的方式”。

LR分析法包括以下几个步骤：1.构造LR(0)项目集规范族：LR(0)项目集是指在一些语法分析的过程中，每个项目表示对应的产生式的哪一部分已经被扫描过了，哪一部分还没有被扫描过。

根据给定的文法，构造出所有可能的项目集，并将它们进行编号，得到项目集规范族。

2.构造LR(0)项目集规范族的DFA：根据构造出的LR(0)项目集规范族，可以构造出一个DFA（确定性有限自动机）来表示LR(0)语法分析的过程。

DFA的每个状态表示一个项目集，每个转移表示在一个状态下扫描一些符号后转移到另一个状态。

3.构造LR(0)分析表：根据构造出的LR(0)项目集规范族的DFA，可以构造出一个分析表，即LR(0)分析表。

分析表的行表示当前状态，列表示当前输入符号，表格中的每个元素表示下一步应该做的动作，可以是移进一些符号，也可以是规约一些项目。

4.进行LR(0)分析：根据构造出的LR(0)分析表，可以进行LR(0)语法分析。

分析的过程是根据当前状态和输入符号，在分析表中查找对应的动作，并执行该动作。

如果遇到移进动作，就将符号加入到解析栈中，同时移动输入指针；如果遇到规约动作，就从解析栈中弹出一些符号，然后根据规约产生式将新的非终结符加入到解析栈中。

5.构造SLR(1)分析表：LR(0)分析表中存在冲突的情况，无法完全正确地进行语法分析。

为了解决这个问题，需要对LR(0)分析表进行优化，得到SLR(1)分析表。

SLR(1)分析表与LR(0)分析表的结构类似，只是在一些冲突的情况下给出更加具体的动作指令。

6.进行SLR(1)分析：根据构造出的SLR(1)分析表，可以进行SLR(1)语法分析。

与LR(0)分析类似，根据当前状态和输入符号，在分析表中查找对应的动作，并执行该动作。

LR语法分析器的实现代码(python)

LR语法分析器的实现代码（python）•构造LR(0)项目集：–构造I的闭包CLOSURE(I)的算法如下：i.I的任何项目都属于CLOSURE(I)；ii.若A→α•Bβ属于CLOSURE(I)，对任何产生式B→γ，B→•γ也属于CLOSURE(I)；iii.重复执行上述两步骤直至CLOSURE(I)不再增大为止。

iv.实现代码如下def get_CLOSURE(tmp): # 生成闭包 CLOSURE = [] for it in tmp:if(it not in CLOSURE): CLOSURE.append(it) x, y = it.split(".") if(y == ""): continue v = y[0] if(v in VN): res = get_VN_gram(v) # 返回非终结符产生的A->.aBb形式 forre in res: if(re not in CLOSURE): CLOSURE.append(re) return CLOSURE–Go(I,a)函数构造算法i.I为当前状态，X为文法符号，J为I中所有形如A->α·Xβ的项目的后续项目所组成的集合，而CLOSURE(J)就是项目集I关于X的后续状态ii.实现代码如下def go(item, v): #生成并返回下一个item tmp = [] for it in item: x, y = it.split(".") if(y!=""): if(y[0] == v): new_it = x + y[0] + "." + y[1:] tmp.append(new_it) if(len(tmp)!=0): new_item = get_CLOSURE(tmp) #print(tmp) #print("go(item, "+v + ") = " + str(new_item)) return new_item–判别LR项目集是否合法：•无移进项目和规约项目并存•无多个规约项目并存•代码如下：def lr_is_legal(: # 判别lr是否合法 has_protocol = 0 #是否存在规约项目 has_shift = 0 #是否存在移进项目 for item in items: for it in item: x, y = it.split(".") if(y ==""): if(has_protocol != 0 or has_shift != 0): return False has_protocol = 1 else: if(y[0] in VT): has_shift = 1 return True•构造LR(0)分析表–构造算法：i.假定项目集规范族C={I0,I1,…,In}。

第七章LR分析法

识别活前缀的DFA
拓广文法G[S]：句子abbcde的可归前缀：
S’ → S[0]
S[0]
S → aAcBe[1] ab[1]
A → b[2]
aAb[3]
A → Ab[3]
aAcd[4]
B → d[4]
aAcBe[1]
识别活前缀及可归前缀的有限自动机
0S 2a
a 5
a 9
14 a
1*
b
3
4
6 A7b
第7章 LR分析法
LR分析法
自底向上分析法的关键是如何在分析过程中确定句柄
LR分析法给出一种能根据当前栈中的符号串进行分析的方法，即：向右查看输入串的 K个符号就可以唯一确定分析器的动作是移进还是归约；用哪个产生式归约。
因而也就能唯一地确定句柄 R 最右推导
规范推导规范句型规范归约
LR分析算法
then begin pop || 令当前栈顶状态为S’ push GOTO[S’,A]和A(进栈)
end else if ACTION[s,a]=acc
then return (成功) else error end.重复
7.2 LR(0)分析
例 G[S]： S aAcBe A b A Ab B d
⇔aAcBe[1]
用(1)规约，前部aAcBe[1]
⇔S
这些前部符号串为归约时在栈里的符号串，规范句型的这种前部称为可归前缀。
可归前缀和子前缀
分析上述每个前部的前缀，对应分别为：
ab[2]
,a,ab
aAb[3] ,a,aA,aAb
aAcd[4] ,a,aA,aAc,aAcd
aAcBe[1] ,a,aA,aAc,aAcB,aAcBe

LR分析方法程序设计原理与实现技术

LR分析⽅法程序设计原理与实现技术LR 分析⽅法程序设计原理与实现技术1郑杰09274053本实验程序中的⼀些约定：在⼯程⽂件main.h中定义所有函数，和数据结构。

在符号⽅⾯，$S定义为拓⼴⽂法的新引⼊的起始符号，$START不能和$S⼀样，并且，为了⽅便，在原来的产⽣式上强⾏加上这么⼀条产⽣式$S $START，这⼀点在main.c中定义⽂法可以看出来，并且该产⽣式加在产⽣式集的⾸要位置。

状态栈的设计引⽤以前程序中的数据结构，但是栈操作在本程序中有所扩展。

下⾯按照程序编写过程顺序介绍各个模块：⼀．⽂法产⽣式扩展由原来的产⽣式拓展成为加’.’的⽂法，并且在这个过程中要引⼊新的起始符号，但是在程序中并没有在这个过程中这么做，原因是因为在原来的产⽣式集中已经引⼊新的符号以及产⽣式，根据原始产⽣式集计算所需要存储新的拓展产⽣式集的所需要的产⽣式个数，然后动态开辟内存空间，再对每个原始产⽣式的各个位置加'.'。

在本次程序中⽤来产⽣拓展⽂法产⽣式集的函数定义如下：PPRO ParseProArray(PPRO lpPriProArr,int iProLen,int *iParsedLen)//参数说明:lpPriProArr:PPRO原始产⽣式集iProLen:int原始产⽣式个数iParsedLen：int*;拓展产⽣式集的个数返回值//返回值:拓展产⽣式集的⾸地址⼆．CLOSURE闭包求取在介绍求⼀个项⽬集的闭包前，先介绍程序中存储项⽬集(状态)的数据结构：typedef struct _ITEM_COLLOECTION{int iCount;//项⽬集合中的产⽣式个数int iSeqNumber;//项⽬集合(状态)的状态号PPRO ProCollection[MAX_ITEM_COUNT];//产⽣式集合的引⽤数组struct _ITEM_COLLOECTION * nextCollection;//由于程序中项⽬集合之间存储组织是单向链表，因此有这个域struct _GO{//GOTO映射数组，byte Symbol;//经历当前符号}ITEM_COLL,*PITEM_COLL;1编译原理第五次实验报告．求解⼀个项⽬集合的CLOSURE闭包的具体⽅法是1.对于给定的项⽬集I,对于I中的的每⼀个产⽣式属于2.对于现有的闭包集合中的产⽣式A-->a.Xb,其中X是⾮终结符，那么对于⽂法拓展的产⽣式X-->.Y均属于CLOSURE(I)。

《编译原理》第7章LR分析法

7.2 LR(0)分析表的构造4．构造LR(0)分析表——举例G[S′]：[0] S′→S [1] S→S(S)[2] S→εG[S]：[1] S→S(S)[2] S→εG[S]：[0] S′→SS′→.SS→.S(S)S→S.(S)S→.S(S) S→.7.3 SLR(1)分析表的构造1．LR(0)方法的不足LR(0)分析表的构造方法实际上隐含了这样一个要求：构造出的识别规范句型活前缀的有穷自动机中，每个状态均不能有冲突项目，这显然对文法的要求太高，也限制了该方法的应用。

7.3 SLR(1)分析表的构造1．LR(0)方法的不足例如，对文法G[S]：0S→E1 E→E+T2 E→T3 T→T*F4 T→F5 F→（E）6 F→i1I S→E.E→E.+TT→.T*F T→.FFT E #)(*+i G[S]：7.3 SLR(1)分析表的构造2．LR(0)方法的问题分析状态{ E→T.，T→T.*F}该状态含有移进-归约冲突，在分析表中表现为重定义。

7.3 SLR(1)分析表的构造2．LR(0)方法的问题①若U→x.ay ∈Ii ，且GO(Ii，a)=Ij，a∈VT，则ACTION[i，a]=“Sj”。

②若S′→S. ∈Ii，则置ACTION[i，＄]=“acc”。

③若U→x. ∈Ii ，则对任意终结符a和＄，均置ACTION[i，a]=“rj”或ACTION[i，＄]=“rj”。

④若GOTO(Ii ，U)=Ij，其中U∈VN，则置GOTO[i，U]=“j”。

⑤除上述方法得到的分析表元素外，其余元素均置“报错标志”。

7.3 SLR(1)分析表的构造3．解决问题的方法所以在状态{ E→T.，T→T.*F}中，只需要向前看下一输入符号是*，还是FOLLOW（E）中的符号，便可解决冲突了。

7.3 SLR(1)分析表的构造3．解决问题的方法假设一个状态Ii中含有冲突项目I i ={ U1→x.b1y1，U2→x.b2y2，…，Um→x.bmym，V1→x.，V 2→x.，…，Vn→x.}若{b1，b2，…，bm}和FOLLOW(V1)、FOLLOW(V2)、…、FOLLOW(Vn)两两互不相交，就可以采用向前看一个输入符号的方法来解决状态中的冲突。

LR分析法

10
LR驱动程序算法流程
开始 •0入状态栈; •‘#’入符号栈; •ip指向w#的第一个符号 ; •令S是状态栈栈顶; •a是ip指向的符号;
a入符号栈; 状态j入状态栈; 使ip指向下一个符号;
初始化
直到(ip指向输入串的尾部# AND 符号栈栈顶为S);
执行ACTION[s,a]
移入
8
-移进Shift:
表示:ACTION[i,a]=Sj 动作:状态j和输入符号a分别入符号栈和状态栈，输入串向前进一字符。
-归约reduce:
表示:ACTION[i,a]=rk 其中: k表示第k个产生式。动作:设第k个产生式右部长度为m, 左边非终结符为A,距状态栈栈顶m个位置的状态为p。 1、从符号栈和状态栈中分别弹出 m个符号; 2、非终结符A入符号栈; 3、GOTO[p,A]=q 入状态栈。
2
(1)LR（K）分析法定义
LR(k)分析法意义 - “L”是指从左至右扫描输入符号串， - “R”是指构造一个最右推导的逆过程， - “k”是指为了作出分析决定而向前看的输入符号的个数。
3
（2）LR分析法的特点
LR分析器（程序）基本上可以识别所有上下文无关文
法写的编程语言结构，分析能力强且适用范围广
16
活前缀和句柄的关系：
约定：β为该句型的句柄，对应产生式为A→β， β= β1β2 1. 活前缀不含有句柄的任何符号，此时期望 A→β的右部所推出的符号串。 2.活前缀只含句柄的一部分符号，表明 A→β1β2的右部子串β1已出现在栈顶，期待从输入串中看到β2推出的符号。 3.活前缀已含有句柄的全部符号，表明产生式 A→β的右部β已出现在栈顶。如：右句型aAbcde的活前缀ε,a,aA,aAb 其中： ε,a不含有句柄的任何符号； aA只含句柄的一部分符号； aAb含有句柄的全部符号。

编译原理LR分析法

编译原理LR分析法
编译原理是研究如何将高级语言程序转换成等价的低级机器语言程序的学科， LR分析法是其中一种重要的语法分析方法。
何为编译原理
编译原理是计算机科学的一个分支，研究将高级语言程序转换为等价的底层机器代码的过程。它涉及词法分析、语法分析、语义分析、优化和代码生成等多个阶段。
LR分析法的概述
LR分析法的步骤
1
1. 构建LR项集族
基于文法的产生式，生成LR(0)项集族，
2. 构建LR分析表
2
包括起始项集和其它项集。
根据LR项集族和文法的终结符和非终结
符，构建LR分析表，包括移进、规约和
接受操作。Leabharlann 33. 进行语法分析
使用构建的LR分析表，对输入的符号串进行逐步解析，直到接受或出错。
构建LR分析表
项集的闭包
通过对项集进行闭包运算，计算出项集中的所有项。
项集的转移
根据项目集的状态和接收符号，进行项集的状态转移。
规约项的处理
确定规约的产生式和规约动作，构建规约表。
LR分析表的使用
使用构建的LR分析表，可进行能够解析输入符号串的自底向上语法分析。它根据输入符号和栈顶符号，执行移进、规约或接受操作来推导和验证语法结构。
优缺点和应用
优点
具有广泛适用性，支持大多数上下文无关文法。解析效率高，能够快速生成语法树。
缺点
对于某些复杂的语法，可能需要构建大型的分析表。编写LR分析器的难度较高。
应用
LR分析法被广泛用于编译器设计、解析器生成器和语法分析工具的开发中。
LR分析法是一种自底向上的语法分析方法，用于构建一个确定性的有限状态自动机（LR自动机）以解析各种语法结构。它具有广泛的应用，包括编译器设计和语法分析工具的开发。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

实验二、语法分析实验
实现LR分析法（P147,例4.6）
或预测分析法（P121,例4.3）
1．实验目的
实现LR分析法（P147,例4.6）
（1）掌握LR(1)分析法的基本原理；
（2）掌握LR(1)分析表的构造方法；
（3）掌握LR(1)驱动程序的构造方法。

2．实验原理
（1）严格地进行最左归约（识别句柄并归约它）。

（2）将识别句柄的过程划分为由若干状态控制，每个状态控制识别出句柄的一个符号。

（3）分析栈：存放已识别的文法符号和状态,描述的是分析过程中的历史和展望信息；
（4）由一个总控程序来控制整个识别过程。

3．主要仪器设备
操作系统：WindowsXP
开发语言：Visual C++6.0
4．主要内容和步骤
对下列文法，用LR(1)分析法对任意输入的符号串进行分析：
（1）L->E，L（2）L->E（3）E->a（4）E->b
（1）将初始状态S0和输入串的左边界(#) 分别进分析栈；
（2）根据状态栈栈顶和当前输入符号查动作表进行如下工作;
移进:若动作表中对应“移进”，那么当前输入符号进符号栈，并据状态转换表查得输入符号所对应的新的状态进状态栈，继续扫描，即下一个输入符号变成当前得输入符号；
归约:若动作表中对应“归约”，则按指定产生式进行归约，若产生式右部的符号串长度为n，则符号栈栈顶的n个符号为句柄，所以符号栈栈顶n个符号出栈，同时，状态栈顶的n个元素也出栈，归约后的文法符号(非终结符)进符号栈，并据状态转换表查归约后的文法符号所对应的新状态进状态栈；
接受:若动作表中对应“acc”，则分析成功；
出错:若动作表中对应空白，则报告错误信息。

（3）重复以上(2)的工作直到接受或出错为止。

5．软件编程与设计
#include<stdio.h>
#include<string.h>
char *action[7][4]={"S3#","S4#",NULL,NULL, /*ACTION表*/
NULL,NULL,NULL,"acc",
NULL,NULL,"S5#","r2#",
NULL,NULL,"r3#","r3#",
NULL,NULL,"r4#","r4#",
"S3#","S4#",NULL,NULL,
NULL,NULL,NULL,"r1#"};
int goto1[7][2]={
1,2, /*GOTO表*/
0,0,
0,0,
0,0,
0,0,
6,2,
0,0
};
char vt[4]={'a','b',',','#'}; /*存放非终结符*/ char vn[2]={'L','E'}; /*存放终结符*/ char *LR[4]={"L->E,L#","E->a#","L->E#","E->b#"};/*存放产生式*/ int a[7];
char b[7],c[7],c1;
int top1,top2,top3,top,m,n;
void main(){
int g,h,i,j,k,l,p,y,z,count;
char x,copy[7],copy1[7];
top1=0;top2=0;top3=0;top=0;
a[0]=0;y=a[0];b[0]='#';
count=0;z=0;
printf("----------请输入表达式----------\n");
/*输出状态栈、输出符号栈、输出输入串*/
do{
scanf("%c",&c1);
c[top3]=c1;
top3=top3+1;
}while(c1!='#');
printf("步骤\t状态栈\t\t符号栈\t\t输入串\t\tACTION\tGOTO\n"); do{
y=z;m=0;n=0; /*y,z指向状态栈栈顶*/ g=top;j=0;k=0;
x=c[top];
count++;
printf("%d\t",count);
while(m<=top1){ /*输出状态栈*/
printf("%d",a[m]);
m=m+1;
}
printf("\t\t");
while(n<=top2){ /*输出符号栈*/ printf("%c",b[n]);
n=n+1;
}
printf("\t\t");
while(g<=top3){ /*输出输入串*/ printf("%c",c[g]);
g=g+1;
}
printf("\t\t");
while(x!=vt[j]&&j<=2) j++;
if(j==2&&x!=vt[j]){
printf("error\n");
return;
}
if(action[y][j]==NULL){
printf("error\n");
return;
}
else
strcpy(copy,action[y][j]);
if(copy[0]=='S'){ /*处理移进*/ z=copy[1]-'0';
top1=top1+1;
top2=top2+1;
a[top1]=z;
b[top2]=x;
top=top+1;
i=0;
while(copy[i]!='#'){
printf("%c",copy[i]);
i++;
}
printf("\n");
}
if(copy[0]=='r'){ /*处理归约*/ i=0;
while(copy[i]!='#'){
printf("%c",copy[i]);
i++;
}
h=copy[1]-'0';
strcpy(copy1,LR[h]);
while(copy1[0]!=vn[k]) k++;
l=strlen(LR[h])-4;
top1=top1-l+1;
top2=top2-l+1;
y=a[top1-1];
p=goto1[y][k];
a[top1]=p;
b[top2]=copy1[0];
z=p;
printf("\t");
printf("%d\n",p);
} }
while(action[y][j]!="acc");
printf("acc\n");
getchar();
}
6．程序测试结果
7．问题与建议
在对实验分析的时候，也遇到很多的问题，刚开始根本想不到用程序怎么实现这么繁杂的LR（1）文法，后来看了程序才知道，才转过来弯，通过对这个程序的分析与揣摩，让自己对这方面文法的实现有了一定的头绪，对以后的的一些文法的程序实现会有很大的帮助，通过练习我也感到仅留在理论是远远不行的，通过一定方式实现才有实用价值。