LR语法分析器的实现代码(python)

合集下载

《编译原理》中LR(0)语法分析动态演示系统分析与设计

《编译原理》中LR(0)语法分析动态演示系统分析与设计

《编译原理》中LR(0)语法分析动态演示系统分析与设计1. 引言1.1 研究背景编译原理是计算机科学领域的重要基础课程,而LR(0)语法分析是编译原理中一个关键的内容。

LR(0)语法分析是一种自底向上的语法分析方法,能够准确地判断一个输入串是否是给定文法的句子,同时可以生成句子对应的语法树。

LR(0)语法分析比上下文无关文法分析更为强大,因此被广泛应用于编译器的设计和实现中。

对于学习者来说,理解和掌握LR(0)语法分析并不是一件容易的事情。

传统的教学方法往往是通过讲解和演示来进行,但存在一定的局限性,学生很难深入理解其中的逻辑和原理。

设计一个LR(0)语法分析动态演示系统是十分必要和有意义的。

这样的系统可以通过图形化的界面展示LR(0)语法分析的每个步骤和过程,帮助学生更直观地理解LR(0)语法分析的原理和实现。

1.2 研究目的研究目的是为了通过设计和实现一个LR(0)语法分析动态演示系统,帮助学生和从业者更好地理解和应用LR(0)语法分析算法。

具体来说,研究目的包括但不限于以下几点:通过分析LR(0)语法分析算法的原理和流程,深入探讨其在编译原理中的重要性和应用价值,为用户提供一个直观、动态的学习工具,帮助他们更好地理解和掌握这一算法的核心概念。

通过设计和实现一个功能齐全、易于操作的LR(0)语法分析动态演示系统,提供用户友好的界面和交互功能,使用户可以通过实际操作和观察,加深对LR(0)语法分析算法的认识,并在实践中掌握其使用方法和技巧。

通过系统测试和优化,不断改进系统性能和用户体验,确保系统稳定运行并具有良好的可用性和可靠性,为用户提供一个高质量的学习工具和应用工具。

通过这些努力,旨在提高用户对LR(0)语法分析算法的理解和应用能力,促进编译原理领域的教学和研究工作的发展。

1.3 研究意义编译原理是计算机专业的重要基础课程,而LR(0)语法分析是编译原理中一项重要的内容。

通过设计和实现一个LR(0)语法分析动态演示系统,可以帮助学生更加直观地理解和掌握LR(0)语法分析的原理和算法。

编译原理词法分析器-ll1-lr0-python实现代码

编译原理词法分析器-ll1-lr0-python实现代码

编译原理词法分析器-ll1-lr0-python实现代码计算机科学与通信工程学院编译原理实验报告题目: 1.词法分析器2. LL(1)分析器3. LR(0)分析器班级:姓名:学号:指导老师:2017年月目录一、实验题目 (1)二、实验目的和要求 (1)三、代码实现 (2)四、总结 (25)一、实验题目1.词法分析器分析一段程序代码,将代码中的单词符号分解出来,并对其进行检查,输出token表和error表2.LL(1)文法分析器分析给定文法。

求出文法的FIRST集,FOLLOW集,并构建分析表,对给定输入串进行分析。

3.LR(0)文法分析器分析给定文法。

用Ꜫ_CLOSURE方法构造文法的LR(0)项目集规范族,根据状态转换函数GO构造出文法的DFA,并转换为分析表,对给定输入串进行分析。

二、实验目的和要求1.学会词法分析器的实现思路。

2.学会求解FIRST集, FOLLOW集,构造LL(1)分析表。

3.学会Ꜫ_CLOSURE方法,状态转换函数GO, 构造LR(0)分析表。

三、代码实现1.词法分析器program.txt 中存放要分析的文法:E->TRR->+TR|-TR|~T->FGG->*FG|/FG|~F->(E)|i代码:KEYWORD_LIST = ['while', 'if', 'else', 'switch', 'case']SEPARATOR_LIST = [';', ':', ',', '(', ')', '[', ']', '{', '}']OPERATOR_LIST1 = ['+', '-', '*']OPERATOR_LIST2 = ['<=', '<', '==', '=', '>', '>=']CATEGORY_DICT = {# KEYWORD"while": {"while": ""},"if": {"if": ""},"else": {"else": ""},"switch": {"switch": ""},"case": {"case": ""},# OPERATOR"+": {"+": ""},"-": {"-": ""},"*": {"*": ""},"<=": {"relop": "LE"},"<": {"relop": "LT"},">=": {"relop": "GE"},">": {"relop": "GT"},"==": {"relop": "EQ"},"=": {"=": ""},# SEPARATOR";": {";": ""},":": {":": ""},",": {",": ""},"(": {"(": ""},")": {")": ""},"[": {"]": ""},"]": {"]": ""},"{": {"{": ""},"}": {"}": ""},}CONSTANTTABLE = []TOKENTABLE = []OPERATORTABLE = []KEYWORDTABLE = []SEPARATORTABLE = []UNDEFINEDTABLE = []# READ FILEdef read_file(path, method):temp_str = ""try:file = open(path, method)for line in file:line = line.replace('\n', " ") temp_str += linetemp_str = str(temp_str)except IOError as e:print(e)exit()finally:file.close()return temp_str.strip() + " "# GETBEdef getbe():global tokengetchar()token = ""return# GETCHARdef getchar():global characterglobal locationwhile all_string[location] == " ":location = location + 1character = all_string[location]return character# LINK TOKENdef concatenation():global tokenglobal charactertoken = token + character# IS NUMBERdef digit():if '0' <= character <= '9':return Truereturn False# IS ALPHABETdef letter():if 'A' <= character <= 'Z' or 'a' <= character <= 'z': return Truereturn False# IS IDENTIFIERdef reserve():if token in KEYWORD_LIST:return CATEGORY_DICT[token]else:return 0# RETRACTdef retract():global locationglobal character# location = location - 1character = ""return# MAIN FUNCTIONdef main():global tokenglobal characters = getchar()getbe()if 'a' <= s <= 'z' or 'A' <= s <= 'Z':while letter() or digit():concatenation()location = location + 1character = all_string[location]retract()c = reserve()if c == 0:TOKENTABLE.append(token)print("这是标识符:{'", token, "':'", TOKENTABLE.index(token), "'}") else:KEYWORDTABLE.append(token)print("这是保留字:", CATEGORY_DICT[token])elif '0' <= s <= '9':while digit():concatenation()location = location + 1character = all_string[location]retract()CONSTANTTABLE.append(token)print("这是常数:{'", token, "':'", CONSTANTTABLE.index(token), "'}") elif s in OPERATOR_LIST1:location = location + 1OPERATORTABLE.append(s)print("这是单操作符:", CATEGORY_DICT[s])elif s in OPERATOR_LIST2:location = location + 1character = all_string[location]if character == '=':OPERATORTABLE.append(s + character)print("这是双操作符:", CATEGORY_DICT[s + character])else:retract()location = location + 1OPERATORTABLE.append(s)print("这是单操作符:", CATEGORY_DICT[s])elif s in SEPARATOR_LIST:location = location + 1SEPARATORTABLE.append(s)print("这是分隔符:", CATEGORY_DICT[s])else:UNDEFINEDTABLE.append(s)print("error:undefined identity :'", s, "'")if __name__ == '__main__':character = ""token = ""all_string = read_file("program.txt", "r")location = 0while location + 1 < len(all_string):main()print('KEYWORDTABLE:', KEYWORDTABLE)print('TOKENTABLE:', TOKENTABLE)print('CONSTANTTABLE:', CONSTANTTABLE)print('OPERATORTABLE:', OPERATORTABLE)print('SEPARATORTABLE:', SEPARATORTABLE)运行结果:2.LL(1)分析器program.txt 中存放要分析的文法:E->TRR->+TR|-TR|~T->FGG->*FG|/FG|~F->(E)|i输入串:i+i*i代码:NonTermSet = set() # 非终结符集合TermSet = set() # 终结符集合First = {} # First集Follow = {} # Follow集GramaDict = {} # 处理过的产生式Code = [] # 读入的产生式AnalysisList = {} # 分析表StartSym = "" # 开始符号EndSym = '#' # 结束符号为“#“Epsilon = "~" # 由于没有epsilon符号用“~”代替# 构造First集def getFirst():global NonTermSet, TermSet, First, Follow, FirstAfor X in NonTermSet:First[X] = set() # 初始化非终结符First集为空for X in TermSet:First[X] = set(X) # 初始化终结符First集为自己Change = Truewhile Change: # 当First集没有更新则算法结束Change = Falsefor X in NonTermSet:for Y in GramaDict[X]:k = 0Continue = Truewhile Continue and k < len(Y):if not First[Y[k]] - set(Epsilon) <= First[X]: # 没有一样的就添加,并且改变标志if Epsilon not in First[Y[k]] and Y[k] in NonTermSet and k > 0: # Y1到Yi候选式都有~存在Continue = Falseelse:First[X] |= First[Y[k]] - set(Epsilon)Change = Trueif Epsilon not in First[Y[k]]:Continue = Falsek += 1if Continue: # X->~或者Y1到Yk均有~产生式First[X] |= set(Epsilon)# FirstA[Y] |= set(Epsilon)# 构造Follow集def getFollow():global NonTermSet, TermSet, First, Follow, StartSymfor A in NonTermSet:Follow[A] = set()Follow[StartSym].add(EndSym) # 将结束符号加入Follow[开始符号]中Change = Truewhile Change: # 当Follow集没有更新算法结束Change = Falsefor X in NonTermSet:for Y in GramaDict[X]:for i in range(len(Y)):if Y[i] in TermSet:continueFlag = Truefor j in range(i + 1, len(Y)): # continueif not First[Y[j]] - set(Epsilon) <= Follow[Y[i]]:Follow[Y[i]] |= First[Y[j]] - set(Epsilon) # 步骤2 FIRST(β)/~ 加入到FOLLOW(B)中。

语法法分析实验报告

语法法分析实验报告

一、实验目的1. 理解语法分析的基本概念和原理。

2. 掌握语法分析器的构建方法。

3. 培养实际操作能力,提高编程水平。

二、实验环境1. 操作系统:Windows 102. 编程语言:Python3.83. 开发工具:PyCharm三、实验内容1. 语法分析概述2. 词法分析3. 语法分析4. 实验实现四、实验步骤1. 语法分析概述(1)了解语法分析的定义、作用和意义。

(2)掌握语法分析的基本原理和流程。

2. 词法分析(1)编写词法分析器代码,将源代码分解成单词序列。

(2)实现词法分析器的各个功能,如:识别标识符、关键字、运算符等。

3. 语法分析(1)设计语法分析器,将单词序列转换为抽象语法树(AST)。

(2)实现语法分析器的各个功能,如:识别表达式、语句、函数等。

4. 实验实现(1)创建Python项目,导入相关库。

(2)编写词法分析器代码,实现单词序列的分解。

(3)编写语法分析器代码,实现抽象语法树的构建。

(4)测试语法分析器,验证其正确性。

五、实验结果与分析1. 词法分析结果实验中,我们成功地将源代码分解成单词序列,包括标识符、关键字、运算符等。

词法分析器的输出结果如下:```identifier: akeyword: intoperator: +identifier: boperator: =integer: 5```2. 语法分析结果通过语法分析器,我们将单词序列转换成抽象语法树。

以下是一个示例的抽象语法树:```Program├── Declaration│ ├── Type│ │ ├── Identifier│ │ └── Integer│ └── Identifier│ └── a└── Statement├── Expression│ ├── Identifier│ └── a└── Operator└── =└── Expression├── Identifier└── b└── Integer└── 5```从实验结果可以看出,我们的语法分析器能够正确地将源代码转换为抽象语法树。

语法分析代码2(LR分析器 C语言实现)

语法分析代码2(LR分析器 C语言实现)

#include"status_stack.h"#include"symbol_instr_stack.h"#include"lr.h"//打印LR分析器的工作过程void print(status *status_p,symbol_instr *symbol_p,symbol_instr *instr_p) {int i;out_stack(status_p);for(i=0;i<20-status_p->top;i++)printf(" ");out_stack1(symbol_p);for(i=0;i<20;i++)printf(" ");out_stack2(instr_p);printf("\n");}//状态转换函数int goto_char(status *status_p,symbol_instr *instr_p){char x;int y,z;x = get_top(instr_p);y = get_top(status_p);z = get_index_char(x);return table[y][z];}//移进--规约函数void action(status *status_p,symbol_instr *symbol_p,symbol_instr *instr_p) {int i,j,x;char a;i = goto_char(status_p,instr_p);//规约出错if(i == -1)printf("\n===============规约出错!================\n");//规约成功if(i == 12)printf("\n===============规约成功!================\n");//移进动作if(i>=0 && i<=11){push(status_p,i);a = pop(instr_p);push(symbol_p,a);print(status_p,symbol_p,instr_p);action(status_p,symbol_p,instr_p);}//规约动作if(i>=21 && i<=26){x = r[i-21].y;for(j=0;j<x;j++){pop(status_p);pop(symbol_p);}push(instr_p,r[i-21].x);action(status_p,symbol_p,instr_p);}}int main(){char x;//分配空间status *status_p;symbol_instr *symbol_p,*instr_p ;status_p = (status *)malloc(sizeof(status));symbol_p = (symbol_instr *)malloc(sizeof(symbol_instr));instr_p = (symbol_instr *)malloc(sizeof(symbol_instr));//初始化各栈init_stack(status_p);init_stack(symbol_p);init_stack(instr_p);//压进栈初始元素push(status_p,0);//push(symbol_p,'#');////输入表达式printf("\n请输入要规约的输入串,各字符之间不能有空格,以'#'字符结束!\n");printf("===========Expression =");//先将输入串压进符号栈do{scanf("%c",&x);push(symbol_p,x);}while(x != '#');//然后由符号栈弹出,压进输入栈while( symbol_p->top != 0){x = pop(symbol_p);push(instr_p,x);}printf("\n\n");//打印框架printf("\n状态栈==============符号栈==============输入串\n");print(status_p,symbol_p,instr_p);//打印初始分析表//移进,规约,并打印每一步分析过程action(status_p,symbol_p,instr_p);return 0;}。

第讲LR分析法

第讲LR分析法

第讲LR分析法LR分析法是一种常用的语法分析方法,可以用于生成语法树,它是自底向上的语法分析方法。

在LR分析法中,L表示“自左向右扫描输入串的方式”,R表示“反向构建和规约的方式”。

LR分析法包括以下几个步骤:1.构造LR(0)项目集规范族:LR(0)项目集是指在一些语法分析的过程中,每个项目表示对应的产生式的哪一部分已经被扫描过了,哪一部分还没有被扫描过。

根据给定的文法,构造出所有可能的项目集,并将它们进行编号,得到项目集规范族。

2.构造LR(0)项目集规范族的DFA:根据构造出的LR(0)项目集规范族,可以构造出一个DFA(确定性有限自动机)来表示LR(0)语法分析的过程。

DFA的每个状态表示一个项目集,每个转移表示在一个状态下扫描一些符号后转移到另一个状态。

3.构造LR(0)分析表:根据构造出的LR(0)项目集规范族的DFA,可以构造出一个分析表,即LR(0)分析表。

分析表的行表示当前状态,列表示当前输入符号,表格中的每个元素表示下一步应该做的动作,可以是移进一些符号,也可以是规约一些项目。

4.进行LR(0)分析:根据构造出的LR(0)分析表,可以进行LR(0)语法分析。

分析的过程是根据当前状态和输入符号,在分析表中查找对应的动作,并执行该动作。

如果遇到移进动作,就将符号加入到解析栈中,同时移动输入指针;如果遇到规约动作,就从解析栈中弹出一些符号,然后根据规约产生式将新的非终结符加入到解析栈中。

5.构造SLR(1)分析表:LR(0)分析表中存在冲突的情况,无法完全正确地进行语法分析。

为了解决这个问题,需要对LR(0)分析表进行优化,得到SLR(1)分析表。

SLR(1)分析表与LR(0)分析表的结构类似,只是在一些冲突的情况下给出更加具体的动作指令。

6.进行SLR(1)分析:根据构造出的SLR(1)分析表,可以进行SLR(1)语法分析。

与LR(0)分析类似,根据当前状态和输入符号,在分析表中查找对应的动作,并执行该动作。

词法分析实验报告代码

词法分析实验报告代码

一、实验目的1. 理解词法分析的概念和作用。

2. 掌握词法分析器的设计和实现方法。

3. 通过实验加深对编译原理中词法分析阶段的理解。

二、实验环境1. 操作系统:Windows 102. 编程语言:Python3.83. 开发工具:PyCharm三、实验内容1. 设计一个简单的词法分析器,能够识别并输出源代码中的单词。

2. 实现词法分析器的关键功能,包括:- 字符串预处理- 单词识别- 生成词法分析表四、实验步骤1. 字符串预处理- 读取源代码字符串。

- 移除字符串中的空白字符(空格、制表符、换行符等)。

- 转义字符串中的特殊字符。

2. 单词识别- 使用正则表达式匹配单词。

- 根据正则表达式匹配结果,将单词分类为关键字、标识符、常量等。

3. 生成词法分析表- 创建一个列表,用于存储词法分析表中的每个单词及其对应的类别。

- 遍历源代码字符串,将识别出的单词添加到词法分析表中。

五、实验代码```pythonimport re# 定义词法分析表结构class Token:def __init__(self, type, value):self.type = typeself.value = value# 单词识别函数def tokenize(source_code):# 移除空白字符source_code = re.sub(r'\s+', '', source_code)# 转义特殊字符source_code = re.sub(r'\\', '\\\\', source_code)# 使用正则表达式匹配单词tokens = re.findall(r'\b\w+\b', source_code)# 生成词法分析表token_table = []for token in tokens:if re.match(r'\bint\b', token):token_table.append(Token('KEYWORD', token))elif re.match(r'\bfloat\b', token):token_table.append(Token('KEYWORD', token))elif re.match(r'\bchar\b', token):token_table.append(Token('KEYWORD', token))elif re.match(r'\bif\b', token):token_table.append(Token('KEYWORD', token))elif re.match(r'\belse\b', token):token_table.append(Token('KEYWORD', token))elif re.match(r'\breturn\b', token):token_table.append(Token('KEYWORD', token))elif re.match(r'\b\w+\b', token):token_table.append(Token('IDENTIFIER', token)) else:token_table.append(Token('CONSTANT', token)) return token_table# 主函数def main():# 读取源代码source_code = '''int main() {int a = 10;float b = 3.14;char c = 'A';if (a > b) {return a;} else {return b;}}'''# 进行词法分析token_table = tokenize(source_code)# 输出词法分析结果for token in token_table:print(f'Type: {token.type}, Value: {token.value}') if __name__ == '__main__':main()```六、实验结果运行实验代码后,输出如下:```Type: KEYWORD, Value: intType: IDENTIFIER, Value: mainType: KEYWORD, Value: (Type: KEYWORD, Value: )Type: KEYWORD, Value: intType: IDENTIFIER, Value: a Type: KEYWORD, Value: = Type: CONSTANT, Value: 10 Type: KEYWORD, Value: ; Type: KEYWORD, Value: float Type: IDENTIFIER, Value: b Type: KEYWORD, Value: = Type: CONSTANT, Value: 3.14 Type: KEYWORD, Value: ; Type: KEYWORD, Value: char Type: IDENTIFIER, Value: c Type: KEYWORD, Value: = Type: CONSTANT, Value: A Type: KEYWORD, Value: ; Type: KEYWORD, Value: if Type: IDENTIFIER, Value: ( Type: IDENTIFIER, Value: a Type: KEYWORD, Value: > Type: IDENTIFIER, Value: b Type: KEYWORD, Value: ) Type: KEYWORD, Value: { Type: KEYWORD, Value: return Type: IDENTIFIER, Value: aType: KEYWORD, Value: ;Type: KEYWORD, Value: }Type: KEYWORD, Value: elseType: KEYWORD, Value: {Type: KEYWORD, Value: returnType: IDENTIFIER, Value: bType: KEYWORD, Value: ;Type: KEYWORD, Value: }```七、实验总结通过本次实验,我们成功地设计并实现了一个简单的词法分析器,能够识别并输出源代码中的单词。

实验5---语法分析器(自下而上):LR(1)分析法

实验5---语法分析器(自下而上):LR(1)分析法

实验5---语法分析器(自下而上):LR(1)分析法一、实验目的构造LR(1)分析程序,利用它进行语法分析,判断给出的符号串是否为该文法识别的句子,了解LR(K)分析方法是严格的从左向右扫描,和自底向上的语法分析方法。

二、实验内容程序输入/输出示例(以下仅供参考):对下列文法,用LR(1)分析法对任意输入的符号串进行分析:(1)E->E+T(2)E->E—T(3)T->T*F(4)T->T/F(5)F-> (E)(6)F->i输出的格式如下:(1)LR(1)分析程序,编制人:姓名,学号,班级(2)输入一个以#结束的符号串(包括+—*/()i#):在此位置输入符号串(3)输出过程如下:3.对学有余力的同学,测试用的表达式事先放在文本文件中,一行存放一个表达式,同时以分号分割。

同时将预期的输出结果写在另一个文本文件中,以便和输出进行对照。

三、实验方法1.实验采用C++程序语言进行设计,文法写入程序中,用户可以自定义输入语句;2.实验开发工具为DEV C++。

四、实验步骤1.定义LR(1)分析法实验设计思想及算法①若ACTION[sm , ai] = s则将s移进状态栈,并把输入符号加入符号栈,则三元式变成为:(s0s1…sm s , #X1X2…Xm ai , ai+1…an#);②若ACTION[sm , ai] = rj则将第j个产生式A->β进行归约。

此时三元式变为(s0s1…sm-r s , #X1X2…Xm-rA , aiai+1…an#);③若ACTION[sm , ai]为“接收”,则三元式不再变化,变化过程终止,宣布分析成功;④若ACTION[sm , ai]为“报错”,则三元式的变化过程终止,报告错误。

2.定义语法构造的代码,与主代码分离,写为头文件LR.h。

3.编写主程序利用上文描述算法实现本实验要求。

五、实验结果1. 实验文法为程序既定的文法,写在头文件LR.h中,运行程序,用户可以自由输入测试语句。

语法树解析 python

语法树解析 python

语法树解析python在自然语言处理领域,语法树发挥着至关重要的作用。

它是句子结构的一种树状表示,能帮助我们更好地理解句子的语法结构和意义。

Python作为一门流行的编程语言,拥有丰富的自然语言处理库,可以方便地进行语法树的解析。

本文将详细介绍如何使用Python进行语法树解析。

一、什么是语法树?语法树(Syntax Tree),又称作句法树,是源代码、自然语言句子等结构的一种抽象语法结构的树状表示。

在自然语言处理中,语法树能够清晰地展示句子的成分结构,如主语、谓语、宾语等,以及它们之间的关系。

二、Python中的语法树解析在Python中,可以使用自然语言处理库(如NLTK、spaCy等)进行语法树的解析。

以下以NLTK库为例,介绍如何实现语法树的解析。

1.安装NLTK库首先,需要安装NLTK库。

在命令行执行以下命令:```pip install nltk```2.使用NLTK解析语法树(1)导入所需模块```pythonimport nltkfrom nltk import CFGfrom nltk.parse import ChartParser```(2)定义语法规则使用上下文无关文法(CFG)定义语法规则。

```pythongrammar = CFG.fromstring("""S -> NP VPVP -> V NPNP -> "I" | "you"V -> "love"""")```(3)创建解析器```pythonparser = ChartParser(grammar)```(4)解析句子将句子转换为词列表,然后使用解析器进行解析。

```pythonsentence = "I love you".split()trees = list(parser.parse(sentence))```(5)显示语法树```pythonfor tree in trees:tree.pretty_print()```三、总结通过使用Python中的自然语言处理库,如NLTK,我们可以方便地进行语法树的解析。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

LR语法分析器的实现代码(python)
•构造LR(0)项目集:
–构造I的闭包CLOSURE(I)的算法如下:
i.I的任何项目都属于CLOSURE(I);
ii.若A→α•Bβ属于CLOSURE(I),对任何产生式B→γ,B→•γ也属于CLOSURE(I);
iii.重复执行上述两步骤直至CLOSURE(I)不再增大为止。

iv.实现代码如下
def get_CLOSURE(tmp): # 生成闭包 CLOSURE = [] for it in tmp:
if(it not in CLOSURE): CLOSURE.append(it) x, y = it.split
(".") if(y == ""): continue v = y[0] if(v in VN): r
es = get_VN_gram(v) # 返回非终结符产生的A->.aBb形式 for
re in res: if(re not in CLOSURE): CLOSURE.append(r
e) return CLOSURE
–Go(I,a)函数构造算法
i.I为当前状态,X为文法符号,J为I中所有形如A->α·Xβ的
项目的后续项目所组成的集合,而CLOSURE(J)就是项目集I
关于X的后续状态
ii.实现代码如下
def go(item, v): #生成并返回下一个item tmp = [] for it in ite
m: x, y = it.split(".") if(y!=""): if(y[0] == v): new_
it = x + y[0] + "." + y[1:] tmp.append(new_it) if(len(tmp)!=
0): new_item = get_CLOSURE(tmp) #print(tmp) #print("g
o(item, "+v + ") = " + str(new_item)) return new_item
–判别LR项目集是否合法:
•无移进项目和规约项目并存
•无多个规约项目并存
•代码如下:
def lr_is_legal(: # 判别lr是否合法 has_protocol = 0 #是否存在规约项目 has_shift = 0 #是否存在移进项目 for item in items: for it in item: x, y = it.split(".") if(y ==""): if(has_protocol != 0 or has_shift !
= 0): return False has_protocol = 1 else: if(y
[0] in VT): has_shift = 1 return True
•构造LR(0)分析表
–构造算法:
i.假定项目集规范族C={I0,I1,…,In}。

令每一个项目集Ik的下标
k作为分析器的状态。

分析表的ACTION子表和GOTO子表可
按如下方法构造
ii.令那个包含项目S’→•S的集合Ik的下标k为分析器的初态。

iii.若项目A→α•aβ属于Ik且GO(Ik , a)= Ij,a为终结符,置
ACTION[k,a]为“把(j,a)移进栈”,简记为“sj”。

iv.若项目A→α•属于Ik,对任何终结符a(或结束符#),置
ACTION[k,a]为“用产生式A→α进行归约”,简记为“rj”(假定
产生式A→α是文法G’的第j个产生式)。

v.若项目S’→S•属于Ik,则置ACTION[k,#]为“接受”,简记为
“acc”。

vi.若GO(Ik , A)= Ij,A为非终结符,则置GOTO[k,A]=j。

vii.分析表中凡不能用规则1至4填入信息的空白格均填上“err”。

def get_lr_table(: #构建lr分析表 init_lr_table( lr_is_legal( i=
0 j=0 for item in items: for it in item: x, y = it.split(".")
if(y==""): #判断是否写入ACTION if (it == "S'->S."): AC
TION[i][len(VT)-1] = "acc" ind = find_gram(it) if(ind != -
1): for k in range(len(ACTION[i])): ACTION[i][k]="r
"+str(ind+1) else: next_item = go(item, y[0]) # print
("go(%s, %s)-->%s" % (str(item), y[0], str(next_item))) ind = is_
inItems(next_item) if(ind != -1): #判断是否写入GOTO i
f (y[0] in VT): j = VT2Int[y[0]] ACTION[i][j] = "s"
+ str(ind) if(y[0] in VN): j = VN2Int[y[0]]
GOTO[i][j] = ind i = i + 1
•LR0规约算法
–遍历输入字符串,对于每一个字符,获取当前状态栈的顶部的状态值,通过查询action表获取的当前的操作是移进、规约还是接受–如果当前操作是移进,将新的状态放入状态栈当中,当移入的字符放入符号栈中。

–如果当前操作是规约,那么将需要规约的部分的状态从状态栈中弹出,将规约后的状态放入状态栈,将规约后的左部放入符号栈,当前的字
符不向下推进
–如果接收,则结束
def stipulations(: # 根据LR(0)表进行规约 global location print('----分析
过程----') print("index\t\t", end='') print('%-20s' % 'Status', end='') print ('%-50s' % 'Symbol', end='') print('%-30s' % 'Input', end='') print('Action
') for i in range(len(dot_grams)): print('---', end='') print( symbol_stac k.append('#') status_stack.append(0) while not is_end(: now_state = sta
tus_stack[-1] input_ch = input_str[location] if(input_ch not in Vs):
print("错误字符") return -1 output( find = ACTION[now_state][V T2Int[input_ch]] if find[0] == 's': # 进入action symbol_stack.append (input_ch) status_stack.append(int(find[1])) location += 1 pri nt('action[%s][%s]=s%s' % (now_state, input_ch, find[1])) elif find[0] ==
'r': # 进入goto num = int(find[1]) g = grams[num - 1] right_n um = count_right_num(g) #print("\n%s"%g) for i in range(right_n um): status_stack.pop( symbol_stack.pop( symbol_stack.a ppend(g[0]) now_state = status_stack[-1] symbol_ch = symbol_stac k[-1] find = GOTO[now_state][VN2Int.get(symbol_ch, -1)] if find == -1: print('分析失败') return -1 status_stack.append(fin
d) print('%s' % g) else: return -1 print("\n is done") return 0 •全部代码:。

相关文档
最新文档