北京工业大学 编译原理 实验报告

合集下载

编译原理 实验报告

编译原理 实验报告

编译原理实验报告编译原理实验报告引言编译原理是计算机科学中的重要课程,它研究的是如何将高级语言程序转化为机器语言程序的过程。

在本次实验中,我们学习了编译原理的基本概念和技术,并通过实践来加深对这些概念和技术的理解。

本报告将对我们在实验中遇到的问题、解决方案以及实验结果进行总结和分析。

实验目的本次实验的主要目的是设计并实现一个简单的编译器,能够将类C语言的源代码翻译成目标代码。

通过这个实验,我们可以更好地理解编译器的工作原理,掌握编译器设计的基本方法和技术。

实验过程在实验中,我们首先对给定的类C语言的语法进行了分析,并根据语法规则设计了相应的语法分析器。

然后,我们使用了自顶向下的递归下降分析法来实现语法分析器。

在实现语法分析器的过程中,我们遇到了一些问题,例如如何处理语法规则中的左递归、如何处理语法规则中的优先级和结合性等。

通过仔细研究相关的文献和资料,我们成功地解决了这些问题,并完成了语法分析器的设计和实现。

接下来,我们对语法分析器进行了测试,并对测试结果进行了分析。

通过测试,我们发现语法分析器在处理简单的源代码时能够正确地识别出语法错误,并给出相应的错误提示。

然而,在处理复杂的源代码时,语法分析器可能会出现一些错误,例如无法正确地处理嵌套的语法结构、无法正确地处理运算符的优先级和结合性等。

为了解决这些问题,我们对语法分析器进行了改进,并进行了多次测试,最终得到了令人满意的结果。

实验结果通过本次实验,我们成功地设计并实现了一个简单的编译器,能够将类C语言的源代码翻译成目标代码。

在实验中,我们对编译器的工作原理有了更深入的了解,掌握了编译器设计的基本方法和技术。

同时,我们也发现了一些问题,并通过不断地改进和测试,最终得到了令人满意的结果。

结论编译原理是一门重要的计算机科学课程,它研究的是如何将高级语言程序转化为机器语言程序的过程。

通过本次实验,我们对编译原理的基本概念和技术有了更深入的了解,并通过实践来加深了对这些概念和技术的理解。

编译原理实验报告

编译原理实验报告

编译原理实验报告一、实验目的和要求本次实验旨在对PL_0语言进行功能扩充,添加新的语法特性,进一步提高编译器的功能和实用性。

具体要求如下:1.扩展PL_0语言的语法规则,添加新的语法特性;2.实现对新语法的词法分析和语法分析功能;3.对扩展语法规则进行语义分析,并生成中间代码;4.验证扩展功能的正确性。

二、实验内容1.扩展语法规则本次实验选择扩展PL_0语言的语句部分,添加新的控制语句,switch语句。

其语法规则如下:<switch_stmt> -> SWITCH <expression> CASE <case_list><default_stmt> ENDSWITCH<case_list> -> <case_stmt> , <case_stmt> <case_list><case_stmt> -> CASE <constant> : <statement><default_stmt> -> DEFAULT : <statement> ,ε2.词法分析和语法分析根据扩展的语法规则,需要对新的关键字和符号进行词法分析,识别出符号类型和记号类型。

然后进行语法分析,建立语法树。

3.语义分析在语义分析阶段,首先对switch语句的表达式进行求值,判断其类型是否为整型。

然后对case语句和default语句中的常量进行求值,判断是否与表达式的值相等。

最后将语句部分生成中间代码。

4.中间代码生成根据语法树和语义分析的结果,生成对应的中间代码。

例如,生成switch语句的跳转表,根据表达式的值选择相应的跳转目标。

5.验证功能的正确性设计一些测试用例,验证新语法的正确性和扩展功能的实用性。

三、实验步骤与结果1.扩展语法规则,更新PL_0语法分析器的词法规则和语法规则。

编译原理实验报告总结

编译原理实验报告总结

编译原理实验报告总结一、实验目的编译原理是计算机科学中的一门重要课程,通过实验可以更深入地理解编译过程的各个阶段,包括词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等。

本次编译原理实验的目的主要有以下几点:1、加深对编译原理理论知识的理解和掌握,将抽象的概念通过实际操作转化为具体的实现。

2、培养实际动手能力和解决问题的能力,通过编写代码实现编译程序的各个模块,提高编程技能和调试能力。

3、熟悉编译程序的开发流程和工具,掌握相关编程语言和开发环境的使用。

4、培养团队合作精神和沟通能力,在实验过程中与小组成员共同探讨、解决问题,提高协作效率。

二、实验环境本次实验使用的编程语言为 C/C++,开发环境为 Visual Studio 2019。

同时,使用了一些辅助工具,如调试工具、代码管理工具等,以提高开发效率和代码质量。

三、实验内容1、词法分析任务:使用正则表达式或有限自动机实现对输入源程序的词法分析,将源程序分解为一个个单词,并识别出单词的类型,如标识符、关键字、常量、运算符等。

实现方法:采用有限自动机的方法,设计状态转移图,根据输入字符的类型进行状态转移,最终确定单词的类型。

遇到的问题及解决方法:在处理一些边界情况时,如字符串中的转义字符,出现了识别错误。

通过仔细分析正则表达式和有限自动机的规则,对代码进行了相应的修改和完善,解决了问题。

2、语法分析任务:使用自顶向下或自底向上的语法分析方法,对词法分析得到的单词序列进行语法分析,构建语法树。

实现方法:选择了自顶向下的递归下降分析法,根据语法规则编写递归函数,逐个处理单词,构建语法树。

遇到的问题及解决方法:在处理复杂的语法结构时,出现了回溯和左递归的问题,导致分析效率低下。

通过消除左递归和提取公共因子,优化了语法分析算法,提高了分析效率。

3、语义分析任务:在语法分析的基础上,进行语义分析,检查语法正确的程序是否在语义上也是正确的,如类型匹配、变量未定义等。

编译原理实验报告

编译原理实验报告

编译原理实验报告一、实验概述本次实验旨在设计并实现一个简单的词法分析器,即实现编译器的第一个阶段,词法分析。

词法分析器将一段源程序代码作为输入,将其划分为一个个的词法单元,并将其作为输出。

二、实验过程1.设计词法规则根据编程语言的规范和所需实现的功能,设计词法规则,以明确规定如何将源程序代码分解为一系列的词法单元。

2.实现词法分析器采用合适的编程语言,根据所设计的词法规则,实现词法分析器。

词法分析器的主要任务是读入源程序代码,并将其根据词法规则进行分解,生成对应的词法单元。

3.测试词法分析器设计测试用例,用于检验词法分析器的正确性和性能。

测试用例应包含各种情况下的源程序代码。

4.分析和修正错误根据测试过程中发现的问题,分析产生错误的原因,并进行修正。

重复测试和修正的过程,直到词法分析器能够正确处理所有测试用例。

三、实验结果我们设计了一个简单的词法分析器,并进行了测试。

测试用例涵盖了各种情况下的源程序代码,包括正确的代码和错误的代码。

经过测试,词法分析器能够正确处理所有的测试用例。

词法分析器将源程序代码分解为一系列的词法单元,每个词法单元包含了单词的种类和对应的值。

通过对词法单元的分析,可以进一步进行语法分析和语义分析,从而完成编译过程。

四、实验总结通过本次实验,我深入了解了编译原理的词法分析阶段。

词法分析是编译器的第一个重要阶段,它将源程序代码分解为一个个的词法单元,为后续的语法分析和语义分析提供基础。

在实现词法分析器的过程中,我学会了如何根据词法规则设计词法分析器的算法,并使用编程语言实现词法分析器。

通过测试和修正,我掌握了调试和错误修复的技巧。

本次实验的经验对我今后的编程工作有很大帮助。

编译原理是计算机科学与技术专业的核心课程之一,通过实践能够更好地理解和掌握其中的概念和技术。

我相信通过进一步的学习和实践,我能够在编译原理领域取得更大的成果。

编译原理实验报告

编译原理实验报告

编译原理实验报告一、实验目的编译原理是计算机科学中的重要学科,它涉及到将高级编程语言转换为计算机能够理解和执行的机器语言。

本次实验的目的是通过实际操作和编程实践,深入理解编译原理中的词法分析、语法分析、语义分析以及中间代码生成等关键环节,提高我们对编译过程的认识和编程能力。

二、实验环境本次实验使用的编程语言为C++,开发环境为Visual Studio 2019。

此外,还使用了一些相关的编译工具和调试工具,如 GDB 等。

三、实验内容(一)词法分析器的实现词法分析是编译过程的第一步,其任务是将输入的源程序分解为一个个单词符号。

在本次实验中,我们使用有限自动机的理论来设计和实现词法分析器。

首先,定义了各种单词符号的类别,如标识符、关键字、常量、运算符等。

然后,根据这些类别设计了相应的状态转换图,并将其转换为代码实现。

在实现过程中,使用了正则表达式来匹配输入字符串中的单词符号。

对于标识符和常量等需要进一步处理的单词符号,使用了相应的规则进行解析和转换。

(二)语法分析器的实现语法分析是编译过程的核心环节之一,其任务是根据给定的语法规则,分析输入的单词符号序列是否符合语法结构。

在本次实验中,我们使用了递归下降的语法分析方法。

首先,根据实验要求定义了语法规则,并将其转换为相应的递归函数。

在递归函数中,通过对输入单词符号的判断和处理,逐步分析语法结构。

为了处理语法错误,在分析过程中添加了错误检测和处理机制。

当遇到不符合语法规则的输入时,能够输出相应的错误信息,并尝试进行恢复。

(三)语义分析及中间代码生成语义分析的目的是对语法分析得到的语法树进行语义检查和语义处理,生成中间代码。

在本次实验中,我们使用了三地址码作为中间代码的表示形式。

在语义分析过程中,对变量的定义和使用、表达式的计算、控制流语句等进行了语义检查和处理。

对于符合语义规则的语法结构,生成相应的三地址码指令。

四、实验步骤(一)词法分析器的实现步骤1、定义单词符号的类别和对应的正则表达式。

编译原理实验报告

编译原理实验报告

编译原理实验报告编译原理实验报告一、实验目的1. 了解编译器的基本原理和工作过程;2. 掌握编译器设计和实现的基本方法和技巧;3. 通过设计和实现一个简单的编译器,加深对编程语言和计算机系统的理解和认识。

二、实验原理编译器是将高级语言程序翻译成机器语言程序的一种软件工具。

它由编译程序、汇编程序、链接程序等几个阶段组成。

本次实验主要涉及到的是编译程序的设计和实现。

编译程序的基本原理是将高级语言程序转换为中间代码,再将中间代码转换为目标代码。

整个过程可以分为词法分析、语法分析、语义分析、代码生成和代码优化几个阶段。

三、实验内容本次实验的设计目标是实现一个简单的四则运算表达式的编译器。

1. 词法分析根据规定的语法规则,编写正则表达式将输入的字符串进行词法分析,将输入的四则运算表达式划分成若干个单词(Token),例如:运算符、操作数等。

2. 语法分析根据定义的语法规则,编写语法分析程序,将词法分析得到的Token序列还原成语法结构,构建抽象语法树(AST)。

3. 语义分析对AST进行遍历,进行语义分析,判断表达式是否符合语法规则,检查语义错误并给出相应的提示。

4. 代码生成根据AST生成目标代码,目标代码可以是汇编代码或者机器码。

四、实验过程和结果1. 首先,根据输入的表达式,进行词法分析。

根据所定义的正则表达式,将输入的字符串划分成Token序列。

例如:输入表达式“2+3”,经过词法分析得到的Token序列为["2", "+", "3"]。

2. 然后,根据语法规则,进行语法分析。

根据输入的Token序列,构建抽象语法树。

3. 接着,对抽象语法树进行语义分析。

检查表达式是否符合语法规则,给出相应的提示。

4. 最后,根据抽象语法树生成目标代码。

根据目标代码的要求,生成汇编代码或者机器码。

五、实验总结通过本次实验,我对编译器的工作原理有了更深入的认识,掌握了编译器设计和实现的基本方法和技巧。

北京工业大学 编译原理 实验报告

北京工业大学 编译原理  实验报告
E, WORD_WHILE); if (strcmp(value, WORD_DO) == 0) return new Token(DO, NONE_OF_VALUE, WO
RD_DO); return new Token(IDN, value, value);
} //////////////////////////////////// 以 下 为 数 字 的 检 测
//////////////////////////////////////////////////////////////////////////// if (isdigit(ch)) { value[i++] = ch; //如果第一个数字是 0,则有可能是 INT10 的 0、INT8 或 INT16 if (ch == '0') { ch = from_file.get(); if ((ch >= '0' && ch < '8') || ch == 'x' || ch == 'X') { //如果 0 后面紧跟着数字 0-8,则为 INT8 if (isdigit(ch)) { while (ch >= '0' && ch < '8') { value[i++] = ch; ch = from_file.get(); } from_file.unget(); return new Token(INT8, value, value); } value[i++] = ch; //到这一步的都是 INT16 ch = from_file.get(); while (isdigit(ch) || (ch >= 'a' && ch <= 'f')) { value[i++] = ch; //TODO:这里没有解决 0xrtr 的问题 ch = from_file.get(); } from_file.unget(); return new Token(INT16, value, value); } else {//0 后面的不为 0-7 的 digit 或 x 或 X 等 8 或 16 进制特征字符,则为 10 进制的

编译原理实验报告2-词法分析程序的设计

编译原理实验报告2-词法分析程序的设计

实验2 词法分析程序的设计一、实验目的掌握计算机语言的词法分析程序的开发方法。

二、实验容编制一个能够分析三种整数、标识符、主要运算符和主要关键字的词法分析程序。

三、实验要求1、根据以下的正规式,编制正规文法,画出状态图;标识符<字母>(<字母>|<数字字符>)*十进制整数0 | ((1|2|3|4|5|6|7|8|9)(0|1|2|3|4|5|6|7|8|9)*)八进制整数0(1|2|3|4|5|6|7)(0|1|2|3|4|5|6|7)*十六进制整数0x(0|1|2|3|4|5|6|7|8|9|a|b|c|d|e|f)(0|1|2|3|4|5|6|7|8|9|a|b|c|d|e|f)*运算符和界符+ - * / > < = ( ) ;关键字if then else while do2、根据状态图,设计词法分析函数int scan( ),完成以下功能:1)从文本文件中读入测试源代码,根据状态转换图,分析出一个单词,2)以二元式形式输出单词<单词种类,单词属性>其中单词种类用整数表示:0:标识符1:十进制整数2:八进制整数3:十六进制整数运算符和界符,关键字采用一字一符,不编码其中单词属性表示如下:标识符,整数由于采用一类一符,属性用单词表示运算符和界符,关键字采用一字一符,属性为空3、编写测试程序,反复调用函数scan( ),输出单词种别和属性。

四、实验环境PC微机DOS操作系统或 Windows 操作系统Turbo C 程序集成环境或 Visual C++ 程序集成环境五、实验步骤1、根据正规式,画出状态转换图;2、根据状态图,设计词法分析算法;观察状态图,其中状态2、4、7、10(右上角打了星号)需要回调一个字符。

声明一些变量和函数:ch: 字符变量,存放最新读进的源程序字符。

strToken: 字符串变量,存放构成单词符号的字符串。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计算机学院实验报告课程名称:编译原理实验人学号:******xx 姓名:xxx 实验完成日期:2014年5月20日报告完成日期:2014年5月20日目录实验一词法分析程序的设计与实现 (3)词法的正规式描述: (3)状态图: (4)词法分析程序数据结构与算法: (4)词法分析算法: (5)实验结果: (7)实验中遇到的问题及其解决: (8)1、保留字的检测问题: (8)2、关于0为首位的数字是int8、int10和int16的判断问题: (8)3、关于回退的问题: (8)实验二自顶向下的语法分析—递归子程序法 (9)改写后的产生式集合: (9)化简后的语法图: (9)递归子程序算法 (10)实验结果: (13)实验中遇到的问题及其解决: (14)1、消除左递归,提取左因子之后的E、T对应的子程序的编写问题: (14)2、缩进的控制: (14)实验三语法制导的三地址代码生成程序 (15)语法制导定义: (15)三地址代码生成器的数据结构 (16)三地址生成器算法: (17)实验结果: (21)实验中遇到的问题及其解决: (22)1、根据化简后的产生式修改语法制导定义: (22)2、使用真假出口法和继承属性来确定goto的标号: (22)实验一词法分析程序的设计与实现词法的正规式描述:标识符 <字母>(<字母>|<数字字符>)*十进制整数 0|(1|2|3|4|5|6|7|8|9)(0|1|2|3|4|5|6|7|8|9)*八进制整数 0(0|1|2|3|4|5|6|7)(0|1|2|3|4|5|6|7)*十六进制整数0(x|X)(0|1|2|3|4|5|6|7|8|9|a|b|c|d|e|f)(0|1|2|3|4|5|6|7|8|9|a|b|c|d|e |f)*运算符和分隔符 + - * / > < = ( ) ;关键字 if then else while do .状态图: 开始标识符或保留字a-z/A-Z Int8或int10或int160十进制数1-9保留字标识符其他运算符和分隔符If/then/while/do/else + - * / > < = ( ) ;Int 16X/xint81-7int10其他词法分析程序数据结构与算法://单词类class Token {public :int type;//种别string value;//属性值string name;//单词具体内容Token() {type = DEFAULT;value = NONE_OF_VALUE;}Token(int type, string value, string name): type(type), value(value), name (name){}~Token() {}};词法分析算法:Token* TokenScan(ifstream &from_file) {char ch;//用于保存从文件中读取的字符//读第一个字符int i =0;char value[30] ="";//用来存放token的属性值ch = from_file.get();while (ch == BLANK || ch == TAB || ch == NEWLINE) {ch = from_file.get();}////////////////////////////////////以下为标识符的检测//////////////////////////////////////////////////////////////////////////// if (isalpha(ch)) {value[i++] = ch;ch = from_file.get();////判断后续的是否为IDN的成分(数字或字母)while (isalnum(ch)) {value[i++] = ch;ch = from_file.get();}//直到不是IDN成分,回退一字符from_file.unget();//TODO:这里加上保留字检测部分//进行字符串的对比,即可比较出保留字,通过压栈的形式来获得完整的属性值////////////////////////////////////以下为保留字的检测//////////////////////////////////////////////////////////////////////////// if (strcmp(value, WORD_IF) ==0) return new Token(IF, NONE_OF_VALUE, WO RD_IF);if (strcmp(value, WORD_THEN) ==0) return new Token(THEN, NONE_OF_VALUE, WORD_THEN);if (strcmp(value, WORD_ELSE) ==0) return new Token(ELSE, NONE_OF_VALUE, WORD_ELSE);if (strcmp(value, WORD_WHILE) ==0) return new Token(WHILE, NONE_OF_VALU E, WORD_WHILE);if (strcmp(value, WORD_DO) ==0) return new Token(DO, NONE_OF_VALUE, WO RD_DO);return new Token(IDN, value, value);}////////////////////////////////////以下为数字的检测//////////////////////////////////////////////////////////////////////////// if (isdigit(ch)) {value[i++] = ch;//如果第一个数字是0,则有可能是INT10的0、INT8或INT16if (ch =='0') {ch = from_file.get();if ((ch >='0'&& ch <'8') || ch =='x'|| ch =='X') {//如果0后面紧跟着数字0-8,则为INT8if (isdigit(ch)) {while (ch >='0'&& ch <'8') {value[i++] = ch;ch = from_file.get();}from_file.unget();return new Token(INT8, value, value);}value[i++] = ch;//到这一步的都是INT16ch = from_file.get();while (isdigit(ch) || (ch >='a'&& ch <='f')) {value[i++] = ch;//TODO:这里没有解决0xrtr的问题ch = from_file.get();}from_file.unget();return new Token(INT16, value, value);} else {//0后面的不为0-7的digit或x或X等 8或16进制特征字符,则为10进制的0,回退一个字符from_file.unget();return new Token(INT10, value, value);}}//能到这一步的都是INT10,且不为0打头ch = from_file.get();while (isdigit(ch)) {value[i++] = ch;ch = from_file.get();}from_file.unget();return new Token(INT10, value, value);}////////////////////////////////////以下为运算符的检测//////////////////////////////////////////////////////////////////////////// value[i++] = ch;switch (ch) {case'+':return new Token(ADD, value, "+");case'-':return new Token(MINUS, value, "-");case'*':return new Token(MUL, value, "*");case'/':return new Token(DIC, value, "/");case'>':return new Token(MORE, value, ">");case'<':return new Token(LESS, value, "<");case'=':return new Token(EQU, value, "=");case'(':return new Token(LBRAC,value, "(");case')':return new Token(RBRAC, value, ")");case';':return new Token(COMMA, value, ";");default:ErrorHandle(from_file); break;}return new Token(DEFAULT, NONE_OF_VALUE, NONE_OF_VALUE); }实验结果:实验中遇到的问题及其解决:1、保留字的检测问题:一开始的时候我的想法是遇到if、while、do、then等单词的首字母时即开始划分状态,后来发现这样子判断的分支会特别多,而且效率不是很高,对保留字集合的扩展支持的也不是很好。

后来我发现保留字存在于标识符的子集,所以为什么不先判断标识符然后再判断是不是保留字呢?后来我就照着这个思路成功实现了功能。

相关文档
最新文档