编译原理实验指导书

合集下载

编译原理实验指导书

编译原理实验指导书《编译原理》实验指导书太原科技大学计算机学院 -3-1序《编译原理》是国内外各高等院校计算机科学技术类专业，特别是计算机软件专业的一门重要专业课程。

该课程系统地向学生介绍编译程序的结构、工作流程及编译程序各组成部分的设计原理和实现技术。

由于该课程理论性和实践性都比较强，内容较为抽象复杂，涉及到大量的软件设计和算法，因此，一直是一门比较难学的课程。

为了使学生更好地理解和掌握编译原理和技术的基本概念、基本原理和实现方法，实践环节非常重要，只有经过上机进行程序设计，才能使学生对比较抽象的教学内容产生具体的感性认识，增强学生综合分析问题、解决问题的能力，并对提高学生软件设计水平大有益处。

为了配合《编译原理》课程的教学，考虑到本课程的内容和特点，本指导书设置了七个综合性实验，分别侧重于词法分析、NFA的确定化、非递归预测分析、算符优先分析器的构造、LR分析、语义分析和中间代码的生成、基于DAG的基本块优化，以支持编译程序的各个阶段，基本涵盖了《编译原理》课程的主要内容。

本指导书可作为《编译原理》课程的实验或课程设计内容，在课程教学的同时，安排学生进行相关的实验。

实验平台可选择在MS-DOS或Windows操作系统环境，使用C/C++的任何版本作为开发工具。

学生在做完试验后，应认真撰写实验报告，内容应包括实验名称、实验目的、实验要求、实验内容、测试或运行结果等。

目录实验一词法分析 ........................................................... 错误!未定义书签。

实验二 NFA的确定化.................................................... 错误!未定义书签。

实验三非递归预测分析 ............................................... 错误!未定义书签。

编译原理实验指导书

编译原理实验指导书计算机学院实验1 词法分析程序一、实验目的构造simple语言的词法分析程序，程序要求能对输入的字符串流进行词法分析。

在实验的过程中，学会应用单词分析的方法——NFA(非确定有穷自动机)和DFA(确定有穷自动机)，加深对词法分析原理的理解。

二、实验内容编写为任一正则文法(见实验参考(一)simple惯用的词法)构造非确定有穷自动机NFA并转换成确定有穷自动机DFA，并对任给的一个输入串(见实验参考(二)测试用输入串)进行词法分析的程序，程序的输出为单词的序列(见实验参考(三)程序输出形式)。

三、实验参考(一)simple 惯用的词法1. 下面是语言的关键字：Begin if then while do end所有的关键字都是保留字，并且必须是小写。

2. 下面是专用符号：:= + * / < <= <> > >= = ; ( ) #3. 其他单词是标识符(ID)和整型常数(NUM)，通过下列正规式定义：ID = letter(letter| digit)*NUM = digit digit*letter = a |…| z | A |…| Zdigit = 0 |…| 9小写和大写字母是有区别的。

思考：构造实数的正规表达式，力争实现对实数的识别及表示。

4. 空格由空白、换行符和制表符组成。

空格一般用来分隔ID、NUM、运算符和关键字，词法分析阶段通常被忽略。

5. 各种单词符号对应的种别码如下表所示：(二)词法分析程序的功能1. 输入为所给文法的源程序字符串。

2. 程序的输出形式为单词串的输出形式。

所输出的每一单词，均按形如(syn，token和sum)的二元式编码。

其中，syn 为单词种别码；token为存放的单词自身字符串；sum为整型常数。

3．测试源程序片断：begin x:=9; if x>0 then x:=2*x+1/3;end #。

编译原理实验指导书

陕西理工学院数学与计算机科学学院《编译原理》实验指导班级网络10级指导教师曹阳计算机工程教研室2012年8月25日编译原理实验指导书一、实验的目的《编译原理》是针对计算机专业的学生开设的一门专业基础课程，对引导学生进行科学思维和提高学生解决实际问题的能力有重要的作用。

开设“编译原理实验”的主要目的是让学生加深理解编译原理的基本理论、方法、词法分析、语法分析、中间代码的生成直到最后的代码生成，了解编译器原理，从而提高学生分析问、题解决问题的能力。

通过实验实现以下基本目标：1.深化已学的知识，完成从理论到实践的转化通过实验，进一步加深对编译原理基本思想、原理的了解。

2. 提高分析和解决实际问题的能力实验不仅是编译原理的一次模拟训练，同时通过实验，积累经验，提高分析和解决问题的能力。

3.培养“开拓创新”能力大力提倡和鼓励在程序中使用新方法，新技术。

激发学生实践的积极性与创造性，开拓思路，设计新算法，进行新创意，培养创造性能力。

二、参加实验的学生应具备的条件参加实验的学生应当具备计算机程序设计的一些基础的知识。

即学生应当熟练掌握和使用一种计算机操作系统(windows操作系统等)、一种程序设计语言(vb、vc、c、delphi等)。

三、实验要求实验的要求体现于整个工作的各个阶段中，可根据所选课题的特点而有所侧重，但应达到如下的基本要求：(1) 根据课题任务制定合理、可行的工作计划任务；(2) 制定适当的技术方案；(3) 学生在老师的指导下独立完成设计过程；(4) 撰写实验报告（包括实验内容中各个阶段所要求的文字材料）；(5) 通过实验检查评定；四、实验项目与内容提要五、实验课程考核办法1、该实验课程考核成绩按百分制计算，满分为100分，60分为及格，60分以上者可获取该学分。

2、该实验课考核由三部分组成：实验课前预习（20%），实验操作（60%），实验报告（20%）。

3、各部分成绩由实验指导教师在每个实验项目完成后分别给出，在学期结束后或完成全部实验项目后综合给出该门实验课的成绩。

学生用-编译原理实验指导书

实验一无符号数的有穷自动机的实现(一)实验目的无符号数的有穷自动机的实现目的是使学生掌握文法的形式描述，穷自动机的概念。

将文法转换成有穷自动机的方法，理解出错处理程序思想，如何用状态矩阵实现一个穷自动机的机内表示。

3．构造状态矩阵；将有穷自动机的状S1 S2 ……Sn及输入的字a1 a2 ……am 构成一个n*m的矩阵。

4．用状态矩阵设计出一个词法分析程序。

5．扫描无符号数，根据文法给出无符号数出错的位置。

(三)实验要求1.学生课前要认真阅读实验指导，理解实验内容与相关理论知识的关系，并完成预习报告2．用C语言或其它高级语言编写程序3．写出实验报告实验二语法制导把表达式翻译成逆波兰式(一)实验目的进一步掌握语法制导翻译的概念，理解中间语言，设计出错处理程序方法，掌握把表达式翻译成中间语言的算法。

(二)实验内容1．从左到右扫描中缀表达式，经语法分析找出中缀表达式出现的错误并给出错误的具体位置和类型。

编译原理实验指导书

编译原理实验指导书第1节概述1、本课程实践的目的和任务编译原理是一门实践性很强的课程，只有通过实践，才能真正掌握。

实际的编译程序是十分复杂的，有时由多达十几万条指令组成。

为此，编译原理的实践教学，采用简化编译过程的办法，选择最关键的３个环节──词法分析、语法分析（包括语义处理、产生无优化的目标指令）、连接调试，进行编程和调试训练。

每个环节作为一个实践课题。

2、实践方法任何一个实用的高级语言，其语法都比较复杂，如选其作为源语言，很难实践全过程。

故本实践将定义一个简化的语言──PASCAL语言的一个子集作为源语言，也可以自行定义一个简单的C语言子集，在3个题目中选择两个题目，也可以自行选择与编译技术相关的实验题目，设计调试出它的编译程序。

前后贯穿这一条主线进行实践。

每次都可利用课余时间编程，利用上机时间进行输入和调试。

建议使用C或C++或JAVA语言。

3、实践报告的规范和要求每个课题完成后写出实践报告。

实践报告包括程序设计时考虑的算法和方法；调试过程中出现的问题和解决的措施；提交电子版的程序清单和调试时所用的源程序。

4、简化的PASCAL语言子集的定义〈PASCAL子集程序〉→〈变量说明〉〈分程序〉。

〈变量说明〉→〈空〉｜VAR〈变量表〉：INTEGER；〈变量表〉→〈变量〉｜〈变量〉，〈变量表〉〈变量〉→〈标识符〉〈分程序〉→BEGIN〈语句组〉END〈语句组〉→〈语句〉｜〈语句〉；〈语句组〉〈语句〉→〈赋值语句〉｜〈条件语句〉｜〈WHILE语句〉｜〈分程序〉〈赋值语句〉→〈变量〉：＝〈算术表达式〉〈条件语句〉→IF〈布尔表达式〉THEN〈语句〉ELSE〈语句〉〈WHILE语句〉→WHILE〈布尔表达式〉DO〈语句〉〈算术表达式〉→〈项〉｜〈算术表达式〉＋〈项〉｜〈算术表达式〉－〈项〉〈项〉→〈初等量〉｜〈项〉＊〈初等量〉｜〈项〉／〈初等量〉〈初等量〉→〈无符号数〉｜〈变量〉｜（〈算术表达式〉）〈关系表达式〉→〈算术表达式〉〈关系运算符〉〈算术表达式〉〈标识符〉→〈字母〉｜〈标识符〉〈字母〉｜〈标识符〉〈数字〉〈无符号数〉→〈数字〉｜〈无符号数〉〈数字〉〈关系运算符〉→〈|〈＝| ＝| 〉＝| 〉|〈〉〈字母〉→ A│B│C│D│E│F│G│H│I│J│K│L│M│N│O│P│Q│R│S│T││U│V│W│X│Y│Z〈数字〉→ 1│2│3│4│5│6│7│8│9│0第2节词法分析本节进行词法分析程序的编程与调试。

编译原理综合实验指导书

编译原理综合实验指导书序言《编译原理综合实验》作为《编译原理》课程的延伸，其目的是让同学动手设计和实现一个简单语言的编译器和解释器。

通过上机实践，来设计这个相对完整的编译器设计，一方面可以使学生增加对编译程序的整体认识和了解——巩固《编译原理》课程所学知识，另一方面，通过上机练习，学生也可以学到很多程序调试技巧和设计大型程序一般的原则，如模块接口的协调，数据结构的合理选择等等。

一、上机实践要求（1）综合实验的成绩占总成绩的30%；（2）本次实验的所有代码都需要自行编码实现，不能用lex、yacc、JavaCC 等软件自动生成；（3）本次实验要求单人独立完成，综合实验提交的截止日期是2016-6-20；（4）本次综合实验须经授课教师当面验收考核后才予评分，否则以缺交处理；（5）实验结束后提交：源代码和实验报告。

实验报告的格式参见“实验报告模板”。

注：实验报告中不要贴代码。

二、实验内容：（一）词法分析程序的设计与实现：20分要求：设计一个词法分析程序，每调用一次就从源程序文件中顺序识别出一个单词符号。

单词种类与识别规则○1标识符：首字符为字母或’#’，其后由字母、数字或’#’组成；○2整数：由一个或多个数字组成、带正负号的数字串，首位数字不能为0；○3小数：[+|-] 正整数1 ·正整数2[+|-]：表示可选的+或-注意：正整数1不能为空，正整数2可以为空，例如：23.○4字符串：由一对双引号括起来的文本注意：字符串不需要支持多行，即假定任意一串字符串都不能超过一行；字符串不需要支持转义符。

○5保留字：class、if、then、else、call、while、do、string、integer、float、○6单目运算符：＋－* / = < >○7双目运算符：<= >= <> ==⑧布尔运算符：&& ||⑨界符：( ) { } ，；此外，该词法分析程序还要能支持单行注释和多行注释（注释语法同C语言）。

编译原理实验指导书

《编译原理》实验指导书别小川于枫编写适用专业：计算机科学与应用江苏科技大学电子信息学院2005年2月前言《编译原理》是计算机专业的一门核心课程，在计算机本科教学中占有十分重要的地位。

由于《编译原理》课程兼有很强的理论性和实践性，并且编译程序构造的算法比较复杂，因而让学生在学习时普遍感到内容抽象、不易理解，难易掌握。

但是掌握编译原理的基本理论和设计思想是非常重要的，尤其是将本课程的理论知识与计算机应用中的许多领域紧密联系与广泛应用结合。

将有利于学生提高专业素质和适应社会多方面需要的能力。

因此，通过理论授课和上机实践，使学生对编译的基本概念、原理和方法有完整的和清楚的理解，并能正确地、熟练地加以运用。

通过实验逐步提高学生的编程能力和调试程序的能力以及解决实际问题的能力。

使学生培养出扎实的软件开发基本技能，并养成良好的编程风格，为进一步学习后续课程和将来从事应用软件开发奠定良好的基础。

实验课时具体内容安排如下：一、实验课的性质和目的（1）深刻理解程序语言编译系统的结构及各部分的功能。

（2）熟练掌握设计和构造程序语言编译系统的基本原理和技术。

（3）能独立编写清晰、工整、结论正确的编译原理的源程序。

（4）能学会上机进行正确调试，并进行程序修改。

即培养发现程序错误，排除错误的能力和经验。

二、实验课的基本要求：（1）掌握编译程序的功能和结构。

（2）掌握词法分析器的设计方法与实现步骤加深对讲授内容的理解，尤其是一些语法给定，通过上机实验帮助掌握。

（3）掌握语法分析器的设计方法与实现步骤。

（4）掌握符号表和存储空间的组织。

（5）掌握代码优化的作用与实现方法（6）掌握错误的诊断和校正方法。

三、主要实验教学方法实验前，由任课教师落实实验任务，每个学生必须事先独立完成好程序的设计的源程序编写工作。

实验课上对疑难点作集中辅导。

实验过程中随时针对不同的情况作个别启发式辅导。

实验后，学生撰写并提交实验报告。

最后，由实验教师根据每个学生的编程、上机调试能力、编程能力和实验结果及实验报告综合评定学生的实验成绩。

《编译原理》实验指导书

《编译原理》实验指导书目录编译原理一共开设了三个实验，它们是：1.词法分析程序，占2个学时2.语法分析程序，占2个学时3.扩充的PL/0分析程序（综合实验），占6个学时。

实验报告格式1.姓名班级学号2.实验名称3.实验目的4.实验要求5.实验内容(这个是实验报告的主要部分)6.实验总结(实验心得)7. 实验报告人报告时间实验一 PL/O语言的词法分析程序GETSYM过程GETSYM的说明：由于一个单词往往是由一个或几个字符组成，所以在词法分析过程GETSYM中又定义一个取字符过程GETCH，由词法分析需要取字符时调用。

实验目的：1.为了更好的配合《编译原理》有关词法分析章节的教学2.加深和巩固学生对于词法分析的了解和掌握3.让学生初步的认识PL/0语言的基础和简单的程序编写4.学生通过本实验能够初步的了解和掌握程序词法分析的整个过程5.提高学生的上机和编程过程中处理具体问题的能力实验要求:1.做本实验之前要先阅读完总体的预备知识以及本实验相关的基础知识2.实验要求自己独立的完成,不允许抄袭别人的实验结果3.编写和调试过程中出现的问题最好做一下记录4.实验程序调试完成后,用给定的PL0测试程序(test.pl0)进行测试，由老师检查测试结果，并给予相应的成绩5.实验完成后,要上交实验报告。

实验内容：1.阅读所给出的词法分析程序（pl0_lexical.c），搞懂程序中每一个变量的含义，以及每一个过程的作用，并在该过程中进行中文注释。

2.阅读完程序后，画出各过程的流程图。

3.给出的程序包含两处输入错误，利用所给的pl/0源程序(test.pl0)对程序进行调试，使其能正确对所给文件进行分析并能够解释运行。

4.在阅读懂所给出的词法分析程序后，将你对词法分析的理解写在实验报告上。

实验环境：1.操作系统为Windows 2000或Dos6.2以上2.应用软件为Pascal或C语言GETCH 所用单元说明：CH ：存放当前读取的字符，初值为空，LINE：为一维数组，其数组元素是字符；界对为1：80。

《编译原理》实验指导书(程细柱)

前言“编译原理”课程是计算机本科专业的必选课程，上机实验是该课程的重要环节，应开实验数约为12学时。

一个编译程序把源程序翻译成等价的目标程序，一般应做词法分析、语法分析、语义分析、代码生成和代码优化等五个方面的工作，为了使学生对其有较深的理解，必须根据这五个方面设计实验。

本指导书正是根据课程的内容，将实验分为前期准备阶段、基本操作阶段和技术提高阶段三个阶段进行：①前期准备阶段的实验主要是为后续实验做好准备，应围绕编译原理课程进行设计，如：学生可根据教科书的内容，设计一个源程序的输入和扫描程序，并完成相应的设计报告；②基本操作阶段的实验是围绕着编译原理的五个方面的工作来进行，其内容主要是词法分析、语法分析、语义分析、代码生成和代码优化等，如：简单的词法分析程序、LL(1) 分析法算法、语义分析程序、中间代码和目标代码生成算法的实验，这些实验基本上包括了以上知识要点，学生可结合书本上有关的知识来完成；③技术提高阶段的实验是综合性课程设计实验，根据编译原理编制应用程序，不仅要求把书本上的内容掌握好，同时还需要自学一些相关的知识。

1目录第1章实验的一般知识 (3)1—1 软件实验室规则及安全守则 (3)1－2 实验条件 (3)1—3 实验的基本要求 (3)第2章实验技术及原理 (3)第3章实验项目 (4)实验一：源程序的输入和扫描（2学时） (4)实验二：词法分析算法（2学时） (6)实验三：LL(1) 分析算法（2学时） (8)实验四：语义分析算法（2学时） (11)实验五：中间代码生成算法（2学时） (14)实验六：目标代码生成算法（4学时） (14)实验七：“编译原理”课程设计（8学时） (14)附录：实验报告示例：有限自动机的运行实验 (16)参考文献：《编译原理》吕映芝、张素琴、蒋维杜等主编清华大学出版社《编译原理与实现》..金成植编高教出版社《编译程序设计原理》..杜淑敏王永宁编北大出版社2第1章实验的一般知识1—1 软件实验室规则及安全守则见《软件实验室规则及安全守则》）。

编译原理实验指导书(-).docx

编译原理实验指导书合肥学院计算编译原理实验指导书实验一词法分析一、实验目的：通过设计编制调试一个具体的词法分析程序，加深对词法分析原理的理解。

并掌握在对程序设计语言源程序进行扫描过程屮将其分解为各类单词的词法分析方法。

编制一个读单词过程，从输入的源程序中，识別出各个具有独立意义的单词, 即基木保留字、标识符、常数、运算符、分隔符五大类。

并依次输出各个单词的内部编码及单词符号自身值。

（遇到错误时可显示“Error”，然后跳过错误部分继续显示）二、实验预习提示1、词法分析器的功能和输出格式词法分析器的功能是输入源程序，输出单词符号。

词法分析器的单词符号常常农示成以下的二元式（单词种别码，单词符号的属性值）。

本实验中，采用的是一类符号一种别码的方式。

2、单词的BNF表示＜标识符＞ -V字母〉v字母数字串〉V字母数字串一V字母〉V字母数字串＞|v数字〉V字母数字串〉Iv下划线＞v字母数字串I e＜无符号整数一V数字〉v数字串〉V数字串〉一V数字〉V数字串〉v加法运算符＞-+＜减法运算符〉-＞・V大于关系运算符＞-＞＞V大于等于关系运算符＞-＞ =3、“超前搜索”方法词法分析时，常常会用到超前搜索方法。

如当前待分析字符串为“”，当前字符为此时，分析器倒底是将其分析为犬于关系运算符还是犬于等于关系运算符呢？显然，只有知道下一个字符是什么才能下结论。

超前读了一个字符所以要回退一个字符，词法分析器才能正常运行。

在分析标识符，无符号整数等时也有类似情况。

4、模块结构Y饗冲区扫播一个辛閒N ▼三、实验过程和指导：(-)准备：1・阅读课木有关章节，明确语言的语法，写出基木保留字、标识符、常'数、运算符、分隔符和程序例。

2 .初步编制好程序。

3•准备好多组测试数据。

(二)上课上机: 将源代码拷贝到机上调试，发现错误，再修改完善。

第二次上机调试通过。

(三)程序要求：程序输入/输出示例：如源程序为C语言。

输入如卜•一段：main(){int a,b;a = 1 0;b = a 4- 20;}要求输出如下图。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

《编译原理》实验指导书适用专业：计算机科学与技术网络工程2008年8 月前言本实验指导书是《编译原理》的配套实验指导书。

本课程的总体目标是：通过实验学习编译程序调试技巧和设计编译程序的一般原则，加深对词法分析、语法分析、语义分析和中间代码生成等编译阶段及实用编译系统的认识，初步掌握编译程序构造的基本原理与技术, 从形式语言理论的角度, 进一步认识与理解程序设计语言。

通过编译程序的编写和调试能力的训练，激发学生进一步思考问题，培养学生的学习兴趣和创新能力。

并进一步培养学生的抽象思维能力，进一步巩固《编译原理》课程所学知识。

书中共设计了6 个实验，其中有3 个验证型实验和3 个设计型实验，开课教师可以根据大纲要求进行选取。

为了克服以往的实验指导书指导过细，学生完全依赖于实验指导书的弊端，该指导书在算法提示上采取从有到无、从多到少的方式。

实验内容和设计题目的设计将针对我校学生的实际情况，做到难易适中，验证型实验和设计型实验分别在实验要求上分成不同的层次，力争让学生经过一定的努力，都能够完成相应题目，收获成功的喜悦，从而激发起他们学习的兴趣和积极性。

另外，书中附录部分专门设计了针对该课程的实验报告和设计报告，并对报告各个部分的写法和要求作了详细说明。

本指导书使用伪语言来描述和实现相关算法，实验环境是可以是VC6.0语言。

本指导书可供计算机软件工程、计算机科学与技术、网络工程以及计算机学科其他相关专业选用。

说明：本实验指导书所提供的源程序均已在VC６.０下调试运行过．目录实验一：消去C、C++程序中的注释 (1)实验二：词法分析 (3)实验三：递归下降分析法 (10)实验四：语法分析程序LL（1） (18)实验五：语法分析程序LR（1） (25)实验六：算术表达式的逆波兰表示与计算 (32)实验一：消去C、C++程序中的注释实验学时：2实验类型：验证实验要求：必修一、实验目的掌握C语言文件的基本操作，消除源C语言程序中的注释，为以后的编译提供方便。

二、实验内容注释对于高级语言程序设计可以提高程序的可阅读性，但是对于编译系统而言，注释是没有实际意义的，所以编译系统在预编译阶段首先就要去掉注释。

在VC中有两种注释，即单行注释，由//引入到行未，由/*…..*/所包围的注释。

要求去掉VC中这两种注释而不改变程序的其它部分。

三、实验原理或算法算法原理：逐字符读入源程序，并判断相邻2个字符是否为//或/*或*/，如果不是，则直接将读入的字符写入新文件中；如果是，则跳过注释部分。

四、程序清单在VC6.0下程序清单：//削除单行注释与多行注释即//与/*...*/#include"stdio.h"#include"stdlib.h"main(){FILE *fp1,*fp2;char ch1,ch2,ch3,ch4,flag=0;if((fp1=fopen("input.cpp","r"))==NULL) // input.cpp为任意带注释的C程序{printf("file cannot be opened\n");exit(1);}if((fp2=fopen("output.cpp","w"))==NULL) // ouput.cpp为去掉注释后的程序{printf("file cannot be writed\n");exit(1);}ch1=fgetc(fp1);ch2=fgetc(fp1);while(!feof(fp1)){if (ch1=='/')if(ch2=='*'||ch2=='/'){ if (ch2=='*'){ch3=fgetc(fp1);ch4=fgetc(fp1);while(!(ch3=='*'&& ch4=='/')&&!feof(fp1)){ch3=ch4;ch4=fgetc(fp1); //read only not write}ch2=fgetc(fp1);}if(ch2=='/')while((ch2=fgetc(fp1))!=10); //read only /not write}elsefputc(ch1,fp2);elsefputc(ch1,fp2);ch1=ch2;ch2=fgetc(fp1);}fputc(ch1,fp2);fclose(fp1);fclose(fp2);return 1;}五、实验结果分析比对源文件和产生的新文件，对照验证程序所产生的结果。

六、思考题（1）将输入输出文件改成可由键盘输入的文件名。

（2）如果在字符串中出现连续的//或/*或*/则不应做处理，请修改上面的程序。

实验二：词法分析实验学时：4实验类型：综合实验要求：必修一、实验目的通过设计编制调试一个具体的词法分析程序，加深对词法分析原理的理解。

并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。

二、实验内容编制一个读单词过程，从输入的源程序中，识别出各个具有独立意义的单词，即基本保留字、标识符、常数、运算符、分隔符五大类。

并依次输出各个单词的内部编码及单词符号自身值。

（遇到错误时可显示“Error”，然后跳过错误部分继续显示）。

三、实验原理或算法1、词法分析器的功能和输出格式词法分析器的功能是输入源程序，输出单词符号。

词法分析器的单词符号常常表示成以下的二元式(单词种别码，单词符号的属性值)。

本实验中，采用的是一类符号一种别码的方式。

2、单词的BNF表示<标识符>-> <字母><字母数字串><字母数字串>-><字母><字母数字串>|<数字><字母数字串>|<下划线><字母数字串>|ε<无符号整数>-> <数字><数字串><数字串>-> <数字><数字串> |ε<加法运算符>-> +<减法运算符>-> -<大于关系运算符>-> ><大于等于关系运算符>-> >=3、“超前搜索”方法词法分析时，常常会用到超前搜索方法。

如当前待分析字符串为“a>=”或“a>b”,当前字符为‟>‟，此时，分析器倒底是将其分析为大于关系运算符还是大于等于关系运算符呢？显然，只有知道下一个字符是什么才能下结论。

于是分析器读入下一个字符‟＝‟或‟b‟，这时可知应将‟>‟解释为大于或大于等于运算符。

但此时，超前读了一个字符‟b‟，所以要回退一个字符，词法分析器才能正常运行。

在分析标识符，无符号整数等时也有类似情况。

4、编程思路这里以开始定义的C语言子集的源程序作为词法分析程序的输入数据。

在词法分析中，自文件头开始扫描源程序字符，一旦发现符合“单词”定义的源程序字符串时，将它翻译成固定长度的单词内部表示，并查填适当的信息表。

经过词法分析后，源程序字符串（源程序的外部表示）被翻译成具有等长信息的单词串（源程序的内部表示），并产生两个表格：常数表和标识符表，它们分别包含了源程序中的所有常数和所有标识符。

5、单词种别码要求：识别保留字：if、int、for、while、do、return、break、continue；单词种别码为1。

分隔符包括：,、;、{、}、(、)；单词种别码为2。

运算符包括：+、-、*、/、=、；单词种别码为3。

关系运算符：>、<、==、>=、<=、!= ；单词种别码为4。

标识符；单词种别码为5。

常数为无符号整形数；单词种别码为6。

四、程序清单//词法分析程序#include <stdio.h>#include <ctype.h>#include <stdlib.h>#include <string.h>#define NULL 0FILE *fp;char cbuffer;char *key[8]={"if","else","for","while","int","return","break","continue"};char *border[6]={",",";","{","}","(",")"};char *arithmetic[5]={"+","-","*","/","="};char *relation[6]={"<","<=","==",">",">=","!="};char *consts[20];char *label[20];int constnum=0,labelnum=0;int search(char searchchar[],int wordtype){int i=0;switch (wordtype){case 1:for (i=0;i<=7;i++)if (strcmp(key[i],searchchar)==0) return(i+1);return 0;case 2:for (i=0;i<=5;i++)if (strcmp(border[i],searchchar)==0) return(i+1);return(0);case 3:for (i=0;i<=4;i++)if (strcmp(arithmetic[i],searchchar)==0) return(i+1);return(0);case 4:for (i=0;i<=5;i++)if (strcmp(relation[i],searchchar)==0) return(i+1);return(0);case 5:for (i=0;i<constnum;i++)if (strcmp(consts[i],searchchar)==0) return(i+1);consts[i]=(char *)malloc(sizeof(searchchar));strcpy(consts[i],searchchar);constnum++;return(i+1);case 6:for (i=0;i<labelnum;i++)if (strcmp(label[i],searchchar)==0) return(i+1);label[i]=(char *)malloc(sizeof(searchchar));strcpy(label[i],searchchar);labelnum++;return(i+1);}}char alphaprocess(char buffer)//字母开头串的处理（可能是保留字或标识符）{int atype;int i=-1;char alphatp[20];while ((isalpha(buffer))||(isdigit(buffer))){alphatp[++i]=buffer;buffer=fgetc(fp);}alphatp[i+1]='\0';//printf("%s,search=%d",alphatp,search(alphatp,1));if (atype=search(alphatp,1))printf("(%s,1,%d)\n",alphatp,atype);else{atype=search(alphatp,6);printf("(%s,6,%d)\n",alphatp,atype);}return(buffer);}char digitprocess(char buffer) //常量串{int i=-1;char digittp[20];int dtype;while ((isdigit(buffer))){digittp[++i]=buffer;buffer=fgetc(fp);}digittp[i+1]='\0';dtype=search(digittp,5);printf("(%s,5,%d)\n",digittp,dtype);return(buffer);}char otherprocess(char buffer) //其它符号的处理{int i=-1;char othertp[20];int otype,otypetp;othertp[0]=buffer;othertp[1]='\0';if (otype=search(othertp,3)){printf("(%s,3,%d)\n",othertp,otype);buffer=fgetc(fp);goto out;}if (otype=search(othertp,4)){buffer=fgetc(fp);othertp[1]=buffer;othertp[2]='\0';if (otypetp=search(othertp,4)){printf("(%s,4,%d)\n",othertp,otypetp);goto out;}else{othertp[1]='\0';printf("(%s,4,%d)\n",othertp,otype);goto out;}}if (buffer==':'){buffer=fgetc(fp);if (buffer=='=')printf(":= (2,2)\n");buffer=fgetc(fp);goto out;}elseif (otype=search(othertp,2)){printf("(%s,2,%d)\n",othertp,otype);buffer=fgetc(fp);goto out;}if ((buffer!='\n')&&(buffer!=' '))printf("%c error,not a word\n",buffer);buffer=fgetc(fp);out: return(buffer);}void main(){int i;for (i=0;i<=20;i++){label[i]=NULL;consts[i]=NULL;};if ((fp=fopen("example.cpp","r"))==NULL)printf("Open File Error!");else{printf("输出格式为：(单词，类别，位置)\n");cbuffer = fgetc(fp);while (cbuffer!=EOF){if (isalpha(cbuffer))cbuffer=alphaprocess(cbuffer);elseif (isdigit(cbuffer))cbuffer=digitprocess(cbuffer);else cbuffer=otherprocess(cbuffer);}printf("Anysis End\n");getchar();}}五、实验结果分析如源程序为C语言。