编译原理实验报告一

合集下载

编译原理实验报告(C语言)

编译原理实验报告实验项目1：词法分析程序实验一、实验的目的与任务：编译原理是计算机类专业特别是计算机软件专业的一门重要专业课。

设置该课程的目的在于系统地向学生讲述编译系统的结构、工作流程及编译程序各组成部分的设计原理和实现方法，使学生通过学习既掌握编译理论和方法方面的基本知识，也具有设计、实现、分析和维护编译程序等方面的初步能力。

编译原理是一门理论性和实践性都比较强的课程。

进行上机实验的目的是使学生通过完成上机实验题目加深对课堂教学内容的理解。

同时培养学生实际动手能力。

编译实验由三个独立实验组成，按照由浅入深进行排列，希望通过本实验使学生更深学习并理解编译的主要过程和相关方法。

词法分析的目的是将输入的源程序进行划分，给出基本符号（token）的序列，并掠过注解和空格等分隔符号。

基本符号是与输入的语言定义的词法所规定的终结符。

本实验要求学生编制一个读单词过程，从输入的源程序中，识别出各个具有独立意义的单词，即基本保留字、标识符、常数、运算符、分隔符五大类。

并依次输出各个单词的内部编码及单词符号自身值。

（遇到错误时可显示“Error”，然后跳过错误部分继续进行）二、题目分析1.这里采用C语言编写的源程序作为词法分析程序的输入数据，输入数据保存在“in.txt”记事本中，将分析结果存在“out.txt”记事本中。

词法分析器的源代码使用C语言编写。

2.下面就词法分析程序中的主要变量进行说明：主函数main()：打开要分析的C语言源程序，若不能正确打开，则报错。

先从源程序中读入一个字符ch，然后进行如下处理：1、cp消耗掉空格，制表符，换行符后，cp数组复位，开始检测cp；2、数字检测,对照符号表输出，若匹配成功，则返回序号；3、字符串检测, 对照符号表输出，若匹配成功，则返回序号；4、基本保留字检测,对照符号表输出，若匹配成功，则返回序号；5、运算符检测，对照符号表输出，若匹配成功，则返回序号；注意这里碰到‘/’时，要判断后面是否跟着是注释语句。

编译原理实验报告

编译原理实验报告一、实验目的本次编译原理实验的主要目的是通过实践加深对编译原理中词法分析、语法分析、语义分析和代码生成等关键环节的理解，并提高实际动手能力和问题解决能力。

二、实验环境本次实验使用的编程语言为 C/C+＋，开发工具为 Visual Studio 2019，操作系统为 Windows 10。

三、实验内容（一）词法分析器的设计与实现词法分析是编译过程的第一个阶段，其任务是从输入的源程序中识别出一个个具有独立意义的单词符号。

在本次实验中，我们使用有限自动机的理论来设计词法分析器。

首先，我们定义了单词的种类，包括关键字、标识符、常量、运算符和分隔符等。

然后，根据这些定义，构建了相应的状态转换图，并将其转换为程序代码。

在实现过程中，我们使用了字符扫描和状态转移的方法，逐步读取输入的字符，判断其所属的单词类型，并将其输出。

（二）语法分析器的设计与实现语法分析是编译过程的核心环节之一，其任务是在词法分析的基础上，根据给定的语法规则，判断输入的单词序列是否构成一个合法的句子。

在本次实验中，我们采用了自顶向下的递归下降分析法来实现语法分析器。

首先，我们根据给定的语法规则，编写了相应的递归函数。

每个函数对应一种语法结构，通过对输入单词的判断和递归调用，来确定语法的正确性。

在实现过程中，我们遇到了一些语法歧义的问题，通过仔细分析语法规则和调整函数的实现逻辑，最终解决了这些问题。

（三）语义分析与中间代码生成语义分析的任务是对语法分析所产生的语法树进行语义检查，并生成中间代码。

在本次实验中，我们使用了四元式作为中间代码的表示形式。

在语义分析过程中，我们检查了变量的定义和使用是否合法，类型是否匹配等问题。

同时，根据语法树的结构，生成相应的四元式中间代码。

（四）代码优化代码优化的目的是提高生成代码的质量和效率。

在本次实验中，我们实现了一些基本的代码优化算法，如常量折叠、公共子表达式消除等。

通过对中间代码进行分析和转换，减少了代码的冗余和计算量，提高了代码的执行效率。

编译原理课程试验报告

int id;//指向符号表的元素的下标
}
2．符号表：
数组string[MAX]，用于存储符号。
3.符号映射：
map<string, int> SM;
用于判断符号是否在符号表中存在，若存在返回此符号在符号表中的位置下标。
(4)错误处理
1.显示错误行数，状态0发生错误，非法的开始字符
2.显示错误行数,装态5发生错误，浮点数分析时发生错误
编译原理课程实验报告
实验1：词法分析
姓名
院系
软件学院
学号
任课教师
指导教师
实验地点
实验时间
2008-12-1
实验课表现
出勤、表现得分
实验报告
得分
实验总分
操作结果得分
一、实验目的
实验目的：
1.巩固对词法分析的基本功能和原理的认识。通过看书和实践来达到目的。
2.能够应用自动机的知识进行词法分析。通过画出状态转换图达到目的。
3.理解并处理词法分析中的异常和错误。通过编写代码处理达到目的。
二、实验内容
要求：对如下工作进行展开描述
(1)给出语言的词法规则描述
记号
属性
关键字
本身
_
标识符
IDN
指向符号表中与*相关的表项的指针
整常数
INUM
数值
浮点常数
FNUM
数值
字符常数
CH
字符
字符串常数
STR
字符串
单界符
SC
字符(+,-,*,/,=,{,},;)
指导教师评语：
日期：
IDN变量: f
SC单界符: =
FNUM浮点数: -2.01

编译原理实验报告(手打)

《编译原理》实验报告班级：计C104姓名：李云霄学号：108490实验一词法分析程序实现一、实验目的与要求通过编写和调试一个词法分析程序，掌握在对程序设计语言的源程序进行扫描的过程中，将字符形式的源程序流转化为一个由各类单词符号组成的流的词法分析方法。

二、实验内容选取无符号数的算术四则运算中的各类单词为识别对象，要求将其中的各个单词识别出来。

输入：由无符号数和+，－，*，/, ( , ) 构成的算术表达式，如1.5E+2－100。

输出：对识别出的每一单词均单行输出其类别码（无符号数的值暂不要求计算）。

三、实现方法与环境1、首先设计识别各类单词的状态转换图。

描述无符号常数的确定、最小化状态转换图如图1所示。

其中编号0，1，2，…，6代表非终结符号<无符号数>、<余留无符号数>、<十进小数>、<小数部分>、<指数部分>、<整指数>及<余留整指数>， 1，2和6为终态，分别代表整数、小数和科学计数的识别结束状态。

图1 文法G[<无符号数>]的状态转换图其中编号0，1，2，…，6代表非终结符号<无符号数>、<余留无符号数>、<十进小数>、<小数部分>、<指数部分>、<整指数>及<余留整指数>， 1，2和6为终态，分别代表整数、小数和科学计数的识别结束状态。

在一个程序设计语言中，一般都含有若干类单词符号，为此可首先为每类单词建立一张状态转换图，然后将这些状态转换图合并成一张统一的状态图，即得到了一个有限自动机，再进行必要的确定化和状态数最小化处理，最后据此构造词法分析程序。

四则运算算术符号的识别很简单，直接在状态图的0状态分别引出相应标记的矢根据描述语言中各类单词的文法状态转换图或状态矩阵，利用某种语言（C语言或JAVA语言）直接编写词法分析程序。

编译原理实验报告——词法分析器(内含源代码)

编译原理实验（一）——词法分析器一．实验描述运行环境：vc++2008对某特定语言A ，构造其词法规则。

该语言的单词符号包括：12状态转换图3程序流程：词法分析作成一个子程序，由另一个主程序调用，每次调用返回一个单词对应的二元组，输出标识符表、常数表由主程序来完成。

二．实验目的通过动手实践，使学生对构造编译系统的基本理论、编译程序的基本结构有更为深入的理解和掌握；使学生掌握编译程序设计的基本方法和步骤；能够设计实现编译系统的重要环节。

同时增强编写和调试程序的能力。

三．实验任务编制程序实现要求的功能，并能完成对测试样例程序的分析。

四．实验原理char set[1000],str[500],strtaken[20];//set[]存储代码,strtaken[]存储当前字符char sign[50][10],constant[50][10];//存储标识符和常量定义了一个Analyzer类class Analyzer{public:Analyzer(); //构造函数 ~Analyzer(); //析构函数int IsLetter(char ch); //判断是否是字母，是则返回 1，否则返回 0。

int IsDigit(char ch); //判断是否为数字，是则返回 1，否则返回 0。

void GetChar(char *ch); //将下一个输入字符读到ch中。

void GetBC(char *ch); //检查ch中的字符是否为空白，若是，则调用GetChar直至ch进入一个非空白字符。

void Concat(char *strTaken, char *ch); //将ch中的字符连接到strToken之后。

int Reserve(char *strTaken); //对strTaken中的字符串查找保留字表，若是一个保留字返回它的数码，否则返回0。

void Retract(char *ch) ; //将搜索指针器回调一个字符位置，将ch置为空白字符。

计算机编译原理实验报告

编译原理实验报告实验一词法分析设计一、实验功能：1、对输入的txt文件内的内容进行词法分析：2、由文件流输入test.txt中的内容，对文件中的各类字符进行词法分析3、打印出分析后的结果；二、程序结构描述：（源代码见附录）1、分别利用k[],s1[],s2[],s3[]构造关键字表，分界符表，算术运算符表和关系运算符表。

2、bool isletter(){} 用来判断其是否为字母，是则返回true，否则返回false；bool isdigit(){} 用来判断其是否为数字，是则返回true，否则返回false；bool iscalcu(){} 用来判断是否为算术运算符，是则返回true，否则返回false；bool reserve(string a[]){} 用来判断某字符是否在上述四个表中，是则返回true，否则返回false；void concat(){} 用来连接字符串；void getn(){} 用来读取字符；void getb(){} 用来对空格进行处理；void retract(){}某些必要的退格处理；int analysis(){} 对一个单词的单词种别进行具体判断；在主函数中用switch决定输出。

三、实验结果四、实验总结词法分析器一眼看上去很复杂，但深入的去做就会发现并没有一开始想象的那么困难。

对于一个字符的种别和类型可以用bool函数来判断，对于关键字和标示符的识别（尤其是3b）则费了一番功夫，最后对于常数的小数点问题处理更是麻烦。

另外，这个实验要设定好时候退格，否则将会导致字符漏读甚至造成字符重复读取。

我认为，这个实验在程序实现上大体不算困难，但在细节的处理上则需要好好地下功夫去想，否则最后的程序很可能会出现看上去没有问题，但实际上漏洞百出的状况。

将学过的知识应用到实际中并不简单，只有自己不断尝试将知识转化成程序才能避免眼高手低，对于知识的理解也必将更加深刻。

实验二LL(1)分析法一、实验原理：1、写出LL（1）分析法的思想：当一个文法满足LL(1)条件时，我们就可以为它构造一个不带回溯的自上而下的分析程序，这个分析程序是有一组递归过程组成的，每个过程对应文法的一个非终结符。

编译原理实验报告1

03091337 李璐 03091339 宗婷婷一、上机题目：实现一个简单语言（CPL）的编译器（解释器）二、功能要求：接收以CPL编写的程序，对其进行词法分析、语法分析、语法制导翻译等，然后能够正确的执行程序。

三、试验目的1.加深编译原理基础知识的理解：词法分析、语法分析、语法制导翻译等2.加深相关基础知识的理解：数据结构、操作系统等3.提高编程能力4.锻炼独立思考和解决问题的能力四、题目说明1.数据类型：整型变量（常量），布尔变量（常量）取值范围{…, -2, -1, 0, 1, 2, …}, {true, false}2、运算表达式：简单的代数运算，布尔运算3、程序语句：赋值表达式，顺序语句，if-else语句，while语句五、环境配置1.安装Parser Generator、Visual C++；2.分别配置Parser Generator、Visual C++；3.使用Parser Generator创建一个工程编写l文件mylexer.l；编译mylexer.l，生成mylexer.h与mylexer.c；4.使用VC++创建Win32 Console Application工程并配置该项目；加入mylexer.h与mylexer.c，编译工程；执行标识符数字识别器；注意：每次修改l文件后，需要重新编译l文件，再重新编译VC工程六、设计思路及过程设计流程：词法分析LEX的此法分析部分主要利用有限状态机进行单词的识别，在分析该部分之前，首先应该对YACC的预定义文法进行解释。

在YACC中用%union扩充了yystype的内容，使其可以处理char型，int型，node型，其中Node即为定义的树形结点，其定义如下：typedef enum { TYPE_CONTENT, TYPE_INDEX, TYPE_OP } NodeEnum;/* 操作符 */typedef struct {int name; /* 操作符名称 */int num; /* 操作元个数 */struct NodeTag * node[1]; /* 操作元地址可扩展 */} OpNode;typedef struct NodeTag {NodeEnum type; /* 树结点类型 *//* Union 必须是最后一个成员 */union {int content; /* 内容 */int index; /* 索引 */OpNode op; /* 操作符对象 */};} Node;extern int Var[26];结点可以是三种类型(CONTENT,INDEX,OP)。

编译原理实验报告

编译方法实验报告实验1：扫描器的设计一、实验目的熟悉并实现一个扫描器（词法分析程序）。

二、实验要求(1) 设计扫描器的有限自动机（识别器）；(2) 设计翻译、生成Token的算法（翻译器）；(3) 编写代码并上机调试运行通过。

·输入——源程序文件或源程序字符串；·输出——相应的Token序列；关键字表和界符表；符号表和常数表；三、实验步骤流程：初始化；打开用户源程序文件；while （文件未结束）{ 读入一行到w[i]，i=0;do //处理一行，每次处理一个单词{ 滤空格，直到第一个非空的w[i]；i--；s=1; //处理一个单词开始while （s!=0）//拼单词并生成相应Token{act(s); //执行q sif （s>=11 && s<=14）//一个单词处理结束break;i++; //getchar()s=find(s, w[i]);}if （s==0）词法错误；}while （w[i]!=换行符）；}关闭用户源程序文件；生成Token文件；输出关键字表；输出Token序列；输出符号表；输出常数表；有限自动机的状态转换图： ed d d+|- -1/+/-+① d ② . ③ d ④ e ⑤ ⑥ d ⑦ d --1/+/-l/d -1/+/--1l ⑧ --1b ⑨ b ⑩ --1--1-其中：d 为数字，l 为字母，b 为界符，-1代表其它符号（如在状态8处遇到了非字母或数字的其它符号，会变换到状态12）。

关键字表和界符表：Program; Begin: End( Var) While, Do:= Repeat+ Until- For* To/ If> Then>= Else==< <=四、主要数据结构①状态转换矩阵：int aut[10][7]={ 2, 0, 0, 0, 8, 9, 15,2, 3, 5,11, 0, 0, 11,4, 0, 0, 0, 0, 0, 0,4, 0, 5,11, 0, 0, 11,7, 0, 0, 6, 0, 0, 0,7, 0, 0, 0, 0, 0, 0,7, 0, 0,11, 0, 0, 11,8, 0, 0, 0, 8, 0, 12,0, 0, 0, 0, 0, 10, 14,0, 0, 0, 0, 0, 0, 13};12 11 13 14 15②关键字表：char keywords[30][12]={“program”,”begin”,”end”,”var”,”while”,”do”,”repeat”,”until”,”for”,”to”,”if”,”then”,”else”,“;”, ”:”, ”(“, ”)”, ”,”, ”:=”, ”+”, ”-“, ”*”, ”/”,”>”, ”>=”, ”==”, “<”, “<=”};③符号表：char ID[50][12]; //表中存有源程序中的标识符④常数表：float C[20];⑤其它变量：struct token{ int code;int value}; //Token结构struct token tok[100]; //Token数组int s; //当前状态int n,p,m,e,t; //尾数值，指数值，小数位数，指数符号，类型float num; //常数值char w[50]; //源程序缓冲区int i; //源程序指针,当前字符为w[i]char strTOKEN[12]; //当前已经识别出的单词五、实验核心代码int main(int argc, char* argv[]){FILE *fp;int s; //当前状态 *有限自动机中的状态fp=fopen("exa.txt","r");while (!feof(fp)){fgets(w,50,fp);i=0;//*处理一行do{printf("%c ",w[i]); //测试显示每个token的首字母//*处理一个tokenwhile (w[i]==' ') //滤空格i++;if (w[i]>='a' && w[i]<='z') //判定单词类别*是字母（关键字或标识符）{ptr=col2; num_map=2;}else if (w[i]>='0' && w[i]<='9') //*是数字（常量的开头）{ptr=col1; num_map=4;}else if (strchr(col3[0].str,w[i])==NULL) //*其他字符算为非法字符{printf("非法字符%c\n",w[i]);i++;continue;}else //界符{ptr=col3; num_map=1;}i--; //*向后退一个字符s=1; //开始处理一个单词while (s!=0){act(s);if (s>=11 && s<=14) //*判断是否是终止状态 *是终止状态，则形成一个tokenbreak;i++; //getchar() *读取下一个字符s=find(s,w[i]); //状态转换}if (s==0){strTOKEN[i_str]='\0';printf("词法错误：%s\n",strTOKEN);}}while (w[i]!=10);}printf("关键字表："); //输出结果for (i=0;i<30;i++)printf("%s ",keywords[i]);printf("\n");printf("Token序列：");for (i=0;i<num_token;i++)printf("(%d,%d)",tok[i].code,tok[i].value);printf("\n");printf("符号表：");for (i=0;i<num_ID;i++)printf("%s ",ID[i]);printf("\n");printf("常数表：");for (i=0;i<num_C;i++)printf("%d ",C[i]);printf("\n");fclose(fp);printf("Hello World!\n");return 0;}//*状态转换后，达到新的状态之后，记录的变化void act(int s){int code;switch (s){case 1:n=0;m=0;p=0;t=0;e=1;num=0;i_str=0;strTOKEN[i_str]='\0'; //其它变量初始化break;case 2:n=10*n+w[i]-48;break;case 3:t=1;break;case 4:n=10*n+w[i]-48; m++;break;case 5:t=1;break;case 6:if (w[i]=='-') e=-1;break;case 7:p=10*p+w[i]-48;break;case 8:strTOKEN[i_str++]=w[i]; //将ch中的符号拼接到strTOKEN的尾部；break;case 9:strTOKEN[i_str++]=w[i]; //将ch中的符号拼接到strTOKEN的尾部；break;case 10:strTOKEN[i_str++]=w[i]; //将ch中的符号拼接到strTOKEN的尾部；break;case 11:num=n*pow(10,e*p-m); //计算常数值tok[i_token].code=2; tok[i_token++].value=InsertConst(num); //生成常数Tokennum_token++;break;case 12:strTOKEN[i_str]='\0';code=Reserve(strTOKEN); //查关键字表if (code){ tok[i_token].code=code; tok[i_token++].value=0; } //生成关键字Token else{ tok[i_token].code=1;tok[i_token++].value=InsertID(strTOKEN); } //生成标识符Token num_token++;break;case 13:strTOKEN[i_str]='\0';code=Reserve(strTOKEN); //查界符表if (code){ tok[i_token].code=code; tok[i_token++].value=0; } //生成界符Token else{strTOKEN[strlen(strTOKEN)-1]='\0'; //单界符i--;code=Reserve(strTOKEN); //查界符表tok[i_token].code=code; tok[i_token++].value=0; //生成界符Token }num_token++;break;case 14:strTOKEN[i_str]='\0';code=Reserve(strTOKEN); //查界符表tok[i_token].code=code; tok[i_token++].value=0; //生成界符Token num_token++;break;}}//*状态转换int find(int s,char ch){int i,col=7;struct map *p;p=ptr;for (i=0;i<num_map;i++)if (strchr((p+i)->str,ch)){col=(p+i)->col;break;}return aut[s][col];}//*向常量表中插入常量int InsertConst(double num){int i;for (i=0;i<num_C;i++)if (num==C[i])return i;C[i]= (int)num;num_C++;return i;}int Reserve(char *str){int i;for (i=0;i<num_key;i++)if (!strcmp(keywords[i],str))return (i+3);return 0;}//*向符号表中插入新的符号int InsertID(char *str){int i;for (i=0;i<num_ID;i++)if (!strcmp(ID[i],str)) //*符号已经存在，则返回地址return i;strcpy(ID[i],str);num_ID++;return i;}六、实验结果实验思考题：1.扫描器的任务是什么？答：词法分析程序又称扫描器，任务有：(1) 识别单词——从用户的源程序中把单词分离出来;(2) 翻译单词——把单词转换成机内表示，便于后续处理。

编译原理实验报告

实验一词法分析一、实验目的设计、编制并调试一个词法分析程序，加深对词法分析原理的理解。

二、实验要求2.1 待分析的简单的词法（1）关键字：begin if then while do end所有的关键字都是小写。

（2）运算符和界符：= + - * / < <= <> > >= = ; ( ) #（3）其他单词是标识符（ID）和整型常数（SUM），通过以下正规式定义：ID = letter (letter | digit)*NUM = digit digit*（4）空格有空白、制表符和换行符组成。

空格一般用来分隔ID、SUM、运算符、界符和关键字，词法分析阶段通常被忽略。

2.2 各种单词符号对应的种别码：表2.1 各种单词符号对应的种别码单词符号种别码单词符号种别码bgin 1 ：17If 2 ：= 18Then 3 < 20wile 4 <> 21do 5 <= 22end 6 > 23lettet（letter|digit）* 10 >= 24 dight dight* 11 = 25 + 13 ；26—14 ( 27* 15 ) 28/ 16 # 02.3 词法分析程序的功能：输入：所给文法的源程序字符串。

输出：二元组（syn,token或sum）构成的序列。

其中：syn为单词种别码；token为存放的单词自身字符串；sum为整型常数。

例如：对源程序begin x:=9: if x>9 then x:=2*x+1/3; end #的源文件，经过词法分析后输出如下序列：(1,begin)(10,x)(18,:=)(11,9)(26,;)(2,if)……三、词法分析程序的算法思想：算法的基本任务是从字符串表示的源程序中识别出具有独立意义的单词符号，其基本思想是根据扫描到单词符号的第一个字符的种类，拼出相应的单词符号。

3.1 主程序示意图：主程序示意图如图3-1所示。

编译原理实验一

编译原理实验一实验1 词法分析程序的设计计科143 王祥真6103114095一、实验目的掌握计算机语言的词法分析程序的开发方法。

二、实验内容编制一个能够分析三种整数、标识符、主要运算符和主要关键字的词法分析程序。

三、实验要求1、根据以下的正规式，编制正规文法，画出状态图；标识符<字母>(<字母>|<数字字符>)*十进制整数0 |（1|2|3|4|5|6|7|8|9）（0|1|2|3|4|5|6|7|8|9）*如有余力，则进一步分析八进制和十六进制整数，其正规式如下：八进制整数0（1|2|3|4|5|6|7）（0|1|2|3|4|5|6|7）*十六进制整数0x（0|1|2|3|4|5|6|7|8|9|a|b|c|d|e|f）（0|1|2|3|4|5|6|7|8|9|a|b|c|d|e|f）*运算符和界符+ - * / > < = <= >= ( ) ；{ }关键字main if then else while do int (可根据需要添加)2、根据状态图，设计词法分析函数int scan( )，完成以下功能：1）从文本文件中读入测试源代码，根据状态转换图，分析出一个单词，2）以二元式形式输出单词<单词种类，单词属性>其中单词种类用整数表示：0：标识符1：十进制整数2：八进制整数3：十六进制整数运算符和界符，关键字采用一字一符，不编码其中单词属性表示如下：标识符，整数由于采用一类一符，属性用单词表示运算符和界符，关键字采用一字一符，属性为空3、编写测试程序，反复调用函数scan( )，输出单词种别和属性。

四、实验环境PC微机DOS操作系统或Windows 操作系统Turbo C 程序集成环境或Visual C++ 程序集成环境或Eclipse集成环境五、实验步骤1、根据正规式，画出状态转换图；2、根据状态图，设计词法分析算法；3、采用C或C++或Java语言，设计函数scan( )，实现该算法；4、编制测试程序（主函数main）；5、调试程序：读入文本文件program.txt，运行程序得到输出结果result.txt，并检查输出结果是否正确。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

函数OUT：一般仅在进入终态时调用此函数,调用得形式为ＯUT(c，VAL)。其中,实参c为相应单词得类别码助记符;实参VAL为TOＫEN（即词文）或为空串。函数OUＴ得功能就是,在送出一个单词得内部表示之后，返回到调用该词法分析程序得那个程序。
总得来说,开发一种新语言时，由于它得单词符号在不停地修改,采用LEX等工具生成得词法分析程序比较易于修改与维护。一旦一种语言确定了,则采用手工编写词法分析程序效率更高。
表Ｉ语言中得各类单词符号及其分类码表
单词符号
类别编码
类别码得助记符
单词值
begiｎ
1
BEＧIN
ｅnd
2
END
ｉf
３
IF
tｈｅn
4
THEＮ
else
5
ＥＬSE
标识符
6
IＤ
字母打头得字母数字串
无符号常数
7
ＵCON
机内二进制表示
〈
８
LT
<=
9
LE
＝
10
EQ
<＞
１1
ＮE
＞
12
GT
>=
13
ＧE
：=
14
ＩＳ
+
15
采用上述策略后，针对表I中得部分单词可以参考教材P80得图３－22（见图1）
图１识别表I所列语言中得部分单词得DFＡ及相关得语义过程
图１中所出现得语义变量及语义函数得含义与功能说明如下:
函数GETCHAR:每调用一次，就把扫描指示器当前所指示得源程序字符送入字符变量cｈ,然后把扫描指示器前推一个字符位置.
实验一词法分析程序实现
一、实验目得与要求
通过编写与调试一个词法分析程序,掌握在对程序设计语言得源程序进行扫描得过程中,将字符流形式得源程序转化为一个由各类单词符号组成得流得词法分析方法
二、实验内容
基本实验题目：若某一程序设计语言中得单词包括五个关键字begｉｎ、end、if、then、elsｅ；标识符；无符号常数；六种关系运算符；一个赋值符与四个算术运算符，试构造能识别这些单词得词法分析程序（各类单词得分类码参见表Ｉ）。
ＰL
—
1６
MI
＊
17
MU
/
Байду номын сангаас18
DI
输入:由符合与不符合所规定得单词类别结构得各类单词组成得源程序文件。
输出：把所识别出得每一单词均按形如(CLASS，VＡLUE）得二元式形式输出,并将结果放到某个文件中。对于标识符与无符号常数，CＬASS字段为相应得类别码得助记符;VALＵＥ字段则就是该标识符、常数得具体值；对于关键字与运算符,采用一词一类得编码形式，仅需在二元式得CLASS字段上放置相应单词得类别码得助记符，VALUE字段则为“空".
字符数组TOKEN：用来依次存放一个单词词文中得各个字符。
函数ＣＡＴ：每调用一次，就把当前ｃｈ中得字符拼接于TOKEＮ中所存字符串得右边。
函数LOOKUP:每调用一次，就以ＴOKEN中得字符串查保留字表,若查到，就将相应关键字得类别码赋给整型变量c;否则将c置为零。
函数RETＲACＴ：每调用一次,就把扫描指示器回退一个字符位置(即退回多读得那个字符)。
四．源程序
＃ｉnｃlｕde<stdio、h>
＃includｅ<ｃtypｅ、h>
＃inclｕｄe<ｓtｒing、h＞
＃inｃluｄe〈maｔh、h〉
＃deｆineＩD 6
＃define INT 7
＃ｄeｆine LT８
#dｅfiｎe LE９
＃defｉne EQ 1０
#ｄefiｎｅNE 1１
#ｄeｆｉｎeＧT 12
处理过程简述：在一个程序设计语言中,一般都含有若干类单词符号，为此可首先为每类单词建立一张状态转换图，然后将这些状态转换图合并成一张统一得状态图,即得到了一个有限自动机，再进行必要得确定化与状态数最小化处理，最后添加当进行状态转移时所需执行得语义动作,就可以据此构造词法分析程序了。
为了使词法分析程序结构比较清晰，且尽量避免某些枝节问题得纠缠，我们假定要编译得语言中,全部关键字都就是保留字,程序员不得将它们作为源程序中得标识符；在源程序得输入文本中，关键字、标识符、无符号常数之间，若未出现关系与算术运算符以及赋值符，则至少须用一个空白字符加以分隔。作了这些限制以后,就可以把关键字与标识符得识别统一进行处理。即每当开始识别一个单词时，若扫视到得第一个字符为字母,则把后续输入得字母或数字字符依次进行拼接，直至扫视到非字母、数字字符为止,以期获得一个尽可能长得字母数字字符串，然后以此字符串查所谓保留字表（此保留字表要事先造好),若查到此字符串，则取出相应得类别码;反之,则表明该字符串应为一标识符。
三、实现方法与环境
词法分析就是编译程序得第一个处理阶段，可以通过两种途径来构造词法分析程序.其一就是根据对语言中各类单词得某种描述或定义(如BＮF)，用手工得方式（例如可用Ｃ语言)构造词法分析程序。一般地,可以根据文法或状态转换图构造相应得状态矩阵,该状态矩阵连同控制程序一起便组成了编译器得词法分析程序;也可以根据文法或状态转换图直接编写词法分析程序。构造词法分析程序得另外一种途径就是所谓得词法分析程序得自动生成，即首先用正规式对语言中得各类单词符号进行词型描述,并分别指出在识别单词时,词法分析程序所应进行得语义处理工作,然后由一个所谓词法分析程序得构造程序对上述信息进行加工.如美国BEＬL实验室研制得ＬＥＸ就就是一个被广泛使用得词法分析程序得自动生成工具。
chaｒ＊KeyWｏｒｄＴabｌｅ[MAX_KＥＹ＿NUMBＥＲ］={＂bｅgin”,”end”，"if＂，＂then＂, "else”，ＫEY_WORD_END｝；
cｈar TOKEN[20]=""；
chａr ch='＇;//用于存储带判断得字符
int row＝1;//rｏw标识错误在第几行
#ｄefｉneＤIGＩT 1
＃definｅＧE 13
＃ｄefine IS 1４
＃defineＰL15
#defiｎe MI 16
#defineＭＵ17
#defineＤI１8
＃defiｎeMAX＿KEY_NＵＭＢＥＲ20//关键字得数量
＃ｄｅｆine KEY_WＯRＤ_END"waiｔｉng for yoｕrｅxpandinｇ＂//关键字结束标记
＃ｄｅfine POINＴ２
＃deｆｉne OＴＨER3
＃dｅfinePOWER４
＃deｆine PLUＳ5
#define MＩNＵＳ６
＃definｅUCON 7 /／假设无符号常量得类数就是7
#defiｎｅClassＯther200
#defineＥｎdStaｔｅ－1