实验1-3-《编译原理》词法分析程序设计方案

实验1-3 《编译原理》S语言词法分析程序设计方案

一、实验目的

了解词法分析程序的两种设计方法之一：根据状态转换图直接编程的方式；

二、实验内容

1．根据状态转换图直接编程

编写一个词法分析程序，它从左到右逐个字符的对源程序进行扫描，产生一个个的单词的二元式，形成二元式（记号）流文件输出。在此，词法分析程序作为单独的一遍，如下图所示。

具体任务有：

（1）组织源程序的输入

（2）拼出单词并查找其类别编号，形成二元式输出，得到单词流文件

（3）删除注释、空格和无用符号

（4）发现并定位词法错误，需要输出错误的位置在源程序中的第几行。将错误信息输出到屏幕上。

（5）对于普通标识符和常量，分别建立标识符表和常量表（使用线性表存储），当遇到一个标识符或常量时，查找标识符表或常量表，若存在，则返回位置，否则返回0并且填写符号表或常量表。

标识符表结构：变量名，类型（整型、实型、字符型），分配的数据区地址

注：词法分析阶段只填写变量名，其它部分在语法分析、语义分析、代码生成等阶段逐步填入。

常量表结构：常量名，常量值

三、实验要求

1．能对任何S语言源程序进行分析

在运行词法分析程序时，应该用问答形式输入要被分析的S源语言程序的文件名，然后对该程序完成词法分析任务。

2．能检查并处理某些词法分析错误

词法分析程序能给出的错误信息包括：总的出错个数，每个错误所在的行号，错误的编号及错误信息。

本实验要求处理以下两种错误（编号分别为1，2）：

1：非法字符：单词表中不存在的字符处理为非法字符，处理方式是删除该字符，给出错误信息，“某某字符非法”。

2：源程序文件结束而注释未结束。注释格式为：/* …… */

四、保留字和特殊符号表

括整数和

实数）单词助记

符

while switch break begin end id num

内码值- - - - - 在符号表

中的位置在常数表中的位置

单词代码19 20 21 22 23 24 25 26 27 单词+ - * / % ( ) [ ] 单词助记

符

+ - * / % ( ) [ ] 内码值- - - - - - - - -

单词代码28 28 29 30 单词!= < > <= >= == ；{ } 单词助记

符

rlop ；{ } 内码值!= < > <= >= == - -

单词代码37 38 39 40 41 42 43 44 45 单词/= += -= *= %= || && ! = 单词助记

符

/= += -= *= %= or and not = 内码值- - - - - - - - - 单词的构词规则：

字母=[A-Za-z]

数字=[0-9]

标识符=（字母|_）（字母|数字）*

数字=数字(数字)*(.数字+|)

四、S语言表达式和语句说明

1．算术表达式:+、-、*、/、%

2．关系运算符：>、>=、<、<=、==、！=

3．赋值运算符：=，+=、-=、*=、/=、%=

4．变量说明：类型标识符变量名表；

5．类型标识符：int char float

6．If语句：if 表达式then 语句[else 语句]

7．For语句：for（表达式1；表达式2；表达式3）语句

8．While语句：while 表达式do 语句

9．S语言程序：由函数构成，函数不能嵌套定义。

函数格式为：

返回值函数名（参数）

{

数据说明

语句

}

五、程序参考结构说明

1．Initscanner函数：程序初始化：输入并打开源程序文件和目标程序文件，初始化保留字表

2．Scanner函数：若文件未结束，反复调用lexscan函数识别单词。

3．Lexscan函数：根据读入的单词的第一个字符确定调用不同的单词识别函数

4．Isalpha函数：识别保留字和标识符

5．Isnumber函数：识别整数，如有精力，可加入识别实数部分工功能

6．Isanotation函数：处理除号/和注释

7．Isother函数识别其他特殊字符

8．Output函数：输出单词的二元式到目标文件，输出格式（单词助记符，单词内码值），如（int，-）（rlop，>）……

9．Error函数：输出错误信息到屏幕

10．除此之外，还可以设置查符号表，填写符号表等函数，学生可自行设计。

实验中，可以将某些类型的单词识别过程利用DFA算法实现，DFA算法参考如下：DFA（S=S0,MOVE[][],F[],ALPHABET[]，ALLS[]）

/*S为状态，初值为DFA的初态，MOVE[][]为状态转换矩阵，F[] 为终态集，ALPHABET[] 为字母表，其中的字母顺序与MOVE[][] 中列标题的字母顺序一致。ALLS[]为状态集*/ {

Char Wordbuffer[10]=“”//单词缓冲区置空

Nextchar=getchar（）；//读字符

i=0；

while（nextchar！=NULL）//NULL代表此类单词

{ if （nextcha r！∈ALPHABET[]）{ERROR（“非法字符”），return（“非法字符”）；}

S=MOVE[S][nextchar] //下一状态

if（S=NULL）return（“不接受”）；//下一状态为空，不能识别，单词错误

wordbuffer[i]=nextchar ；//保存单词符号

i++；

nextchar=getchar（）；

}

Wordbuffer[i]=‘\0’;

If（S∈F）return（wordbuffer）；//接受

Else return（“不接受”）；

}

六、实验过程说明

1．每人单独完成。

2．完成后，由老师验收，并给出成绩。

3．实验完成后，写出实验报告（要求交打印稿）。报告内容要求如下：

七、测试源程序示例：

//aa.c

void aa( )

{

float rate,circle;

rate=3;

circle=3.14*rate*rate;

}

输出结果：

（1）输出结果文件：

（void,-）(id, 0) ((,-) (),-) ({,- ) ( float,-) (id,1)……

（2）标识符的符号表：

（3

实验地点：教10五楼计算机学院软一机房

实验时间:第4周周二3单元、周四1单元、第五周周二3单元

八、实验代码

#include

#define MAX 10//保留字符号长度

#define MAXSIZE 45//保留字和特殊符号表长度

#define NUM 30//标识符和常数的个数

FILE *in,*out;// 指向文件的指针

char in];//文件名字

char token[MAX];

char Word[NUM][MAX];//标识符

char consts[NUM][MAX];//常数

char lownum[NUM][MAX]={"0","1","2","3","4","5","6","7","8","9",

"10","11","12","13","14","15","16","17","18","19"

"20","21","22","23","24","25","26","27","28","29"}; //自定义表int n=1;//行号

int num=0; //错误统计数

typedef struct Key_word//保留字和特殊符号表结构

{

//int keyNum;

char keyWord[MAX];

char keySign[MAX];

char keyValue[MAX];

}Key_word;

//初始化保留字表

Key_word Key[MAXSIZE]={{"int","int","-"},{"char","char","-"},{"float","float","-"},

{"void","void","-"},{"const","const","-"},{"for","for","-"},

{"if","if","-"},{"else","else","-"},{"then","then","-"},

{"while","while","-"},{"switch","switch","-"},{"break","break","-"},

{"begin","begin","-"},{"end","end","-"},{"","",""},

{"","",""},{"","id",""},{"","num",""},

{"+","+","-"},{"-","-","-"},{"*","*","-"},

{"/","/","-"},{"%","%","-"},{"(","(","-"},

{")",")","-"},{"[","[","-"},{"]","]","-"},

{"","",""},{"<","rlop","<"},{">","rlop",">"},

{"<=","rlop","<="},{">=","rlop",">="},{"=","rlop","="},

{"!=","rlop","!="},{";",";","-"},{"","",""},

{"/=","/=","-"},{"+=","+=","-"},{"-=","-=","-"},

{"*=","*=","-"},{"%=","%=","-"},{"||","or","-"},

{"&&","and","-"},{"!","not","-"},{"=","=","-"}};

//打开关闭文件

int Initscanner()

{

printf("请输入要输入的文件:\n");

scanf("%s",infile);

if((in=fopen(infile,"r"))==NULL)

{

printf("cannot open infile!\n");

return 0;

}

if((out=fopen("word.txt","a+"))==NULL)

{

printf("cannot open outfile!\n");

return 0;

}

return 0;

}

//写入文件

void Output(int n,int m)

{

fputs("(",out);

fputs(Key[n].keySign,out);

fputs(",",out);

if(m==-1)

fputs(Key[n].keyValue,out);

else

fputs(lownum[m],out);//下标

fputs(")",out);

}

//Isalpha函数：识别保留字和标识符

int Isalpha()

{

int i;

for(i=0;i<16;i++)//关键字

{

if(strcmp(token,Key[i].keyWord)==0)

{

Output(i,-1);

return 0;

}

//标识符Word[NUM][MAX]

for(i=0;i

{

if((Word[i][0]!=NULL)&&strcmp(token,Word[i])==0)

{

Output(16,i);

return 0;

}

if(Word[i][0]==NULL)

{

strcpy(Word[i],token);

Output(16,i);

return 0;

}

return 0;

}

int Isnumber()//Isnumber函数:consts[NUM][MAX]

{

int i;

for(i=0;i

{

if((consts[i][0]!=NULL)&&strcmp(token,consts[i])==0)

{

Output(17,i);

return 0;

}

if(consts[i][0]==NULL)

{

strcpy(consts[i],token);

Output(17,i);

return 0;

}

return 0;

}

void remove() //扫描指针回退一个字符

{

fseek(in,-1,SEEK_CUR);

}

//Isanotation函数：处理除号/和注释

void Isanotation() //提示第一个字符已经存为/了

{

char ch,pre;

ch=getc(in);

if(ch=='=')// "/="

Output(36,-1);

else if(ch=='*')// "/*"

{

ch=getc(in);

do{

if(feof(in))

{

num++;

printf("\n第(%d)行: 注释错误: /*后面的字符全部当做注释，缺少结束注释*/\n",n);

break;

}

pre=ch;

ch=getc(in);

}while(pre!='*'||ch!='/');

}

else// "/"

{

remove(); //指针回退一个字符

Output(21,-1);

}

//Isother函数识别其他特殊字符

void Isother()

{ int i=1;int j=0;

if(token[0]=='<'||token[0]=='>'||token[0]=='!'||token[0]=='%')

{

ch=getc(in);

if(ch=='=')

token[i++]=ch;

else

remove();

}

else if(token[0]=='|')

{

ch=getc(in);

if(ch=='|')

token[i++]=ch;

else

remove();

}

else if(token[0]=='&')

{

ch=getc(in);

if(ch=='&')

token[i++]=ch;

else

remove();

}

token[i]='\0';

for(i=18;i<45;i++)

{

if(strcmp(token,Key[i].keyWord)==0)

{

Output(i,-1);

break;

}

if(i==45)

{

num++;

printf("\n第(%d)行: 字符错误: %s字符非法\n",n,token);

}

void Scanner()

{

char ch;

ch=getc(in);

while(!feof(in))

{

while(ch==' '||ch=='\t'||ch=='\n') //先统计行数

{

if(ch=='\n')

++n;

ch=getc(in);

}

if(((ch>='a')&&(ch<='z'))||(ch=='_'))//标识符isalpha(ch)单词

{

i=1;

token[0]=ch;

ch=getc(in);

while(((ch>='a')&&(ch<='z'))||((ch>='0')&&(ch<='9')))//word number

{

token[i++]=ch;

ch=getc(in);

}

token[i]='\0';

Isalpha();

}

else if((ch>='0')&&(ch<='9'))//整数

{

i=1;

token[0]=ch;

ch=getc(in);

while(isdigit(ch))

{

token[i++]=ch;

ch=getc(in);

}

token[i]='\0';

Isnumber();

}

else if(ch=='/')//区分"/" , "/=" , "/*"

{

token[0]=ch;

Isanotation();

ch=getc(in);

}

else //特殊字符

{

token[0]=ch;

Isother();

ch=getc(in);

}

void show()

{

int i;

char ch;

printf("\n二元式:\n");

rewind(out);

while(!feof(out))

{

printf("%c",getc(out));

}

printf("\n标志符表\n");

for(i=0;i

{

if(Word[i][0]!=NULL)

printf("%d,%s\n",i,Word[i]);

}

printf("\n常数表\n");

for(i=0;i

{

if(consts[i][0]!=NULL)

printf("%d,%s\n",i,consts[i]);

}

void main()

{

Initscanner();

Scanner();

printf("\n共有%d个错误\n",num);

show();

fclose(in);

fclose(out);

}

九、实验结果

输入文件

void aa( ) begin float rate,circle; rate=3;

circle=3.14*rate;/******/ end 输出文件

(void,-)

(id,0)

((,-)

(),-)

(begin,-)

(float,-)

(id,1)

(id,2)

(;,-)

(id,1)

(rlop,=)

(num,0)

(;,-)

(id,2)

(rlop,=)

(num,0)

(num,1)

(*,-)

(id,1)

(;,-)

(end,-)

十、实验总结

经过此次实验，了解了程序的词法构词规则和词法分析过程。在实验过程中，得到了同学的帮助才得以完成。本实验基本达到了老师的要求，实现了词法分析的基本功能。

B14511 2014405A114 王自达

实验一词法分析器的设计

实验一词法分析器的设计 (2) 1.1 词法分析器的结构和主要任务 (2) 1.1.1 输入输出接口 (2) 1.1.2 条件限制 (2) 1.2 词法分析程序的总体设计 (3) 1.3 词法分析程序的详细设计 (4) 1.4实验步骤 (5) 1.5输入数据 (15) 1.6结果输出 (15)

实验一词法分析器的设计实验目的：掌握词法分析的概念，设计方法，熟悉高级语言中词法的定义，词法分析程序的编写。实验要求：在8学时内实现SAMPLE语言的词法分析器，要求用VC窗口界面实现。实验内容：分为4次实验完成。 1.1 词法分析器的结构和主要任务 1.1.1 输入输出接口图1-1词法分析器的输入输出界面词法分析程序的主要任务是从左到右扫描每行源程序，拼成单词，换成统一的内部表示(token)输出，送给语法分析器。具体包括： 1.组织源程序的输入； 2.按规则拼单词，并转换成二元形式； 3.滤掉空白符，跳过注释、换行符及一些无用的符号(如字符常数的引号) 4.进行行列计数，用于指出出错的行列号，并复制出错部分； 5.列表打印源程序； 6.发现并定位词法错误； 7.生成符号表。 token文件和符号表用作语法分析的输入部分。 1.1.2 条件限制本实验可以作如下假定： (1) 假定SAMPLE语言采用自由格式书写； (2) 可以使用注解，用/*……*/或者{……}标识，但注解不能插在单词内部，注解要在一行内结束，若一行结束，没有遇到注释后面的结束标记，自动认为注释也结束； (3) 一行可以有多个语句，一个语句也可以分布在多行中，单词之间和语句之间可以插入任意空格，单词中间不能有空白符号，单词中间也不能有回车换行符，即单词不能跨行书写； (4) 关键字都是保留字。

编译原理实验--词法分析器

编译原理实验--词法分析器实验一词法分析器设计【实验目的】 1(熟悉词法分析的基本原理，词法分析的过程以及词法分析中要注意的问题。 2(复习高级语言，进一步加强用高级语言来解决实际问题的能力。 3(通过完成词法分析程序，了解词法分析的过程。【实验内容】用C语言编写一个PL/0词法分析器，为语法语义分析提供单词，使之能把输入的字符串形式的源程序分割成一个个单词符号传递给语法语义分析，并把分析结果(基本字，运算符，标识符，常数以及界符)输出。【实验流程图】

【实验步骤】 1(提取pl/0文件中基本字的源代码 while((ch=fgetc(stream))!='.') { int k=-1; char a[SIZE]; int s=0; while(ch>='a' && ch<='z'||ch>='A' && ch<='Z') { if(ch>='A' && ch<='Z') ch+=32; a[++k]=(char)ch; ch=fgetc(stream); } for(int m=0;m<=12&&k!=-1;m++) for(int n=0;n<=k;n++) {

if(a[n]==wsym[m][n]) ++s; else s=0; if(s==(strlen(wsym[m]))) {printf("%s\t",wsym[m]);m=14;n=k+1;} } 2(提取pl/0文件中标识符的源代码 while((ch=fgetc(stream))!='.') { int k=-1; char a[SIZE]=" "; int s=0; while(ch>='a' && ch<='z'||ch>='A' && ch<='Z') { if(ch>='A' && ch<='Z') ch+=32; a[++k]=(char)ch; ch=fgetc(stream); } for(int m=0;m<=12&&k!=-1;m++) for(int n=0;n<=k;n++) { if(a[n]==wsym[m][n]) ++s; else s=0; if(s==(strlen(wsym[m]))) {m=14;n=k+1;} } if(m==13) for(m=0;a[m]!=NULL;m++) printf("%c ",a[m]);

编译原理词法分析器语法分析器实验报告

编译技术班级网络0802 学号3080610052姓名叶晨舟指导老师朱玉全2011年 7 月 4 日

一、目的编译技术是理论与实践并重的课程，而其实验课要综合运用一、二年级所学的多门课程的内容，用来完成一个小型编译程序。从而巩固和加强对词法分析、语法分析、语义分析、代码生成和报错处理等理论的认识和理解；培养学生对完整系统的独立分析和设计的能力，进一步培养学生的独立编程能力。二、任务及要求基本要求： 1．词法分析器产生下述小语言的单词序列这个小语言的所有的单词符号，以及它们的种别编码和内部值如下表：单词符号种别编码助记符内码值 DIM IF DO STOP END 标识符常数（整）= + * ** ，（）1 2 3 4 5 6 7 8 9 10 11 12 13 14 $DIM $IF $DO $STOP $END $ID $INT $ASSIGN $PLUS $STAR $POWER $COMMA $LPAR $RPAR - - - - - - 内部字符串标准二进形式 - - - - - - 对于这个小语言，有几点重要的限制：首先，所有的关键字（如IF﹑WHILE等）都是“保留字”。所谓的保留字的意思是，用户不得使用它们作为自己定义的标示符。例如，下面的写法是绝对禁止的： IF（5）=x 其次，由于把关键字作为保留字，故可以把关键字作为一类特殊标示符来处理。也就是说，对于关键字不专设对应的转换图。但把它们（及其种别编码）预先安排在一张表格中（此表叫作保留字表）。当转换图识别出一个标识符时，就去查对这张表，确定它是否为一个关键字。再次，如果关键字、标识符和常数之间没有确定的运算符或界符作间隔，则必须至少用一个空白符作间隔（此时，空白符不再是完全没有意义的了）。例如，一个条件语句应写为

东南大学编译原理词法分析器实验报告

词法分析设计 1. 实验目的通过本实验的编程实践，了解词法分析的任务，掌握词法分析程序设计的原理和构造方法，对编译的基本概念、原理和方法有完整的和清楚的理解，并能正确地、熟练地运用。 2. 实验内容用C++语言实现对C++语言子集的源程序进行词法分析。通过输入源程序从左到右对字符串进行扫描和分解，依次输出各个单词的内部编码及单词符号自身值；若遇到错误则显示“Error”，然后跳过错误部分继续显示；同时进行标识符登记符号表的管理。 3. 实验原理本次实验采用NFA->DFA->DFA0的过程: 对待分析的简单的词法（关键词/id/num/运算符/空白符等）先分别建立自己的FA，然后将他们用产生式连接起来并设置一个唯一的开始符，终结符不合并。待分析的简单的词法（1）关键字： "asm","auto","bool","break","case","catch","char","class","

const","const_cast"等（2）界符（查表） ";",",","(",")","[","]","{","}" （3）运算符 "*","/","%","+","-","<<","=",">>","&","^","|","++","--"," +=","-=","*=","/=","%=","&=","^=","|=" relop：（4）其他单词是标识符（ID）和整型常数（SUM），通过正规式定义。 id/keywords: digit: （5）空格有空白、制表符和换行符组成。空格一般用来分隔ID、SUM、运算符、界符和关键字，词法分析阶段通常被忽略。

编译原理词法分析和语法分析报告+代码(C语言版)

词法分析一、实验目的设计、编制并调试一个词法分析程序，加深对词法分析原理的理解。二、实验要求 2.1 待分析的简单的词法（1）关键字： begin if then while do end 所有的关键字都是小写。（2）运算符和界符： = + - * / < <= <> > >= = ; ( ) # （3）其他单词是标识符（ID）和整型常数（SUM），通过以下正规式定义： ID = letter (letter | digit)* NUM = digit digit* （4）空格有空白、制表符和换行符组成。空格一般用来分隔ID、SUM、运算符、界符和关键字，词法分析阶段通常被忽略。 2.2 各种单词符号对应的种别码：输入：所给文法的源程序字符串。输出：二元组（syn,token或sum）构成的序列。其中：syn为单词种别码； token为存放的单词自身字符串； sum为整型常数。例如：对源程序begin x:=9: if x>9 then x:=2*x+1/3; end #的源文件，经过词法分析后输出如下序列： (1,begin)(10,x)(18,:=)(11,9)(26,;)(2,if)…… 三、词法分析程序的算法思想：算法的基本任务是从字符串表示的源程序中识别出具有独立意义的单词符号，其基本思想是根据扫描到单词符号的第一个字符的种类，拼出相应的单词符号。

3.1 主程序示意图：主程序示意图如图3-1所示。其中初始包括以下两个方面： ⑴关键字表的初值。关键字作为特殊标识符处理，把它们预先安排在一张表格中（称为关键字表），当扫描程序识别出标识符时，查关键字表。如能查到匹配的单词，则该单词为关键字，否则为一般标识符。关键字表为一个字符串数组，其描述如下： Char *rwtab[6] = {“begin”, “if”, “then”, “while”, “do”, “end”,}; 图3-1 （2）程序中需要用到的主要变量为syn,token和sum 3.2 扫描子程序的算法思想：首先设置3个变量：①token用来存放构成单词符号的字符串；②sum用来整型单词；③syn用来存放单词符号的种别码。扫描子程序主要部分流程如图3-2所示。

编译原理实验词法分析实验报告

编译技术实验报告实验题目：词法分析学院：信息学院专业：计算机科学与技术学号：姓名：

一、实验目的 (1)理解词法分析的功能； (2)理解词法分析的实现方法；二、实验内容 PL0的文法如下 …< >?为非终结符。 …::=? 该符号的左部由右部定义，可读作“定义为”。 …|? 表示…或?，为左部可由多个右部定义。 …{ }? 表示花括号内的语法成分可以重复。在不加上下界时可重复0到任意次数，有上下界时可重复次数的限制。 …[ ]? 表示方括号内的成分为任选项。 …( )? 表示圆括号内的成分优先。上述符号为“元符号”，文法用上述符号作为文法符号时需要用引号…?括起。〈程序〉∷=〈分程序〉．〈分程序〉∷= [〈变量说明部分〉][〈过程说明部分〉]〈语句〉〈变量说明部分〉∷=V AR〈标识符〉{，〈标识符〉}：INTEGER；〈无符号整数〉∷=〈数字〉{〈数字〉} 〈标识符〉∷=〈字母〉{〈字母〉|〈数字〉} 〈过程说明部分〉∷=〈过程首部〉〈分程序〉{；〈过程说明部分〉}；〈过程首部〉∷=PROCEDURE〈标识符〉；〈语句〉∷=〈赋值语句〉|〈条件语句〉|〈过程调用语句〉|〈读语句〉|〈写语句〉|〈复合语句〉|〈空〉〈赋值语句〉∷=〈标识符〉∶=〈表达式〉〈复合语句〉∷=BEGIN〈语句〉{；〈语句〉}END 〈条件〉∷=〈表达式〉〈关系运算符〉〈表达式〉〈表达式〉∷=〈项〉{〈加法运算符〉〈项〉} 〈项〉∷=〈因子〉{〈乘法运算符〉〈因子〉} 〈因子〉∷=〈标识符〉|〈无符号整数〉|'('〈表达式〉')' 〈加法运算符〉∷=+|- 〈乘法运算符〉∷=* 〈关系运算符〉∷=<>|=|<|<=|>|>= 〈条件语句〉∷=IF〈条件〉THEN〈语句〉〈字母〉∷=a|b|…|X|Y|Z 〈数字〉∷=0|1|2|…|8|9 实现PL0的词法分析

词法分析器实验报告

词法分析器实验报告词法分析器实验报告实验目的: 设计、编制、调试一个词法分析子程序,识别单词，加深对词法分析原理的理解。实验要求: 该程序要实现的是一个读单词过程，从输入的源程序中，识别出各个具有独立意义的单词，即基本保留字、标识符、常数、运算符、分界符五大类。并依次输出各个单词的内部编码及单词符号自身值。 (一)实验内容 (1)功能描述:对给定的程序通过词法分析器弄够识别一个个单词符号，并以二元式(单词种别码，单词符号的属性值)显示。而本程序则是通过对给定路径的文件的分析后以单词符号和文字提示显示。 (2)程序结构描述: 函数调用格式: 函数调用格式函数名(实在参数表 ) Switch(m)、 isKey(String string)、isLetter(char c)、实参 isDigit(char c)、isOperator(char c) isKey(String string)、isLetter(char c)、调作为表达式 isDigit(char c)、isOperator(char c) 用方作为语句 getChar()、judgement()、法函数的递归调用 isOperator(char c) 、isLetter(char c)、isDigit(char c)

参数含义: 1 String string;存放读入的字符串 String str; 存放暂时读入的字符串 char ch; 存放读入的字符 int rs 判断读入的文件是否为空 char []data 存放文件中的数据 int m;通过switch用来判断字符类型，函数之间的调用关系图: main Complier..judgement isOperate() M=0 getChar( ) isDigit() M=4 For(ch ) isLet ter() M=2 Switch(m) isKey() M=3 函数功能: Judgement()判断输入的字符并输出单词符号，返回值为空; getChar() 读取文件的，返回值为空; isLetter(char c) 判断读入的字符是否为字母的，返回值为Boolean类型; switch (m) 判断跳转输出返回值为空; isOperator(char c)判断是否为运算符的，返回值为Boolean类型; isKey(String string)判断是否为关键字的，返回值为Boolean类型; isDigit(char c) 判断读入的字符是否为数字的，返回值为Boolean类型。测试结果:

词法分析器实验报告

词法分析器实验报告词法分析器设计一、实验目的：对C语言的一个子集设计并实现一个简单的词法分析器，掌握利用状态转换图设计词法分析器的基本方法。利用该词法分析器完成对源程序字符串的词法分析。输出形式是源程序的单词符号二元式的代码，并保存到文件中。二、实验内容： 1. 设计原理词法分析的任务：从左至右逐个字符地对源程序进行扫描，产生一个个单词符号。理论基础：有限自动机、正规文法、正规式词法分析器(Lexical Analyzer) 又称扫描器(Scanner)：执行词法分析的程序 2. 词法分析器的功能和输出形式功能:输入源程序、输出单词符号程序语言的单词符号一般分为以下五种：关键字、标识符、常数、运算符,界符 3. 输出的单词符号的表示形式: 单词种别用整数编码，关键字一字一种，标识符统归为一种，常数一种，各种符号各一种。 4. 词法分析器的结构单词符号 5. 状态转换图实现

三、程序设计 1．总体模块设计 /*用来存储目标文件名*/ string file_name; /*提取文本文件中的信息。*/ string GetText(); /*获得一个单词符号,从位置i开始查找。并且有一个引用参数j，用来返回这个单词最后一个字符在str的位置。*/ string GetWord(string str,int i,int& j); /*这个函数用来除去字符串中连续的空格和换行 int DeleteNull(string str,int i); /*判断i当前所指的字符是否为一个分界符，是的话返回真，反之假*/ bool IsBoundary(string str,int i); /*判断i当前所指的字符是否为一个运算符，是的话返回真，反之假*/ bool IsOperation(string str,int i);

编译原理实验_词法分析器的设计与实现

南华大学计算机科学与技术学院实验报告（ 2018~2019学年度第二学期）课程名称编译原理实验名称词法分析器的设计与实现学号专业班级地点教师

1.实验目的及要求实验目的加深对词法分析器的工作过程的理解；加强对词法分析方法的掌握；能够采用一种编程语言实现简单的词法分析程序；能够使用自己编写的分析程序对简单的程序段进行词法分析。实验要求 1.对单词的构词规则有明确的定义； 2.编写的分析程序能够正确识别源程序中的单词符号； 3.识别出的单词以<种别码，值>的形式保存在符号表中，正确设计和维护符号表； 4.对于源程序中的词法错误，能够做出简单的错误处理，给出简单的错误提示，保证顺利完成整个源程序的词法分析； 2.实验步骤 1.词法分析规则 <标识符>::=<字母>|<标识符><字母>|<标识符><数字> <常数>::=<数字>|<数字序列><数字> <数字序列>::＝<数字序列><数字>|<数字>|<.> <字母>::=a|b|c|……|x|y|z <数字>::=0|1|2|3|4|5|6|7|8|9 <运算符>::=<关系运算符>|<算术运算符>|<逻辑运算符>|<位运算符>|<赋值运算符> <算数运算符>::＝+|-|*|／|...|-- <关系运算符>::＝<|>|!=|>=|<=|== <逻辑运算符>::=&&| || |！ <位运算符>::=&| | |！ <赋值运算符>::==|+=|-=|/=|*= <分界符>::＝,|;|(|)|{|}|：| // |/**/ <保留字>::＝main|if|else|while|do|for|...|void

编译原理实验报告(词法分析器语法分析器)

编译原理实验报告

实验一一、实验名称：词法分析器的设计二、实验目的：1，词法分析器能够识别简单语言的单词符号 2，识别出并输出简单语言的基本字.标示符.无符号整数.运算符.和界符。三、实验要求：给出一个简单语言单词符号的种别编码词法分析器四、实验原理： 1、词法分析程序的算法思想算法的基本任务是从字符串表示的源程序中识别出具有独立意义的单词符号，其基本思想是根据扫描到单词符号的第一个字符的种类，拼出相应的单词符号。 2、程序流程图（1 （2）扫描子程序

五、实验内容： 1、实验分析编写程序时，先定义几个全局变量a[]、token[]（均为字符串数组),c,s( char型)，i,j,k（int型），a[]用来存放输入的字符串，token[]另一个则用来帮助识别单词符号，s用来表示正在分析的字符。字符串输入之后，逐个分析输入字符，判断其是否‘#’，若是表示字符串输入分析完毕，结束分析程序，若否则通过int digit(char c)、int letter(char c)判断其是数字，字符还是算术符,分别为用以判断数字或字符的情况，算术符的判断可以在switch语句中进行，还要通过函数int lookup(char token[])来判断标识符和保留字。 2 实验词法分析器源程序： #include #include #include int i,j,k; char c,s,a[20],token[20]={'0'}; int letter(char s){ if((s>=97)&&(s<=122)) return(1); else return(0); } int digit(char s){ if((s>=48)&&(s<=57)) return(1); else return(0); } void get(){ s=a[i]; i=i+1; } void retract(){ i=i-1; } int lookup(char token[20]){ if(strcmp(token,"while")==0) return(1); else if(strcmp(token,"if")==0) return(2); else if(strcmp(token,"else")==0) return(3); else if(strcmp(token,"switch")==0) return(4); else if(strcmp(token,"case")==0) return(5); else return(0); } void main() { printf("please input string :\n"); i=0; do{i=i+1; scanf("%c",&a[i]);

编译原理实验词法分析语法分析

本代码只供学习参考：词法分析源代码： #include #include #include using namespace std; string key[8]={"do","end","for","if","printf","scanf","then","while"}; string optr[4]={"+","-","*","/"}; string separator[6]={",",";","{","}","(",")"}; char ch; //判断是否为保留字 bool IsKey(string ss) { int i; for(i=0;i<8;i++) if(!strcmp(key[i].c_str(),ss.c_str())) return true; return false; } //字母判断函数 bool IsLetter(char c) { if(((c>='a')&&(c<='z'))||((c>='A')&&(c<='Z'))) return true; return false; } //数字判断函数 bool IsDigit(char c) { if(c>='0'&&c<='9') return true; return false; } //运算符判断函数 bool IsOptr(string ss) { int i; for(i=0;i<4;i++) if(!strcmp(optr[i].c_str(),ss.c_str())) return true ; return false; } //分界符判断函数 bool IsSeparator(string ss) { int i; for(i=0;i<6;i++) if(!strcmp(separator[i].c_str(),ss.c_str()))

实验一：词法分析器

实验一：词法分析器实验要求：输入一段源程序或者是字符序列，判断它属于关键字或者是标志符等类型，通过设计编制调试一个具体的词法分析程序，加深对词法分析原理的理解。掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。实验说明：本实验里面设计了两个程序，第一个非常简单，只有最简单的判断功能，即输入一个字符，判断它是属于关键字，或者标志符，或者数字，或者特殊字符，然后输出到屏幕它的类型，实现方法和编写的代码都很简单. 第二个程序是一个比较完整的词法即分析器，此处分析的是一段PASCL语言的代码，通过词法分析器的分析作用，在进行词法分析中，先自文件头开始以行为单位扫描程序，将该行的字符读入预先设定的一个数组缓冲区中，然后对该数组的字符逐词分割，进行词法分析，将每个词分割成关键字、标识符、常量和运算符四种词种，最终产生四个相对应的表，关键字表、标识符表、常量表和运算符表。此程序代码的编写和思路部分参考网上的程序。实验过程：本实验中用到c中自带的几个判断字母和数字的函数，他们包含在ctype.h 主要用到其中的几个函数如下： o isalnum - 是否為英文字母或數字字元(A~Z, a~z, 0~9) o isalpha - 是否為英文字母(A~Z, a~z) o isdigit - 是否為數字字元(0~9) 当其为真时，则返回非零值，由此可以由其返回的布尔值判断字符，为字符的类型判断提供了很大的方便。主要的几个函数是： bool Is_keyword(char str1[]) 判断是否为关键字 bool Is_signword(char str1[]) 判断是否为标志符 bool Is_digit(char str1[]) 判断是否为数字 bool Is_special(char str1[] ) 判断是否为特殊符号 Main()主函数部分用最简单的if else 结构，形成多个If …. Else if 的嵌套，顺次判断字符是否为某个函数中的真值，是则输出对应的显示，否则继续向下运行，如果最后还得不到匹配的话就输出提示错误的信息，整个实现的方法和思路都很简单。

编译原理实验报告2词法分析程序的设计

实验2 词法分析程序的设计一、实验目的掌握计算机语言的词法分析程序的开发方法。二、实验内容编制一个能够分析三种整数、标识符、主要运算符和主要关键字的词法分析程序。三、实验要求 1、根据以下的正规式，编制正规文法，画出状态图；标识符<字母>(<字母>|<数字字符>)* 十进制整数0 | (（1|2|3|4|5|6|7|8|9）（0|1|2|3|4|5|6|7|8|9）*) 八进制整数0（1|2|3|4|5|6|7）（0|1|2|3|4|5|6|7）* 十六进制整数0x（0|1|2|3|4|5|6|7|8|9|a|b|c|d|e|f）（0|1|2|3|4|5|6|7|8|9|a|b|c|d|e|f）* 运算符和界符+ - * / > < = ( ) ；关键字if then else while do 2、根据状态图，设计词法分析函数int scan( )，完成以下功能： 1）从文本文件中读入测试源代码，根据状态转换图，分析出一个单词， 2）以二元式形式输出单词<单词种类，单词属性> 其中单词种类用整数表示： 0：标识符 1：十进制整数 2：八进制整数 3：十六进制整数运算符和界符，关键字采用一字一符，不编码其中单词属性表示如下：标识符，整数由于采用一类一符，属性用单词表示运算符和界符，关键字采用一字一符，属性为空 3、编写测试程序，反复调用函数scan( )，输出单词种别和属性。四、实验环境 PC微机 DOS操作系统或Windows 操作系统 Turbo C 程序集成环境或Visual C++ 程序集成环境五、实验步骤 1、根据正规式，画出状态转换图；

编译原理词法分析器语法分析器实验报告

(此文档为word格式，下载后您可任意编辑修改！) 编译技术班级网络0802 学号姓名叶晨舟指导老师朱玉全 2011年 7 月 4 日

实验一、词法分析器(含源代码)

词法分析器实验报告一、实验目的及要求本次实验通过用C语言设计、编制、调试一个词法分析子程序，识别单词，实现一个C语言词法分析器，经过此过程可以加深对编译器解析单词流的过程的了解。运行环境：硬件：windows xp 软件：visual c++6.0 二、实验步骤 1.查询资料，了解词法分析器的工作过程与原理。 2.分析题目，整理出基本设计思路。 3.实践编码，将设计思想转换用c语言编码实现，编译运行。 4.测试功能，多次设置包含不同字符，关键字的待解析文件，仔细察看运行结果，检测该分析器的分析结果是否正确。通过最终的测试发现问题，逐渐完善代码中设置的分析对象与关键字表，拓宽分析范围提高分析能力。三、实验内容本实验中将c语言单词符号分成了四类：关键字key（特别的将main说明为主函数）、普通标示符、常数和界符。将关键字初始化在一个字符型指针数组*key[]中，将界符分别由程序中的case列出。在词法分析过程中，关键字表和case列出的界符的内容是固定不变的（由程序中的初始化确定），因此，从源文件字符串中识别出现的关键字，界符只能从其中选取。标识符、常数是在分析过程中不断形成的。对于一个具体源程序而言，在扫描字符串时识别出一个单词，若这个单词的类型是关键字、普通标示符、常数或界符中之一，那么就将此单词以文字说明的形式输出．每次调用词法分析程序，它均能自动继续扫描下去，形成下一个单词，直到整个源程序全部扫描完毕，从而形成相应的单词串。输出形式例如：void $关键字

流程图、程序流程图：开始输入源文件路径路径是否有效是初始化文件指针否将字符加入字符数组Word[] 是空格，空白或换行吗是字母吗是数字吗否否是界符吗否打开源文件跳过该字符是是文件结束？否将字符加入字符数组Word[] 否将字符加入字符数组Word[] 是指向下一字符识别指针内容指向下一字符是字母惑数字吗是将word 与关键字表key 进行匹配否匹配？是输出word 为关键字输出word 为普通标示符否将字符加入字符数组Word[] 指向下一字符输出word 为常数识别指针内容回退是数字吗是否输出word 为界符指向下一字符结束是输出Word 内容为不可识别将字符加入字符数组Word[]

编译原理词法分析器

一、实验目的了解词法分析程序的两种设计方法：1.根据状态转换图直接编程的方式；2.利用DFA 编写通用的词法分析程序。二、实验内容及要求 1．根据状态转换图直接编程编写一个词法分析程序，它从左到右逐个字符的对源程序进行扫描，产生一个个的单词的二元式，形成二元式（记号）流文件输出。在此，词法分析程序作为单独的一遍，如下图所示。具体任务有：（1）组织源程序的输入（2）拼出单词并查找其类别编号，形成二元式输出，得到单词流文件（3）删除注释、空格和无用符号（4）发现并定位词法错误，需要输出错误的位置在源程序中的第几行。将错误信息输出到屏幕上。（5）对于普通标识符和常量，分别建立标识符表和常量表（使用线性表存储），当遇到一个标识符或常量时，查找标识符表或常量表，若存在，则返回位置，否则返回0并且填写符号表或常量表。标识符表结构：变量名，类型（整型、实型、字符型），分配的数据区地址注：词法分析阶段只填写变量名，其它部分在语法分析、语义分析、代码生成等阶段逐步填入。常量表结构：常量名，常量值 2．编写DFA模拟程序算法如下： DFA（S=S0,MOVE[][],F[],ALPHABET[]） /*S为状态，初值为DFA的初态，MOVE[][]为状态转换矩阵，F[] 为终态集，ALPHABET[] 为字母表，其中的字母顺序与MOVE[][] 中列标题的字母顺序一致。*/ { Char Wordbuffer[10]=“”//单词缓冲区置空 Nextchar=getchar（）；//读 i=0； while（nextchar！=NULL）//NULL代表此类单词 { if （nextcha r！∈ALPHABET[]）{ERROR（“非法字符”），return（“非法字符”）；} S=MOVE[S][nextchar] //下一状态 if（S=NULL）return（“不接受”）；//下一状态为空，不能识别，单词错误 wordbuffer[i]=nextchar ；//保存单词符号 i++； nextchar=getchar（）； } Wordbuffer[i]=‘\0’;

编译原理词法分析实验报告

词法分析器实验报告一、实验目的选择一种编程语言实现简单的词法分析程序,设计、编制并调试一个词法分析程序,加深对词法分析原理的理解。二、实验要求 2、1 待分析的简单的词法 (1)关键字: begin if then while do end 所有的关键字都就是小写。 (2)运算符与界符 : = + - * / < <= <> > >= = ; ( ) # (3)其她单词就是标识符(ID)与整型常数(SUM),通过以下正规式定义: ID = letter (letter | digit)* NUM = digit digit* (4)空格有空白、制表符与换行符组成。空格一般用来分隔ID、SUM、运算符、界符与关键字,词法分析阶段通常被忽略。 2、2 各种单词符号对应的种别码: 表2、1 各种单词符号对应的种别码 2、3 词法分析程序的功能: 输入:所给文法的源程序字符串。输出:二元组(syn,token或sum)构成的序列。其中:syn为单词种别码; token为存放的单词自身字符串; sum为整型常数。例如:对源程序begin x:=9: if x>9 then x:=2*x+1/3; end #的源文件,经过词法分析后输出如下序列: (1,begin)(10,x)(18,:=)(11,9)(26,;)(2,if)…… 三、词法分析程序的算法思想: 算法的基本任务就是从字符串表示的源程序中识别出具有独立意义的单词符号,其基本思想就是根据扫描到单词符号的第一个字符的种类,拼出相应的单词符号。 3、1 主程序示意图:

主程序示意图如图3-1所示。其中初始包括以下两个方面: ⑴ 关键字表的初值。关键字作为特殊标识符处理,把它们预先安排在一张表格中(称为关键字表),当扫描程序识别出标识符时,查关键字表。如能查到匹配的单词,则该单词为关键字,否则为一般标识符。关键字表为一个字符串数组,其描述如下: Char *rwtab[6] = {“begin ”, “if ”, “then ”, “while ”, “do ”, “end ”,}; (2)3、2 扫描子程序的算法思想: 首先设置3个变量:①token 用来存放构成单词符号的字符串;②sum 用来整型单词;③syn 用来存放单词符号的种别码。扫描子程序主要部分流程如图3-2所示。

编译原理实验词法分析&语法分析程序

编译原理实验词法分析程序

实验一：词法分析程序 1、实验目的从左至右逐个字符的对源程序进行扫描，产生一个个单词符号，把字符串形式的源程序改造成单词符号形式的中间程序。 2、实验内容表C语言子集的单词符号及内码值单词符号种别编码助记符内码值 while 1 while -- if 2 if -- else 3 else -- switch 4 switch -- case 5 case -- 标识符 6 id id在符号表中的位置常数7 num num在常数表中的位置 + 8 + -- - 9 - -- * 10 * -- <= 11 relop LE < 11 relop LT == 11 relop LQ = 12 = -- ; 13 ; -- 输入源程序如下 if a==1 a=a+1; else a=a+2; 输出对应的单词符号形式的中间程序 3、实验过程实验上机程序如下： #include "stdio.h" #include "string.h" int i,j,k; char s ,a[20],token[20]; int letter() { if((s>=97)&&(s<=122))return 1; else return 0; } int Digit() {if((s>=48)&&(s<=57))return 1;

else return 0; } void get() { s=a[i]; i=i+1; } void retract() {i=i-1;} int lookup() { if(strcmp(token, "while")==0) return 1; else if(strcmp(token, "if")==0) return 2; else if(strcmp(token,"else")==0) return 3; else if(strcmp(token,"switch")==0) return 4; else if(strcmp(token,"case")==0) return 5; else return 0; } void main() { printf("please input you source program,end('#'):\n"); i=0; do { i=i+1; scanf("%c",&a[i]); }while(a[i]!='#'); i=1; memset(token,0,sizeof(char)*10); j=0; get(); while(s!='#') { if(s==' '||s==10||s==13) get(); else { switch(s)

词法分析器实验报告代码

编译系统课程实验报告实验1：词法分析

常数： digits -> digit digit* optionalFraction -> .digits|ε optionalExponent -> E(+|-|ε)digits|ε number -> digits optionalFraction optionalExponent 运算符：（除/，/=外的）op -> + | - | * | += | -= | *= | % | ++ | -- | != | == | > | < | >= | <= | >> | << | ^ | | | & | && | || | ! | != （以/开头的）op->/|/= 界符：Boundary -> { | } | [ | ] | ( | ) | , | ; | : | ? |~ 行//注释：Comment->//(除\n外的字符)*\n 块/**/注释：Comment->/*(除*/外的字符)*/ 8进制：OCT -> 0(1|2|3|4|5|6|7)(0|1|2|3|4|5|6|7)* 16进制：HEX -> 0x(1|…|9|a|…|f) (0|…|9|a|…|f)* 字符常数：char -> ' (a|b|c|...|z|A|B|C|...|Z|_) ' 字符串常数：string-> "((((除\和”外的字符)*|\(所有字符)+)(除\和”外的字符|\”))*)"（2）各类单词的转换图标识符： 8进制，16进制，10进制常数：运算符：

界符：行//注释：块/**/注释：字符常数：字符串常数：

编译原理词法分析及语法分析

编译原理实验报告实验名称：词法分析及语法分析专业班级：姓名：学号：完成日期：

实验一、sample语言的词法分析一、实验目的给出SAMPLE文法规范，要求编写SAMPLE语言的词法分析程序。二、实验准备了解sample语言单词的定义，选择任一种编程语言实现词法分析。三、实验内容给出SAMPLE语言文法，输出单词（关键字、专用符号以及其它标记）。 1、格式输入：源程序文件。输出：关键字、专用符号以及其它标记。 2、实现原理程序中先判断这个句语句中每个单元为关键字、常数、运算符、界符，对与不同的单词符号给出不同编码形式的编码，用以区分之。 3、实验方法读懂Sample源代码，自己重点独立实现对常量的判别。四、实验设计 1、设计SAMPLE语言的词法分析器 A、字符集定义 1． <字符集> → <字母>│<数字>│<单界符> 2． <字母> → A│B│…│Z│a│b│…│z 3． <数字> → 0│1│2│…│9 4． <单界符> → +│-│*│/│=│<│>│(│)│[│]│:│. │; │, │' B、单词集定义 5．<单词集> → <保留字>│<双界符>│<标识符>│<常数>│<单界符> 6．<保留字> → and│array│begin│bool│call│case│char│constant│dim│do│else │end│false│for│if│input│integer│not│of│or│output│procedure│program │read│real│repeat│set│stop│then│to│true│until│var│while│write 7．<双界符> → <>│<=│>=│:= │/*│*/│.. 8．<标识符> → <字母>│<标识符> <数字>│<标识符> <字母> 9．<常数> → <整数>│<布尔常数>│<字符常数> 10．<整数> → <数字>│<整数> <数字> 11．<布尔常数> → true│false 12．<字符常数> → ' 除 {'} 外的任意字符串 ' 2、词法分析系统流程设计

编译原理词法分析器实验报告

竭诚为您提供优质文档/双击可除编译原理词法分析器实验报告篇一：编译原理词法分析器实验报告曲阜师范大学实验报告计算机系20XX年级软件工程一班组日期20XX年10月17日星期日姓名陈金金同组者姓名课程编译原理成绩实验名称：教师签章词法分析器一、实验目的： 1·掌握词法分析的原理。 2·熟悉保留字表等相关的数据结构与单词的分类方法。 3·掌握词法分析器的设计与调试。二、实验内容：根据编译中的分词原理，编写一个词法分析程序： 1.输入：任意一个c语言程序的源代码。 2.处理：对输入进行分析，分离出保留字、标识符、常

量、算符和界符。 3.输出：对应的二元式（种别编码自定，可暂编为一类对应一个编码）。三、实验要求： 1.任选c/c++/Java中的一种高级程序语言编程完成词法分析器。 2.词法分析器应以教材所述分词原理为依据，使用恰当的数据结构和方法，结构清晰、高效。四、实验环境： windowsxp操作系统，J2se，eclipse集成开发环境五、实验分析：将源代码作为长字符串进行读入，之后通过switch语句，及状态转换图进行词素识别，并对识别的词素进行分类整理以二元式的形式输出。六、实验过程： 1、建立词法分析器界面，很简单：输入框，输出框，执行分析按钮，清空按钮，退出程序按钮。主要的地方是，考虑mvc开发模式，为model及controller提供接口。实现界面如下所示： 2、核心代码的编写，考虑到需要进行词素的匹配，创建符号表类symTable。提供两个变量，分别存放如下内容：并提供方法insert()，lookup()，分别负责标志符的插

实验1-3-《编译原理》词法分析程序设计方案

实验一 词法分析器的设计

编译原理实验--词法分析器

编译原理词法分析器语法分析器实验报告

东南大学编译原理词法分析器实验报告

编译原理词法分析和语法分析报告+代码(C语言版)

编译原理实验词法分析实验报告

词法分析器实验报告

词法分析器实验报告

编译原理实验_词法分析器的设计与实现

编译原理实验报告(词法分析器语法分析器)

编译原理实验词法分析语法分析

实验一： 词法分析器

编译原理实验报告2词法分析程序的设计

编译原理词法分析器语法分析器实验报告

实验一、词法分析器(含源代码)

编译原理词法分析器

编译原理词法分析实验报告

编译原理实验 词法分析&语法分析程序

词法分析器实验报告代码

编译原理词法分析及语法分析

编译原理词法分析器实验报告

实验一词法分析器的设计

实验一：词法分析器

编译原理实验词法分析&语法分析程序