编译原理实验词法分析实验报告

编译技术实验报告

实验题目：词法分析

学院：信息学院

专业：计算机科学与技术

学号：

姓名：

一、实验目的

(1)理解词法分析的功能；

(2)理解词法分析的实现方法；

二、实验内容

PL0的文法如下

‘< >’为非终结符。

‘::=’ 该符号的左部由右部定义，可读作“定义为”。

‘|’ 表示‘或’，为左部可由多个右部定义。

‘{ }’ 表示花括号内的语法成分可以重复。在不加上下界时

可重复0到任意次数，有上下界时可重复次数的限制。

‘[ ]’ 表示方括号内的成分为任选项。

‘( )’ 表示圆括号内的成分优先。

上述符号为“元符号”，文法用上述符号作为文法符号时需

要用引号‘’括起。

〈程序〉∷=〈分程序〉．

〈分程序〉∷= [〈变量说明部分〉][〈过程说明部分〉]〈语句〉〈变量说明部分〉∷=VAR〈标识符〉{，〈标识符〉}：INTEGER；

〈无符号整数〉∷=〈数字〉{〈数字〉}

〈标识符〉∷=〈字母〉{〈字母〉|〈数字〉}

〈过程说明部分〉∷=〈过程首部〉〈分程序〉{；〈过程说明部分〉}；

〈过程首部〉∷=PROCEDURE〈标识符〉；

〈语句〉∷=〈赋值语句〉|〈条件语句〉|〈过程调用语句〉|〈读语句〉|〈写语句〉|〈复合语句〉|〈空〉

〈赋值语句〉∷=〈标识符〉∶=〈表达式〉

〈复合语句〉∷=BEGIN〈语句〉{；〈语句〉}END

〈条件〉∷=〈表达式〉〈关系运算符〉〈表达式〉

〈表达式〉∷=〈项〉{〈加法运算符〉〈项〉}

〈项〉∷=〈因子〉{〈乘法运算符〉〈因子〉}

〈因子〉∷=〈标识符〉|〈无符号整数〉|'('〈表达式〉')'

〈加法运算符〉∷=+|-

〈乘法运算符〉∷=*

〈关系运算符〉∷=<>|=|<|<=|>|>=

〈条件语句〉∷=IF〈条件〉THEN〈语句〉

〈字母〉∷=a|b|…|X|Y|Z

〈数字〉∷=0|1|2|…|8|9

实现PL0的词法分析

三、实验分析与设计

PL0词法分析程序是一个独立的过程，其功能是为语法语义分析提供单词，把输入的字符串形式的源程序分割成一个个单词符号传递给语法语义分析。

其主要方法步骤为从源程序扫描下一个字符，忽略空格、换行、TAB和注释并识别单词，再将不同类别的单词归类输出。

四、实验的实现

#include

#define norw 11 //norw-1个关键字#define al 20 //最长的关键字的长度#define ID norw

#define INT norw+1

#define COMMA norw+2

#define ENDF norw+3

#define COLON norw+4

#define SEMIC norw+5

#define ADD norw+6

#define MINUS norw+7

#define MULTI norw+8

#define EVALU norw+9

#define LE norw+10

#define NE norw+11

#define LT norw+12

#define EQ norw+13

#define GE norw+14

#define GT norw+15

#define FLOAT norw+16

char TOKEN[20]; //字符数组用来依次存放单词词文的各个字符

extern int lookup(char *); //以TOKEN字符串查保留字表

extern void report_error(char); //报告程序中的词法错误bool isalpha(char); //判断接收字符是否为字母

bool isalnum(char); //判断接收字符是否为字母或者数字

bool isdigit(char); //判断接收字符是否为数字

bool isannotation(char); //判断接收字符是否为注释

extern char letter(char c); //用来将大写字母转化成小写字母FILE* fin;

FILE* fout;

void scanner()

{//词法分析的主体程序，对输入的文本文件进行词法分析

char ch;

int i,c;

int error=0; //记录文件中词法错误的个数

ch=fgetc(fin); //从输入文件中读取一个字符

while(ch!=EOF)

{//当从输入文件接收的字符不是文件结束符时，执行循环if(isalpha(ch))

{//如果从输入文件接收的第一个字符是字母

ch=letter(ch);

TOKEN[0]=ch;

ch=fgetc(fin);i=1;

while(isalnum(ch))

{ ch=letter(ch);

TOKEN[i]=ch;i++;

ch=fgetc(fin);

}

TOKEN[i]='\0';

c=lookup(TOKEN); //查保留字表

if(c==0) {fprintf(fout,"(%d,%s)\n", ID,TOKEN);} //输出标识符