系统软件开发实践实验报告(计科-4 徐竹)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中国矿业大学计算机学院2012 级本科生实验报告
课程名称系统软件开发实践
报告时间2015/5/1
学生姓名徐竹
学号08123325
专业计算机科学与技术
任课教师刘晋
任课教师评语
任课教师评语(①对实验课程基础理论的掌握;②对实验课程知识应用能力的评价;③对课程报告相关实验、作品、软件等成果的评价;④实验课学习态度和上课纪律;⑤实验课程成果和报告工作量;⑥总体评价和成绩;⑦存在问题等):
成绩:任课教师签字:
年月日
实验一(第一周)词法分析器(flex实验)
一、实验目的
1、通过对flex基本知识的阅读,了解其工作原理和过程以及其匹配模式和规则,掌握简
单的lex语法和规则;
2、在上述基础上能够自主编写出简单且可以运行的词法分析器,实现简单的词法分析功
能;
3、通过实验,设计编制调试一个具体的词法分析程序,加深对词法分析原理的理解,并
掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。
二、实验说明
本次编制调试的词法分析器基本可以实现如下简单功能:
1、可以匹配识别关键字:else if switch for int float return void while(所
有的关键字都是保留字,并且必须是小写);
2、可以匹配识别专用符号: + - * / < <= > >= == != = ; , ( ) [ ] { } /* */
3、标识符(ID)和数字(NU )通过下列正则表达式定义:
ID = letter letter*
NUM = digit digit*
letter = a|..|z|A|..|Z
digit = 0|..|9
4、可以匹配识别空格(空格由空白、换行符和制表符组成,空格通常被忽略,,除了它必
须分开ID、NUM 关键字);
5、可以识别简单的注释(/* 注释内容*/);
三、实验原理与分析
词法分析的基本任务是从字符串表示的源程序中识别出具有独立意义的单词符号,其基本思想是根据扫描到单词符号的第一个字符的种类,拼出相应的单词符号。词法分析阶段是编译过程的第一个阶段,是编译的基础。这个阶段的任务是从左到右一个字符一个字符地读入源程序,即对构成源程序的字符流进行扫描然后根据构词规则识别单词(也称单词符号或符号)。
词法分析是编译程序的第一个阶段且是必要阶段;词法分析的核心任务是扫描、识别单词且对识别出的单词给出定性、定长的处理;实现词法分析程序的常用途径:自动生成,手工生成。而本次实验用的是自动生成工具flex,相对于手动生成可以极大地减少工作量。
单词的描述也就是模式(Lexical Pattern),模式一般用正规表达式进行精确描述。FLEX通过读取一个有规定格式的文本文件,输出一个如下所示的C语言源程序。
| 输入文件*.l |------>|flex工具 |------>|输出文件lex.yy.c |
FLEX的输入文件为LEX源文件,它内含正规表达式和对相应模式处理的C语言代码。FLEX通过对.l源文件的扫描自动生成相应的词法分析函数 int yylex(),并将之输出到lex.yy.c的文件中。该文件即为LEX的输出文件或输出的词法分析器。
LEX的源文件由三个部份组成,每个部分之间用顶行的“%%”分割,其格式如下:
定义部份
%%
规则部份
%%
用户附加C语言部份
其中,定义部分由C语言代码、模式的宏定义、条件模式的开始条件说明三部份组成。C代码部份由顶行的%{和}%引入,LEX扫描源文件时将%{和}%之间的部分原封不动的拷贝到输出文件lex.yy.c中。而模式宏定义则是一个正则表达式的定义。正则表达式的匹配如下:
第二部分规则部份是LEX源文件的核心部份,它包括一组模式和在生成分析器识别相应模式后对相应模式进行处理的C语言动作(Action)。
LEX对第三部分不作任何处理,仅仅将之直接拷贝到输出文件lex.yy.c的尾部。在些部份,可定义对模式进行处理的C语言函数、主函数和yylex要调用的函数yywrap()等。如果用户在其它C模块中提供这些函数,用户代码部份可以省略。
yylex()函数被调用之后,它首先检查全局文件指针变量yyin是否有定义,如有,则将之设置为将要扫描的文件指针。如无,则设置为标准输入文件stdin。同理,如全局文件指针变量yyout无定义,则将之设置为标准输出文件stdout。若有多个模式与被扫描文
件中的字符串相匹配,则yylex()执行能匹配最长字符串的模式,称为“最长匹配原则”;若还有多个模式匹配长度相同的字符串,则yylex()选择在LEX源文件中排列最前面的模式进行匹配,称为“最先匹配原则”。yylex()常通过超前搜索一个字符来实现这样的原则,如果使用超前搜索匹配了某一模式,则yylex()在进行下一次分析前,将回退一个字符。
另外,LEX提供控制模式在一定状态下使用的功能,称为条件模式。LEX首先在定义部份通过%start来定义条件句。在规则部份可通过宏BEGIN 条件名来激活条件。BEGIN INITIAL或BEGIN 0将休眠所有的条件模式,使分析器回到开始状态。
四、实验步骤和过程分析
1、lex源代码编写
通过前期对flex的了解自主编写了以下简单的的词法分析器,该词法分析器能够实现基本的词法分析功能如行数、关键字个数、单词个数以及简单注释等的判别。由于功能简单,所以本次代码完全是自己一一在记事本里面编写而成;
digit [0-9]
NUM [digit][digit]* /*此正则表达式用于对数字进行匹配*/
letter [A-Za-z]
ID [letter][letter]* /*此正则表达式是用于对标示符进行模式匹配*/
"else" {num_id++;}
"while" {++num_id;} /*这是实现代对关键字进行匹配*/ "+"|"-"|"*"|"/"|"="|"<"|"<="|">"|">="|"=="|"!="|";"|","|"("|")"|"["|"]"|"{"|"}"|"/*"|"\*"{fuhao++;} /*这些代码可以用于匹配其它符号*/
[^ \t\n]+ { nword++;} /*识别单词个数*/
\n {hangshu++;} /*对行数进行识别并统计*/
/*下面再编写一个comment函数用于判断注释*/
comment(){
char c,c1;
loop:
while((c=input())!='*'&&(c!=0))
putchar('\n');
if((c1=input())!='/'&&c!=0)
{
unput(c1);
goto loop;
}
if(c!=0)
putchar('\n');}
int yywrap()
{return 1;}
最后将这些代码按照flex语法进行整合得到完整flex源码。