《编译原理(实验部分)》实验1_程序预处理

合集下载

编译原理实验一_源程序的预处理及词法分析程序设计

实验一词法分析程序设计（6学时）一、实验目的设计并实现一个包含预处理功能的词法分析程序，加深对编译中词法分析过程的理解。

二、实验要求1、实现词法分析功能输入：所给文法的源程序字符串。

输出：二元组（syn,token）构成的序列。

其中，syn为单词种别码。

Token为存放的单词自身字符串。

具体实现时，可以将单词的二元组用结构进行处理。

2、待分析的C语言子集的词法1）关键字main if then while do static int double struct break else long switch case typedef char return const float shortcontinue for void default sizeof do所有的关键字都是小写。

2）运算符和界符+ - * / < <= > >= = ; ( )3）其他标记ID和NUM通过以下正规式定义其他标记：标识符 ID→letter(letter|digit)*无符号整数 NUM→digit digit*字母 letter→a|…|z|A|…|Z数字 digit→0|…|9…4）空格由空白、制表符和换行符组成空格一般用来分隔ID、NUM、专用符号和关键字，词法分析阶段通常被忽略。

4、各种单词符号对应的种别码表1 各种单词符号的种别码单词符号种别码单词符号种别码main 1 ; 41if 2 ( 42else 3 ) 43while 4 int 7do 5 double 8static 6 struct 9ID （标识符）25 break 10NUM （整数） 26 else 11+ 27 long 12- 28 switch 13* 29 case 14/ 30 typedef 15: 31 char 16:= 32 return 17< 33 const 18<> 34 float 19<= 35 short 20> 36 continue 21>= 37 for 22= 38 void 23default 39 sizeof 24do 405、词法分析程序的主要算法思想算法的基本任务是从字符串表示的源程序中识别出具有独立意义的单词符号，其基本思想是根据扫描到的单词符号的第一个字符的种类，拼出相应的单词符号。

编译原理实验报告(C语言)

else if(strcmp(word,"if")==0) fprintf(out,"%c%c%s%c,%d%c\n",'(','"',word,'"',12,')'); else if(strcmp(word,"else")==0) fprintf(out,"%c%c%s%c,%d%c\n",'(','"',word,'"',13,')'); else if(strcmp(word,"switch")==0) fprintf(out,"%c%c%s%c,%d%c\n",'(','"',word,'"',14,')'); else if(strcmp(word,"case")==0) fprintf(out,"%c%c%s%c,%d%c\n",'(','"',word,'"',15,')'); else if(strcmp(word,"for")==0) fprintf(out,"%c%c%s%c,%d%c\n",'(','"',word,'"',16,')'); else if(strcmp(word,"do")==0) fprintf(out,"%c%c%s%c,%d%c\n",'(','"',word,'"',17,')'); else if(strcmp(word,"while")==0) fprintf(out,"%c%c%s%c,%d%c\n",'(','"',word,'"',18,')'); else if(strcmp(word,"goto")==0) fprintf(out,"%c%c%s%c,%d%c\n",'(','"',word,'"',19,')'); else if(strcmp(word,"continue")==0) fprintf(out,"%c%c%s%c,%d%c\n",'(','"',word,'"',20,')'); else if(strcmp(word,"break")==0) fprintf(out,"%c%c%s%c,%d%c\n",'(','"',word,'"',21,')');

编译原理实验报告(C语言)

编译原理实验报告实验项目1：词法分析程序实验一、实验的目的与任务：编译原理是计算机类专业特别是计算机软件专业的一门重要专业课。

设置该课程的目的在于系统地向学生讲述编译系统的结构、工作流程及编译程序各组成部分的设计原理和实现方法，使学生通过学习既掌握编译理论和方法方面的基本知识，也具有设计、实现、分析和维护编译程序等方面的初步能力。

编译原理是一门理论性和实践性都比较强的课程。

进行上机实验的目的是使学生通过完成上机实验题目加深对课堂教学内容的理解。

同时培养学生实际动手能力。

编译实验由三个独立实验组成，按照由浅入深进行排列，希望通过本实验使学生更深学习并理解编译的主要过程和相关方法。

词法分析的目的是将输入的源程序进行划分，给出基本符号（token）的序列，并掠过注解和空格等分隔符号。

基本符号是与输入的语言定义的词法所规定的终结符。

本实验要求学生编制一个读单词过程，从输入的源程序中，识别出各个具有独立意义的单词，即基本保留字、标识符、常数、运算符、分隔符五大类。

并依次输出各个单词的内部编码及单词符号自身值。

（遇到错误时可显示“Error”，然后跳过错误部分继续进行）二、题目分析1.这里采用C语言编写的源程序作为词法分析程序的输入数据，输入数据保存在“in.txt”记事本中，将分析结果存在“out.txt”记事本中。

词法分析器的源代码使用C语言编写。

2.下面就词法分析程序中的主要变量进行说明：主函数main()：打开要分析的C语言源程序，若不能正确打开，则报错。

先从源程序中读入一个字符ch，然后进行如下处理：1、cp消耗掉空格，制表符，换行符后，cp数组复位，开始检测cp；2、数字检测,对照符号表输出，若匹配成功，则返回序号；3、字符串检测, 对照符号表输出，若匹配成功，则返回序号；4、基本保留字检测,对照符号表输出，若匹配成功，则返回序号；5、运算符检测，对照符号表输出，若匹配成功，则返回序号；注意这里碰到‘/’时，要判断后面是否跟着是注释语句。

编译原理实验报告

编译原理实验报告一、实验目的编译原理是计算机科学中的重要学科，它涉及到将高级编程语言转换为计算机能够理解和执行的机器语言。

本次实验的目的是通过实际操作和编程实践，深入理解编译原理中的词法分析、语法分析、语义分析以及中间代码生成等关键环节，提高我们对编译过程的认识和编程能力。

二、实验环境本次实验使用的编程语言为C+＋，开发环境为Visual Studio 2019。

此外，还使用了一些相关的编译工具和调试工具，如 GDB 等。

三、实验内容（一）词法分析器的实现词法分析是编译过程的第一步，其任务是将输入的源程序分解为一个个单词符号。

在本次实验中，我们使用有限自动机的理论来设计和实现词法分析器。

首先，定义了各种单词符号的类别，如标识符、关键字、常量、运算符等。

然后，根据这些类别设计了相应的状态转换图，并将其转换为代码实现。

在实现过程中，使用了正则表达式来匹配输入字符串中的单词符号。

对于标识符和常量等需要进一步处理的单词符号，使用了相应的规则进行解析和转换。

（二）语法分析器的实现语法分析是编译过程的核心环节之一，其任务是根据给定的语法规则，分析输入的单词符号序列是否符合语法结构。

在本次实验中，我们使用了递归下降的语法分析方法。

首先，根据实验要求定义了语法规则，并将其转换为相应的递归函数。

在递归函数中，通过对输入单词符号的判断和处理，逐步分析语法结构。

为了处理语法错误，在分析过程中添加了错误检测和处理机制。

当遇到不符合语法规则的输入时，能够输出相应的错误信息，并尝试进行恢复。

（三）语义分析及中间代码生成语义分析的目的是对语法分析得到的语法树进行语义检查和语义处理，生成中间代码。

在本次实验中，我们使用了三地址码作为中间代码的表示形式。

在语义分析过程中，对变量的定义和使用、表达式的计算、控制流语句等进行了语义检查和处理。

对于符合语义规则的语法结构，生成相应的三地址码指令。

四、实验步骤（一）词法分析器的实现步骤1、定义单词符号的类别和对应的正则表达式。

《编译原理》实验指导书

《编译原理》实验指导书编译⽅法实验指导书柴本成赵晨编写浙江万⾥学院2010.01⽬录实验⼀有限⾃动机的构造与实现 (1)实验⼆词法分析器的设计 (3)实验三语法分析－递归下降分析器 (5)实验四LL(1)⽂法预测分析表的实现 (6)附录 (9)附录⼀实验结果的提交与检查 (9)附录⼆实验报告参考格式 (9)附录三Visual C++上机环境简介 (10)附录四参考程序 (13)实验⼀有限⾃动机的构造与实现⼀、实验⽬的1、正确理解正规式和正规集以及有限⾃动机的定义；2、熟练掌握⽤状态转换图表⽰有限⾃动机的⽅法。

⼆、实验预习提⽰1、正规表达式就是⼀种形式化的表⽰法，它可以表⽰单词符号的结构，从⽽精确地定义单词符号集。

正规表达式简称为正规式，它表⽰的集合即为正规集。

2、状态转换图是⼀张当输⼊不同内容时选择不同分析路径的有向图。

⼀个状态转换图可⽤于识别⼀定的字符串。

3、有限⾃动机（FA）是更⼀般化的状态转换图，可⽤来识别正规集；分为DFA和NFA 两种。

三、实验内容构造识别如下字符串的状态转换图，并将其编程实现。

1、识别标识符(以字母开始由字母和数字构成的字符串，要求长度不超过10)；参考程序：#include#include //字符串处理的头⽂件//判断⼀个字符是不是字母bool Isletter(char ch){if(ch>='a' && ch<='z' || ch>='A' && ch<='Z') return true;return false;}//判断⼀个字符是不是数字bool IsDigit(char ch){if(ch>='0' && ch<='9') return true;return false;}//判断⼀个字符串是不是标识符bool IsId(char *str){if(!Isletter(str[0]) ) return false;int l=strlen(str); //计算字符串的长度for(int i=1;iif(Isletter(str[i]) || IsDigit(str[i])) continue; //如果是字母或数字就继续循环else return false; //否则，返回不是字符串return true;}void main(){char *str="1abc"; //初始化字符串，也可键盘输⼊if(IsId(str)) cout<<"accept!"<else cout<<" not accept!"<}2、识别实数(要求正负号可有可⽆，长度不超过20，不要求识别⽤科学记数法表⽰的实数)。

《编译原理》实验指导书

《编译原理》实验指导书编著陈志刚中南大学信息科学与工程学院2006年11月第一部分词法分析（实验一必作）实验一词法分析程序设计与实现一、实验目的加深对词法分析器的工作过程的理解；加强对词法分析方法的掌握；能够采用一种编程语言实现简单的词法分析程序；能够使用自己编写的分析程序对简单的程序段进行词法分析。

二、实验内容自定义一种程序设计语言，或者选择已有的一种高级语言，编制它的词法分析程序。

词法分析程序的实现可以采用任何一种编程语言和编程工具。

从输入的源程序中，识别出各个具有独立意义的单词，即关键字、标识符、常数、运算符、界符。

并依次输出各个单词的内部编码及单词符号自身值。

（遇到错误时可显示“Error”，然后跳过错误部分继续显示）三、实验要求：1.对单词的构词规则有明确的定义；2.编写的分析程序能够正确识别源程序中的单词符号；3.识别出的单词以<种别码，值>的形式保存在符号表中，正确设计和维护符号表；4.对于源程序中的词法错误，能够做出简单的错误处理，给出简单的错误提示，保证顺利完成整个源程序的词法分析；四、实验步骤1.定义目标语言的可用符号表和构词规则；2.依次读入源程序符号，对源程序进行单词切分和识别，直到源程序结束；3.对正确的单词，按照它的种别以<种别码，值>的形式保存在符号表中；4.对不正确的单词，做出错误处理。

五、实验报告要求详细说明你的程序的设计思路和实现过程。

用有限自动机或者文法的形式对词法定义做出详细说明，说明词法分析程序的工作过程，说明错误处理的实现。

参考资料一、程序要求1、以下面一段程序为例main() {int a,b;a = 10;b = a + 20;}2、需要识别的词1.关键字：if、int、for、while、do、return、break、continue；单词种别码为1。

2.标识符；单词种别码为2。

3.常数为无符号整形数；单词种别码为3。

4.运算符包括：+、-、*、/、=、、<、=、<=、!= ；单词种别码为4。

编译原理—实验指导书-1

(13)end.#
4.词法分析器的功能和输出格式
词法分析器的功能是输入以字符串表示的源程序，从左向右扫描每行源程序的符号，拼成单词，换成统一的二元式(单词种别码，单词符号的属性值)表示。对给定的程序通过词法分析器识别一个个单词符号，并以二元式(单词种别码，单词符号的属性值)显示，本程序是通过对给定路径的文件的分析后以单词符号和文字提示显示），本实验中，采用单词种别码是一符一种种别码的方式。
(4)var
(5)a,b,c:integer;
(6)x:char;
(7)begin
(8)if(a+c*3>b)and(b>3)thenc:=3;
(9)x:=2+(3*a)-b*c*8;
(10)forx:=1+2to3dob:=100;
(11)whilea>bdoc:=5;
(12)repeata:=10;untila>b;
(124){
(125)printf("%s\t$运算符\n\n",Word);
(126)}
(127)else if(ch=='-')
(128){
(129)printf("%s\t$运算符\n\n",Word); //判断结果为“--”
(2)设计描述Sample语言各类单词结构的状态转换图（即有限自动机FA）；
如标识符的状态转换图可以用下图表示
其相应代码科为
(1)recog_id(char ch)
(2){
(3)char state='0';
(4)while(state!='2')
(5){
(6)switch(state)

《编译原理(实验部分)》实验1_程序预处理

《编译原理》（实验部分）实验1_程序预处理一、实验目的明确预处理子程序的任务，构造一个简单的预处理子程序，对源程序进行相应的预处理。

二、实验设备1、PC 兼容机一台；操作系统为WindowsWindowsXP。

2、Visual C++ 6.0 或以上版本， Windows 2000 或以上版本，汇编工具（在Software 子目录下）。

三、实验原理定义模拟的简单语言的词法构成，编制读入源程序和进行预处理的程序，要求将源程序读入到文件或存入数组中，再从文件或数组中逐个读取字符进行预处理，包括去掉注释、Tab、Enter和续行符等操作，并显示预处理后的程序。

四、实验步骤1、从键盘读入源程序存放到输入缓冲区中。

2、对源程序进行预处理，预处理后的程序存放到扫描缓冲区中。

3、显示预处理后的程序。

参考源程序（C++语言编写）//源程序的输入及预处理#include <fstream.h>#include <iostream.h>void pro_process(char *);void main( ) //测试驱动程序{//定义扫描缓冲区char buf[4048]={'\0'}; //缓冲区清0//调用预处理程序pro_process(buf); //在屏幕上显示扫描缓冲区的内容cout<<buf<<endl;}void pro_process(char *buf) //预处理程序{ifstream cinf("source.txt",ios::in);int i=0; //计数器char old_c='\0',cur_c; //前一个字符，当前字符。

bool in_comment=false; //false表示当前字符未处于注释中。

while(cinf.read(&cur_c,sizeof(char))){ //从文件读一个字符switch(in_comment){case false:if(old_c=='/' && cur_c=='*'){ //进入注释i--; //去除已存入扫描缓冲区的字符'/'in_comment=true;}else {if(old_c=='\\' && cur_c=='\n') //发现续行i--; //去除已存入扫描缓冲区的字符'\'else {if(cur_c>='A' && cur_c<='Z') //大写变小写cur_c+=32;if(cur_c =='\t' || cur_c =='\n')//空格取代TAB换行cur_c=' ';buf[i++]=cur_c ;}}break;case true:if(old_c=='*' && cur_c=='/') //离开注释in_comment=false;}//end of switchold_c= cur_c; //保留前一个字符}//end of whilebuf[i++]='#'; //在源程序尾部添加字符'#' }。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

《编译原理》（实验部分）
实验1_程序预处理
一、实验目的
明确预处理子程序的任务，构造一个简单的预处理子程序，对源程序进行相应的预处理。

二、实验设备
1、PC 兼容机一台；操作系统为WindowsWindowsXP。

2、Visual C++ 6.0 或以上版本， Windows 2000 或以上版本，汇编工具（在Software 子目录下）。

三、实验原理
定义模拟的简单语言的词法构成，编制读入源程序和进行预处理的程序，要求将源程序读入到文件或存入数组中，再从文件或数组中逐个读取字符进行预处理，包括去掉注释、Tab、Enter和续行符等操作，并显示预处理后的程序。

四、实验步骤
1、从键盘读入源程序存放到输入缓冲区中。

2、对源程序进行预处理，预处理后的程序存放到扫描缓冲区中。

3、显示预处理后的程序。

参考源程序（C++语言编写）
//源程序的输入及预处理
#include <fstream.h>
#include <iostream.h>
void pro_process(char *);
void main( ) //测试驱动程序
{
//定义扫描缓冲区
char buf[4048]={'\0'}; //缓冲区清0
//调用预处理程序
pro_process(buf); //在屏幕上显示扫描缓冲区的内容cout<<buf<<endl;
}
void pro_process(char *buf) //预处理程序{
ifstream cinf("source.txt",ios::in);
int i=0; //计数器
char old_c='\0',cur_c; //前一个字符，当前字符。

bool in_comment=false; //false表示当前字符未处于注释中。

while(cinf.read(&cur_c,sizeof(char))){ //从文件读一个字符switch(in_comment){
case false:
if(old_c=='/' && cur_c=='*'){ //进入注释
i--; //去除已存入扫描缓冲区的字符'/'
in_comment=true;
}
else {
if(old_c=='\\' && cur_c=='\n') //发现续行
i--; //去除已存入扫描缓冲区的字符'\'
else {
if(cur_c>='A' && cur_c<='Z') //大写变小写
cur_c+=32;
if(cur_c =='\t' || cur_c =='\n')
//空格取代TAB换行
cur_c=' ';
buf[i++]=cur_c ;
}
}
break;
case true:
if(old_c=='*' && cur_c=='/') //离开注释
in_comment=false;
}//end of switch
old_c= cur_c; //保留前一个字符}//end of while
buf[i++]='#'; //在源程序尾部添加字符'#' }。