编译原理实践(实现减除语句)

实验二算数表达式的扩充

一、实验目的

掌握LR分析表的设计方法和语义加工程序的扩充。

二、实验内容

算术表达式文法扩充如下：

E→E+E|E-E|E*E|E/E|(E)|i

试根据该文法添加单词“-”、“/”的内部定义以及重新设计LR分析表，并修改语义加工程程序，最后验证修改的结果。

三、L R分析表的构造

四、编译程序的修改与扩充

定义符号减和除的编号

#define sub 35//减

#define div 37//除

重新构造LR分析表action1

static int action1[14][9]=

{{3,-1,-1,2,-1,-1,1,-1,-1,}, {-1,4,6,-1,-1,ACC,-1,5,7}, {3,-1,-1,2,-1,-1,8,-1,-1},

{-1,104,104,-1,104,104,-1,104,104},

{3,-1,-1,2,-1,-1,9,-1,-1},

{3,-1,-1,2,-1,-1,10,-1,-1},

{3,-1,-1,2,-1,-1,11,-1,-1},

{3,-1,-1,2,-1,-1,12,-1,-1},

{-1,4,6,-1,13,-1,-1,5,7},

{-1,101,6,-1,101,101,-1,101,7},

{-1,105,6,-1,105,105,-1,105,7},

{-1,102,102,-1,102,102,-1,102,102},

{-1,106,106,-1,106,106,-1,106,106},

{-1,103,103,-1,103,103,-1,103,103}};

在扫描程序中添加-，/情况

case '-':

buf[count].sy1=sub;

count++;

break;

case '/':

buf[count].sy1=div;

count++;

break;

change1(int chan)//action1的符号查找排序（i,+,*,(,),#,E,-，/）加入：

case sub:return 7;//-

case div:return 8;// /

lrparse1语义分析中

状态数增加

if((lr1<14)&&(lr1>=0))//在0~13个状态之中

规约增加数

if((lr1>=100)&&(lr1<107))

case 105:E.pos=newtemp();//E->E-E

gen("-",sstack[ssp-2],sstack[ssp],E.pos+100);

ssp=ssp-2;

sstack[ssp].sy1=tempsy;

sstack[ssp].pos=E.pos;

sp1=sp1-3;

break;

case 106:E.pos=newtemp();//E->E/E

gen("/",sstack[ssp-2],sstack[ssp],E.pos+100);

ssp=ssp-2;

sstack[ssp].sy1=tempsy;

sstack[ssp].pos=E.pos;

sp1=sp1-3;

break;

测试字符是否为表达式中的值(不包括":")，test(int value)增加：case sub:

case div:

五、编译程序的验证

测试用例：

while (a>b) do

begin

if m>=n then a:=a-1

else

while k=h do x:=x/2;

m:=n+x*(m+y)

end#~

测试结果：

六、实验体会

经过一个星期的编译原理课程设计，本人在李艳老师的指导下，顺利完成该课程设计。通过该课程设计，收获颇多。

1.对实验原理有更深的理解

通过该课程设计，掌握了什么是编译程序，编译程序工作的基本过程及其各阶段的基本任务，熟悉了编译程序总流程框图，了解了编译程序的生成过程、构造工具及其相关的技术对课本上的知识有了更深的理解，课本上的知识师机械的，表面的。通过把该算法的内容，算法的执行顺序在计算机上实现，把原来以为很深奥的书本知识变的更为简单，对实验原理有更深的理解。

2.对该理论在实践中的应用有深刻的理解

通过把该算法的内容，算法的执行顺序在计算机上实现，知道和理解了该理论在计算机中是怎样执行的，对该理论在实践中的应用有深刻的理解。

3.激发了学习的积极性

通过该课程设计，全面系统的理解了编译原理程序构造的一般原理和基本实现方法。把死板的课本知识变得生动有趣，激发了学习的积极性。把学过的计算机编译原理的知识强化，能够把课堂上学的知识通过自己设计的程序表示出来，加深了对理论知识的理解。以前对与计算机操作系统的认识是模糊的，概念上的，现在通过自己动手做实验，从实践上认识了操作系统是如何处理命令的，如何协调计算机内部各个部件运行，对计算机编译原理的认识更加深刻。课程设计中程序比较复杂，在调试时应该仔细，在程序调试时，注意指针，将不必要的命令去除。在这次课程设计中，我就是按照实验指导的思想来完成。加深了理解文件系统的内部功能及内部实现，培养实践动手能力和程序开发能力的目的。四、理解了该知

识点以及学科之间的融合渗透本次课程设计程序部分是用c语言编写的，把《计算机操作系统》，《编译原理》，《算法分析与设计》《c语言》四门学科联系起来，把各个学科之间的知识融合起来，把各门课程的知识联系起来，对计算机整体的认识更加深刻。使我加深了对《计算机操作系统》，《编译原理》，《算法分析与设计》《c 语言》四门课程的认识。

七、源码

#include "stdio.h"

#include "string.h"

#define ACC -2

/**************************************/

#define sy_if 0

#define sy_then 1

#define sy_else 2

#define sy_while 3

#define sy_begin 4

#define sy_do 5

#define sy_end 6

#define a 7

#define semicolon 8

#define e 9

#define jinghao 10

#define S 11

#define L 12

#define tempsy 15

#define EA 18

#define E0 19

#define plus 34

#define sub 35//减

#define times 36

#define div 37//除

#define becomes 38

#define op_and 39

#define op_or 40

#define op_not 41

#define rop 42

#define lparent 48

#define rparent 49

#define ident 56

#define intconst 57

/********************************************/

char ch='\0';//可用于存放读出的一个字符

int count=0;//词法分析结果缓冲区计数器

static char spelling[10]={""};//存放是别的字

static char line[81]={""};//一行字符缓冲区

char *pline;//line的指针

static char ntab1[100][10];//变量类型名表

struct ntab

{

int tc;//真

int fc;//假

}ntab2[200];//用于存放布尔表达式的值

int label=0;//指向ntab2的指针

struct rwords

{

char sp[10];

int sy;

};//匹配表结构体

struct rwords reswords[10]={{"if",sy_if},

{"do",sy_do},

{"else",sy_else},

{"while",sy_while},

{"then",sy_then},

{"begin",sy_begin},

{"end",sy_end},

{"and",op_and},

{"or",op_or},

{"not",op_not}};//初始化匹配表，用于关键字的匹配

struct aa

{

int sy1;//存放变量的类型名

int pos;//存放该变量在自己表中的位置

}buf[1000],//词法分析结果缓冲区

n,//存放二元式当前字符

n1,//表达式当前的字符

E,//非终结符

sstack[100],//算术表达式和布尔表达式的符号栈

ibuf[100],//算术表达式和布尔表达式的缓冲区

stack[1000];//语法分析的符号栈

struct aa oth;//四元式中没有填写的空白位置

struct fourexp//四元式结构体

{

char op[10];

struct aa arg1;

struct aa arg2;

int result;

}fexp[200];

int ssp=0;//指向 sstack的指针

struct aa *pbuf=buf;//词法分析结果缓冲区的指针

int nlength=0;//词法分析中记录单词的长度

int lnum=0;//行数计数源程序

int tt1=0;//变量类型名表的指针

FILE *cfile;//源程序文件

/********************************************************/

int newt=0;//临时变量计数器

int nxq=100;//总是指向下一个要形成的四元式每次执行gen()

int lr;//用于存放action1中的当前状态

int lr1;//用于存放action2，3中的当前状态

int sp=0;//LR分析表栈顶指针

int stack1[100];//状态栈1

int sp1=0;//状态栈的指针

int num=0;//算术表达式或布尔表达式的指针

struct ll

{

int nxq1;//指向下一条四元式的指针

int tc1;//真值链

int fc1;//假值链

}labelmark[10];//记录嵌套中每层布尔表达式e的首地址

int labeltemp[10];//记录每层else之前四元式的地址

int pointmark=-1,pointtemp=-1;//labelmark的指针，labelmark的指针int sign=0;// sign=1 赋值语句，sign=2 while语句，sign=3 if语句/********************程序语句的LR分析表********************/ static int action[19][13]=

{{2,-1,-1,3,4,-1,-1,5,-1,-1,10,1,-1},

{-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,ACC,-1,-1},

{-1,-1,-1,-1,-1,-1,-1,-1,-1,6,-1,-1,-1},

{-1,-1,-1,-1,-1,-1,-1,-1,-1,7,-1,-1,-1},

{2,-1,-1,3,4,-1,-1,5,-1,-1,-1,9,8},

{-1,-1,104,-1,-1,-1,104,-1,104,-1,104,-1,-1},

{-1,10,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1},

{-1,-1,-1,-1,-1,11,-1,-1,-1,-1,-1,-1,-1},

{-1,-1,-1,-1,-1,-1,12,-1,-1,-1,-1,-1,-1},

{-1,-1,-1,-1,-1,-1,105,-1,13,-1,-1,-1,-1},

{2,-1,-1,3,4,-1,-1,5,-1,-1,-1,14,-1},

{2,-1,-1,3,4,-1,-1,5,-1,-1,-1,15,-1},

{-1,-1,103,-1,-1,-1,103,-1,103,-1,103,-1,-1},

{2,-1,-1,3,4,-1,-1,5,-1,-1,-1,9,16},

{-1,-1,17,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1},

{-1,-1,102,-1,-1,-1,102,-1,102,-1,102,-1,-1},

{-1,-1,-1,-1,-1,-1,106,-1,-1,-1,-1,-1,-1},

{2,-1,-1,3,4,-1,-1,5,-1,-1,-1,18,-1},

{-1,-1,101,-1,-1,-1,101,-1,101,-1,101,-1,-1}};

/********************算术表达式的LR分析表********************/ static int action1[14][9]=

{{3,-1,-1,2,-1,-1,1,-1,-1,},

{-1,4,6,-1,-1,ACC,-1,5,7},

{3,-1,-1,2,-1,-1,8,-1,-1},

{-1,104,104,-1,104,104,-1,104,104},

{3,-1,-1,2,-1,-1,9,-1,-1},

{3,-1,-1,2,-1,-1,10,-1,-1},

{3,-1,-1,2,-1,-1,11,-1,-1},

{3,-1,-1,2,-1,-1,12,-1,-1},

{-1,4,6,-1,13,-1,-1,5,7},

{-1,101,6,-1,101,101,-1,101,7},

{-1,105,6,-1,105,105,-1,105,7},

{-1,102,102,-1,102,102,-1,102,102},

{-1,106,106,-1,106,106,-1,106,106},

{-1,103,103,-1,103,103,-1,103,103}};

/********************布尔表达式的LR分析表*********************/ static int action2[16][11]=

{{1,-1,4,-1,5,-1,-1,-1,13,7,8},

{-1,2,-1,101,-1,101,101,101,-1,-1,-1},

{3,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1},

{-1,-1,-1,102,-1,102,102,102,-1,-1,-1},

{1,-1,4,-1,5,-1,-1,-1,11,7,8},

{1,-1,4,-1,5,-1,-1,-1,6,7,8},

{-1,-1,-1,104,-1,9,10,104,-1,-1,-1},

{1,-1,4,-1,5,-1,-1,-1,14,7,8},

{1,-1,4,-1,5,-1,-1,-1,15,7,8},

{105,-1,105,-1,105,-1,-1,-1,-1,-1,-1},

{107,-1,107,-1,107,-1,-1,-1,-1,-1,-1},

{-1,-1,-1,12,-1,9,10,-1,-1,-1,-1},

{-1,-1,-1,103,-1,103,103,103,-1,-1,-1},

{-1,-1,-1,-1,-1,9,10,ACC,-1,-1,-1},

{-1,-1,-1,106,-1,9,10,106,-1,-1,-1},

{-1,-1,-1,108,-1,9,10,108,-1,-1,-1}};

/********************从文件读一行到缓冲区**********************/ readline()//读一行

{

char ch1;

pline=line;

ch1=fgetc(cfile);//从文件中取一个

while((ch1!='\n')&&(ch1!=EOF))//把字符缓冲区填满

{

*pline=ch1;

pline++;

ch1=fgetc(cfile);

}

*pline='\0';//结尾终结符

pline=line;//字符缓冲区指针重新回到字符缓冲区的第一个字符位置

}

/**********************从缓冲区读取一个字符*********************/ readch()//读一个

{

if(ch=='\0')//读到尾姐再来一行，行数加一

{

readline();

lnum++;

}

ch=*pline;//从行缓冲区读取一个字符

pline++;//字符缓冲区指针后移

}

/***********************标识符和关键字的识别********************/

find(char spel[])//在变量表中查询

{

int ss1=0;// 是否查到的变量的标志（1为查到，0为没查到）

int ii=0;//记录查到变量表第几条

while((ss1==0)&&(ii

{

if(!strcmp(spel,ntab1[ii]))

ss1=1;

ii++;

}

if(ss1==1)//查到了

return ii-1;//返回在表量表的地址（-1的原因是上面的ii++最后多加了一次） else return -1;//没查到，返回-1

}

identifier()//关键字或变量或常量查询

{

int iii=0,j,k;//iii关键字表中的指针位置

int ss=0;//关键字是否匹配到的标识

k=0;//存放的识别的字的指针（spelling[k]）

do//将取出的字符放入识别的字 spelling数组中

{

spelling[k]=ch;

k++;

readch();//取一个字符

}while(((ch>='a')&&(ch<='z'))||((ch>='0')&&(ch<='9')));//数字或小写字母 pline--;//取字时多加的一个，-1可使 *pline指向字符缓冲区行尾

spelling[k]='\0';

while((ss==0)&&(iii<10))

{

if(!strcmp(spelling,reswords[iii].sp))//在关键字表中查询

ss=1;//查到标志置1

iii++;

}

/*关键字匹配*/

if(ss==1)//在关键字表中查到

{

buf[count].sy1=reswords[iii-1].sy;//关键字名字放入结果缓冲区

}

else//没查到

{

buf[count].sy1=ident;//将变量名置入结果缓冲区

j=find(spelling);//变量表查询，查到就把变量在变量表的地址赋给j

if(j==-1)//没查到就新建一个变量

{

buf[count].pos=tt1;//将其在变量表中的地址放入结果缓冲区中的地址栏

strcpy(ntab1[tt1],spelling);//将识别的变量名放入变量名表

tt1++;

nlength++;//变量名表长加一

}

else buf[count].pos=j;//查到后，将变量名表中变量的地址放入结果缓冲区该变量的地址栏中

}

count++;//指向结果缓冲区下一位置

for(k=0;k<10;k++) spelling[k]=' ';//以识别的临时字符清空

}

/**********************数字识别*************************/

number()

{

int ivalue=0;

int digit;

{

digit=ch-'0';//取出的字符转换为数字

ivalue=ivalue*10+digit;//数字地址从10后开始记录

readch();//取一个字符

}while((ch>='0')&&(ch<='9'));

buf[count].sy1=intconst;//常量名存入结果缓冲区

buf[count].pos=ivalue;//该常量地址存入结果缓冲区

count++;// 向结果缓冲区下一位置

pline--;//指向行缓冲区尾字符

}

/***********************扫描主程序************************/

scan()

{

int i;

while(ch!='~')//~为程序结束符

{

switch(ch)

{

case ' ':break;

case 'a':

case 'b':

case 'c':

case 'd':

case 'e':

case 'f':

case 'g':

case 'h':

case 'i':

case 'j':

case 'k':

case 'l':

case 'm':

case 'n':

case 'o':

case 'p':

case 'q':

case 'r':

case 's':

case 't':

case 'u':

case 'v':

case 'w':

case 'x':

case 'y':

case 'z':identifier();break;//关键词或变量查询

case '0':

case '1':

case '2':

case '3':

case '4':

case '5':

case '6':

case '7':

case '8':

case '9':number();break;//数字查询

case '<':readch();//6种关系运算符buf[count].pos=（<=为0，<为1，>=为2，>为3，<>为4，=为5）

if(ch=='=')

buf[count].pos=0;

else

{

if(ch=='>') buf[count].pos=4;

else

{

buf[count].pos=1;

pline--;

}

buf[count].sy1=rop;//关系运算符名存入结果 count++;//结果指针后移

break;

case '>':

readch();

if(ch=='=')

buf[count].pos=2;

else

{

buf[count].pos=3;

pline--;

}

buf[count].sy1=rop;

count++;

break;

case '(':

buf[count].sy1=lparent;

count++;

break;

case ')':

buf[count].sy1=rparent;

count++;

break;

case '#':

buf[count].sy1=jinghao;

count++;

break;

case '+':

buf[count].sy1=plus;

count++;

break;

case '-':

buf[count].sy1=sub;

count++;

break;

case '*':

buf[count].sy1=times;

count++;

break;

case '/':

buf[count].sy1=div;

count++;

break;

case ':':

readch();

if(ch=='=')

buf[count].sy1=becomes;

count++;

break;

case '=':

buf[count].sy1=rop;

buf[count].pos=5;

count++;

break;

case ';':

buf[count].sy1=semicolon;

count++;

break;

}

readch();// 取下一个字符

}

buf[count].sy1=-1;//结束了

}

/*******************************************************/

readnu()//读取当前结果缓冲区的二元式存入struct aa n中，pbuf指向结果缓冲区中下一位置的指针

{

if(pbuf->sy1>=0)

{

n.sy1=pbuf->sy1;//存放当前二元式字符名称

n.pos=pbuf->pos;//存放当前二元式字符位置

pbuf++;

}

/***********************中间变量的生成*********************/

newtemp()//返回目前临时变量数

{

newt++;//临时变量计数器+1

return newt;

}

/***********************生成四元式**************************/

gen(char op1[],struct aa arg11,struct aa arg22,int result1)//op1算符，arg11

操作数1，arg22操作数2， result1结果

{

strcpy(fexp[nxq].op,op1);//为四元式传入算符

fexp[nxq].arg1.sy1=arg11.sy1;//为四元式操作数1传入名字

fexp[nxq].arg1.pos=arg11.pos;// 为四元式操作数1传入地址

fexp[nxq].arg2.sy1=arg22.sy1;//为四元式操作数2传入名字

fexp[nxq].arg2.pos=arg22.pos;// 为四元式操作数2传入地址

fexp[nxq].result=result1;// 为四元式结果传入结果

nxq++;//每次指向下一个要生成的四元式地址

return nxq-1;//当前四元式地址

}

/***********************布尔表达式的匹配**********************/

merg(int p1,int p2)// 将链首“指针”分别为p1和p2的两条链合并为一条，并返回新链的链首“指针”（此处的“指针”实际上是四元式的序号，应为整型值）{

int p;

if(p2==0) return p1;

else

{

p=p2;

while(fexp[p].result!=0)

p=fexp[p].result;

fexp[p].result=p1;

return p2;

}

backpatch(int p,int t)//用四元式序号t回填以p为首的链，将链中每个四元式的Result域改写为t的值。

{

int tempq;

int q;

q=p;

while(q!=0)

{

tempq=fexp[q].result;

fexp[q].result=t;

q=tempq;

}

/*********************************************************/

change1(int chan)//action1的符号查找排序（i,+,*,(,),#,E,-，/）

编译原理概念_名词解释

编译过程的六个阶段：词法分析，语法分析，语义分析，中间代码生成，代码优化，目标代码生成解释程序：把某种语言的源程序转换成等价的另一种语言程序——目标语言程序，然后再执行目标程序。解释方式是接受某高级语言的一个语句输入，进行解释并控制计算机执行，马上得到这句的执行结果，然后再接受下一句。编译程序：就是指这样一种程序，通过它能够将用高级语言编写的源程序转换成与之在逻辑上等价的低级语言形式的目标程序(机器语言程序或汇编语言程序)。解释程序和编译程序的根本区别：是否生成目标代码句子的二义性（这里的二义性是指语法结构上的。）:文法G[S]的一个句子如果能找到两种不同的最左推导(或最右推导)，或者存在两棵不同的语法树，则称这个句子是二义性的。文法的二义性:一个文法如果包含二义性的句子，则这个文法是二义文法，否则是无二义文法。 LL(1)的含义：(LL(1)文法是无二义的； LL(1)文法不含左递归) 第1个L：从左到右扫描输入串第2个L：生成的是最左推导 1：向右看1个输入符号便可决定选择哪个产生式某些非LL(1)文法到LL(1)文法的等价变换: 1. 提取公因子 2. 消除左递归文法符号的属性:单词的含义，即与文法符号相关的一些信息。如，类型、值、存储地址等。一个属性文法(attribute grammar)是一个三元组A=(G, V, F) G：上下文无关文法。 V：属性的有穷集。每个属性与文法的一个终结符或非终结符相连。属性与变量一样，可以进行计算和传递。 F：关于属性的断言或谓词(一组属性的计算规则)的有穷集。断言或语义规则与一个产生式相联，只引用该产生式左端或右端的终结符或非终结符相联的属性。综合属性:若产生式左部的单非终结符A的属性值由右部各非终结符的属性值决定,则A的属性称为综合属继承属性:若产生式右部符号B的属性值是根据左部非终结符的属性值或者右部其它符号的属性值决定的,则B的属性为继承属性。 (1)非终结符既可有综合属性也可有继承属性，但文法开始符号没有继承属性。 (2) 终结符只有综合属性，没有继承属性，它们由词法程序提供。在计算时：综合属性沿属性语法树向上传递；继承属性沿属性语法树向下传递。语法制导翻译：是指在语法分析过程中，完成附加在所使用的产生式上的语义规则描述的动作。语法制导翻译实现：对单词符号串进行语法分析，构造语法分析树，然后根据需要构造属性依赖图，遍历语法树并在语法树的各结点处按语义规则进行计算。中间代码（中间语言） 1、是复杂性介于源程序语言和机器语言的一种表示形式。 2、一般，快速编译程序直接生成目标代码。 3、为了使编译程序结构在逻辑上更为简单明确，常采用中间代码，这样可以将与机器相关的某些实现细节置于代码生成阶段仔细处理，并且可以在中间代码一级进行优化工作，使得代码优化比较容易实现。何谓中间代码：源程序的一种内部表示，不依赖目标机的结构，易于代码的机械生成。为何要转换成中间代码:(1)逻辑结构清楚；利于不同目标机上实现同一种语言。 (2)便于移植，便于修改，便于进行与机器无关的优化。中间代码的几种形式：逆波兰记号，三元式和树形表示，四元式符号表的一般形式：一张符号表的的组成包括两项，即名字栏和信息栏。信息栏包含许多子栏和标志位，用来记录相应名字和种种不同属性，名字栏也称主栏。主栏的内容称为关键字（key word）。符号表的功能：（1）收集符号属性(2) 上下文语义的合法性检查的依据：检查标识符属性在上下文中的一致性和合法性。(3)作为目标代码生成阶段地址分配的依据

编译原理教程课西安电子科大出版社第三版后习题答案——第二章

第二章词法分析 2.1 完成下列选择题： (1) 词法分析器的输出结果是。 a. 单词的种别编码 b. 单词在符号表中的位置 c. 单词的种别编码和自身值 d. 单词自身值 (2) 正规式M1和M2等价是指。 a. M1和M2的状态数相等 b. M1和M2的有向边条数相等 c. M1和M2所识别的语言集相等 d. M1和M2状态数和有向边条数相等 (3) DFA M(见图2-1)接受的字集为。 a. 以0开头的二进制数组成的集合 b. 以0结尾的二进制数组成的集合 c. 含奇数个0的二进制数组成的集合 d. 含偶数个0的二进制数组成的集合【解答】 (1) c (2) c (3) d 图2-1 习题2.1的DFA M 2.2 什么是扫描器？扫描器的功能是什么？【解答】扫描器就是词法分析器，它接受输入的源程序，对源程序进行词法分析并识别出一个个单词符号，其输出结果是单词符号，供语法分析器使用。通常是把词法分析器作为一个子程序，每当词法分析器需要一个单词符号时就调用这个子程序。每次调用时，词法分析器就从输入串中识别出一个单词符号交给语法分析器。 2.3 设M=({x,y}, {a,b}, f, x, {y})为一非确定的有限自动机，其中f 定义如下： f(x,a)={x,y} f{x,b}={y} f(y,a)=Φ f{y,b}={x,y} 试构造相应的确定有限自动机M ′。【解答】对照自动机的定义M=(S,Σ,f,So,Z)，由f 的定义可知f(x,a)、f(y,b)均为多值函数，因此M 是一非确定有限自动机。先画出NFA M 相应的状态图，如图2-2所示。图2-2 习题2.3的NFA M 用子集法构造状态转换矩阵，如表表2-1 状态转换矩阵 1b a

编译原理实验指导

编译原理实验指导实验安排：上机实践按小组完成实验任务。每小组三人，分别完成TEST语言的词法分析、语法分析、语义分析和中间代码生成三个题目,语法分析部分可任意选择一种语法分析方法。先各自调试运行，然后每小组将程序连接在一起调试，构成一个相对完整的编译器。实验报告：上机结束后提交实验报告，报告内容： 1．小组成员； 2．个人完成的任务； 3．分析及设计的过程； 4．程序的连接； 5．设计中遇到的问题及解决方案； 6．总结。

实验一词法分析一、实验目的通过设计编制调试TEST语言的词法分析程序，加深对词法分析原理的理解。并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。编制一个读单词过程，从输入的源程序中，识别出各个具有独立意义的单词，即基本字、标识符、常数、运算符、分隔符五大类。并依次输出各个单词的内部编码及单词符号自身值。二、实验预习提示 1．词法分析器的功能和输出格式词法分析器的功能是输入源程序，输出单词符号。词法分析器的单词符号常常表示成以下的二元式(单词种别码，单词符号的属性值)。 2．TEST语言的词法规则 →|ID|ID →|NUM →a|b|…|z|A|B|…|Z →1|2|…|9|0 →+|-|*|/|=|（|）|{|}|：|，|；|＜|＞|! →＞=|＜=|！=|== →/* →*/ 三、实验过程和指导 1.阅读课本有关章节，明确语言的语法，画出状态图和词法分析算法流程图。 2.编制好程序。 3.准备好多组测试数据。 4.程序要求程序输入/输出示例：

编译原理与技术01

编译原理与技术模拟试题一一、填空题（20分） 1.1编译程序的工作过程可划分为词法分析、语法分析、语义分析、中间代码生成、代码优化、目标代码生成等阶段，一般在语义分析阶段对表达式中运算对象的类型进行检查。 1.2 递归下降法和预测分析法是自上而下的语法分析方法。 1.3常用日的存储分配策略有静态存储分配和动态存储分配，其中，动态存储分配策略包括栈分配和堆分配。 1.4移进、归约是自下而上或LR 分析中的典型操作。 1.5对于数组M[1..6, 1..8]，如果每个元素占k个存储单元，且起始地址为a，则以行为主序存放时元素M[4,4]的地址是__ a+27*k __，以列为主序存放时元素M[4,4]的地址是__ a+21k __。二、单选题（20分） 2.1词法分析器不能 D 。 A. 识别出数值常量 B. 过滤源程序中的注释 C. 扫描源程序并识别记号 D. 发现括号不匹配 2.2给定文法A→bA|ca， C 是该文法的句子。 A. bba B. cab C. bca D. cba 2.3一个句型中的最左 B 称为该句型的句柄。 A. 短语 B. 直接短语 C. 非终结符号 D. 终结符号 2.4已知文法G[S]:S→A1A→A1|S0|0。与G等价的正规式是 C 。 A. 0(0|1)* B. 1*|0*1 C. 0(1|10)*1 D. 1(10|01)*0 2.5源程序是句子的集合， B 可以较好地反映句子的结构。 A. 线性表 B. 树 C. 完全图 D. 堆栈 2.6与逆波兰式ab+c*d+对应的中缀表达式是 B 。 A. a+b+c*d B. (a+b)* c+d C. (a+b)* (c+d) D. a+b*c+d 2.7识别上下文无关语言的自动机是 A 。 A. 下推自动机 B. NFA C. DFA D. 图灵机 2.8 B 是与规范归约（最左归约）互逆的一个过程。 A. 最左推导 B. 最右推导 C. 词法分析 D. 语义分析 2.9文法G产生的 A 的全体是该文法描述的语言， A. 句子 B. 短语 C. 终结符 D. 非终结符 2.10在表达式x:=y+1中， A 作为左值出现(其中，“:=”表示赋值)。 A. x B. y C. 1 D. y+1 三、简答题（30分） 3.1 （5分）请分别写出传值调用、引用调用方式下，下面代码的输出结果。 program main(input,output) procedure f(a,b) begin a := b - a; b := a * b + 1; end; begin x := 5; y := 10; f(y,x); print(x,y); end.

编译原理课程设计---C语言编译器的实现

扬州大学编译原理课程设计学号：091202122 姓名：专业：计算机科学与技术课程：编译原理指导教师：陈宏建

目录一．程序简介与分析---------------------------------------------------------3 二．程序适用范围-----------------------------------------------------------3 三．词法分析---------------------------------------------------------------3 四．语法分析---------------------------------------------------------------4 五．语义分析和中间代码生成------------------------------------------------10 六．代码生成--------------------------------------------------------------12 七．流程图----------------------------------------------------------------13 八．实现------------------------------------------------------------------14 九．程序运行结果----------------------------------------------------------14 十．总结------------------------------------------------------------------18 十一.附录（源程序）--------------------------------------------------------18

编译原理实验报告一

实验一词法分析程序实现一、实验目得与要求通过编写与调试一个词法分析程序,掌握在对程序设计语言得源程序进行扫描得过程中,将字符流形式得源程序转化为一个由各类单词符号组成得流得词法分析方法二、实验内容基本实验题目：若某一程序设计语言中得单词包括五个关键字begｉｎ、end、if、then、elsｅ；标识符；无符号常数；六种关系运算符；一个赋值符与四个算术运算符，试构造能识别这些单词得词法分析程序（各类单词得分类码参见表Ｉ）。表Ｉ语言中得各类单词符号及其分类码表输入:由符合与不符合所规定得单词类别结构得各类单词组成得源程序文件。输出：把所识别出得每一单词均按形如(CLASS，VＡLUE）得二元式形式输出,并将结果放到某个文件中。对于标识符与无符号常数，CＬASS字段为相应得类别码得助记符;V AL ＵＥ字段则就是该标识符、常数得具体值；对于关键字与运算符,采用一词一类得编码形式，仅需在二元式得CLASS字段上放置相应单词得类别码得助记符，V ALUE字段则为“空". 三、实现方法与环境词法分析就是编译程序得第一个处理阶段，可以通过两种途径来构造词法分析程序.其一就是根据对语言中各类单词得某种描述或定义(如BＮF)，用手工得方式（例如可用Ｃ语言)构造词法分析程序。一般地,可以根据文法或状态转换图构造相应得状态矩阵,该状态矩阵连同控制程序一起便组成了编译器得词法分析程序;也可以根据文法或状态转换图直接编写词法分析程序。构造词法分析程序得另外一种途径就是所谓得词法分析程序得自动生成，即首先用正规式对语言中得各类单词符号进行词型描述,并分别指出在识别单词时,词法分析程

编译原理及实现课后习题答案(1)

2.1 设字母表A={a}，符号串x=aaa，写出下列符号串及其长度：x0,xx,x5以及A+和A*. x0=(aaa)0=ε| x0|=0 xx=aaaaaa |xx|=6 x5=aaaaaaaaaaaaaaa | x5|=15 A+ =A1∪A2∪…. ∪A n∪…={a,aa,aaa,aaaa,aaaaa…} A* = A0 ∪A1 ∪A2∪…. ∪ A n ∪…={ε,a,aa,aaa,aaaa,aaaaa…} 2.2 令∑={a，b，c}，又令x=abc，y=b，z=aab，写出如下符号串及它们的长度：xy，xyz，（xy）3 xy=abcb |xy|=4 xyz=abcbaab |xyz|=7 (xy)3=(abcb)3 =abcbabcbabcb | (xy)3 |=12 2.3设有文法G[S]：S∷=SS*|SS+|a，写出符号串aa+a*规范推导，并构造语法树。 S => SS* => Sa* => SS+a* => Sa+a* => aa+a*

2.4 已知文法G[Z]：Z∷=U0∣V1 、U∷=Z1∣1 、V∷=Z0∣0 ,请写出全部由此文法描述的只含有四个符号的句子。 Z=>U0=>Z10=>U010=>1010 Z=>U0=>Z10=>V110=>0110 Z=>V1=>Z01=>U001=>1001 Z=>V1=>Z01=>V101=>0101 2.5 已知文法G[S]：S∷=AB A∷=aA︱εB∷=bBc︱bc , 写出该文法描述的语言。 A∷=aA︱ε描述的语言: {a n|n>=0} B∷=bBc︱bc描述的语言：{b n c n|n>=1} L(G[S])={a n b m c m|n>=0,m>=1} 2.6 已知文法E∷=T∣E+T∣E-T 、T∷=F∣T*F∣T/F 、F∷=(E)∣i，写出该文法的开始符号、终结符号集合V T、非终结符号集合V N。开始符号：E V t={+, - , * , / ,（, ）, i} V n={E , F , T} 2.7 对2.6题的文法，写出句型T+T*F+i的短语、简单短语以及句柄。短语：T+T*F+i T+T*F Array i i T T*F 简单短语：i T*F T 句柄：T

编译原理教程课后习题答案——第四章

第四章语义分析和中间代码生成 4.1 完成下列选择题： (1) 四元式之间的联系是通过实现的。 a. 指示器 b. 临时变量 c. 符号表 d. 程序变量 (2) 间接三元式表示法的优点为。 a. 采用间接码表，便于优化处理 b. 节省存储空间，不便于表的修改 c. 便于优化处理，节省存储空间 d. 节省存储空间，不便于优化处理 (3) 表达式(┐A∨B)∧(C∨D)的逆波兰表示为。 a. ┐AB∨∧CD∨ b. A┐B∨CD∨∧ c. AB∨┐CD∨∧ d. A┐B∨∧CD∨ (4) 有一语法制导翻译如下所示： S→bAb {print″1″} A→(B {print″2″} A→a {print″3″} B→Aa) {print″4″} 若输入序列为b(((aa)a)a)b，且采用自下而上的分析方法，则输出序列为。a. 32224441 b. 34242421 c. 12424243 d. 34442212 【解答】 (1) b (2) a (3) b (4) b 4.2 何谓“语法制导翻译”？试给出用语法制导翻译生成中间代码的要点，并用一简例予以说明。【解答】语法制导翻译(SDTS)直观上说就是为每个产生式配上一个翻译子程序(称语义动作或语义子程序)，并且在语法分析的同时执行这些子程序。也即在语法分析过程中，当一个产生式获得匹配(对于自上而下分析)或用于归约(对于自下而上分析)时，此产生式相应的语义子程序进入工作，完成既定的翻译任务。用语法制导翻译(SDTS)生成中间代码的要点如下： (1) 按语法成分的实际处理顺序生成，即按语义要求生成中间代码。 (2) 注意地址返填问题。 (3) 不要遗漏必要的处理，如无条件跳转等。例如下面的程序段： if (i>0) a=i+e-b*d; else a=0; 在生成中间代码时，条件“i>0”为假的转移地址无法确定，而要等到处理“else”时方可确定，这时就存在一个地址返填问题。此外，按语义要求，当处理完(i>0)后的语句(即“i>0”为真时执行的语句)时，则应转出当前的if语句，也即此时应加入一条无条件跳转指令，并且这个转移地址也需要待处理完else之后的语句后方可获得，就是说同样存在着地址返填问题。对于赋值语句a=i+e-b*d，其处理顺序(也即生成中间代码顺序)是先生成i+e的代码，再生成b*d的中间代码，最后才产生“-”运算的中间代码，这种顺序不能颠倒。 4.3 令S.val为文法G[S]生成的二进制数的值，例如对输入串101.101，则S.val= 5.625。按照语法制导翻译方法的思想，给出计算S.val的相应的语义规则，G(S)如下： G[S]: S→L.L|L

编译原理实验指导书

《编译原理》课程实验指导书计算机学院编２００７年９月

实验一 C语言子集编译程序一、实验目的用C语言对一个C语言的子集编制一个一遍扫描的编译程序，以加深对编译原理的理解，掌握编译程序的实现方法和技术。 1．设计、编制并调试一个词法分析程序，加深对词法分析原理的理解。 2．编制一个递归下降分析程序，并对C语言的简单子集进行分析。 3．通过上机实习，加深对语法制导翻译原理的理解，掌握将语法分析所识别的语法成分变换中间代码的语义翻译方法。二、实验要求、内容及学时词法分析部分：2学时（一）待分析的C语言子集的词法： 1．关键字 main if else int return void while 所有关键字都是小写。 2．专用符号 = + - * / < <= > >= == != ; : , { } [ ] ( ) 3.其他标记ID和NUM 通过以下正规式定义其他标记： ID→letter(letter|digit)*NUM→digit(digit)* letter→a|…|z|A|…|Z digit→0|…|9 4.空格由空白、制表符和换行符组成空格一般用来分隔ID、NUM、专用符号和关键字，词法分析阶段空格通常被忽略。各种

（二）词法分析程序的功能：输入：所给文法的源程序字符串。输出：二元组（syn,token或sum）构成的序列。其中， syn 为单词类别码。 token 为存放的单词自身字符串。 sum 为整型常量。具体实现时，可以将单词的二元组用结构进行处理。例如：对源程序 main() { int i=10; while(i) i=i-1; } 的源文件，经词法分析后输出如下序列： (1,main) (26,() (27,)) (30,{) (2,int) (10,i) (21,=) (20,10) (34,;) (7,while) (26,() (10,i) (27,)) (10,i) (21,=) (10,i) (23,-) (20,1) (34,;) (31, }) （三）词法分析程序主要算法思想：算法的基本任务是从字符串表示的源程序中识别出具有独立意义的单词符号，其基本思想是根据扫描到单词符号的第一个字符的种类，拼出相应的单词符号。 1．主程序示意结构图（如下）：注：

编译原理实验指导书

《编译原理》实验指导书太原科技大学计算机学院 -3-1

序《编译原理》是国内外各高等院校计算机科学技术类专业，特别是计算机软件专业的一门重要专业课程。该课程系统地向学生介绍编译程序的结构、工作流程及编译程序各组成部分的设计原理和实现技术。由于该课程理论性和实践性都比较强，内容较为抽象复杂，涉及到大量的软件设计和算法，因此，一直是一门比较难学的课程。为了使学生更好地理解和掌握编译原理和技术的基本概念、基本原理和实现方法，实践环节非常重要，只有经过上机进行程序设计，才能使学生对比较抽象的教学内容产生具体的感性认识，增强学生综合分析问题、解决问题的能力，并对提高学生软件设计水平大有益处。为了配合《编译原理》课程的教学，考虑到本课程的内容和特点，本指导书设置了七个综合性实验，分别侧重于词法分析、NFA的确定化、非递归预测分析、算符优先分析器的构造、LR分析、语义分析和中间代码的生成、基于DAG的基本块优化，以支持编译程序的各个阶段，基本涵盖了《编译原理》课程的主要内容。本指导书可作为《编译原理》课程的实验或课程设计内容，在课程教学的同时，安排学生进行相关的实验。实验平台可选择在MS-DOS或Windows操作系统环境，使用C/C++的任何版本作为开发工具。学生在做完试验后，应认真撰写实验报告，内容应

包括实验名称、实验目的、实验要求、实验内容、测试或运行结果等。

目录实验一词法分析 ........................................................... 错误!未定义书签。实验二 NFA的确定化.................................................... 错误!未定义书签。实验三非递归预测分析 ............................................... 错误!未定义书签。实验四算符优先分析器的构造................................... 错误!未定义书签。实验五 LR分析 .............................................................. 错误!未定义书签。实验六语义分析和中间代码生成................................ 错误!未定义书签。实验七基于DAG的基本块优化................................... 错误!未定义书签。

(完整版)编译原理及实现课后习题答案

编译原理及实现课后习题解答 2.1设字母表A={a}，符号串x=aaa，写出下列符号串及其长度：x0,xx,x5 以及A+和A*. x0=(aaa)0=ε| x0|=0 xx=aaaaaa |xx|=6 x5=aaaaaaaaaaaaaaa | x5|=15 A+ =A1∪A2∪ …. ∪A n∪…={a,aa,aaa,aaaa,aaaaa…} A* = A0 ∪A1 ∪A2 ∪…. ∪A n ∪…={ε,a,aa,aaa,aaaa,aaaaa…} 2.2令∑={a，b，c}，又令x=abc，y=b，z=aab，写出如下符号串及它们的长度：xy，xyz，（xy）3 xy=abcb |xy|=4 xyz=abcbaab |xyz|=7 (xy)3=(abcb)3 =abcbabcbabcb | (xy)3 |=12 2.3设有文法G[S]：S∷=SS*|SS+|a，写出符号串aa+a*规范推导，并构造语法树。 S => SS* => Sa* => SS+a* => Sa+a* => aa+a*

S S S * S S + a a a 2.4 已知文法G[Z]：Z∷=U0∣V1 、U∷=Z1∣1 、V∷=Z0∣0 ,请写出全部由此文法描述的只含有四个符号的句子。 Z=>U0=>Z10=>U010=>1010 Z=>U0=>Z10=>V110=>0110 Z=>V1=>Z01=>U001=>1001 Z=>V1=>Z01=>V101=>0101 2.5已知文法G[S]：S∷=AB A∷=aA︱εB∷=bBc︱bc , 写出该文法描述的语言。 A∷=aA︱ε描述的语言: {a n|n>=0} B∷=bBc︱bc 描述的语言：{b n c n|n>=1} L(G[S])={a n b m c m|n>=0,m>=1} 2.6已知文法E∷=T∣E+T∣E-T 、T∷=F∣T*F∣T/F 、F∷=(E)∣i，写出该文法的开始符号、终结符号集合V T、非终结符号集合V N。开始符号：E V t={+, - , * , / ,（, ）, i} V n={E , F , T}

编译原理实验二

实验二语法分析一、实验目的：设计MiniC的上下文无关文法，利用JavaCC生成调试递归下降分析程序，以便对任意输入的符号串进行分析。本次实验的目的主要是加深对递归下降分析法的理解。二、语法分析器: 按照MiniC语言的语法规则检查词法分析输出的记号流是否符合这些规则，并根据这些规则所体现出的语言中的各种语法结构的层次性。把规则写入到JavaCC的.jjt文件中，可以生成树状的层次结构。三、JavaCC: 在JavaCC的文法规范文件中，不仅可以描述语言的语法规范，而且可以描述词法规范，本次实习中，利用JavaCC以MiniC语言构造一个不含语义分析的编译器前端，包括词法分析、语法分析，并要考虑语法分析中的错误恢复问题。通过使用JavaCC, 可以体会LL(k)文法的编写特点，掌握编写JavaCC文法规范文件的方法。内容：利用JavaCC生成一个MiniC的语法分析器；要求： 1.用流的形式读入要分析的C语言程序，或者通过命令行输入源程序。 2.具有错误检查的能力，如果有能力可以输出错误所在的行号，并简单提示 3.如果输入的源程序符合MiniC的语法规范，输出该程序的层次结构的语法树本次实习仅完成以下语法范畴的语法分析： 1. 写出一个源程序中仅包含if…else, else语句的语法分析。要求能分析其自身嵌套. 其他语句可简化处理 2. 写出一个源程序中仅包含for语句的语法分析。要求能分析其自身嵌套，其他语句可简化处理 3. 写出一个源程序中仅包含while语句的语法分析。要求能分析其自身嵌套。其他语句可简化处理 4. 写出一个源程序中包含上面的12或者13或者23或者123语句的语法分析。要求能分析除其自身嵌套外，还包括相互嵌套。其他语句可简化处理具体实施步骤如下： 1.把MiniC转换为文法如下 <程序〉→ main()〈语句块〉〈语句块〉→{〈语句串〉}

编译原理知识点汇总

编译原理的复习提纲 1.编译原理=形式语言+编译技术 2.汇编程序：把汇编语言程序翻译成等价的机器语言程序 3.编译程序：把高级语言程序翻译成等价的低级语言程序 4.解释执行方式：解释程序，逐个语句地模拟执行翻译执行方式：翻译程序，把程序设计语言程序翻译成等价的目标程序 5.计算机程序的编译过程类似，一般分为五个阶段：词法分析、语法分析、语义分析及中间代码生成、代码优化、目标代码生成词法分析的任务：扫描源程序的字符串，识别出的最小的语法单位（标识符或无正负号数等）语法分析是：在词法分析的基础上的，语法分析不考虑语义。语法分析读入词法分析程序识别出的符号，根据给定的语法规则，识别出各个语法结构。语义分析的任务是检查程序语义的正确性，解释程序结构的含义，语义分析包括检查变量是否有定义，变量在使用前是否具有值，数值是否溢出等。

语法分析完成之后，编译程序通常就依据语言的语义规则，利用语法制导技术把源程序翻译成某种中间代码。所谓中间代码是一种定义明确、便于处理、独立于计算机硬件的记号系统，可以认为是一种抽象机的程序代码优化的主要任务是对前一阶段产生的中间代码进行等价变换，以便产生速度快、空间小的目标代码编译的最后一个阶段是目标代码生成，其主要任务是把中间代码翻译成特定的机器指令或汇编程序编译程序结构包括五个基本功能模块和两个辅助模块 6.编译划分成前端和后端。编译前端的工作包括词法分析、语法分析、语义分析。编译前端只依赖于源程序，独立于目标计算机。前端进行分析编译后端的工作主要是目标代码的生成和优化后端进行综合。独立于源程序，完全依赖于目标机器和中间代码。把编译程序分为前端和后端的优点是：可以优化配置不同的编译程序组合，实现编译重用，保持语言与机器的独立性。 7.汇编器把汇编语言代码翻译成一个特定的机器指令序列第二章 1.符号，字母表，符号串，符号串的长度计算P18，子符号串的含义，符号串的简单运算XY，Xn， 2.符号串集合的概念，符号串集合的乘积运算，方幂运算，闭包与正闭包的概念P19，P20A0 ={ε} 3.重写规则，简称规则。非xx（V

编译原理实验报告2

学生学号实验课成绩武汉理工大学学生实验报告书实验课程名称编译原理开课学院计算机科学与技术学院指导老师姓名饶文碧学生姓名学生专业班级

—学年第学期实验课程名称：编译原理实验项目名称单词的词法分析实验成绩实验者专业班级组别同组者实验日期第一部分：实验分析与设计（可加页）一、实验内容描述（问题域描述）完成对某一种常用高级语言（如Pascal、C语言、PL/0语言）的各类单词进行词法分析，即对源程序从左到右进行扫描，对组成源程序的字符串拼接成为单词；并把其转换成属性字输出。实验要求：（1）选择常用高级程序设计语言（如 Pascal、C语言、PL/0语言）的源程序作为词法分析对象。（2）根据教学要求和学生具体情况，从上列语言之一中选取它的一个适当大小的子集，可以选取一类典型单词，也可以尽可能使各种类型的单词都能兼顾到。其基本要求是：对源程序从左到右进行扫描，对组成源程序的字符串拼接成为单词，并把其转换成属性字输出。

二、实验基本原理与设计（包括实验方案设计，实验手段的确定，试验步骤等，用硬件逻辑或者算法描述） #include #include #include #include char *table[7]={" ","main","int","if","then","else","return"},TOKEN[20],ch; //定义关键字 int lookup(char *TOKEN){ //关键字匹配函数 int m,i; for(i=1;i<6;i++){ if((m=strcmp(TOKEN,table[i]))==0) return(i); } return(0); } void out(int c,char *TOKEN){ //输出函数 printf("(%d,%s)\n",c,TOKEN); } void scanner(FILE *fp){ //扫描函数

编译原理发展史

编译原理历史与发展姓名：费张烨学号：09923206 指导老师：朱文华基于形式语言理论中的有关概念来讨论编译实现问题。即编译原理=形式语言理论+编译技术编译原理是计算机专业的一门重要专业课，旨在介绍编译程序构造的一般原理和基本方法。内容包括语言和文法、词法分析、语法分析、语法制导翻译、中间代码生成、存储管理、代码优化和目标代码生成。编译原理是计算机专业设置的一门重要的专业课程。虽然只有少数人从事编译方面的工作，但是这门课在理论、技术、方法上都对学生提供了系统而有效的训练，有利于提高软件人员的素质和能力。编译器是将一种语言翻译为另一种语言的计算机程序。编译器将源程序（source language）编写的程序作为输入，而产生用目标语言（target language ）编写的等价程序。通常地，源程序为高级语言（high-level language ），如C或C + + ，而目标语言则是目标机器的目标代码（object code，有时也称作机器代码（machine code ）），也就是写在计算机机器指令中的用于运行的代码。这一过程可以表示为：源程序→编译器→目标程序编译技术的历史在20世纪40年代，由于冯·诺伊曼在存储-程序计算机方面的先锋作用，编写一串代码或程序已成必要，这样计算机就可以执行所需的计算。开始时，这些程序都是用机器语言（machine language ）编写的。机器语言就是表示机器实

际操作的数字代码，例如：C7 06 0000 0002 表示在IBM PC 上使用的Intel 8x86处理器将数字2移至地址0 0 0 0 （16进制）的指令。

编译原理实验指导书(图)

编译原理实验指导书

前言编译原理是计算机科学与技术、软件工程等专业的主干课和必修课，由于这门课程相对抽象且内容较复杂，一直是比较难学的一门课程。在编译原理的学习过程中，实验非常重要，只有通过上机实验，才能使学生对比较抽象的课程内容产生一个具体的感性认识。本书实验环境主要为C环境及一个词法分析器自动生成工具FLEX和一个语法分析器自动生成工具BISON。书中给出的参考源程序也是C源程序，但由于实验者熟悉精通的语言工具不尽相同，因而强求采用统一的编程语言编程是不现实的。实验者在掌握了编译程序各个阶段的功能和原理之后，不难借助使用其他自己熟悉的语言实现相关功能。实验者在实验过程中应该侧重写出自己在算法分析、设计思路、实现功能或程序代码等方面的特色，写出设计和实现过程中遭遇到的难点和解决办法，可以不拘泥于实验指导给出的参考性设计思路，尽可能在深度和广度上加以拓展。只有这种各具特色的实验报告，才将更有利于体现实验者在创新思维和动手能力上的差异。通过这些实验，能使学生对这些部份的工作机理有一个详细的了解，达到“知其然，且知其所以然”的目的。并可在C环境下对自动生成工具生成的词法、语法分析器进行编译调试。由于手工生成词法和语法分析器的工作量太大，在实际中常用自动生成工具来完成之。这些工具中最著名的当属贝尔实验室的词法分析器生成工具LEX和语法分析器生成工具YACC。它们现已成为UNIX的标准应用程序同UNIX一起发行。与此同时GNU推出与LEX完全兼容的FLEX，与YACC完全兼容的BISON。这两个程序都在Internet上以源代码的形式免费发行，所以很容易在其它操作系统下重新编译安装。我们实验采用的就是for dos的FLEX和BISON。本书有关的编译工具及其源程序例子，可到BISON的网站上下载。关于FLEX和BISON的用法简介，参见附录，如需更详细的介绍，请参阅编译工具中帮助文件。

编译原理实验报告：实验一编写词法分析程序

( 编译原理实验报告 , 实验名称：实验一编写词法分析程序实验类型：验证型实验指导教师：何中胜专业班级：（ 13软件四姓名：丁越学号：实验地点：) 秋白楼B720

实验成绩：日期：2016年 3 月 18 日

一、实验目的通过设计、调试词法分析程序，实现从源程序中分出各种单词的方法；熟悉词法分析程序所用的工具自动机，进一步理解自动机理论。掌握文法转换成自动机的技术及有穷自动机实现的方法。确定词法分析器的输出形式及标识符与关键字的区分方法。加深对课堂教学的理解；提高词法分析方法的实践能力。通过本实验，应达到以下目标：[ 1、掌握从源程序文件中读取有效字符的方法和产生源程序的内部表示文件的方法。 2、掌握词法分析的实现方法。 3、上机调试编出的词法分析程序。二、实验过程以编写PASCAL子集的词法分析程序为例 1.理论部分 > （1）主程序设计考虑主程序的说明部分为各种表格和变量安排空间。数组 k为关键字表，每个数组元素存放一个关键字。采用定长的方式，较短的关键字后面补空格。 P数组存放分界符。为了简单起见，分界符、算术运算符和关系运算符都放在 p表中（编程时，还应建立算术运算符表和关系运算符表，并且各有类号），合并成一类。 id和ci数组分别存放标识符和常数。 instring数组为输入源程序的单词缓存。￥ outtoken记录为输出内部表示缓存。还有一些为造表填表设置的变量。主程序开始后，先以人工方式输入关键字，造 k表；再输入分界符等造p表。主程序的工作部分设计成便于调试的循环结构。每个循环处理一个单词；接收键盘上送来的一个单词；调用词法分析过程；输出每个单词的内部码。 ⑵词法分析过程考虑将词法分析程序设计成独立一遍扫描源程序的结构。其流程图见图 1-1。 …

编译原理实验：目标代码的生成

5. 目标代码生成本章实验为实验四，是最后一次实验，其任务是在词法分析、语法分析、语义分析和中间代码生成程序的基础上，将C 源代码翻译为MIPS32指令序列（可以包含伪指令），并在SPIM Simulator上运行。当你完成实验四之后，你就拥有了一个自己独立编写、可以实际运行的编译器。选择MIPS作为目标体系结构是因为它属于RISC范畴，与x86等体系结构相比形式简单便于我们处理。如果你对于MIPS体系结构或汇编语言不熟悉并不要紧，我们会提供详细的参考资料。需要注意的是，由于本次实验的代码会与之前实验中你已经写好的代码进行对接，因此保持一个良好的代码风格、系统地设计代码结构和各模块之间的接口对于整个实验来讲相当重要。 5.1 实验内容 5.1.1 实验要求为了完成实验四，我们建议你首先下载并安装SPIM Simulator用于对生成的目标代码进行检查和调试，SPIM Simulator的官方下载地址为：https://www.360docs.net/doc/7c15849947.html,/~larus/spim.html。这是由原Wisconsin-Madison的Jame Larus教授（现在在微软）领导编写的一个功能强大的MIPS32汇编语言的汇编器和模拟器，其最新的图形界面版本QtSPIM由于使用了Qt组件因而可以在各大操作系统平台如Windows、Linux、Mac等上运行，推荐安装。我们会在后面介绍有关SPIM Simulator的使用方法。你需要做的就是将实验三中得到的中间代码经过与具体体系结构相关的指令选择、寄存器选择以及栈管理之后，转换为MIPS32汇编代码。我们要求你的程序能输出正确的汇编代码。“正确”是指该汇编代码在SPIM Simulator（命令行或Qt版本均可）上运行结果正确。因此，以下几个方面不属于检查范围： 1)寄存器的使用与指派可以不必遵循MIPS32的约定。只要不影响在SPIM Simulator中的正常运行，你可以随意分配MIPS体系结构中的32个通用寄存器，而不必在意哪些寄存器应该存放参数、哪些存放返回值、哪些由调用者负责保存、哪些由被调用者负责保存，等等。 2)栈的管理（包括栈帧中的内容及存放顺序）也不必遵循MIPS32的约定。你甚至可以使用栈以外的方式对过程调用间各种数据的传递进行管理，前提是你输出的目标代码（即MIPS32汇编代码）能运行正确。

编译原理和技术期末考试复习题

2.1 考虑文法G[S],其产生式如下: S→(L)|a L→L，S|S (1)试指出此文法的终结符号、非终结符号。终结符号为：{(,),a,,,} 非终结符号为：{S,L} 开始符号为：S (2)给出下列各句子的分析树： ① ②(a,(a,a))③ (a,((a,a),(a,a))) (a,a) (3)构造下列各句子的一个最左推导： ① (a,a) S (L) (L,S) (S,S) (a,S) (a,a) ② (a,(a,a)) S (L) (L,S) (S,S) (a,S) (a,(L) (a,(L,S)) (a,(S,S)) (a,(a,S)) (a,(a,a)) ③ (a,((a,a),(a,a))) S (L) (L,S) (S,S) (a,S) (a,(L)) (a,(L,S)) (a,(S,S)) (a,((L),S)) (a,((L,S),S)) (a,((S,S),S)) (a,((a,S),S)) (a,((a,a),S)) (a,((a,a),(L))) (a,((a,a),(L,S))) (a,((a,a),(S,S))) (a,((a,a),(a,S))) (a,((a,a),(a,a))) (4)构造下列各句子的一个最右推导： ①(a,a) S (L) (L,S) (L,a) (S,a) (a,a) ②(a,(a，a)) S (L) (L,S) (L,(L)) (L,(L,S)) (L,(L,a)) (L,(S,a)) (L,(a,a)) (S,(a,a)) (a,(a,a) ③(a，((a，a)，(a，a)) S (L) (L,S) (L,(L)) (L,(L,S)) (L,(L,(L))) (L,(L,(L,S))) (L,(L,(L,a))) (L,(L,(S,a))) (L,(L,(a,a))) (L,(S,(a,a))) (L,((L),(a,a))) (L,((L,S),(a,a))) (L,((L,a),(a,a))) (L,((S,a),(a,a))) (L,((a,a),(a,a))) (S,((a,a),(a,a))) (a,((a,a),(a,a))) (5)这个文法生成的语言是什么？ L(G[S]) = (α1,α2,...,αn)或a 其中αi(1≤i≤n)，即L(G[S])是一个以a为原子的纯表，但不包括空表。 2.2 考虑文法G[S] S→aSbS|bSaS|ε (1)试说明此文法是二义性的。可以从对于句子abab有两个不同的最左推导来说明。 S aSbS abS abaSbS ababS abab S aSbS abSaSbS abaSbS ababS abab 所以此文法是二义性的。 (2)对于句子abab构造两个不同的最右推导。 S aSbS aSbaSbS aSbaSb aSbab abab S aSbS aSb abSaSb abSab abab (3)对于句子abab构造两棵不同的分析树。