编译原理-中间代码生成程序解析

合集下载

编译原理课件05语法制导翻译技术和中间代码生成

5.4 中间代码
四元式的特点: 1. 四元式出现的顺序和语法成份的计值顺序相一致. 2. 四元式之间的联系是通过临时变量实现的,这样易于调整和变动四元式. 3. 便于优化处理.
5.4 中间代码
编译系统中,有时将四元式表示成另一种更直观,更易理解的形式——三地址代码或三地址语句. 三地址代码形式定义为: result := arg1 OP arg2 三地址语句:语句中是三个量的赋值语句, 三地址语句每个量占一个地址.
5.5 自下而上的语法制导翻译
例3 简单算术表达式翻译到四元式的语义描述例如,设有简单算术表达式的文法: E→E+E | E*E | (E) | i
T R / S T
c S a c
c R S
输入是bR / bTc / bSc /ac 输出为: 1 4 5 314 24 31 给出相应语义动作(翻译方案) S→bTc { print "1"} { print "2"} S→a R T→R { print "3"} R→R/S { print "4"} R→S { print "5"}
5.1 概述
例如: 表达式 A+B*C 对运算对象进行类型检查, 对变量进行先定义后使用检查执行真正的翻译如果静态语义正确, 语义处理则要执行真正的翻译, 即生成程序的某种中间代码的形式或直接生成目标代码.
5.1 概述
目前多数编译程序进行语义分析的方法是采用语法制导翻译法 .它不是一种采用语法制导翻译法形式系统, 但它比较接近形式化. 语法制导翻译法使用属性文法为工具来描述程序设计语言的语义.
5.4 中间代码

编译原理语义分析与中间代码生成

编译原理语义分析与中间代码生成在编译原理中，语义分析是编译器的重要组成部分之一，它负责验证和处理源代码中的语义信息，为后续的中间代码生成做准备。

本文将介绍语义分析的基本概念和流程，并探讨中间代码生成的相关技术。

一、语义分析的基本概念和流程语义分析是指对源代码进行语义检查和语义信息提取的过程。

其主要目标是确保源代码在语义上是正确的，并从中提取出各种语义信息，以便后续阶段使用。

语义分析的基本流程如下：1. 词法分析和语法分析：在进行语义分析之前，需要先对源代码进行词法分析和语法分析，以便将代码转化为具有结构的中间表示形式（如抽象语法树）。

2. 符号表的构建：符号表是语义分析的重要数据结构，用于存储程序中出现的各种标识符及其相关信息，如类型、作用域等。

在语义分析阶段，需要构建符号表并实时更新。

3. 类型检查：类型检查是语义分析的核心任务之一。

它通过对表达式、赋值语句、函数调用等进行类型推导和匹配，来验证程序是否存在类型错误。

4. 语义规则检查：除了类型检查外，语义分析还需要检查程序是否符合语言规范中的其他语义规则，如变量是否已声明、函数调用是否正确等。

5. 语义信息提取：语义分析还负责提取源代码中的各种语义信息，如函数调用关系、变量的定义和引用关系、控制流信息等。

这些信息将为后续的代码优化和代码生成提供依据。

二、中间代码生成的相关技术中间代码是指某种形式的中间表示形式，通常与源代码和目标代码之间存在一定的映射关系。

它在编译过程中起到连接前后两个阶段的桥梁作用，并且可以进行一些优化。

常见的中间代码形式之一是三地址码。

三地址码是一种低级的代码表示形式，每条指令最多包含三个操作数。

它具有简洁明了的特点，适合进行后续的优化工作。

在进行中间代码生成时，需要考虑以下几个方面的技术：1. 表达式的翻译：在将源代码转化为中间代码时，需要将源代码中的表达式进行翻译。

这包括对表达式的计算顺序、运算符优先级等方面的处理。

2. 控制流的处理：在编译过程中，需要将源代码中的控制流转化为中间代码中的条件分支和循环结构。

编写中间代码生成程序

武夷学院实验报告课程名称：编译原理项目名称：编写中间代码生成程序二、实验过程记录1：（一）实验目的：在分析理解PL/0编译程序的基础上，对其词法分析程序、语法分析程序和语义处理程序进行部分修改扩充。

（二）实验内容：对PL/0语言作如下功能扩充：（1）扩充条件语句的功能使其为：if <条件> then <语句>[else <语句>]（2）增加repeat语句，格式为：repeat <语句> {; <语句>} until <条件>（三）实验过程语句语法描述图：1注：实验过程记录要包含实验目的、实验原理、实验步骤，页码不够可自行添加。

EBNF表示：<程序>::= <分程序>.<分程序>::= [<常量说明部分>][<变量说明部分>][<过程说明部分>]<语句> <常量说明部分>::= const<常量定义>{,<常量定义>};<常量定义>::= <标识符>=<无符号整数><无符号整数>::= <数字>{<数字>}<标识符>::= <字母>{<字母>|<数字>}<变量说明部分>::= var<标识符>{, <标识符>};<过程说明部分>::= <过程首部><分程序>{;<过程说明部分>}<过程首部>::= procedure<标识符>;<语句> ::= <赋值语句>|<条件语句>|<当循环语句>|<过程调用语句><复合语句>|<读语句>|<写语句>|<空><赋值语句>::= <标识符> := <表达式><表达式> ::= [+|-]<项>{<加法运算符><项>}<项>::= <因子>{<乘法运算符><因子>}<因子>::= <标识符>|<无符号整数>| ‘ ( ’ <表达式> ‘ ) ’<加法运算符>::= +|-<乘法运算符>::= *|/<条件>::= <表达式><关系运算符><表达式>|odd<表达式>程序描述图：三、实验结果与讨论：2实验结果：实验小结：通过在PL/0的编译程序的实验中，认识了许多关于中间代码生成的知识，掌握了中间代码中的作用所谓“中间代码”是一种结构简单、含义明确的记号系统，这种记号系统复杂性介于源程序语言和机器语言之间，容易将它翻译成目标代码，产生中间代码的过程叫中间代码生成。

编译器编译原理详解

编译器编译原理详解编译器是一种将源代码转换为目标代码的程序。

它的作用是将人类可读的源代码翻译成计算机可执行的目标代码。

编译器的编译原理是一门关于如何设计和实现编译器的研究领域。

下面详细介绍编译器的编译原理。

编译器的编译原理主要包括以下几个部分：词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成。

词法分析是编译器的第一步，它将源代码分解成一系列的词法单元。

词法单元是编译器的最小处理单位，比如关键字、标识符、运算符和常数等。

词法分析器通常通过正则表达式来识别这些词法单元，然后生成一个词法分析表，用于语法分析。

语法分析是编译器的第二步，它根据词法分析器生成的词法单元序列，将其组合成抽象语法树。

抽象语法树是一种以树状结构表示源代码语法结构的数据结构。

语法分析使用的主要技术是上下文无关文法和语法分析算法，如LL算法和LR算法等。

语义分析是编译器的第三步，它主要负责对抽象语法树进行语义检查和类型推导。

语义检查是验证源代码是否符合语言规范的过程，比如检查变量是否定义、函数调用是否正确等。

类型推导是确定表达式的类型的过程，比如确定算术表达式的结果类型。

中间代码生成是编译器的第四步，它将抽象语法树转换成一种中间表示形式，通常是三地址代码或类似的形式。

中间代码是一种与具体机器无关的代码表示形式，它可以简化后续的代码优化和目标代码生成。

代码优化是编译器的第五步，它对中间代码进行优化，以提高目标代码的执行效率和空间利用率。

代码优化可以包括常量折叠、公共子表达式消除、循环不变表达式移动等优化技术。

目标代码生成是编译器的最后一步，它将中间代码转换成目标机器的机器代码。

目标代码生成主要包括指令选择、寄存器分配和代码布局等过程。

指令选择将中间代码转换成目标机器的指令序列，寄存器分配将临时变量分配到目标机器的寄存器或内存位置，代码布局将指令按照一定的顺序排列，以提高指令的缓存命中率。

综上所述，编译器的编译原理涉及词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等几个主要部分。

请简要描述编译的各个阶段的功能及输入输出。

编译是将高级语言代码转换成机器语言的过程。

它分为多个阶段，每个阶段都有不同的功能和输入输出。

1. 词法分析阶段：输入为源代码，输出为词法单元序列。

该阶段将源代码转换成词法单元序列，每个词法单元代表一个单词或符号。

2. 语法分析阶段：输入为词法单元序列，输出为语法树。

该阶段将词法单元序列转换成语法树，检查语法是否正确。

3. 语义分析阶段：输入为语法树，输出为带有语义信息的语法树。

该阶段对语法树进行语义分析，检查变量和函数是否定义，类型是否匹配等。

4. 中间代码生成阶段：输入为带有语义信息的语法树，输出为中间代码。

该阶段将语法树转换成中间代码，可以是三地址码、虚拟机指令等。

5. 代码优化阶段：输入为中间代码，输出为优化后的中间代码。

该阶段对中间代码进行优化，去除冗余代码，减少执行时间和空间消耗等。

6. 目标代码生成阶段：输入为优化后的中间代码，输出为目标机器代码。

该阶段将中间代码转换成目标机器代码，可以是汇编语言或二进制机器码。

7. 目标代码优化阶段：输入为目标机器代码，输出为优化后的目标机器代码。

该阶段对目标机器代码进行优化，提高执行效率和
减小目标文件大小。

总之，编译的各个阶段都有特定的功能和输入输出，它们共同协作完成将高级语言代码转换成目标机器代码的过程。

编译原理与中间代码生成技术

编译原理与中间代码生成技术编译原理是计算机科学中的重要理论基础，它研究的是将高级语言翻译成机器语言的转换过程。

而中间代码生成技术则是编译原理中的一个关键环节，它负责将源代码转换为中间表示形式，为后续的优化和目标代码生成做准备。

本文将介绍编译原理的基本概念和中间代码生成技术的原理与应用。

一、编译原理基础编译原理是计算机科学中的一个重要分支，它研究的是高级语言程序如何转换为机器语言的过程。

编译原理包括词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等多个阶段。

其中，中间代码生成是编译原理的一个关键环节，它将源代码转换为中间表示形式，以便后续的优化和目标代码生成。

二、中间代码生成技术的原理中间代码是源代码与目标代码之间的一种中间表示形式。

它既比源代码更容易理解，又比目标代码更容易生成和优化。

中间代码生成技术的目的是将源代码转换为中间代码，为后续的优化和目标代码生成做准备。

中间代码生成技术的原理可以用以下步骤来描述：1. 词法分析：将源代码分割成一个个语法单元，比如标识符、关键字、操作符等。

词法分析器会根据事先定义好的词法规则，将源代码转换为词法单元序列。

2. 语法分析：将词法单元序列转换为抽象语法树（AST）。

语法分析器会根据事先定义好的语法规则，分析词法单元序列所组成的语法结构，并构建出相应的抽象语法树。

3. 语义分析：对抽象语法树进行语义检查和类型推断。

语义分析器会检查语法结构中是否存在语义错误，并为表达式推导出对应的类型信息。

4. 中间代码生成：将语法树转换为中间代码表示形式。

中间代码生成器会根据语义信息和事先定义好的转换规则，将语法树转换为中间代码表示形式。

三、中间代码生成技术的应用中间代码生成技术广泛应用于编译器、解释器和虚拟机等领域。

以下是中间代码生成技术在这些领域的具体应用场景：1. 编译器：编译器是将高级语言程序转换为机器语言的工具。

中间代码生成技术在编译器中起到了至关重要的作用，它能够将源代码转换为中间代码表示形式，为后续的代码优化和目标代码生成做准备。

c语言的编译原理

c语言的编译原理
编译原理是指将高级语言（如C语言）编写的程序转换成机
器语言的过程。

它主要分为四个步骤：词法分析、语法分析、语义分析和代码生成。

词法分析是将源代码分解成一个个标记（token）的过程，每
个标记代表着一个词法单元，例如关键字、标识符、运算符等。

词法分析器会利用正则表达式等方法来识别源代码中的词法单元，并生成标记序列。

语法分析是将标记序列按照语法规则进行分析的过程。

它会将标记序列组织成一个由语法规则定义的语法树（Syntax Tree）。

语法分析器会利用文法规则和语法分析算法（如LL(k)算法、LR(k)算法等）来构建语法树。

语义分析是在构建语法树的基础上，对表达式、语句等进行语义检查和语义转换的过程。

语义分析器会检查类型匹配、作用域等语义规则，并将源代码转换成中间代码或目标代码。

代码生成是将中间代码或目标代码生成可执行文件的过程。

它包括了代码优化、目标机器指令的生成和链接等步骤。

代码生成器会根据目标机器的特性和约束，生成对应的机器指令，最终生成可执行文件。

总的来说，C语言的编译原理涉及了词法分析、语法分析、语
义分析和代码生成等几个关键步骤，通过这些步骤将C语言
程序转换成机器语言，从而使计算机能够理解和执行这些程序。

编译原理课后习题答案解析+清华大学出版社第二版

答案： PL/0 语言允许过程嵌套定义和递归调用，它的编译程序在运行时采用了栈式动态存储
管理。（数组 CODE 存放的只读目标程序，它在运行时不改变。）运行时的数据区 S 是由解释程序定义的一维整型数组，解释执行时对数据空间 S 的管理遵循后进先出规则，当每个过程(包括主程序)被调用时，才分配数据空间，退出过程时，则所分配的数据空间被释放。应用动态链和静态链的方式分别解决递归调用和非局部变量的引用问题。
RA 的用途说明如下： T：栈顶寄存器 T 指出了当前栈中最新分配的单元(T 也是数组 S 的下标)。 B：基址寄存器，指向每个过程被调用时，在数据区 S 中给它分配的数据段起始地址，
也称基地址。 SL：静态链，指向定义该过程的直接外过程（或主程序）运行时最新数据段的基地址，
用以引用非局部（包围它的过程）变量时，寻找该变量的地址。 DL：动态链，指向调用该过程前正在运行过程的数据段基地址，用以过程执行结束释放
广义上讲，编译程序和解释程序都属于翻译程序，但它们的翻译方式不同，解释程序是边翻译（解释）边执行，不产生目标代码，输出源程序的运行结果。而编译程序只负责把源程序翻译成目标程序，输出与源程序等价的目标程序，而目标程序的执行任务由操作系统来完成，即只翻译不执行。
）
第4题
对下列错误信息，请指出可能是编译的哪个阶段（词法分析、语法分析、语义分析、代码生成）报告的。（1） else 没有匹配的 if （2）数组下标越界（3）使用的函数没有定义（4）在数中出现非数字字符
CAL L A 调用过程，完成填写静态链、动态链、返回地址，给出被调用过程的基地址值，送入基址寄存器 B 中，目标程序的入口地址 A 的值送指令地址寄存器 P 中，使指令从 A 开始执行。第6题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

实验报告课程名称编译原理实验学期至学年第学期学生所在系部年级专业班级学生姓名学号任课教师实验成绩计算机学院制开课实验室：年月日实验题目分析中间代码生成程序一、实验目的分析PL/0编译程序的总体结构、代码生成的方法和过程；具体写出一条语句的中间代码生成过程。

二、设备与环境PC兼容机、Windows操作系统、Turbo Pascal软件等。

三、实验内容1.分析PL/0程序的Block子程序，理清PL/0程序结构和语句格式。

画出Block子程序的流程图，写出至少两条PL/0程序语句的语法格式。

2.分析PL/0程序的Block子程序和Gen子程序，了解代码生成的方法和过程。

使用概要算法来描述语句的代码生成过程。

3.自己编写一个简单的PL/0程序，能够正确通过编译，得到中间代码。

列出自己编写的源程序和编译后得到的中间代码。

4.从中选择一个语句或表达式，写出代码生成的过程。

要求从自己的源程序中选择一条语句，结合这条语句写出语义分析和代码生成过程。

在描述这个过程中，要说清楚每个功能有哪个子程序的哪条语句来完成，说清楚语句和参数的含义和功能。

四、实验结果及分析(一)程序标注levmax = 3; { max depth of block nesting } { 最大允许的块嵌套层数}{ 语法分析过程block }{ 参数：lev:这一次语法分析所在的层次}{ tx:符号表指针}{ fsys:用于出错恢复的单词集合}procedure block(lev, tx: integer; fsys: symset);vardx: integer; { data allocation index } { 数据段内存分配指针，指向下一个被分配空间在数据段中的偏移位置}tx0: integer; { initial table index } { 记录本层开始时符号表位置}cx0: integer; { initial code index } { 记录本层开始时代码段分配位置}{ 登陆符号表过程enter }procedure enter(k: object1);begin { enter object into table } { 参数：k:欲登陆到符号表的符号类型}tx := tx + 1; { 符号表指针指向一个新的空位}with table[tx] do { 开始登录}beginname := id; { name是符号的名字，对于标识符，这里就是标识符的名字}kind := k; { 符号类型，可能是常量、变量或过程名}case k of { 根据不同的类型进行不同的操作}constant: { 如果是常量名}beginif num > amax then { 在常量的数值大于允许的最大值的情况下}beginerror(31); { 抛出31号错误}num := 0; { 实际登陆的数字以0代替}end;val := num { 如是合法的数值，就登陆到符号表}end;variable: { 如果是变量名}beginlevel := lev; { 记下它所属的层次号}adr := dx; { 记下它在当前层中的偏移量}dx := dx+1; { 偏移量自增一，为下一次做好准备}end;procedur: { 如果要登陆的是过程名}level := lev { 记录下这个过程所在层次}EndEndend { enter };{ 登录符号过程没有考虑到重复的定义的问题。

如果出现重复定义，则以最后一次的定义为准。

}{ 在符号表中查找指定符号所在位置的函数position }{ 参数：id:要找的符号}{ 返回值：要找的符号在符号表中的位置，如果找不到就返回0 }function position (id: alfa): integer;vari: integer;begin { find identifier in table }table[0].name := id; { 先把id放入符号表0号位置}i := tx; { 从符号表中当前位置也即最后一个符号开始找}while table[i].name <> id do { 如果当前的符号与要找的不一致}i := i –1; { 找前面一个}position := i { 返回找到的位置号，如果没找到则一定正好为0 }end{ position };(二)过程说明说明入口参数，返回值和过程的功能1、入口参数：过程体入口时的处理code[table[tx0].adr].a:=cx;（cx为过程入口地址，填写在code 中）with table[tx0] dobeginadr:=cx; （过程的入口填写在table表的过程名中）size:=dx; （过程需要的空间填写在table中）end;cxo:=cx; （保留过程在code中的入口地址在输出目标代码时用）gen(int,0,dx);（生成过程入口指令）2、返回值：(* 通过静态链求出数据区基地址的函数base *)(* 参数说明：l:要求的数据区所在层与当前层的层差*)(* 返回值：要求的数据区基址*)function base(l: integer): integer;varb1: integer;beginb1 := b; (* find base 1 level down *) (* 首先从当前层开始*)while l > 0 do (* 如果l大于0，循环通过静态链往前找需要的数据区基址*)beginb1 := s[b1]; (* 用当前层数据区基址中的内容（正好是静态链SL数据，为上一层的基址）的作为新的当前层，即向上找了一层*)l := l - 1 (* 向上了一层，l减一*)end;base := b1 (* 把找到的要求的数据区基址返回*)end(* base *);(三)程序静态结构图BLOCK 开始置DX,TX 的初值，并将CODE 的下标指针ＣＸ值保存到TABLE 中当前TOKEN 是常量保留字进行常量声明处理当前TOKEN 是变量保留字进行变量声明处理当前TOKEN 是过程保留字SYM 是语句开始符？ERROR向TABLE 回填过程入口新建数据段调用语句处理过程退出数据段向TABLE 表填写新的过程名递归调用BLOCK ，参数LEV+1获取单词SYM 为语句后继符？ERRORPCODE 码输出结束NYNYYNNYNY(四)PL0文法描述在计算机科学中，文法是编译原理的基础，是描述一门程序设计语言和实现其编译器的方法。

文法的描述多用BNF(巴克斯范式)，而另一个重要的概念：正则表达式，也是文法的另一种形式。

PL/0文法的表示： <程序>::= <分程序>.<分程序>::= [<常量说明部分>][<变量说明部分>][<过程说明部分>]<语句><常量说明部分>::= const<常量定义>{,<常量定义>};<常量定义>::= <标识符>=<无符号整数><无符号整数>::= <数字>{<数字>}<标识符>::= <字母>{<字母>|<数字>}<变量说明部分>::= var<标识符>{, <标识符>};<过程说明部分>::= <过程首部><分程序>{;<过程说明部分>}<过程首部>::= procedure<标识符>;<语句> ::= <赋值语句>|<条件语句>|<当循环语句>|<过程调用语句> |<复合语句>|<读语句>|<写语句>|<空><赋值语句>::= <标识符> := <表达式><表达式> ::= [+|-]<项>{<加法运算符><项>}<项>::= <因子>{<乘法运算符><因子>}<因子>::= <标识符>|<无符号整数>| ‘ ( ’ <表达式> ‘ ) ’<加法运算符>::= +|-<乘法运算符>::= *|/<条件>::= <表达式><关系运算符><表达式>|odd<表达式><关系运算符>::= =|<>|<|<=|>|>=<条件语句>::= if<条件>then<语句><当循环语句>::= while<条件>do<语句><过程调用语句>::= call<标识符><复合语句>::= begin<语句>{;<语句>}end<读语句>::= read ‘ ( ’<标识符>{, <标识符>} ‘ ) ’<写语句>::= write ‘ ( ’<表达式>{, <表达式>} ‘ ) ’<字母>::= a|b|c|d…..x|y|z<数字>::= 0|1|2|3…...8|9(五)代码生成程序说明对分程序体人口的处理（见程序文本block 的过程体） begin (*block*)dx:=3;tx0:=tx; （*保留当前table表指针值,实际为过程名在table 表中的位置*）table[tx].adr:=cx;（*保留当前code指针值到过程名的adr 域*）gen(jmp,0,0);（*生成转向过程体入口的指令，该指令的地址为cx已保留在过程名的adr域，真正的过程体入口地址，等生成过程体入口的指令时，再由table[tx].adr中取出 cx 将过程体入口返填到cx所指目标代码，即:（jmp,0,0）的第3区域，同时填到table[tx].adr 中*)②过程体入口时的处理code[table[tx0].adr].a:=cx;（cx为过程入口地址，填写在code 中）with table[tx0] dobeginadr:=cx; （过程的入口填写在table表的过程名中）size:=dx; （过程需要的空间填写在table中）end;cxo:=cx; （保留过程在code中的入口地址在输出目标代码时用）gen(int,0,dx);（生成过程入口指令）table表格管理(六)代码生成程序实例给出pl0源程序，中间代码和过程说明编写代码：program abc(input,output);vari : integer;begini := 10;writeln(i);end.运行程序如图：五、实验总结这次实验加深了我对编译过程的理解，无论是整体还是细节都有了更深入的体会，强化了基础知识的进一步学习，如活动记录、符号表、中间过程生成等。