编译原理--词法分析器实验报告

合集下载

编译技术实验报告词法(3篇)

第1篇一、实验目的本次实验旨在通过实践加深对编译技术中词法分析阶段的理解，掌握词法分析的基本原理和方法，能够实现一个简单的词法分析器，并对源代码进行初步的符号化处理。

二、实验环境1. 操作系统：Windows 102. 编程语言：Java3. 开发工具：Eclipse IDE4. 实验素材：实验提供的C语言源代码三、实验原理词法分析是编译过程中的第一个阶段，其主要任务是将源代码中的字符序列转换成一系列的词法单元（Token）。

词法单元是构成源程序的基本单位，如标识符、关键字、运算符等。

词法分析的基本原理如下：1. 字符流：从源代码中逐个读取字符，形成字符流。

2. 状态转换：根据字符流中的字符，在有限状态自动机（FSM）中转换状态。

3. 词法单元生成：当状态转换完成后，生成对应的词法单元。

4. 错误处理：在分析过程中，如果遇到无法识别的字符或状态，进行错误处理。

四、实验步骤1. 设计词法分析器：根据C语言的语法规则，设计有限状态自动机，定义状态转换图。

2. 实现状态转换函数：根据状态转换图，实现状态转换函数，用于将字符流转换为词法单元。

3. 实现词法单元生成函数：根据状态转换结果，生成对应的词法单元。

4. 测试词法分析器：使用实验提供的C语言源代码，测试词法分析器的正确性。

五、实验结果与分析1. 词法分析器设计：根据C语言的语法规则，设计了一个包含26个状态的状态转换图。

状态转换图包括以下状态：- 初始状态：用于开始分析。

- 标识符状态：用于分析标识符。

- 关键字状态：用于分析关键字。

- 运算符状态：用于分析运算符。

- 数字状态：用于分析数字。

- 字符串状态：用于分析字符串。

- 错误状态：用于处理非法字符。

2. 状态转换函数实现：根据状态转换图，实现了状态转换函数。

该函数用于将字符流转换为词法单元。

3. 词法单元生成函数实现：根据状态转换结果，实现了词法单元生成函数。

该函数用于生成对应的词法单元。

编译原理词法分析实验报告

编译原理词法分析实验报告实验名称:词法分析器的设计与实现一、实验目的：1.熟悉编译原理中词法分析的基本概念和原理；2.掌握正则表达式的使用方法；3.实现一个简单的词法分析器。

二、实验内容：1.设计一个简单的编程语言，包含如下几种类型的词法单元：关键字、标识符、常量、运算符和界符。

2.使用正则表达式定义每种词法单元的模式。

3.设计一个词法分析器，将源代码中的每个词法单元识别出来并输出。

三、实验步骤：1. 确定编程语言的词法单元类型和正则表达式模式，定义相应的单词类型（如 TokenType）和模式（如 regex）。

2. 实现一个词法分析器的类 Lexer，包含以下方法：(1)一个构造方法，用于初始化词法分析器的输入源代码。

(2) 一个getNextToken方法，用于获取源代码中的下一个词法单元。

3. 在getNextToken方法中，使用正则表达式逐个识别源代码中的词法单元，并返回相应的Token对象。

4. 设计一个Token类，包含以下属性：词法单元类型、词法单元的值和位置信息等。

5.在主程序中使用词法分析器，将源代码中的每个词法单元识别出来并输出。

四、实验结果：1.设计一个简单的编程语言，包含如下词法单元类型（示例）：(1) 关键字：if、else、while、for等；(2)标识符：变量名等；(3)常量：整数、浮点数、字符串等；(4)运算符：+、-、*、/、=等；(5)界符：(、)、{、}、;等。

2. 实现一个词法分析器，识别出源代码中的每个词法单元，并输出相应的Token对象。

五、实验总结：通过本次实验，我熟悉了编译原理中词法分析的基本概念和原理，并掌握了正则表达式的使用方法。

我成功完成了一个简单的词法分析器的设计与实现，实现了源代码中每个词法单元的识别与输出。

这次实验对我深化了对编译原理中词法分析的理解，并提高了我的编程能力。

编译原理实验报告

编译原理实验报告一、实验目的本次编译原理实验的主要目的是通过实践加深对编译原理中词法分析、语法分析、语义分析和代码生成等关键环节的理解，并提高实际动手能力和问题解决能力。

二、实验环境本次实验使用的编程语言为 C/C+＋，开发工具为 Visual Studio 2019，操作系统为 Windows 10。

三、实验内容（一）词法分析器的设计与实现词法分析是编译过程的第一个阶段，其任务是从输入的源程序中识别出一个个具有独立意义的单词符号。

在本次实验中，我们使用有限自动机的理论来设计词法分析器。

首先，我们定义了单词的种类，包括关键字、标识符、常量、运算符和分隔符等。

然后，根据这些定义，构建了相应的状态转换图，并将其转换为程序代码。

在实现过程中，我们使用了字符扫描和状态转移的方法，逐步读取输入的字符，判断其所属的单词类型，并将其输出。

（二）语法分析器的设计与实现语法分析是编译过程的核心环节之一，其任务是在词法分析的基础上，根据给定的语法规则，判断输入的单词序列是否构成一个合法的句子。

在本次实验中，我们采用了自顶向下的递归下降分析法来实现语法分析器。

首先，我们根据给定的语法规则，编写了相应的递归函数。

每个函数对应一种语法结构，通过对输入单词的判断和递归调用，来确定语法的正确性。

在实现过程中，我们遇到了一些语法歧义的问题，通过仔细分析语法规则和调整函数的实现逻辑，最终解决了这些问题。

（三）语义分析与中间代码生成语义分析的任务是对语法分析所产生的语法树进行语义检查，并生成中间代码。

在本次实验中，我们使用了四元式作为中间代码的表示形式。

在语义分析过程中，我们检查了变量的定义和使用是否合法，类型是否匹配等问题。

同时，根据语法树的结构，生成相应的四元式中间代码。

（四）代码优化代码优化的目的是提高生成代码的质量和效率。

在本次实验中，我们实现了一些基本的代码优化算法，如常量折叠、公共子表达式消除等。

通过对中间代码进行分析和转换，减少了代码的冗余和计算量，提高了代码的执行效率。

编译原理实验词法分析实验报告

编译原理实验词法分析实验报告一、实验目的词法分析是编译过程的第一个阶段，其主要任务是从左到右逐个字符地对源程序进行扫描，产生一个个单词符号。

本次实验的目的在于通过实践，深入理解词法分析的原理和方法，掌握如何使用程序设计语言实现词法分析器，提高对编译原理的综合应用能力。

二、实验环境本次实验使用的编程语言为_____，开发工具为_____。

三、实验原理词法分析的基本原理是根据编程语言的词法规则，将输入的字符流转换为单词符号序列。

单词符号通常包括关键字、标识符、常量、运算符和界符等。

词法分析器的实现方法有多种，常见的有状态转换图法和正则表达式法。

在本次实验中，我们采用了状态转换图法。

状态转换图是一种有向图，其中节点表示状态，有向边表示在当前状态下输入字符的可能转移。

通过定义不同的状态和转移规则，可以实现对各种单词符号的识别。

四、实验步骤1、定义单词符号的类别和编码首先，确定实验中要识别的单词符号种类，如关键字（if、else、while 等）、标识符、整数常量、浮点数常量、运算符（＋、、、／等）和界符（括号、逗号等）。

为每个单词符号类别分配一个唯一的编码，以便后续处理。

2、设计状态转换图根据单词符号的词法规则，绘制状态转换图。

例如，对于标识符的识别，起始状态为“起始状态”，当输入为字母时进入“标识符中间状态”，在“标识符中间状态”中，若输入为字母或数字则继续保持该状态，直到遇到非字母数字字符时结束识别，确定为一个标识符。

3、编写词法分析程序根据状态转换图，使用所选编程语言实现词法分析器。

在程序中，通过不断读取输入字符，根据当前状态进行转移，并在适当的时候输出识别到的单词符号。

4、测试词法分析程序准备一组包含各种单词符号的测试用例。

将测试用例输入到词法分析程序中，检查输出的单词符号是否正确。

五、实验代码以下是本次实验中实现词法分析器的核心代码部分：｀｀｀include ＜stdioh>include ＜ctypeh>／／单词符号类别定义typedef enum ｛KEYWORD,IDENTIFIER,INTEGER_CONSTANT,FLOAT_CONSTANT,OPERATOR,DELIMITER｝ TokenType;／／关键字列表char keywords ＝｛＂if"，＂else"，＂while"，＂for"，＂int"，＂float"，＂void"｝；／／状态定义typedef enum ｛START,IN_IDENTIFIER,IN_INTEGER,IN_FLOAT,IN_OPERATOR｝ State;／／词法分析函数TokenType getToken(char token, int tokenLength) ｛State state ＝ START;int i ＝ 0;while （1) ｛char c ＝ getchar(）；switch （state) ｛case START:if （isalpha(c)）｛state ＝ IN_IDENTIFIER;tokeni+＋＝ c;｝ else if （isdigit(c)）｛state ＝ IN_INTEGER;tokeni+＋＝ c;｝ else if （c ＝＝＇＋＇｜｜ c ＝＝＇＇｜｜ c ＝＝＇＇｜｜ c ＝＝＇／＇｜｜ c ＝＝＇（＇｜｜ c ＝＝＇）＇｜｜ c ＝＝＇；＇｜｜ c ＝＝＇，＇）｛state ＝ IN_OPERATOR;tokeni+＋＝ c;｝ else if （c ＝＝＇＇）｛state ＝ IN_FLOAT;tokeni+＋＝ c;｝ else if （c ＝＝ EOF) ｛tokeni ＝＇＼0'；tokenLength ＝ i;return －1;｝ else ｛tokeni ＝＇＼0'；tokenLength ＝ i;return －2;｝break;case IN_IDENTIFIER:if （isalpha(c) ｜｜ isdigit(c)）｛tokeni+＋＝ c;｝ else ｛ungetc(c, stdin)；tokeni ＝＇＼0'；tokenLength ＝ i;／／检查是否为关键字for （int j ＝ 0; j ＜ sizeof(keywords) ／ sizeof(keywords0)； j+＋）｛if （strcmp(token, keywordsj) ＝＝ 0) ｛return KEYWORD;｝｝return IDENTIFIER;｝break;case IN_INTEGER:if （isdigit(c)）｛tokeni+＋＝ c;｝ else if （c ＝＝＇＇）｛state ＝ IN_FLOAT;tokeni+＋＝ c;｝ else ｛ungetc(c, stdin)；tokeni ＝＇＼0'；tokenLength ＝ i;return INTEGER_CONSTANT;｝break;case IN_FLOAT:if （isdigit(c)）｛tokeni+＋＝ c;｝ else ｛ungetc(c, stdin)；tokeni ＝＇＼0'；tokenLength ＝ i;return FLOAT_CONSTANT;｝break;case IN_OPERATOR: tokeni ＝＇＼0'；tokenLength ＝ i;return OPERATOR; break;｝｝｝int main(）｛char token100;int tokenLength;TokenType tokenType;while （（tokenType ＝ getToken(token, ＆tokenLength)）！＝－1) ｛switch （tokenType) ｛case KEYWORD:printf(＂Keyword: ％s\n"， token)；break;case IDENTIFIER:printf(＂Identifier: ％s\n"， token)；break;case INTEGER_CONSTANT:printf(＂Integer Constant: ％s\n"， token)；break;case FLOAT_CONSTANT:printf(＂Float Constant: ％s\n"， token)；break;case OPERATOR:printf(＂Operator: ％s\n"， token)；break;case DELIMITER:printf(＂Delimiter: ％s\n"， token)；break;｝｝return 0;｝｀｀｀六、实验结果对准备的测试用例进行输入，得到的词法分析结果如下：测试用例 1：｀｀｀int main(）｛int num ＝ 10;float pi ＝ 314;if （num ＞ 5) ｛printf(＂Hello, World!＼n"）；｝｝｀｀｀词法分析结果：｀｀｀Keyword: int Identifier: main Delimiter: （Delimiter: ）｛Identifier: num Operator: ＝Integer Constant: 10；Identifier: float Identifier: pi Operator: ＝Float Constant: 314；Keyword: ifDelimiter: （Identifier: numOperator: ＞Integer Constant: 5）｛Identifier: printfDelimiter: （String: ＂Hello, World!＼n" Delimiter: ）；｝｀｀｀测试用例 2：｀｀｀for （int i ＝ 0; i ＜ 10; i+＋）｛double result ＝ i 25;｀｀｀词法分析结果：｀｀｀Keyword: for Delimiter: （Keyword: int Identifier: i Operator: ＝Integer Constant: 0；Identifier: i Operator: ＜Integer Constant: 10；Identifier: i Operator: ＋＋）Identifier: doubleIdentifier: resultOperator: ＝Identifier: iOperator:Float Constant: 25；｝｀｀｀通过对多个测试用例的分析，词法分析器能够正确识别出各种单词符号，实验结果符合预期。

编译原理实验报告

编译原理实验报告一、实验概述本次实验旨在设计并实现一个简单的词法分析器，即实现编译器的第一个阶段，词法分析。

词法分析器将一段源程序代码作为输入，将其划分为一个个的词法单元，并将其作为输出。

二、实验过程1.设计词法规则根据编程语言的规范和所需实现的功能，设计词法规则，以明确规定如何将源程序代码分解为一系列的词法单元。

2.实现词法分析器采用合适的编程语言，根据所设计的词法规则，实现词法分析器。

词法分析器的主要任务是读入源程序代码，并将其根据词法规则进行分解，生成对应的词法单元。

3.测试词法分析器设计测试用例，用于检验词法分析器的正确性和性能。

测试用例应包含各种情况下的源程序代码。

4.分析和修正错误根据测试过程中发现的问题，分析产生错误的原因，并进行修正。

重复测试和修正的过程，直到词法分析器能够正确处理所有测试用例。

三、实验结果我们设计了一个简单的词法分析器，并进行了测试。

测试用例涵盖了各种情况下的源程序代码，包括正确的代码和错误的代码。

经过测试，词法分析器能够正确处理所有的测试用例。

词法分析器将源程序代码分解为一系列的词法单元，每个词法单元包含了单词的种类和对应的值。

通过对词法单元的分析，可以进一步进行语法分析和语义分析，从而完成编译过程。

四、实验总结通过本次实验，我深入了解了编译原理的词法分析阶段。

词法分析是编译器的第一个重要阶段，它将源程序代码分解为一个个的词法单元，为后续的语法分析和语义分析提供基础。

在实现词法分析器的过程中，我学会了如何根据词法规则设计词法分析器的算法，并使用编程语言实现词法分析器。

通过测试和修正，我掌握了调试和错误修复的技巧。

本次实验的经验对我今后的编程工作有很大帮助。

编译原理是计算机科学与技术专业的核心课程之一，通过实践能够更好地理解和掌握其中的概念和技术。

我相信通过进一步的学习和实践，我能够在编译原理领域取得更大的成果。

词法分析器的实验报告

词法分析器的实验报告词法分析器的实验报告引言：词法分析器是编译原理中的重要组成部分，它负责将源代码中的字符序列转换为有意义的词法单元，为后续的语法分析提供基础。

本实验旨在设计和实现一个简单的词法分析器，并对其进行测试和评估。

实验设计：1. 词法规则设计：在开始实验之前，我们首先需要设计词法规则，即定义源代码中的合法词法单元。

例如，对于一门类C的语言，我们可以定义关键字（如if、while、int等）、标识符、运算符（如+、-、*等）、分隔符（如()、{}等）等。

2. 有限自动机（DFA）的设计：基于词法规则，我们可以设计一个有限自动机，用于识别和分析源代码中的词法单元。

有限自动机是一个状态转换图，其中每个状态代表一种词法单元，而边表示输入字符的转换关系。

3. 实现代码：根据有限自动机的设计，我们可以使用编程语言（如Python、C++等）实现词法分析器的代码。

代码的主要功能包括读取源代码文件、逐个字符进行词法分析、识别和输出词法单元。

实验过程：1. 词法规则设计：我们以一门简单的算术表达式语言为例，设计了以下词法规则：- 数字：由0-9组成的整数或浮点数。

- 运算符：包括+、-、*、/等。

- 分隔符：包括括号()和逗号,。

- 标识符：以字母开头，由字母和数字组成的字符串。

2. 有限自动机（DFA）的设计：我们基于词法规则，设计了一个简单的有限自动机。

该自动机包含以下状态：- 初始状态：用于读取和识别源代码中的字符。

- 数字状态：用于识别和输出数字。

- 运算符状态：用于识别和输出运算符。

- 分隔符状态：用于识别和输出分隔符。

- 标识符状态：用于识别和输出标识符。

3. 实现代码：我们使用Python编程语言实现了词法分析器的代码。

代码主要包括以下功能：- 读取源代码文件。

- 逐个字符进行词法分析，根据有限自动机的设计进行状态转换。

- 识别和输出词法单元。

实验结果：我们对几个测试样例进行了词法分析，并对结果进行了评估。

编译原理的实验报告

一、实验目的1. 理解编译原理的基本概念和原理。

2. 掌握编译器的各个阶段及其实现方法。

3. 能够运用编译原理的知识解决实际问题。

二、实验环境1. 操作系统：Windows 102. 编程语言：C++3. 开发工具：Visual Studio 20194. 实验内容：词法分析、语法分析、语义分析、中间代码生成、代码优化、目标代码生成三、实验内容1. 词法分析（1）实验目的：实现一个简单的词法分析器，将源代码中的字符序列转换为词法符号序列。

（2）实验步骤：1）定义词法符号类型，包括标识符、关键字、运算符、常量等。

2）设计词法分析器算法，对源代码进行遍历，将字符序列转换为词法符号序列。

3）实现词法分析器程序，输出词法符号序列。

（3）实验结果：输入源代码：int a = 10;输出词法符号序列：{<int, int>, <a, a>, <=, =>, <10, 10>, <;, ;>}2. 语法分析（1）实验目的：实现一个简单的语法分析器，将词法符号序列转换为抽象语法树（AST）。

（2）实验步骤：1）定义语法规则，包括产生式、非终结符、终结符等。

2）设计语法分析算法，根据语法规则对词法符号序列进行解析，生成AST。

3）实现语法分析器程序，输出AST。

（3）实验结果：输入词法符号序列：{<int, int>, <a, a>, <=, =>, <10, 10>, <;, ;>}输出AST：```AST:- ExpressionStatement- Expression- BinaryExpression- Identifier: a- Operator: =- Constant: 10```3. 语义分析（1）实验目的：实现语义分析器，对AST进行语义检查，确保程序的正确性。

（2）实验步骤：1）定义语义规则，包括类型检查、作用域检查等。

编译原理词法分析报告

实验一：词法分析一、实验目的：1、通过设计编制调试一个具体的词法分析程序，加深对词法分析原理的理解。

并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。

2、编制一个读单词过程，从输入的源程序中，识别出各个具有独立意义的单词，即基本关键字、标识符、常数、运算符、分隔符五大类。

并依次输出各个单词的内部编码及单词符号自身值。

（遇到错误时可显示“Error”，然后跳过错误部分继续显示）二、实验预习提示1、词法分析器的功能和输出格式词法分析器的功能是输入源程序，输出单词符号。

词法分析器的单词符号常常表示成以下的二元式(单词种别码，单词符号的属性值)。

本实验中，采用的是一类符号一种别码的方式。

2、单词的BNF表示<标识符>-> <字母><字母数字串><字母数字串>-><字母><字母数字串>|<数字><字母数字串>|<下划线><字母数字串>|ε<无符号整数>-> <数字><数字串><数字串>-> <数字><数字串> |ε<加法运算符>-> +<减法运算符>->-<大于关系运算符>->><大于等于关系运算符>-> >=3、“超前搜索”方法词法分析时，常常会用到超前搜索方法。

如当前待分析字符串为“a>+”,当前字符为’>’，此时，分析器到底是将其分析为大于关系运算符还是大于等于关系运算符呢？显然，只有知道下一个字符是什么才能下结论。

于是分析器读入下一个字符’+’，这时可知应将’>’解释为大于运算符。

但此时，超前读了一个字符’+’，所以要回退一个字符，词法分析器才能正常运行。

在分析标识符，无符号整数等时也有类似情况。

编译原理实验报告

编译原理实验报告一、实验目的编译原理是计算机科学中的重要课程，旨在让学生了解编译器的基本工作原理以及相关技术。

本次实验旨在通过设计和实现一个简单的编译器，来进一步加深对编译原理的理解，并掌握实际应用的能力。

二、实验环境本次实验使用了Java编程语言及相关工具。

在开始实验前，我们需要安装Java JDK并配置好运行环境。

三、实验内容及步骤1. 词法分析词法分析是编译器的第一步，它将源代码分割成一系列词法单元。

我们首先实现一个词法分析器，它能够将输入的源代码按照语法规则进行切割，并识别出关键字、标识符、数字、运算符等。

2. 语法分析语法分析是编译器的第二步，它将词法分析得到的词法单元序列转化为语法树。

我们使用自顶向下的LL(1)语法分析算法，根据文法规则递归地构建语法树。

3. 语义分析语义分析是编译器的第三步，它对语法树进行检查和转换。

我们主要进行类型检查、语法错误检查等。

如果源代码存在语义错误，编译器应该能够提供相应的错误提示。

4. 代码生成代码生成是编译器的最后一步，它将经过词法分析、语法分析和语义分析的源代码翻译为目标代码。

在本次实验中，我们将目标代码生成为Java字节码。

5. 测试与优化完成以上步骤后，我们需要对编译器进行测试，并进行优化。

通过多个测试用例的执行，我们可以验证编译器的正确性和性能。

四、实验心得通过完成这个编译器的实验，我收获了很多。

首先，我对编译原理的知识有了更深入的理解。

在实验过程中，我深入学习了词法分析、语法分析、语义分析和代码生成等关键技术，对编译器的工作原理有了更系统的了解。

其次，我提高了编程能力。

实现一个完整的编译器需要处理复杂的数据结构和算法，这对我的编程能力是一个很好的挑战。

通过实验，我学会了合理地组织代码，优化算法，并注意到细节对程序性能的影响。

最后，我锻炼了解决问题的能力。

在实验过程中，我遇到了很多困难和挑战，但我不断地调试和改进代码，最终成功地实现了编译器。

编译原理实验报告小结

一、实验背景编译原理是计算机科学的一个重要分支，主要研究如何将高级语言源代码转换为计算机可以执行的机器代码。

本实验旨在通过实践操作，加深对编译原理基本概念和算法的理解，提高编程能力和解决问题的能力。

二、实验目的1. 理解编译原理的基本概念和流程；2. 掌握词法分析和语法分析的基本方法；3. 熟悉编译过程中的中间代码生成和代码优化；4. 培养编程能力和团队协作精神。

三、实验内容1. 词法分析词法分析是编译过程的第一步，其主要任务是将源代码中的字符序列转换成一个个有意义的符号（单词）。

本实验中，我们实现了词法分析器，能够识别出标识符、关键字、运算符、常量等单词。

2. 语法分析语法分析是编译过程的核心，其主要任务是将词法分析器生成的单词序列按照一定的语法规则进行组织，形成语法树。

本实验中，我们实现了递归下降解析法，对表达式、赋值语句、函数定义等语法结构进行了分析。

3. 中间代码生成中间代码生成是编译过程中的一个重要环节，其主要任务是将语法树转换为一种抽象的、与具体机器无关的中间代码。

本实验中，我们实现了三地址代码生成，将语法树转换为三地址代码。

4. 代码优化代码优化是编译过程中的一个关键步骤，其主要任务是在保证程序正确性的前提下，提高程序的性能。

本实验中，我们实现了简单的代码优化，如常数传播、变量替换等。

四、实验结果与分析1. 实验结果通过实验，我们成功实现了词法分析、语法分析、中间代码生成和代码优化等功能。

以一个简单的C语言程序为例，我们能够将其转换为三地址代码，并进行简单的优化。

2. 实验分析（1）词法分析：本实验中，我们通过定义状态转换表和动作表，实现了对C语言源代码的词法分析。

实验结果表明，词法分析器能够准确地识别出标识符、关键字、运算符、常量等单词。

（2）语法分析：递归下降解析法是一种较为直观的语法分析方法。

本实验中，我们实现了递归下降解析法，对表达式、赋值语句、函数定义等语法结构进行了分析。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

编译原理--词法分析器实验报告
计算机的地方2008-10-25 23:52:25 阅读9369 评论14 字号：大中小订阅
一．目的与要求：通过编写并上机调试一个词法分析程序，掌握在对程序设计语言的源程序进行扫描的过程中，将其分解后各类单词的词法分析方法。

二．实验内容：
输入：据教学要求和学生具体情况，从具有代表性的高级程序设计语言中，选取一个适当大小的子集，例如可以选取一类典型单词，也可以尽可能使各种类型的单词都能兼顾到。

输出：单词串的输出形式，所输出的每一单词均按形如（CLASS，VALUE）的二元式编码。

对于变量和常数，CLASS字段为相应的类别码，VALUE字段则是该标识符、常数在其符号表中登记项的序号（要求在变量名表登记项中存放该标识符的字符串；常数表登记项中则存放该常数的二进制形式）。

对于关键字和分隔符，采用一词一类的编码形式。

由于采用一词一类的编码方式，所以仅需在二元式的CLASS字段上放置相应的单词的类别码，VALUE字段则为“空”。

不过，为便于查看由词法分析程序所输出的单词串，要求在CLASS字段上直接放置单词符号串本身。

三．处理过程：在扫描源程序字符串时，一旦识别出关键字、分隔符、标识符、无符号常数中之一，即以单词形式（各类单词均采用相同的结构，即二元式编码形式）输出。

每次调用词法分析程序，它均能自动继续扫描下去，形成下一个单词，直至整个源程序全部扫描完毕，并形成相应的单词串形式的源程序。

具体方法如下：
（一）单词的分类：构造上述语言中的各类单词符号及其分类码表如下:
（二）状态转移矩阵
(三)词法分析过程
四、词法分析程序的功能
输入：所给文法的原程序字符串。

输出：二元数组。

如：main() { int x,y; x=9; x>=y; return; }#
输出结果为:
(1, main)
error!
error!
(17, {)
(2, int)
(6,x)
(14,,)
(6,y)
(15,;)
(6,x)
(13,>=)
(6,return)
(15,;)
(18,})
五．源程序
#include<string.h>
#include<stdio.h>
#include<stdlib.h>
#include<ctype.h>
char *table[7]={" ","main","int","if","then","else","return"},TOKEN[20],ch; //定义关键字int lookup(char *TOKEN){ //关键字匹配函数
int m,i;
for(i=1;i<6;i++){
if((m=strcmp(TOKEN,table[i]))==0)
return(i);
}
return(0);
}
void out(int c,char *TOKEN){ //输出函数
printf("(%d,%s)\n",c,TOKEN);
}
void scanner(FILE *fp){ //扫描函数
char TOKEN[20]={'\0'};
char ch;
int i,c;
ch=fgetc(fp); //获取字符，指针fp并自动指向下一个字符if(isalpha(ch)){ //判断该字符是否是字母
TOKEN[0]=ch;
ch=fgetc(fp);
i=1;
while(isalnum(ch)){ //判断该字符是否是字母或数字
TOKEN[i]=ch;
i++;
ch=fgetc(fp);
}
TOKEN[i]='\0';
fseek(fp,-1,1); //回退一个字符
c=lookup(TOKEN);
if(c==0)
out(6,TOKEN); //输出标识符
else out(c,TOKEN); //输出关键字
}
else
if(isdigit(ch)){ //判断是否是数字
TOKEN[0]=ch;
ch=fgetc(fp);
i=1;
while(isdigit(ch)){
TOKEN[i]=ch;
i++;
ch=fgetc(fp);
}
TOKEN[i]='\0';
fseek(fp,-1,1);
out(7,TOKEN);
}
else
{
TOKEN[0]=ch;
switch(ch){
case'{':out(17,TOKEN);
break;
case'}':out(18,TOKEN);
break;
case',':out(14,TOKEN);
break;
case';':out(15,TOKEN);
break;
case'<':ch=fgetc(fp);
TOKEN[1]=ch;
if(ch=='='){
out(9,TOKEN);
}
else if(ch=='>'){
out(11,TOKEN);
}
else {
fseek(fp,-1,1);
out(8,TOKEN);
}
break;
case'=':out(10,TOKEN);
break;
case'>':ch=fgetc(fp);
TOKEN[1]=ch;
if(ch=='=') out(13,TOKEN);
else {
fseek(fp,-1,1);
out(12,TOKEN);
}
break;
default:printf("error!\n");
break;
}
}
}
main()
{
FILE *fp;
if((fp=fopen("E:\\222.txt","r"))==NULL){ //读取文件内容，并返回文件指针，该指针指向文件的第一个字符
fprintf(stderr,"error opening.\n");
exit(1);
}
do{
ch=fgetc(fp);
if(ch=='#') //文件以#结尾，作为扫描结束条件
break;
if(ch==' ') //如果是空格，自动跳到下个字符
scanner(fp);
else{
fseek(fp,-1,1); //如果不是空格，则回退一个字符并扫描
scanner(fp);
}
}while(ch!='#');
return(0);
}
六．函数说明
1. int lookup(char *TOKEN) 关键字匹配函数,查询所述程序中的关键字
2. void out(int c,char *TOKEN) 输出函数
3. void scanner(FILE *fp) 扫描函数，扫描程序中的字符串并调用lookup函数检查是否是关键字，再调用out函数输出二元组
4.fseek（fp，-1，1）回退一个字符
5.isalpha（ch）字母判断函数，若ch指的是字母，返回非0，否则返回0
6.isalnum（h）字母或数字判断函数，若ch指的是字母或数字，返回非0，否则返回0
7.isdigit（ch）数字判断函数，若ch指的是数字，返回非0，否则返回0
8.fgetc（fp）从数据流中区下一个字符
9.fopen 文件打开函数，返回指向文件第一个字符的指针
七．实验结果及截图。