编译原理基本概念

合集下载

编译原理与技术

编译原理与技术编译原理与技术是计算机科学与技术中的一门重要课程，旨在教授学生如何设计、实现和优化编译器以及相关的编程工具和技术。

本文将介绍编译原理与技术的基本概念、主要任务以及在实际应用中的作用和挑战，并探讨编译原理与技术在不同编程语言和开发环境中的应用。

一、编译原理与技术的基本概念编译原理与技术研究的对象是编译器，而编译器是一种从一种语言（源语言）到另一种语言（目标语言）的程序转换工具。

编译器的主要任务是将源程序转换为等价的目标程序，以便计算机能够执行。

编译原理与技术的基本概念包括词法分析、语法分析、语义分析、中间代码生成、代码优化和代码生成等。

1. 词法分析词法分析是编译器的第一个阶段，它将源程序的字符流转换为有意义的词法单元序列。

词法单元是编程语言中具有独立含义的最小单元，例如关键字、标识符、运算符和常量等。

词法分析器通常通过有限自动机或正则表达式来实现。

2. 语法分析语法分析是编译器的第二个阶段，它通过对词法单元序列的分析来构造语法树。

语法树反映了源程序的语法结构，其中每个节点代表一个语法单元，每个子节点代表一个子表达式。

语法分析器通常使用上下文无关文法和分析方法（如递归下降分析和LR分析）来实现。

3. 语义分析语义分析是编译器的第三个阶段，它对语法树进行静态检查以确定源程序是否符合语义规则。

语义分析器通常处理类型检查、作用域分析和语义动作等任务，以确保生成的中间代码具有准确的语义含义。

4. 中间代码生成中间代码生成是编译器的第四个阶段，它将语法树转换为一种中间表示形式，以便后续的优化和目标代码生成。

中间代码通常是一种抽象的、与机器无关的形式，例如三地址码、虚拟机代码或中间表示IR。

5. 代码优化代码优化是编译器的第五个阶段，它利用各种优化技术来改进中间代码的性能和效率。

常见的代码优化技术包括常量传播、公共子表达式消除、循环优化和内联展开等。

6. 代码生成代码生成是编译器的最后一个阶段，它将优化后的中间代码转换为目标代码。

编译原理虎书

编译原理虎书编译原理（Compiler Design）是计算机科学中的一门重要课程，也是计算机专业学生必修的一门课程。

《编译原理》（通常被称为“虎书”）是编译原理领域的经典教材，由Alfred V. Aho、Monica S. Lam、Ravi Sethi和Jeffrey D. Ullman合著。

本文将从编译原理的基本概念、编译器的结构以及编译器设计的一般原则等方面对《编译原理》这本书进行简要介绍。

编译原理是研究源语言程序到目标语言程序的转换过程的一门学科。

编译器是实现这一转换过程的程序，它将高级语言程序翻译成机器语言程序。

编译原理的研究对象包括语法分析、语义分析、中间代码生成、代码优化和目标代码生成等内容。

《编译原理》这本书系统地介绍了这些内容，对于理解编译原理的基本原理和方法非常有帮助。

在《编译原理》中，作者首先介绍了编译器的基本结构，包括词法分析、语法分析、语义分析、中间代码生成、代码优化和代码生成等模块。

然后，作者详细介绍了每个模块的具体实现方法和算法。

此外，书中还介绍了一些编译器设计的一般原则，如错误处理、符号表管理、类型检查等内容。

这些内容对于编译器的设计和实现非常重要。

在学习《编译原理》这本书时，我们应该注重理论与实践相结合。

除了理解书中介绍的理论知识外，我们还应该通过实际编程练习来加深对编译原理的理解。

只有理论与实践相结合，才能真正掌握编译原理这门课程。

总之，《编译原理》这本书是一本经典的教材，对于理解编译原理的基本原理和方法非常有帮助。

通过学习这本书，我们可以了解编译器的基本结构、设计原则以及实现方法，从而为我们今后的编译器设计和实现打下坚实的基础。

希望大家能够认真学习这本书，掌握编译原理这门课程。

编译原理在编程中的应用

编译原理在编程中的应用编译原理是计算机科学中的重要分支，是计算机技术的基础和核心之一。

它主要研究如何将高级程序语言翻译成为低级机器语言，以便让计算机能够理解和执行。

在程序设计和开发过程中，编译原理扮演着至关重要的角色。

本文将从编译原理在编程中的应用角度来探讨其重要性和作用。

一、编译原理的基本概念编译原理是一门关于如何将高级语言转换为机器语言的学科。

它主要由三部分组成：词法分析、语法分析和语义分析。

其中，词法分析是将程序中的字符流划分为词素的过程；语法分析是根据语言的文法规则，将词素组成语法树，以便进行语法分析；语义分析是在语法树的基础上，对程序进行意义分析，以便进行代码生成和优化。

在编译过程中，还有一个重要的环节，即目标代码生成和优化，它是将高级语言翻译成为机器语言的最终结果。

编译器将每个语句翻译成为一组机器指令，然后将这些指令打包成为可执行程序或目标代码，以便计算机可以运行它们。

在目标代码生成的过程中，还需要进行代码优化，以提高程序的执行效率和速度。

二、编译原理在编程中具有广泛的应用。

它不仅可以提高代码的效率和速度，还可以减小程序的体积，降低资源的消耗和开发成本。

下面从几个方面来讲述其具体应用。

1. 语言设计编译原理可以用于设计新的编程语言。

通过分析常用的编程语言的特点和缺陷，可以设计出更加高效、简洁、易用的编程语言，以便将来的程序员可以更加方便地开发和维护代码。

同时，基于编译原理的词法分析、语法分析和语义分析技术，可以使设计出的编程语言变得更加具有可读性、可维护性和可扩展性。

2. 编译器和解释器开发编译原理可以用于编译器和解释器的开发。

编译器是将高级语言翻译成为低级机器语言的程序，而解释器则是将高级语言翻译成为中间代码或解释执行。

编译器和解释器是程序设计中的基础组成部分，它们对程序的执行效率、速度和可移植性都有着重要的影响。

通过使用编译原理技术，可以设计出高效、稳定、易维护的编译器和解释器，以便更加方便地开发和维护代码。

编译原理基础

第一章引论主要内容：编译原理的基本概念、定义、编译原理的应用发展和现状。

重点：编译程序工作的基本构成及各阶段的基本任务，具体要求：理解什么是编译程序，了解各编译程序的基本构成及各阶段的基本任务，编译程序总框，了解编译程序生成过程和构造工具。

一、名词解释1、编译程序：能够把用各种高级语言书写的源程序翻译成某种等价的目标程序的翻译程序。

2、遍：指编译程序对源程序或中间代码程序从头到尾扫描一次。

3、静态分配：在编译时就能够安排好目标程序运行时的全部数据空间。

二、问答题1、简述编译程序的结构？答：编译程序包括词法分析、语法分析、中间代码生成、优化，目标代码产生五个阶段，上述各阶段中还要进行表格处理和出错处理的工作。

2、编译程序可分成哪几个阶段？它们之间的关系如何？答：编译程序可分为五个阶段：词法分析、语法分析、中间代码生成、优化、目标代码生成。

上述五个阶段之间每个阶段输出为作下一阶段的输入，第一阶段的输入是源程序，最后阶段的输出是目标代码程序。

注意：编译过程中，阶段的划分和遍的划分不一定相同第二章高级程序语言概述主要内容：程序语言定义、初等数据类型、数据结构、表达式、语句、高级语言的一般特征及程序语言的语法描述。

重点：程序语言定义具体要求：理解程序语言的词法、语法和语义等概念；熟悉高级程序语言的一般结构和主要共同特征。

一、填空题1、程序语言是由（语法）和（语义）两方面定义的。

2、一个名字的属性包括（类型）和（作用域）3、目标代码一般有三种形式：能够立即执行的机器语言代码，（待装配的机器语言模块）和（汇编语言代码）4、语义：定义一个程序的意义的（一组规则）5、2型文法又称为（上下文无关文法），3型文法又为（正规文法）二、是非题1、虽然名字都是用标识符表示的，但名字和标识符有着本质的区别（对）2、各种名字都是用标识符表示的，所以名字和标识没有本质的区别（错）3、数组元素的地址计算与数组的存储方式没有关系（错）4、语法是指程序的含义（错）5、因名字都是用标识符表示的，故名字与标识符没有区别（错）第三章词法分析主要内容：词法分析器的任务、词法分析器的设计、正规表达式与有限自动机、词法分析器的自动生成。

介绍计算机语言处理的基本概念与应用

介绍计算机语言处理的基本概念与应用计算机语言处理是计算机科学和人工智能领域的重要研究方向，是对计算机语言进行分析、理解和生成的过程。

本文将介绍计算机语言处理的基本概念与应用，并按照以下几个方面进行划分讨论：编译原理、语法分析、语义分析与代码生成、自然语言处理、机器翻译和语言模型。

一、编译原理编译原理是计算机语言处理的核心概念之一，它研究的是将高级语言转化为机器语言的过程。

编译器是完成这一过程的关键工具，它将源代码中的高级语言表达转化为机器指令的二进制代码。

编译原理涉及到词法分析、语法分析、语义分析等多个环节，同时还包括目标代码生成和优化等技术。

二、语法分析语法分析是计算机语言处理中的重要环节，它主要负责根据给定的语法规则对输入的语句进行分析和判断是否合法。

语法分析器通过构建语法树或者语法图表示输入语句的结构，进而进行后续的语义分析和代码生成。

常用的语法分析算法包括递归下降、LL（1）文法、LR（1）文法等。

三、语义分析与代码生成语义分析是对输入语句的语义进行分析和判断，确保语义的正确性，并将其转化为中间代码或者机器代码。

语义分析包括类型检查、作用域分析、常量折叠等过程，它是编译过程中一项非常关键的工作。

代码生成则是根据语法分析和语义分析的结果生成机器可执行的目标代码，常用的代码生成技术有目标代码生成、中间代码生成和代码优化等。

四、自然语言处理自然语言处理是计算机语言处理的一个子领域，其研究的对象主要是人类自然语言。

自然语言处理涉及到词法分析、句法分析、语义分析、语篇分析等多个方面，旨在开发能够理解和生成自然语言的计算机系统。

自然语言处理在机器翻译、问答系统、信息提取等领域有着广泛的应用。

五、机器翻译机器翻译是指利用计算机技术实现不同语言之间的自动翻译。

它通过语言模型、句法分析和语义分析等技术将源语言的文本转化为目标语言的文本。

机器翻译领域涉及到统计机器翻译、神经机器翻译等多个子领域，近年来取得了很大的进展。

编译原理基础

第一章引论主要内容：编译原理的基本概念、定义、编译原理的应用发展和现状。

一、名词解释1、编译程序：能够把用各种高级语言书写的源程序翻译成某种等价的目标程序的翻译程序。

2、遍：指编译程序对源程序或中间代码程序从头到尾扫描一次。

3、静态分配：在编译时就能够安排好目标程序运行时的全部数据空间。

2、编译程序可分成哪几个阶段？它们之间的关系如何？答：编译程序可分为五个阶段：词法分析、语法分析、中间代码生成、优化、目标代码生成。

上述五个阶段之间每个阶段输出为作下一阶段的输入，第一阶段的输入是源程序，最后阶段的输出是目标代码程序。

重点：程序语言定义具体要求：理解程序语言的词法、语法和语义等概念；熟悉高级程序语言的一般结构和主要共同特征。

一、填空题1、程序语言是由（语法）和（语义）两方面定义的。

编译原理课程期末总结

编译原理课程期末总结一、引言编译原理是计算机科学与技术专业必修的一门课程，主要讲授计算机程序语言的组织规则和程序的翻译方法。

本学期的编译原理课程，从基本概念开始，逐渐深入到词法分析、语法分析、语义分析和代码生成等内容。

通过学习编译原理，我对程序的编写和翻译有了更深入的理解，并且提高了编写高效程序的能力。

本文将对本学期编译原理课程的学习内容以及个人体会进行总结和归纳。

二、课程学习内容1. 基本概念在编译原理的第一节课中，老师给我们介绍了编译原理的基本概念。

编译器是将源语言程序翻译成目标语言程序的一种软件。

它包括词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等阶段。

我们学习了编译器的整体结构和各个阶段的作用。

2. 词法分析词法分析是编译器的第一阶段，它负责将源程序分割成一个个单词（Token）。

在本学期的编译原理课程中，我们学习了正则表达式、DFA（Deterministic Finite Automaton）和NFA（Nondeterministic Finite Automaton）的概念。

通过实践，我了解了如何用正则表达式描述词法单元的集合，并将正则表达式转化为NFA和DFA。

3. 语法分析语法分析是编译器的第二阶段，它负责将词法分析得到的单词序列解析成语法树。

在本学期的编译原理课程中，我们学习了上下文无关文法和语法分析算法。

我通过实现LL（1）语法分析器和LR（1）语法分析器，深入理解了语法分析的原理与方法。

4. 语义分析语义分析是编译器的第三阶段，它负责对语法树进行静态检查和语义处理。

在本学期的编译原理课程中，我们学习了符号表的管理和使用、类型检查和类型转换等内容。

通过实践，我掌握了如何设计和实现一个简单的语义分析器。

5. 中间代码生成中间代码生成是编译器的第四阶段，它负责将语法树转化为中间代码。

在本学期的编译原理课程中，我们学习了三地址码和四元式的表示方法，以及中间代码的生成和优化等内容。

编译原理陈火旺

编译原理陈火旺编译原理是计算机科学与技术中的重要学科，它涉及到程序设计语言、编译器、解释器等方面的知识。

在计算机软件开发中，编译原理扮演着至关重要的角色，它是软件开发的基础和核心。

本文将围绕编译原理展开讨论，介绍编译原理的基本概念、原理和应用。

首先，我们来了解一下编译原理的基本概念。

编译原理是指将高级语言程序翻译成机器语言程序的一门学科。

它包括词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等过程。

编译原理的主要任务是设计和实现编译器，将高级语言程序转换成目标代码，以便计算机能够执行。

其次，我们需要了解编译原理的基本原理。

编译原理的基本原理包括语言的文法、词法分析、语法分析和语义分析等内容。

语言的文法是描述语言结构的形式化规则，词法分析是将源程序转换成单词序列的过程，语法分析是将单词序列转换成语法树的过程，语义分析是对语法树进行语义检查和语义动作的过程。

这些原理是编译原理的基础，对于理解编译原理和设计编译器非常重要。

接下来，我们将介绍编译原理的应用。

编译原理在软件开发中有着广泛的应用，它是编程语言和编译器设计的基础。

通过学习编译原理，可以更好地理解编程语言的设计和实现原理，提高程序设计和编码的能力。

此外，编译原理还在软件工程、人工智能、计算机图形学等领域有着重要的应用，可以帮助开发者更好地理解和利用计算机系统的底层原理。

总的来说，编译原理是计算机科学与技术中的重要学科，它涉及到程序设计语言、编译器、解释器等方面的知识。

通过学习编译原理，可以更好地理解和应用计算机系统的底层原理，提高软件开发的能力。

希望本文能够帮助读者更好地理解编译原理的基本概念、原理和应用，为进一步深入学习和研究编译原理打下坚实的基础。

bit编译原理

bit编译原理编译原理是计算机科学与技术中的一门关键课程，主要研究编程语言的编译过程。

编译器将高级编程语言代码转化为机器语言，使计算机能够执行代码。

在本文中，我们将讨论编译原理的基本概念、过程和相关技术。

首先，我们将介绍编译原理的基本概念。

编译器是一种将高级编程语言转化为低级机器语言的程序。

编译器的主要任务包括词法分析、语法分析、语义分析、优化和代码生成等。

词法分析器将源代码分解成标记（tokens）的序列，语法分析器将标记组织成语法树，而语义分析器在语法树上执行类型检查等操作。

优化器通过改进代码结构来提高性能，代码生成器将优化后的代码转化为目标机器代码。

接下来，我们将讨论编译原理的过程。

编译器的主要过程分为两个阶段：分析（Analysis）和综合（Synthesis）。

分析阶段将源码转化为中间表示形式（IR，Intermediate Representation），并对其进行语法和语义分析。

综合阶段将IR转化为目标代码，并进行优化处理。

在分析阶段，词法分析器将源码分解为标记流，语法分析器将标记流组成语法树。

在综合阶段，代码生成器将语法树转化为中间表示形式，优化器对中间表示进行优化，最后生成目标代码。

编译原理涉及的相关技术有很多。

词法分析中常用的技术有有限自动机（DFA）和正则表达式。

语法分析中常用的技术有上下文无关文法（CFG）和递归下降分析。

语义分析中常用的技术有类型检查和语义动作。

优化器中常用的技术有数据流分析和代码重排。

代码生成中常用的技术有寄存器分配和指令选择。

编译原理在计算机科学与技术中有着广泛的应用。

编译器是现代软件开发的核心工具之一，几乎所有的程序语言都需要经过编译过程才能运行。

编译原理的研究对于提高软件性能、减少资源消耗和提高开发效率都有着重要的作用。

总结起来，编译原理是计算机科学与技术中一门重要的课程，主要研究编程语言的编译过程。

通过词法分析、语法分析、语义分析、优化和代码生成等过程，编译器将高级编程语言转化为机器语言。

编译原理pdf

编译原理pdf编译原理是计算机科学中的一门重要课程，它涉及到计算机程序的编写、编译和执行过程，对于理解计算机程序的工作原理和优化程序性能具有重要意义。

本文将介绍编译原理的基本概念、主要内容和相关知识点，并提供编译原理pdf文档供大家学习参考。

编译原理是指将高级语言程序翻译成机器语言程序的过程，这个过程主要包括词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等阶段。

在这个过程中，编译器需要将高级语言程序转换成中间代码，然后再将中间代码转换成目标机器的机器语言程序，最终实现程序的执行。

在编译原理的学习过程中，我们需要了解一些基本概念，比如文法、自动机、语法分析、语义分析、中间代码等。

文法是描述程序语言结构的形式化方法，它由终结符、非终结符、产生式和起始符号组成。

自动机是一种抽象的数学模型，用来描述程序的执行过程。

语法分析是指根据给定的文法规则，将输入的程序文本分析成语法树的过程。

语义分析是指确定程序文本的含义和执行过程的过程。

中间代码是指将高级语言程序转换成的一种中间形式，它比源程序更接近目标机器的机器语言程序。

编译原理pdf文档是学习编译原理的重要资源，它可以帮助我们更好地理解编译原理的基本概念和知识点。

在编译原理pdf文档中，通常会包括编译原理的基本概念、词法分析、语法分析、语义分析、中间代码生成、代码优化、目标代码生成等内容。

通过阅读编译原理pdf文档，我们可以更加系统地学习编译原理的相关知识，加深对编译原理的理解。

除了编译原理pdf文档，我们还可以通过其他途径学习编译原理，比如参加相关课程、阅读相关书籍、参与编译原理的实践项目等。

通过多种途径的学习，我们可以更全面地掌握编译原理的知识，提高编译原理的应用能力。

总之，编译原理是计算机科学中的重要课程，它涉及到计算机程序的编写、编译和执行过程，对于理解计算机程序的工作原理和优化程序性能具有重要意义。

通过学习编译原理pdf文档和其他途径，我们可以更好地掌握编译原理的基本概念和知识点，提高编译原理的应用能力。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1．编译程序编译程序是一种翻译程序，它将高级语言所写的源程序翻译成等价的机器语言或汇编语言的目标程序。

2．词法分析（Lexical analysis或Scanning）和词法分析程序（Lexical analyzer 或Scanner）词法分析阶段是编译过程的第一个阶段。

这个阶段的任务是从左到右一个字符一个字符地读入源程序，即对构成源程序的字符流进行扫描然后根据构词规则识别单词(也称单词符号或符号)。

词法分析程序实现这个任务。

词法分析程序可以使用lex等工具自动生成。

3．语法分析（Syntax analysis或Parsing）和语法分析程序（Parser）语法分析是编译过程的一个逻辑阶段。

语法分析的任务是在词法分析的基础上将单词序列组合成各类语法短语，如“程序”，“语句”，“表达式”等等.语法分析程序判断源程序在结构上是否正确.源程序的结构由上下文无关文法描述.4．语义分析（Syntax analysis）及中间代码生成语义分析是编译过程的一个逻辑阶段. 语义分析的任务是对结构上正确的源程序进行上下文有关性质的审查, 进行类型审查.例如一个C程序片断:int arr[2],b;b = arr * 10;源程序的结构是正确的.语义分析将审查类型并报告错误:不能在表达式中使用一个数组变量,赋值语句的右端和左端的类型不匹配.语义分析时，根据语句的含义，可对它进行翻译，用另一种语言形式（比源语言更接近于目标语言的一种中间代码或直接用目标语言）来描述这种语义。

5．代码优化代码优化的任务是对前阶段产生的中间代码进行等价变换或改造，以期获得更为高效的，即省时间和空间的代码。

6．目标代码生成目标代码的生成的任务是将中间代码变换成特定机器上的绝对指令代码或可重定位的指令代码或汇编指令代码。

7．遍8．前端（Front－end）和后端（Back end）有时，常常把编译的过程分为前端(front end)和后端(back end)，前端由那样一些阶段组成：这些阶段的工作主要依赖于源语言而与目标机无关。

通常这些阶段包括词法分析、语法分析、语义分析和中间代码生成，某些优化工作也可在前端做，也包括与前端每个阶段相关的出错处理工作和符号表管理工作。

后端工作指那些依赖于目标机而一般不依赖源语言，只与中间代码有关的那些阶段，即目标代码生成，以及相关出错处理和符号表操作。

编译程序和解释程序9．Lex一个词法分析程序的自动生成工具。

它输入描述构词规则的一系列正规式,然后构建有穷自动机和这个有穷自动机的一个驱动程序,进而生成一个词法分析程序.10．Yacc一个语法分析程序的自动生成工具。

它接受语言的文法,构造一个LALR(1)分析程序.因为它采用语法制导翻译的思想,还可以接受用C语言描述的语义动作,从而构造一个编译程序. Yacc 是Yet another compiler compiler的缩写.11．源语言（Source language）和源程序（Source program）被编译程序翻译的程序称为源程序,书写该程序的语言称为源语言.12．目标语言（Object language or Target language）和目标程序（Object program or Target program）编译程序翻译源程序而得到的结果程序称为目标程序, 书写该程序的语言称为目标语言.13．中间语言（中间表示）（Intermediate language(representation)）在进行了语法分析和语义分析阶段的工作之后，有的编译程序将源程序变成一种内部表示形式，这种内部表示形式叫做中间语言或中间表示或中间代码。

所谓“中间代码”是一种结构简单、含义明确的记号系统，这种记号系统复杂性介于源程序语言和机器语言之间，容易将它翻译成目标代码。

另外，还可以在中间代码一级进行与机器无关的优化。

常见的中间代码形式有：逆波兰式、三元式、四元式、树形表示和三地址代码。

14．文法（Grammars）文法是用于描述语言的语法结构的形式规则。

文法G定义为四元组(V N，V T，P，S)。

其中V N为非终结符号(或语法实体，或变量)集；V T为终结符号集；P为产生式(也称规则)的集合；产生式(规则)是形如α→β或 a ::=b 的(a , b)有序对,其中α∈(V N∪V T)*且至少含有一个非终结符，而β∈(V N∪V T)*。

V N，V T和P 是非空有穷集。

S称作识别符号或开始符号，它是一个非终结符，至少要在一条规则中作为左部出现。

一个文法的例子: G=( V N ={A，R}, P ={0,1} ，P ={A→0R，A→01,R→A1}, S =A)15．文法分类（A hierarchy of Grammars）著名语言学家Noam Chomsky定义了四类文法和四种形式语言类，文法的四种类型分别是0型、1型、2型和3型。

几类文法的差别在于对产生式施加不同的限制，分别是：0型文法(短语结构文法)(phrase structure grammars)：设G=(V N，V T，P，S)，如果它的每个产生式α→β是这样一种结构α∈(V N∪V T)*且至少含有一个非终结符，而β∈(V N∪V T)*，则G是一个0型文法。

1型文法（上下文有关文法）(context-sensitive grammars)：设G=(V N，V T，P，S)为一文法|α|，若P中的每一个产生式α→β均满足|β|≥|α|，仅仅S→ε除外，则文法G是1型或上下文有关的。

2型文法（上下文无关文法）(context-free grammars)：设G=(V N，V T，P，S)，若P中的每一个产生式α→β满足：α是一非终结符，β∈(V N∪V T)*则此文法称为2型的或上下文无关的。

3型文法（正规文法）(regular grammars)：设G=(V N，V T，P，S)，若P中的每一个产生式的形式都是A→aB或A→a，其中A和B都是非终结符，a是终结符，则G是3型文法或正规文法。

0型文法产生的语言称为0型语言。

1型文法产生的语言称为1型语言，也称作上下文有关语言。

2型文法产生的语言称为2型语言，也称作上下文无关语言。

3型文法产生的语言称为3型语言，也称作正规语言。

16．句型（Sententialform），句子（Sentence）和语言（Language）设G［S］是一文法，如果符号串x是从识别符号推导出来的，即有S x，则称x是文法G［S］的句型。

若x仅由终结符号组成，即S x，x∈V T*，则称x 为G［S］的句子。

文法G所产生的语言定义为集合｛x｜S x，其中S为文法识别符号，且x∈V T*｝。

可用L(G) 或L(G[S])表示该集合。

17．推导（Derive）和语法树（Parse tree）推导的概念：分别定义V*中的符号之间的关系直接推导、长度为n（n≥1）的推导和长度为n（n≥0）的推导：（1）如α→β是文法G=(V N，V T，P，S)的规则（或说是P中的一个产生式），γ和δ是V*中的任意符号，若有符号串v，w满足：v＝γαδ，w＝γβδ则说v（应用规则α→β）直接产生w，或说，w是v的直接推导，或说，w直接归约到v，记做v w。

（2）如果存在直接推导的序列：v w0w1w2…w n w，（n>0）则称v推导出（产生）w（推导长度为n），或称w归约到v。

记作v w。

（3）若有v w，或v＝w，则记作。

语法树（推导树）的概念：给定文法G=(V N，V T，P，S)，对于G的任何句型都能构造与之关联的语法树（推导树）。

这棵树满足下列4个条件：①每个结点都有一个标记，此标记是V的一个符号。

②根的标记是S。

③若一个结点n至少有一个它自己除外的子孙，并且有标记A，则A肯定在V N 中。

④如果结点n的直接子孙，从左到右的次序是结点n1，n2，… ，n k，其标记分别为A1，A2，…，A k，那么A→A1A2，…，A k一定是P中的一个产生式。

18．二义文法（Ambiguous grammer）如果一个文法存在某个句子对应两棵不同的语法树，则说这个文法是二义的。

或者说，若一个文法中存在某个句子，它有两个不同的最左(最右)推导，则这个文法是二义的。

19．短语，句柄(phrase , sentence handle)令G是一文法，S是文法的开始符号，αβδ是文法G的一个句型。

如果有：且则称β是句型αβδ相对与非终结符A的短语。

特别，如有则称β是句型αβδ相对于规则A→β的直接短语(也称简单短语)。

一个句型的最左直接短语称为该句型的句柄。

20．正规式（regular expression）和它所表示的正规集（regular set）设字母表为Σ,辅助字母表Σ’ =｛Φ,ε，｜，.，*,(,)｝。

1. ε和Φ都是Σ上的正规式，它们所表示的正规集分别为{ε}和Φ；2.任何a∈Σ，a是Σ上的一个正规式，它所表示的正规集为{a}；3.假定е1和е2都是Σ上的正规式，它们所表示的正规集分别为L(е1)和L(е2)，那么，(е1)，е1｜е2，е1·е2和е2*也都是正规式，它们所表示的正规集分别为L(е1)，L(е1)∪L(е2)，L(е1)L(е2)和(L(е1)) *。

4.仅由有限次使用上述三步骤而定义的表达式才是Σ上的正规式，仅由这些正规式所表示的字集才是Σ上的正规集。

21．确定的有穷状态自动机DFA(deterministic finite automaton)和不确定的有穷状态自动机NFA(nondeterministic finite automaton)我们这里是把DFA和NFA作为正规集的识别工具而介绍的。

DFA定义如下：一个确定的有穷自动机(DFA)M是一个五元组：M=(K, Σ，f，S，Z)其中1.K是一个有穷集，它的每个元素称为一个状态；2. Σ是一个有穷字母表，它的每个元素称为一个输入字符,所以也称Σ为输入符号字母表;3.f是转换函数，是在K×Σ→K上的映像，即，如f(k i,a)= k j( k i∈K, k j∈K)就意味着，当前状态为k i，输入字符为a时，将转换到下一状态k j，我们把k j称作k i的一个后继状态;4.S∈K是唯一的一个初态；5.Z K，是一个终态集，终态也称可接受状态或结束状态。

NFA定义如下;一个不确定的有穷自动机(NFA)M是一个五元组，M=(K, Σ，f，S，Z)其中1.K是一个有穷集，它的每个元素称为一个状态；2. Σ是一个有穷字母表，它的每个元素称为一个输入字符；3. f是一个从K×Σ*到K的子集的映像.4. S K，是一个非空初态集;5. Z K，是一个终态集。