离散数学(形式语言与自动机)

合集下载

浅谈在高职院校计算机专业增设离散数学课程的重要性

浅谈在高职院校计算机专业增设离散数学课程的重要性

在 计 算 机 专业 增 设 离 散 数学 课 程 ,势 必 涉 及 到课 程 内容 设 置 的 问 题 。
基于高职院校培养“ 应用型人才” 的专业定位及专业需求 , 算机专业离散 计
程 是于 17 9 7年被 I E E E确定 为计 算机 专业 核心 主干课 程 ,0 1 2 0 年又 被
浅谈在高职院校计算机专业增设 离散数学课程的重要性
摘 要 : 文首先论述 了高职院校 离散 数学教 学的现状和存在 的问题 , 本 并且指 出要 正确认识 离散数学在高职院校 计算机 专业中的地位 。阐述 了离散数 学课 程的设置要结 合 高职院校人才培养模 式的特 点 , 并结合现状说 明设置 离散数 学课程 时应注 意的问题 。 关键 词 : 职 ; 算机 专 业 ; 高 计 离散 数 学课 程
涵盖离散数学所有知识要点 , 还要确保计算机科学与技术专业学生应有 的 数学知识 、 素质 和能力 。因此在进行课程 内容设置时应选取与计算机专业
年递减 , 甚至有些高职院校完全取 消了离散数学课 。 这个 现象在计算机专
业中尤为突出。众所周知数字电子计 算机是一个离 散结构 , 只能处理离 它 散的或离散化 了的数量关 系 , 因此 , 无论 计算机科学本 身 , 还是 与计 算机 科学及其应用密切相关的现代科学研究领域 ,都 面l 临着如何 对离散结构 建立相应的数学模型 ;又如何将 已用连续数量关 系建立起来 的数学模型
均采取校企合作教育 “+ ” 2 1 人才培养模 式的指导思想 , 学生在校 理论 学习 的时间为两年 , 在校 时间进 一步缩 小 , 较本科生的学习既缺少本科教 育的 理论层次 。 又未能摆脱传统专科教 育的模 式 , 因而没能形成适合 自身 特点 的理论和实践教学体系。数学教学缺乏与专业教学的有机结合 ; 其次是 对 以“ 必需 ” “ 、 够用” 为度 含义的片 面理解 。 以“ 把 必需 ” “ 、够用 ” 为度等 同于

07879离散数学-屈婉玲(形式语言与自动机)11.1

07879离散数学-屈婉玲(形式语言与自动机)11.1
19
Chomsky谱系 谱系
0型语言 0 型文法生成的语言 型语言: 型文法生成的语言 型语言 1型语言 上下文有关语言 如果 型语言(上下文有关语言 可由1型文法 型语言 上下文有关语言): 如果L-{ε}可由 型文法 可由 生成, 生成 则称 L 是1型语言 型语言 2型语言 上下文无关语言 : 2 型文法生成的语言 型语言(上下文无关语言 型语言 上下文无关语言) 3型语言 正则语言 3 型文法生成的语言 型语言(正则语言 型语言 正则语言): 如 {1x00 | x∈{0, 1}*} 是正则语言 (例1) ∈ 例 {anbn | n>0} 是上下文无关语言 (例2,3) 例 2i | i ≥1} 是 0 型语言 (例4) { a 例 型语言 型语言 型语言 定理 0型语言1型语言2型语言3型语言 型语言 型语言 型语言 型语言
2i 2i
2i
(4) 2i 次(7) (8)
*
可以证明: 可以证明 L(G) = { a
2i
| i ≥1}
17
形式文法的分类 —Chomsky谱系 谱系
0型文法 短语结构文法 无限制文法 型文法(短语结构文法 无限制文法) 型文法 短语结构文法,无限制文法 1型文法 上下文有关文法 型文法(上下文有关文法 型文法 上下文有关文法): 所有产生式α→β, 满足 |α|≤|β| 所有产生式 ≤ 另一个等价的定义: 另一个等价的定义 所有的产生式形如 ξAη→ξαη 其中A∈ 且 ≠ 其中 ∈V, ξ,η,α∈(V∪T)*,且α≠ε ∈ ∪ 2型文法 上下文无关文法): 型文法(上下文无关文法 型文法 上下文无关文法 所有的产生式形如 A→α 其中A∈ ∈ ∪ 其中 ∈V,α∈(V∪T)*,
5
子字符串(子串 子字符串 子串): 子串 字符串中若干连续符号组成的字符串 前缀: 前缀 最左端的子串 后缀: 后缀 最右端的子串 例如 ω =abbaab a,ab,abb是ω的前缀 是 的前缀 aab,ab,b是ω的后缀 是 的后缀 ba是ω的子串 但既不是前缀 也不是后缀 的子串, 是 的子串 但既不是前缀, ω本身也是 的子串 且既是前缀 也是后缀 本身也是ω的子串 本身也是 的子串, 且既是前缀, ε也是 的子串 且既是前缀 也是后缀 也是ω的子串 也是 的子串, 且既是前缀,

离散数学(形式语言与自动机)

离散数学(形式语言与自动机)
对每一个NFA M 都存在 都存在DFA M ′使得 定理 对每一个 L(M)=L(M ′)
用M′=〈Q′,Σ,δ′,q0′,F′ 〉 模拟 M=〈Q,Σ,δ,q0,F 〉 ′ 〈 ′ ′ ′ 〈 Q′=P(Q), q0′={q0} ′ F′={ A∈Q | A∩F≠∅} ′ ∈ ∅ ∀A∈Q 和 a∈Σ, ∈ ∈
7
例2 (续) 续
δ*(q0 ,w) w 1 {q0, q1} 10 {q0, q3} 101 {q0, q1} 1011 {q0, q1 , q2} 10110 {q0, q2 , q3} L(G) = { x00y, x11y | x,y∈{0,1}*} ∈
8
DFA与NFA的等价性 与 的等价性
∗ n
L(M)={a2k+1 | k∈N} ∈
4
非确定型有穷自动机
定义 非确定型有穷自动机 (NFA) M =〈 Q,Σ,δ,q0,F 〉, 〈 其中 Q,Σ, q0, F 的定义与 DFA 的相同 而 的相同, δ: Q ×Σ→P(Q)
5
实例
一台NFA 例2 一台 δ 0 1 →q0 {q0 , q3} {q0 , q1} q1 ∅ {q2} *q2 {q2} {q2} q3 {q4} ∅ *q4 {q4} {q4}
21
11.2 有穷自动机
确定型有穷自动机(DFA) 确定型有穷自动机 非确定型有穷自动机(NFA) 非确定型有穷自动机 转移的NFA(ε-NFA) 带ε转移的 转移的
1
确定型有穷自动机
确定型有穷自动机(DFA)是一个有序 元组 是一个有序5元组 定义 确定型有穷自动机 是一个有序 M = 〈Q,Σ,δ,q0,F 〉, 其中 状态集合Q: (1) 状态集合 非空有穷集合 (2) 输入字母表 非空有穷集合 输入字母表Σ: (3) 状态转移函数 状态转移函数δ:Q×Σ→Q × 控制器 (4) 初始状态 q0∈Q (5) 终结状态集 F⊆Q ⊆

离散数学大纲

离散数学大纲

离散数学教学大纲第一部分大纲说明一.课程的性质与任务《离散数学》是现代数学的一个重要分支,也是计算机计算机科学与技术一级学科及其相关专业必修的基础理论的核心课程。

它是学习后续专业课程不可缺少的数学工具。

该课程结合计算机学科的特点,主要研究离散量结构及相互关系,其研究对象一般是有限个或可数个元素,因此《离散数学》充分描述了计算机学科离散性的特点。

它是一门理论性较强,应用性较广的课程。

掌握集合论、数理逻辑、图论、整数、群、环、域、格、布尔代数以及语言与有限自动机等离散数学的基本概念和基本原理,为学习计算机专业各后续课程做好必要的知识准备。

并通过这些知识的学习进一步提高学生的抽象思维和逻辑推理能力,为从事计算机相关的理论研究与应用提供必要的描述工具和理论基础。

二《离散数学》的特点作为计算机科学与技术一级学科的一门课程,《离散数学》有与其他课程相同相似的地方,当然也有它自身的特点:1、义与定理多。

《离散数学》是建立在大量定义之上的逻辑推理学科,因此对概念的理解是我们学习这门课程的核心。

在学习这些概念的基础上,要特别注意概念之间的联系,而描述这些联系的实体则是大量的定理与性质。

2、法性强。

《离散数学》的许多证明题中,方法性是非常强的,如果知道题的证明方法,很容易就可以证出来,反之则事倍功半。

所以在学习该课程中要善于总结,勤于思考,这也是培养分析问题解决问题抽象思维能力的一个过程。

三与其他相关课程的关系先修课程:高等数学(包括数学分析、线性代数)后续课程:数据结构、数据库、编译原理等四课程的主要内容与基本要求本课程分为九部分:集合论基础、命题逻辑、谓词逻辑、图与网络、数论基础、群与环、多项式与有限域、格与布尔代数以及语言和有限自动机。

(一)集合论基础:在整个《离散数学》的知识体系中,集合论处于基础的地位,对于其所包含知识的掌握程度,直接关系到是否能学好图论和抽象代数问题。

本章主要讲述集合、关系和映射。

1. 掌握集合、子集、超集、空集、幂集、集合族的概念。

形式语言与自动机理论--第六章(蒋宗礼)

形式语言与自动机理论--第六章(蒋宗礼)

• 右句型(right sentencial form)
–最右派生得到的句型可叫做右句型。
• 最左归约(leftmost reduction)
–与最左派生对相的归约叫做最右归约。
6.1.1 上下文无关文法的派生树
• 规范派生(normal derivation)
–最右派生。
• 规范句型(normal sentencial form)
• 必要性
–设Anα ,现施归纳于派生步数n,证明存在结果为α 的A-子树。 设n≤k(k≥1)时结论成立,往证当n=k+1时结论也成立:令 Ak+1α,则有: AX1X2…Xm *α1X2…Xm *α1α2…Xm … * α 1 α 2 … α m
6.1.1 上下文无关文法的派生树
6.1.1 上下文无关文法的派生树
• CSL
– CSG、LBA。
教材及主要参考书目
1.蒋宗礼,姜守旭. 形式语言与自动机理论. 北京: 清华大学出版社,2003年 2. John E Hopcroft, Rajeev Motwani, Jeffrey D Ullman. Introduction to Automata Theory, Languages, and Computation (2nd Edition). Addison-Wesley Publishing Company, 2001 3. John E Hopcroft, Jeffrey D Ullman. Introduction to Automata Theory, Languages, and Computation. Addison-Wesley Publishing Company, 1979
6.1.1 上下文无关文法的派生树

离散数学(形式语言与自动机)

离散数学(形式语言与自动机)

6
NFA接受的语言
δ*:QΣ*→Q 递归定义如下: qQ, aΣ 和 wΣ* δ*(q,ε)={q}
δ*(q,wa)= ( p, a) p (q,w)
定义 wΣ*,如果δ*(q0 ,w)∩F≠, 则称M接受w. M接受的字符串的全体称作M接受的语言,记作 L(M), 即
n为 奇 数 n为 偶 数
L(M)={a2k+1 | kN}
4
非确定型有穷自动机
定义 非确定型有穷自动机 (NFA) M =〈 Q,Σ,δ,q0,F 〉,
其中 Q,Σ, q0, F 的定义与 DFA 的相同, 而 δ: Q Σ→P(Q)
5
实例
例2 一台NFA
δ
→q0
q1 *q2
q3 *q4
0 {q0 , q3} {q2} {q4} {q4} 1 {q0 , q1} {q2} {q2} {q4}
DFA M
δ
01
→*{q0,q2} {q1}
{q1} {q0,q2}
εε

L(M)=L(M)={ (01)n | n0 }
15
11.3 有穷自动机和正则文法 的等价性
用ε-NFA模拟右线性文法 用右线性文法模拟DFA
16
有穷自动机和正则文法的等价性
定理 设G是右线性文法, 则存在ε-NFA M 使得 L(M)=L(G); 设M是DFA, 则存在右线性文法G使 得L(G)= L(M). 定理 下述命题是等价的:
AV和αΣ∪{ε}, 若A→αBP, 则δ(A, α)中含有B; 若A→αP, 则δ(A, α)中含有qf;
αΣ∪{ε}, δ(qf ,α)=
18
模拟实例
G =V,T,S,P V={A,S} T={0,1} P: S→11S

形式语言与自动机课后习题答案

形式语言与自动机课后习题答案第二章4.找出右线性文法,能构成长度为1至5个字符且以字母为首的字符串。

答:G={N,T,P,S}其中N={S,A,B,C,D} T={x,y} 其中x∈{所有字母} y∈{所有的字符} P如下: S→x S→xA A→y A→yBB→y B→yC C→y C→yD D→y6.构造上下文无关文法能够产生L={ω/ω∈{a,b}*且ω中a的个数是b的两倍}答:G={N,T,P,S}其中N={S} T={a,b} P如下:S→aab S→aba S→baaS→aabS S→aaSb S→aSab S→SaabS→abaS S→abSa S→aSba S→SabaS→baaS S→baSa S→bSaa S→Sbaa7.找出由下列各组生成式产生的语言(起始符为S)(1)S→SaS S→b(2)S→aSb S→c(3)S→a S→aE E→aS答:(1)b(ab)n /n≥0}或者L={(ba)n b/n≥0}(2) L={a n cb n /n≥0}(3)L={a2n+1 /n≥0}第三章1.下列集合是否为正则集,若是正则集写出其正则式。

(1)含有偶数个a和奇数个b的{a,b}*上的字符串集合(2)含有相同个数a和b的字符串集合(3)不含子串aba的{a,b}*上的字符串集合答:(1)是正则集,自动机如下(2) 不是正则集,用泵浦引理可以证明,具体见17题(2)。

(3) 是正则集先看L’为包含子串aba的{a,b}*上的字符串集合显然这是正则集,可以写出表达式和画出自动机。

(略)则不包含子串aba的{a,b}*上的字符串集合L是L’的非。

根据正则集的性质,L也是正则集。

4.对下列文法的生成式,找出其正则式(1)G=({S,A,B,C,D},{a,b,c,d},P,S),生成式P如下:S→aA S→BA→abS A→bBB→b B→cCC→D D→bBD→d(2)G=({S,A,B,C,D},{a,b,c,d},P,S),生成式P如下:S→aA S→BA→cC A→bBB→bB B→aC→D C→abBD→d答:(1) 由生成式得:S=aA+B ①A=abS+bB ②B=b+cC ③C=D ④D=d+bB ⑤③④⑤式化简消去CD,得到B=b+c(d+bB)即B=cbB+cd+b =>B=(cb)*(cd+b) ⑥将②⑥代入①S=aabS+ab(cb)*(cd+b)+(cb)*(cd+b) =>S=(aab)*(ab+ε)(cb)*(cd+b) (2) 由生成式得:S=aA+B ①A=bB+cC ②B=a+bB ③C=D+abB ④D=dB ⑤由③得 B=b*a ⑥将⑤⑥代入④ C=d+abb*a=d+ab+a ⑦将⑥⑦代入② A=b+a+c(d+b+a) ⑧将⑥⑧代入① S=a(b+a+c(d+ab+a))+b*a=ab+a+acd+acab+a+b*a5.为下列正则集,构造右线性文法:(1){a,b}*(2)以abb结尾的由a和b组成的所有字符串的集合(3)以b为首后跟若干个a的字符串的集合(4)含有两个相继a和两个相继b的由a和b组成的所有字符串集合答:(1)右线性文法G=({S},{a,b},P,S)P: S→aS S→bS S→ε(2) 右线性文法G=({S},{a,b},P,S)P: S→aS S→bS S→abb(3) 此正则集为{ba*}右线性文法G=({S,A},{a,b},P,S)P: S→bA A→aA A→ε(4) 此正则集为{{a,b}*aa{a,b}*bb{a,b}*, {a,b}*bb{a,b}*aa{a,b}*}右线性文法G=({S,A,B,C},{a,b},P,S)P: S→aS/bS/aaA/bbBA→aA/bA/bbCB→aB/bB/aaCC→aC/bC/ε7.设正则集为a(ba)*(1)构造右线性文法(2)找出(1)中文法的有限自 b动机答:(1)右线性文法G=({S,A},{a,b},P,S)P: S→aA A→bS A→ε(2)自动机如下:(p2是终结状态)9.对应图(a)(b)的状态转换图写出正则式。

离散数学在自然语言处理中的应用

离散数学在自然语言处理中的应用自然语言处理是一门跨学科的领域,涉及语言学、计算机科学、人工智能等多个学科,旨在使计算机能够理解和处理人类的自然语言。

在自然语言处理领域中,离散数学是一个重要的分支,其应用广泛,包括语言模型、语法分析、词法分析等方面。

离散数学是数学中的一个分支,研究的是非连续的、离散的数学结构。

自然语言是连续的、离散的符号序列,其中的字符、单词、短语和句子等都可以表示为离散的对象。

因此,在自然语言处理中需要使用离散数学的理论和方法来处理文本数据。

在自然语言处理中,最常用的离散数学工具是自动机和形式语言。

自动机是一种能够对离散序列进行状态转移的计算模型,能够对文本进行自动识别和分类。

形式语言是一种能够对文本进行形式化描述和规范化的工具,包括正则表达式、上下文无关文法、正则文法和上下文有关文法等。

语言模型是自然语言处理中的一个重要概念,指的是对自然语言中的词序列进行建模。

在语言模型中,离散数学中的马尔可夫链是一个非常重要的工具。

马尔可夫链是一个随机过程,指的是当前状态只与前一个状态有关的模型。

在自然语言处理中,马尔可夫链可以被用来描述语言中的概率性质,例如某个单词出现在某个位置的概率,或者一个短语出现在一个句子中的概率。

语法分析和词法分析是自然语言处理中的两个重要任务,分别负责解析语言结构和单词的基本属性。

在语法分析和词法分析中,正则表达式和有限状态自动机是常用的离散数学工具。

正则表达式是一种用来描述文本模式的符号串,能够帮助分析语言中的基本符号,例如空格、标点符号和单词分隔符等。

有限状态自动机是一种能够对正则表达式进行编译的计算模型,能够有效地处理正则表达式匹配问题。

总之,离散数学在自然语言处理中的应用是非常广泛的,各种离散数学工具和理论都能够被用来解决自然语言处理中的具体问题。

离散数学的研究成果为解析语言结构、词法分析和语言模型等任务提供了基础和支持,使得自然语言处理的效率和准确性得以提升。

《离散数学》教学大纲

离散数学一、说明(一)课程性质离散数学是计算机专业重要的基础理论课程,以研究离散量的结构和相互间的关系为主要目标,其研究对象一般是有限个或可数个元素,因此它充分描述了计算机科学离散性的特点。

离散数学与计算机科学中的许多后继课联系紧密,能够提供为专业课服务的基本理论。

(二)教学目的对现实世界中被研究的对象进行抽象,建立必要的基本概念,运用数学工具和方法研究揭示对象发展变换的内在规律,为实验设计和工程设计实现提供方法和技术,并展开实验设计和实现工作是计算机科学的基本工作流程。

以离散数学为代表的构造性数学是描述学科理论、方法和技术的主要工具,本课程的目的在于使计算机专业的学生掌握必要的离散形式的数学概念和结构,培养学生的抽象概括能力和严谨的思维能力,为后继课程的学习和创新研究打下良好的基础。

(三)教学内容本课程包括计算机专业所需要的离散数学基础知识,主要内容由数理逻辑、集合论、代数系统与图论四部分组成。

数理逻辑是研究推理的科学,包括了命题逻辑和谓词逻辑,是计算机科学重要的逻辑基础;集合论包含了二元关系、函数、无限集合等;代数是对字母集合和字母组成的结构的计算,抽象代数是关于计算规则的学说,本课程主要讲述了群、布尔代数等;图论起源于欧拉对著名的哥尼斯堡七桥问题的研究,现实中的许多问题可以用图来表示。

上述概念在计算机科学中有着广泛的应用。

它们为数据结构和数据表示理论奠定了数学基础,同时为许多问题从算法的能行性角度提供了抽象和描述的重要方法和数学基础。

(四)教学时数教学时数为周4学时,共计72学时。

(五)教学方式采用课堂讲授与辅导答疑相结合的教学方式。

二、本文第一篇数理逻辑第一章命题逻辑教学要点:逻辑学是一门研究人类思维形式和思维规律的科学,思维的形式结构包括了概念、判断和推理之间的结构和联系,其中概念是思维的基本单位,通过概念对事物是否具有某种属性进行肯定或否定的回答就是判断;由一个或几个判断推出另一个判断的思维形式就是推理。

形式语言和自动机 与离散数学的关系

形式语言和自动机与离散数学的关系下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。

文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by theeditor. I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!形式语言和自动机就是一种特殊的数学方式,它们和离散数学有很多关系哦。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7
例2 (续) 续
δ*(q0 ,w) w 1 {q0, q1} 10 {q0, q3} 101 {q0, q1} 1011 {q0, q1 , q2} 10110 {q0, q2 , q3} L(G) = { x00y, x11y | x,y∈{0,1}*} ∈
8
DFA与NFA的等价性 与 的等价性
δ ′( A, a ) =
∪ δ ( p, a )
p∈A
9
模拟实例
NFA M 0 1 δ →q0 {q0, q1} {q0} q1 {q2} ∅ *q2 ∅ ∅ DFA M′ ′ 0 δ′ ′ {q0, q1} →{q0} {q1} {q2} *{q2} ∅ {q0,q1} {q0,q1,q2} *{q0,q2} {q0,q1} *{q1,q2} {q2} *{q0,q1,q2} {q0,q1,q2} ∅ ∅ 1 {q0} ∅ ∅ {q0} {q0} ∅ {q0} ∅
3
DFA接受的语言 续) 接受的语言(续 接受的语言
例1 M= 〈{q0, q1},{a}, δ,q0,{q1}〉 〉 δ(q0, a)=q1, δ(q1, a)=q0
q1 , n为奇数 δ (q0 , a ) = q0 , n为偶数 q0 , n为奇数 n ∗ δ (q1 , a ) = q1 , n为偶数
18
模拟实例
G =〈V,T,S,P 〉 〈 V={A,S} T={0,1} P: S→11S S→11A A→0A A→ε ε-NFA M=〈Q,Σ,δ, S, {qf} 〉 〈 Q ={A, S, qf} Σ ={11, 0} δ →S A *qf 11 0 ε ∅ {qf} ∅
{S,A} ∅ ∅ {A} ∅ ∅
对每一个NFA M 都存在 都存在DFA M ′使得 定理 对每一个 L(M)=L(M ′)
用M′=〈Q′,Σ,δ′,q0′,F′ 〉 模拟 M=〈Q,Σ,δ,q0,F 〉 ′ 〈 ′ ′ ′ 〈 Q′=P(Q), q0′={q0} ′ F′={ A∈Q | A∩F≠∅} ′ ∈ ∅ ∀A∈Q 和 a∈Σ, ∈ ∈
20
模拟实例
DFA M δ →q0 q1 *q2 0 q1 q2 q0 1 q0 q1 q2 G =〈V,T,S,P〉 〈 〉 V={q0,q1,q2}, T={0,1}, S= q0 P: q0→0q1 q0→1q0 q1→0q2 q1→1q1 q2→0q0 q2→1q2 q2→ε L(M)=L(G), 它们是所有含 它们是所有含3k+2 (k≥0)个0的0,1串组成的集合 ≥ 个 的 串组成的集合

15
11.3 有穷自动机和正则文法 的等价性
用ε-NFA模拟右线性文法 模拟右线性文法 用右线性文法模拟DFA 用右线性文法模拟
16
有穷自动机和正则文法的等价性
是右线性文法, 定理 设G是右线性文法 则存在 是右线性文法 则存在ε-NFA M 使得 L(M)=L(G); 设M是DFA, 则存在右线性文法 使 则存在右线性文法G使 是 得L(G)= L(M). 下述命题是等价的: 定理 下述命题是等价的 (1) L是正则语言 是正则语言; 是正则语言 (2) 语言 能由右线性文法生成 语言L能由右线性文法生成 能由右线性文法生成; (3) 语言 能由左线性文法生成 语言L能由左线性文法生成 能由左线性文法生成; (4) 语言 能被 语言L能被 能被DFA接受 接受; 接受 (5) 语言 能被 语言L能被 能被NFA接受 接受; 接受 (6) 语言L能被 语言 能被ε-NFA接受 接受. 能被 接受
17
用ε-NFA模拟右线性文法 模拟右线性文法
设右线性文法G=〈 设右线性文法 〈V,T,S,P 〉 ε-NFA M=〈Q,Σ,δ, q0 , F 〉构造如下 构造如下: 〈 Q=V∪{qf }, q0={S}, F={qf }, ∪ Σ={ α∈T *-{ε} | 存在 存在A→αB∈P或A→α∈P } ∈ ∈ 或 ∈ ∀A∈V和α∈Σ∪{ε}, ∈ 和 ∈ ∪ 中含有B; 若A→αB∈P, 则δ(A, α)中含有 ∈ 中含有 中含有q 若A→α∈P, 则δ(A, α)中含有 f; ∈ 中含有 ∀α∈Σ∪{ε}, δ(qf ,α)= ∅ ∈ ∪
10
模拟实例 (续) 续
不可达状态:从初始状态出发永远不可能达到的状态 不可达状态 从初始状态出发永远不可能达到的状态 删去所有的不可达状态, 不会改变FA接受的语言 接受的语言. 删去所有的不可达状态 不会改变 接受的语言 如M′中的 1},{q2},{q0,q2},{q1,q2}和∅都是不可达状态 ′中的{q 和 都是不可达状态, 删去这些状态得到M′′ 删去这些状态得到 ′′ 0 1 δ′′ ′′ {q0, q1} {q0} →{q0} {q0,q1} {q0,q1,q2} {q0} *{q0,q1,q2} {q0,q1,q2} {q0}
11
带ε转移的非确定型有穷自动机 转移的非确定型有穷自动机
ε转移 不读如何符号 自动转移状态 转移: 不读如何符号, 自动转移状态. 转移 ε-NFA: δ:Q×(Σ∪{ε})→P(Q) × ∪ 对每一个ε-NFA M 都存在 都存在DFA M ′ 使得 定理 对每一个 L(M)=L(M′) ′ DFA, NFA 和 ε-NFA 接受同一个语言类
q∈ A
构造DFA M′时不需要对不可达状态进行计算 做法如下 从q0′= 做法如下: 构造 ′ 不需要对不可达状态进行计算,做法如下 E(q0)开始 对每一个 ∈Σ计算 ′的值 然后对每一个新出现的子 开始, 计算δ′ 开始 对每一个a∈ 计算 的值, 集计算δ′的值, 重复进行, 直至没有新的子集出现为止. 集计算 ′的值 重复进行 直至没有新的子集出现为止
L(G)=L(M)={ (11)m0n | m≥1, n≥0 } ≥ ≥
19
用右线性文法模拟DFA 右线性文法模拟
设DFA M=〈Q,Σ,δ,q0,F 〉 〈 右线性文法G=〈 构造如下: 右线性文法 〈V,T,S,P 〉构造如下 V=Q, T=Σ, S=q0 ∀q∈Q和α∈Σ, ∈ 和 ∈ 则有产生式q→ap 若δ(q,a)=p, 则有产生式 若q∈F, 则有产生式 ∈ 则有产生式q→ε
a1 a2 … ai … an
2
DFA接受的语言 接受的语言
扩张到Q× 把δ扩张到 ×Σ*上 δ*:Q×Σ*→Q, 递归定义如下 扩张到 × ∀q∈Q, a∈Σ和w∈Σ* ∈ ∈ 和 ∈ δ*(q,ε)=q δ*(q,wa)= δ(δ*(q,w),a) 接受w. 定义 ∀w∈Σ*,如果 *(q0,w)∈F, 则称 M接受 ∈ 如果δ ∈ 接受 M接受的字符串的全体称作 接受的语言 记作 接受的字符串的全体称作M接受的语言 接受的字符串的全体称作 接受的语言,记作 L(M), 即 L(M)={ w∈Σ*| δ*(q0,w)∈F } ∈ ∈
21
14
模拟实例——例3(续) 例 续 模拟实例
ε-NFA M
δ →q0 q1 *q2 0 1 ε {q1} ∅ {q2} ∅ {q2} ∅ ∅ ∅ {q0}
DFA M′ ′
δ′ ′ →*{q0,q2} {q1} ∅ 0 1 {q1} ∅ ∅ {q0,q2} ∅ ∅
ε
ε
L(M)=L(M′)={ (01)n | n≥0 } ′ ≥
12
模拟ε-NFA 用DFA模拟 模拟
设ε-NFA M=〈Q,Σ,δ,q0,F 〉, q∈Q 〈 ∈ q的ε闭包 闭包E(q): 从q出发 经过 转移能够到达的所 出发, 的 闭包 出发 经过ε转移能够到达的所 有状态, 有状态 递归定义如下 (1) E(q)包含 包含q; 包含 (2) 如果 ∈E(q), 则δ(p, ε)⊆E(q). 如果p∈ ⊆ 例3 ε-NFA M q E(q) 0 1 ε δ q0 {q0,q2} →q0 {q1} ∅ {q2} q1 {q1} q1 ∅ {q2} ∅ q2 {q0,q2} *q2 ∅ ∅ {q0}
13
用DFA模拟ε-NFA(续) 模拟 续
模拟的方法与用DFA模拟不带 的NFA的方法基本相同 模拟不带ε的 的方法基本相同, 模拟的方法与用 模拟不带 的方法基本相同 只是要用E(q)代替 代替q. 只是要用 代替 用DFA M′=〈Q′,Σ,δ′,q0′,F′ 〉模拟 ′ 〈 ′ ′ ′ 模拟ε-NFA M=〈Q,Σ,δ,q0,F 〉 〈 Q′=P(Q), q0′=E(q0) ′ F ′={A∈Q | A∩F≠∅} ∈ ∅ ∀A∈Q和a∈Σ, ∈ 和 ∈ δ ′( A, a ) = ∪ { r ∈ E ( t ) | ∃p, t使p ∈ E ( q ), t ∈ δ ( p, a )}
∗ n
L(M)={a2k+1 | k∈N} ∈
4
非确定型有穷自动机
定义 非确定型有穷自动机 (NFA) M =〈 Q,Σ,δ,q0,F 〉, 〈 其中 Q,Σ, q0, F 的定义与 DFA 的相同 而 的相同, δ: Q ×Σ→P(Q)
5
实例
一台NFA 例2 一台 δ 0 1 →q0 {q0 , q3} {q0 , q1} q1 ∅ {q2} *q2 {q2} {q2} q3 {q4} ∅ *q4 {q4} {q4}
6
NFA接受的语言 接受的语言
δ*:Q×Σ*→Q 递归定义如下 ∀q∈Q, a∈Σ 和 w∈Σ* 递归定义如下: ∈ × ∈ ∈ δ*(q,ε)={q} δ*(q,wa)= ∪ δ ( p, a )
p∈ p∈δ ∗ ( q , w )
接受w. 定义 ∀w∈Σ*,如果 *(q0 ,w)∩F≠∅, 则称 接受 ∈ 如果δ ∅ 则称M接受 M接受的字符串的全体称作 接受的语言 记作 接受的字符串的全体称作M接受的语言 接受的字符串的全体称作 接受的语言,记作 L(M), 即 L(M)={ w∈Σ*| δ*(q0 ,w)∩F≠∅ } ∈ ∅
相关文档
最新文档