形式语言与自动机-完整版本
合集下载
完整版形式语言与自动机课后习题答案部分.ppt

• pp.84:习题 7(1)
用自然语言描述下列文法定义的语言
G: AaaA|aaB
BBcc|D#cc
DbbbD|#
• 解题思路
– 观察每个产生式及其组合产生的子语言的特点; – 根据开始符的产生式将它们并起来就是整个文法产生的语言;
• 解答
(1) D产生式:DbbbD|# – 使用DbbbD可产生句型:(bbb)mD (m1); – 进一步使用D#可得:L(D)={(bbb)m#| m0}
• A|0A|1A;
– 产生语言{0x|x{0, 1}*}的文法
• S0A;
– G: S0A
A|0A|1A
精心整理
11
G FH
课后作业二 (cont.)
• 习题8(3)的解答
– 分析:语言的特点
• {11x11|x*}{111, 11};
– 产生语言{x|x{0, 1}*}的文法
• A|0A|1A;
– 习题 22 --- 前/后缀
– 习题 23 --- 前/后缀
– 习题 28(1)(2)(10) --- L的描述
精心整理
3
G FH
课后作业一 (cont.)
• pp.40:习题 21
– 判断集合是否字母表的依据
• 非空性
• 有穷性
• 可区分性:字母表中的字符两两互不相同
• 整体性或不可分性
– 解答:(1)、(2) 和(6) 是字母表,其它不是
– 产生子语言{11x11|x*}的文法
• S11A11 ;
– 产生子语言{111, 11}的文法
• S111|11;
– G: S11A11|111|11
A|0A|1A
其它答案 (1) G: S11A|111|11
形式语言与自动机讲义(Part3)

* 证明思路: $ 对派生的步数n施归纳,证明对于任意A∈V,如果 A⇒nα ,则在G中存在对应的从A到α的最左派生: A⇒n左α 。
定理6-3 如果α是CFG G的一个句型, α的派生树与最左派 生和最右派生是一一对应的,但是,这棵派生树可以对 应多个不同的派生。
15
文法的二义性
* 定义6-6 文法的二义性(ambiguity) $ 设有CFG G=(V,T,P,S),如果存在w∈L(G),w至 少有两棵不同的派生树,则称G是二义性的。否则, G为非二义性的。
Gexp1: $ E→E+T|E-T|T $ T→T*F|T/F|F $ F→F↑P|P $ P→(E)|N(L)|id $ N→sin|cos|exp|abs|log|int $ L→L,E|E
8
上下文无关文法的派生
上下文无关文法的派生
* 定义6-1 派生树(derivation tree) :设有CFG G=(V,T,P,S),G的一棵派生树是满足如下条件 的一棵(有序)树: (1)树的每个顶点有一个标记X,且 X∈V∪T∪{ε} (2)树根的标记为S; (3)如果非叶子顶点v标记为A,A的儿子从 左到右依次为v1,v2,…,vn,并且它们 分别标记为X1,X2,…,Xn,则 A→X1X2…Xn∈P; (4)如果X是一个非叶子顶点的标记,则 X∈V; (5)如果顶点v标记为ε ,则v是该树的叶 子,并且v是其父顶点的惟一儿子。
⇒x+x/F ⇒x+x/F↑P ⇒x+x/P↑P ⇒x+x/y↑P ⇒x+x/y↑2
(b)最右推导:
E
⇒E+T
⇒E+T/F ⇒E+T/F↑P ⇒E+T/F↑2 ⇒E+T/P↑2 ⇒E+T/y↑2 ⇒ E+F/y↑2 ⇒ E+P/y↑2 ⇒ E+x/y↑2 ⇒ T+x/y↑2 ⇒ F+x/y↑2 ⇒ P+x/y↑2 ⇒x+x/y↑2
定理6-3 如果α是CFG G的一个句型, α的派生树与最左派 生和最右派生是一一对应的,但是,这棵派生树可以对 应多个不同的派生。
15
文法的二义性
* 定义6-6 文法的二义性(ambiguity) $ 设有CFG G=(V,T,P,S),如果存在w∈L(G),w至 少有两棵不同的派生树,则称G是二义性的。否则, G为非二义性的。
Gexp1: $ E→E+T|E-T|T $ T→T*F|T/F|F $ F→F↑P|P $ P→(E)|N(L)|id $ N→sin|cos|exp|abs|log|int $ L→L,E|E
8
上下文无关文法的派生
上下文无关文法的派生
* 定义6-1 派生树(derivation tree) :设有CFG G=(V,T,P,S),G的一棵派生树是满足如下条件 的一棵(有序)树: (1)树的每个顶点有一个标记X,且 X∈V∪T∪{ε} (2)树根的标记为S; (3)如果非叶子顶点v标记为A,A的儿子从 左到右依次为v1,v2,…,vn,并且它们 分别标记为X1,X2,…,Xn,则 A→X1X2…Xn∈P; (4)如果X是一个非叶子顶点的标记,则 X∈V; (5)如果顶点v标记为ε ,则v是该树的叶 子,并且v是其父顶点的惟一儿子。
⇒x+x/F ⇒x+x/F↑P ⇒x+x/P↑P ⇒x+x/y↑P ⇒x+x/y↑2
(b)最右推导:
E
⇒E+T
⇒E+T/F ⇒E+T/F↑P ⇒E+T/F↑2 ⇒E+T/P↑2 ⇒E+T/y↑2 ⇒ E+F/y↑2 ⇒ E+P/y↑2 ⇒ E+x/y↑2 ⇒ T+x/y↑2 ⇒ F+x/y↑2 ⇒ P+x/y↑2 ⇒x+x/y↑2
形式语言与自动机讲义(Part2)

DFA的构造
几点注意 ⑴ 定义FA时,常只给出FA相应的状态转移图即可。 ⑵ DFA要求列出每个状态对每个字母的状态转移函 数,每个顶点的出度恰好等于字母表中字符的个数。 ⑶一个FA可以有多于1个的终止状态。 ⑷字符串x被FA M接受的充要条件是,在M的状态转移 图中存在一条从开始状态到某一个终止状态的有向 路,该有向路上从第一条边到最后一条边的标记依次 并置构成的字符串x。
如果w不能由给定文法产生,证明不存在从S到w的推导或w 在G中不能归约到S
困难
有nm种推导(归约)方法( n候选式个数, m推导步数):当w能 由给定文法产生时,找到一个推导(归约)并不容易
要证明w不能由给定文法产生时,需要证明所有推导都无法 得到w,或所有归约都不能使w归约为S
结论:基于文法进行推导和归约在效率上存在较大问题
├ 1010001q0 到达q3
M接受
x=1010001
对于x∈∑*, q0x1├+ x1q0 q0x10├+ x10 q1 q0x100├+ x100q2 q0x101├+ x101q0 q0x000├+ x000 q3
20
DFA的构造
问题:给定语言,设计能接受语言的DFA 构造DFA的方法:
经验方法 划分等价类法 用状态表示记忆的DFA
21
DFA的构造
经验啊,来吧…
例 3-2 构造一个DFA,它接受的语言为 {x000y|x,y∈{0,1}*}
要求:
每个句子都含有连续的3个0
思路
当读入0时,用状态记住这是第几个0,有q0, q1 , q2 , q3,只要到了q3大功即告成,后面无论读入任何字 符都无所谓。
未到q3时,一旦读入1,前功尽弃,回到q0
《形式语言与自动机》完整加精版

形式语言与自动机
Formal Languages and Automata
2019/9/11
1
第1章 绪论
• 1.1 集合的基础知识 • 1.1.1 集合及其表示
– 集合:一定范围内的、确定的、并且彼此可以区 分的对象汇集在一起形成的整体叫做集合(set), 简称为集(set)。
– 元素:集合的成员为该集合的元素(element)。 – 集合描述形式。 – 基数。 – 集合的分类。
2019/9/11
14
补集(complementary set)
A是论域U上的一个集合,A补集是由U中的、 不在A中的所有元素组成的集合,记作
AU A
U
U
2019/9/11
15
补集(complementary set)
如果AB,则 B A 。
A A U。
A A 。
⑵ (A× B)× C≠A× (B× C)。 ⑶ A× A≠A。 ⑷ A× Φ =Φ 。
2019/9/11
11
笛卡儿积(Cartesian product)
⑸ A× (B∪C)=(A× B)∪(A× C)。 ⑹ (B∪C)× A=(B× A)∪(A× C)。 ⑺ A× (B∩C)=(A× B)∩(A× C)。 ⑻ (B∩C)× A=(B× A)∩(C× A)。 ⑼ A× (B-C)=(A× B)-(A× C)。 ⑽ (B-C)× A=(B× A)-(C× A)。 ⑾ 当A、B为有穷集时,|A× B|=|A|*|B|。
B A AB U & AB 。 AB AB 。
AB AB 。
2019/9/11
16
1.2 关系
• 二元关系 • 递归定义与归纳证明 • 关系的闭包
Formal Languages and Automata
2019/9/11
1
第1章 绪论
• 1.1 集合的基础知识 • 1.1.1 集合及其表示
– 集合:一定范围内的、确定的、并且彼此可以区 分的对象汇集在一起形成的整体叫做集合(set), 简称为集(set)。
– 元素:集合的成员为该集合的元素(element)。 – 集合描述形式。 – 基数。 – 集合的分类。
2019/9/11
14
补集(complementary set)
A是论域U上的一个集合,A补集是由U中的、 不在A中的所有元素组成的集合,记作
AU A
U
U
2019/9/11
15
补集(complementary set)
如果AB,则 B A 。
A A U。
A A 。
⑵ (A× B)× C≠A× (B× C)。 ⑶ A× A≠A。 ⑷ A× Φ =Φ 。
2019/9/11
11
笛卡儿积(Cartesian product)
⑸ A× (B∪C)=(A× B)∪(A× C)。 ⑹ (B∪C)× A=(B× A)∪(A× C)。 ⑺ A× (B∩C)=(A× B)∩(A× C)。 ⑻ (B∩C)× A=(B× A)∩(C× A)。 ⑼ A× (B-C)=(A× B)-(A× C)。 ⑽ (B-C)× A=(B× A)-(C× A)。 ⑾ 当A、B为有穷集时,|A× B|=|A|*|B|。
B A AB U & AB 。 AB AB 。
AB AB 。
2019/9/11
16
1.2 关系
• 二元关系 • 递归定义与归纳证明 • 关系的闭包
形式语言与自动机讲义(Part1)

语言是字母表上所有句子集合的子集 语言是字母表上一些句子的集合 语言就是从通过组合规则从∑*中选择一些合 乎要求的句子形成的集合。
13
⑶ L3={0, 1, 00, 01, 10, 11, 000, …}=∑+ ⑷ L4={ε, 0, 1, 00, 01, 10, 11, 000, …}=∑* ⑸ L5={0n|n≥1} ⑹ L6={0n1n|n ≥ 1} ⑺ L7={1n|n ≥ 1} ⑻ L8={x|x∈∑+且x中0和1的个数相同}
∈(V∪T)*。
产生式又叫做定义式或者语法规则。 第一个产生的左边一定是开始符号
31
α→β1|β2|…|βn 读作:α定义为β1,或者β2 ,…,或者βn 称β1,β2,…,βn为候选式(candidate)
例:S → i|SAS|(S), A → +|-|*|/
5
文法的形式定义
G=(V,T,P,S)
文法的形式定义 约定
⑴ 对一组有相同左部的产生式
P——产生式(production)的非空有穷集合 产生式,形如α→β 读作:α定义为β
α→β1,α→β2, … ,α→βn
可以简单地记为:
α 称为左部,其中α∈(V∪T)+,且α中至少有V中
元素的一个出现。
β 称为右部,β
例
∑={0, 1} ∑0= {ε}
例
∑={0, 1} ∑+= {0, 1, 00, 01, 10, 11, 000, 001, 010, 011, 100, …} ∑* = {ε, 0, 1, 00, 01, 11, 000, 001, 010, 011, 100, …}
∑1= ∑0∑ = {ε} {0, 1} = {0, 1} ∑2 = ∑1∑ = {00, 01, 10, 11} ∑3 = ∑2∑= {000, 001, 010, 011, 100, 101, 110, 111}
13
⑶ L3={0, 1, 00, 01, 10, 11, 000, …}=∑+ ⑷ L4={ε, 0, 1, 00, 01, 10, 11, 000, …}=∑* ⑸ L5={0n|n≥1} ⑹ L6={0n1n|n ≥ 1} ⑺ L7={1n|n ≥ 1} ⑻ L8={x|x∈∑+且x中0和1的个数相同}
∈(V∪T)*。
产生式又叫做定义式或者语法规则。 第一个产生的左边一定是开始符号
31
α→β1|β2|…|βn 读作:α定义为β1,或者β2 ,…,或者βn 称β1,β2,…,βn为候选式(candidate)
例:S → i|SAS|(S), A → +|-|*|/
5
文法的形式定义
G=(V,T,P,S)
文法的形式定义 约定
⑴ 对一组有相同左部的产生式
P——产生式(production)的非空有穷集合 产生式,形如α→β 读作:α定义为β
α→β1,α→β2, … ,α→βn
可以简单地记为:
α 称为左部,其中α∈(V∪T)+,且α中至少有V中
元素的一个出现。
β 称为右部,β
例
∑={0, 1} ∑0= {ε}
例
∑={0, 1} ∑+= {0, 1, 00, 01, 10, 11, 000, 001, 010, 011, 100, …} ∑* = {ε, 0, 1, 00, 01, 11, 000, 001, 010, 011, 100, …}
∑1= ∑0∑ = {ε} {0, 1} = {0, 1} ∑2 = ∑1∑ = {00, 01, 10, 11} ∑3 = ∑2∑= {000, 001, 010, 011, 100, 101, 110, 111}
形式语言及自动机 哈尔滨工业大学(中文版)

start
q.0
1
0,1
0,1
q1
q2
q3
start
0,1 q.0 1
1
0,1
q1 0,1 q2
q3
1
1.2 ε-NFA 形式定义
ε-NFA 为五元组 (Q, Σ, δ, q0, F ),其中:
Q 状态有穷集, Σ 输入字符有穷集, q0 ∈ Q 开始状态, F ⊆ Q 终态集
δ: Q × (Σ ∪ {ε}) → 2Q – 允许空串上的转移
=
{r1, r2, . . . , rm},则每个
pi rj
经过 再求
a
边到达的所有状态为
∪k
i=1
δ(pi,
a);
ε-闭包,所得到的状态集,定义为
δˆ(q, w);即 δˆ(q, w) = ECLOSE({r1, r2, . . . , rm})
例:前面的例子中,求 δˆ(q0, 10) =? δˆ(q0, ε) = ECLOSE(q0) = {q0} δˆ(q0, 1) = ECLOSE(δˆ(q0, 1)) = ECLOSE({q0, q1}) = {q0} ∪ {q1, q2, q3} = {q0, q1, q2, q3} δˆ(q0, 10) = ECLOSE(δˆ(q0, 0) ∪ δˆ(q1, 0) ∪ δˆ(q2, 0) ∪ δˆ(q3, 0)) = ECLOSE({q0, q2, q3}) = {q0, q2, q3}
例:前面例子的语言 L={w|w 倒数 3 个字符至少有一个是 1,w ∈ {0, 1}∗}
可以构造 ε-NFA 为 E = ({q0, q1, q2, q3}, {0, 1}, δ, q0, {q3}) 其中 δ 如转移表:
自然语言理解(03)形式语言与自动机

3.3自动机理论
q 线性带限自动机所接受的语言
3.3自动机理论
q 定理
定理 3.5:如果 L 是一个前后文有关语言,则 L 由一个不 确定的线性带限自动机所接受。反之,如果 L 被一个线性带 限自动机所接受,则 L 是一个前后文有关语言。
各类自动机的区别与联系
主要区别:各类自动机的主要区别是它们能够使用的信 息存储空间的差异:有限状态自动机只能用状态来存储信息; 下推自动机除了可以用状态以外,还可以用下推存储器 (栈);线性带限自动机可以利用状态和输入/输出带本身。 因为输入/输出带没有“先进后出”的限制,因此其功能大于 栈;而图灵机的存储空间没有任何限制。 识别语言的能力:有限自动机等价于正则文法;下推自 动机等价于上下文无关文法;线性带限自动机等价于上下文 有关文法,图灵机等基于 0 型文法。
3.2 形式语言
q 关于语言的定义
按照一定规律构成的句子和符号串的有限或无限的集合。
- Chomsky
语言可以被看成一个抽象的数学系统。(吴蔚天,1994)
语言描述的三种途径
v 穷举法 — — 只适合句子数目有效的语言。 v 语法描述 — — 生成语言中合格的句子。
v 自动机 — — 对输入的句子进行检验,区别哪些是语 言中的句子,哪些不是语言中的句子。
3.4自动机在自然语言处理中的应用
• 3.4.1 单词拼写检查 • 3.4.2单词形态分析 • 3.4.3 词性消歧
3.4自动机在自然语言处理中的应用
q 有限自动机用于英语单词拼写检查
[Oflazer, 1996] 设 X 为拼写错误的字符串,其长度为 m,Y 为 X 对应的正 确的单词(答案),其长度为 n。则 X 和 Y 的编辑距离 ed(X[m], Y[n])为:从字符串 X 转换到 Y 需要的插入、删除、 替换和交换两个相邻的基本单位(字符)的最小个数。如: ed (recoginze, recognize) = 1 ed (sailn, failing) = 3
形式语言与自动机理论(一)

2.4 文法的类型 2.4.2 正规文法和正规语言
定理:L 是 RL 的充分必要条件是存在一 个文法,该文法产生语言L,并且产生式 的形式是: A→aB,A→a or A→Ba,A→a 其中 A,B∈V, a∈T.
第二章 文法
2.4 文法的类型 2.5 空语句 定义:假设G=(V,T,P,S)是一个文法。如 果 S 不出现在 G 的任何产生式的右部, 则P∪{S→ε}所形成的文法仍然是与G 等价的相应类型的文法,所产生的语言 是相应类型的语言。
第二章 文法
2.2 文法的形式定义 2.2.3 语言
定义:设文法 G = (V,T,P,S)。对 α∈(V∪T)*, 如果S(⇒)*α , 则α为文法G的一个句型; 若对w∈T*,如果 S(⇒)* w,则 w 称为由 G 产生的一个句子。 称 L(G)={w| w ∈T*, S(⇒)* w}为文法 G 产 生的语言。
第一章 绪论
1.4 语言
1.4.3 基本概念 (1)符号 (2)字母表 (3)字符串 (4)语言 Σ
①乘积运算 字母表的运算 ②幂运算 ③闭包运算
第二章 文法
2.1 文法的引入
例1 汉语中的句子:王平和李新是大学生。 它由两个短语组成: 〈主语〉 王平和李新 〈谓语〉 是大学生
该句子可以应用下列规则构成:
3.2 有限状态自动机的形式定义 (4)到达某状态的字符串集合 定义:设 FA M=(Q,∑,δ,q0,F), 对 ∀q∈Q 能从开始状态到达所输 入的字符串集合为: set(q)={x|x∈∑*,并且δ(q0,x)= q}
第三章 有限状态自动机
3.2 有限状态自动机的形式定义 (5)有限状态自动机等价 假设 M1,M2 是 FA, 如果 L(M1)=L(M2),则 M1 与 M2 等价。
定理:L 是 RL 的充分必要条件是存在一 个文法,该文法产生语言L,并且产生式 的形式是: A→aB,A→a or A→Ba,A→a 其中 A,B∈V, a∈T.
第二章 文法
2.4 文法的类型 2.5 空语句 定义:假设G=(V,T,P,S)是一个文法。如 果 S 不出现在 G 的任何产生式的右部, 则P∪{S→ε}所形成的文法仍然是与G 等价的相应类型的文法,所产生的语言 是相应类型的语言。
第二章 文法
2.2 文法的形式定义 2.2.3 语言
定义:设文法 G = (V,T,P,S)。对 α∈(V∪T)*, 如果S(⇒)*α , 则α为文法G的一个句型; 若对w∈T*,如果 S(⇒)* w,则 w 称为由 G 产生的一个句子。 称 L(G)={w| w ∈T*, S(⇒)* w}为文法 G 产 生的语言。
第一章 绪论
1.4 语言
1.4.3 基本概念 (1)符号 (2)字母表 (3)字符串 (4)语言 Σ
①乘积运算 字母表的运算 ②幂运算 ③闭包运算
第二章 文法
2.1 文法的引入
例1 汉语中的句子:王平和李新是大学生。 它由两个短语组成: 〈主语〉 王平和李新 〈谓语〉 是大学生
该句子可以应用下列规则构成:
3.2 有限状态自动机的形式定义 (4)到达某状态的字符串集合 定义:设 FA M=(Q,∑,δ,q0,F), 对 ∀q∈Q 能从开始状态到达所输 入的字符串集合为: set(q)={x|x∈∑*,并且δ(q0,x)= q}
第三章 有限状态自动机
3.2 有限状态自动机的形式定义 (5)有限状态自动机等价 假设 M1,M2 是 FA, 如果 L(M1)=L(M2),则 M1 与 M2 等价。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 能力
–培养学生的形式化描述和抽象思维能力。 –使学生了解和初步掌握“问题、形式化描述、
自动化(计算机化)”这一最典型的计算机问 题求解思路。
2020/3/21
4
主要内容
• 语言的文法描述。 • RL
– RG、 FA、RE、RL的性质 。
• CFL
– CFG(CNF、GNF)、PDA、CFL的性质。
2020/3/21
9
1.1.2 集合之间的关系
⑸ 如果AB,则对x∈A,有x∈B。 ⑹ 如 果 AB , 则 对 x∈A , 有 x∈B 并 且
x∈B,但xA。 ⑺ 如果AB且BC,则AC。 ⑻ 如果AB且BC,或者AB且BC,或者
AB且BC,则AC。 ⑼ 如果A=B,则|A|=|B|。
2020/3/21
• 子集
• 如果集合A中的每个元素都是集合B的元素, 则称集合A是集合B的子集(subset),集合B是 集合A的包集(container)。记作AB。也可记 作 BA 。 AB 读 作 集 合 A 包 含 在 集 合 B 中 ; BA读作集合B包含集合A。
• 如果AB,且x∈B,但xA,则称A是B的 真子集(proper subset),记作AB
• TM
– 基本TM、构造技术、TM的修改。
• CSL
– CSG、LBA。
2020/3/21
5
教材及主要参考书目
1.蒋宗礼,姜守旭. 形式语言与自动机理论. 北京: 清华大学出版社,2003年
2. John E Hopcroft, Rajeev Motwani, Jeffrey D Ullman. Introduction to Automata Theory, Languages, and Computation (2nd Edition). Addison-Wesley Publishing Company, 2001
2020/3/21
15
笛卡儿积(Cartesian product)
• A与B的笛卡儿积(Cartesian product)是一个集合, 该集合是由所有这样的有序对(a,b)组成的:其 中a∈A,b∈B ,记作A× B。
A× B={(a,b)|a∈A& b∈B }。
• 1.1 集合的基础知识 • 1.1.1 集合及其表示
– 集合:一定范围内的、确定的、并且彼此可以区 分的对象汇集在一起形成的整体叫做集合(set), 简称为集(set)。
– 元素:集合的成员为该集合的元素(element)。 – 集合描述形式。 – 基数。 – 集合的分类。
2020/3/21
7
1.1.2 集合之间的关系
Ai
i1
A{a|AS,aA}
AS
2020/3/21
11
交(intersection)
• 集合A和B中都有的所有元素放在一起构成 的集合为A与B的交 ,记作A∩B。
A∩B={a|a∈A且a∈B}
• “∩”为交运算符,A∩B读作A交B。
• 如果A∩B=Φ,则称A与B不相交。
• ⑴ A∩B= B∩A。 ⑵ (A∩B)∩C=A∩(B∩C)。 ⑶ A∩A=A。
2020/3/21
14
对称差(symmetric difference)
• 属于A但不属于B,属于B但不属于A的所有元 素组成的集合叫A与B的对称差,记作A⊕B。
A⊕B={a|a∈A且aB或者aA且a∈B}
• “⊕”为对称差运算符。A⊕B读作A对称减B。 • A⊕B=(A∪B)-(A∩B)=(A-B)∪(B-A)。
形式语言与自动机
Formal Languages and Automata
2020/3/21
1
课程目的和基本要求
• 课程性质
–技术基础
• 基础知识要求
–数学分析(或者高等数学),离散数学
• 主要特点
–抽象和形式化 –理论证明和构造性 –基本模型的建立与性质
2020/3/21
2
课程目的和基本要求
• 本专业人员4种基本的专业能力
ቤተ መጻሕፍቲ ባይዱ
2020/3/21
12
交(intersection)
⑷ A∩B=A iff AB。 ⑸ Φ∩A=Φ。 ⑹ |A∩B|≤min{|A|,|B|}。 ⑺ A∩(B∪C)=(A∩B)∪(A∩C)。 ⑻ A∪(B∩C)=(A∪B)∩(A∪C)。 ⑼ A∩(A∪B)=A。 ⑽ A∪(A∩B)=A。
2020/3/21
–计算思维能力 –算法的设计与分析能力 –程序设计和实现能力 –计算机软硬件系统的认知、分析、设计与应用能力
• 计算思维能力
–逻辑思维能力和抽象思维能力 –构造模型对问题进行形式化描述 –理解和处理形式模型
2020/3/21
3
课程目的和基本要求
• 知识
–掌握正则语言、下文无关语言的文法、识别模 型及其基本性质、图灵机的基本知识。
10
1.1.3 集合的运算
• 并(union)
• A与B的并(union)是一个集合,该集合中的元素要么 是A的元素,要么是B的元素,记作A∪B。
A∪B={a|a∈A或者a∈B} A1∪A2∪…∪An={a|i,1≤i≤n,使得a∈Ai} A1∪A2∪…∪An ∪…={a|i,i∈N,使得a∈Ai}
2020/3/21
8
1.1.2 集合之间的关系
•集合相等
–如果集合A,B含有的元素完全相同,则称集 合A与集合B相等(equivalence),记作A=B。
•对任意集合A、B、C: ⑴ A=B iff AB且BA。 ⑵ 如果AB,则|A|≤|B|。 ⑶ 如果AB,则|A|≤|B|。 ⑷ 如果A是有穷集,且AB,则|B|>|A|。
13
差(difference)
• 属于A,但不属于B的所有元素组成的集合叫做A 与B的差,记作A-B。
A-B={a|a∈A且aB}
• “-”为减(差)运算符,A-B读作A减B。
• ⑴ A-A=Φ。
⑵ A-Φ=A。 ⑶ A-B ≠ B-A。 ⑷ A-B=A iff A∩B=Φ。 ⑸ A∩(B-C)=(A∩B)-(A∩C)。 ⑹ |A-B|≤|A|。
3. John E Hopcroft, Jeffrey D Ullman. Introduction to Automata Theory, Languages, and Computation. Addison-Wesley Publishing Company, 1979
2020/3/21
6
第1章 绪论
–培养学生的形式化描述和抽象思维能力。 –使学生了解和初步掌握“问题、形式化描述、
自动化(计算机化)”这一最典型的计算机问 题求解思路。
2020/3/21
4
主要内容
• 语言的文法描述。 • RL
– RG、 FA、RE、RL的性质 。
• CFL
– CFG(CNF、GNF)、PDA、CFL的性质。
2020/3/21
9
1.1.2 集合之间的关系
⑸ 如果AB,则对x∈A,有x∈B。 ⑹ 如 果 AB , 则 对 x∈A , 有 x∈B 并 且
x∈B,但xA。 ⑺ 如果AB且BC,则AC。 ⑻ 如果AB且BC,或者AB且BC,或者
AB且BC,则AC。 ⑼ 如果A=B,则|A|=|B|。
2020/3/21
• 子集
• 如果集合A中的每个元素都是集合B的元素, 则称集合A是集合B的子集(subset),集合B是 集合A的包集(container)。记作AB。也可记 作 BA 。 AB 读 作 集 合 A 包 含 在 集 合 B 中 ; BA读作集合B包含集合A。
• 如果AB,且x∈B,但xA,则称A是B的 真子集(proper subset),记作AB
• TM
– 基本TM、构造技术、TM的修改。
• CSL
– CSG、LBA。
2020/3/21
5
教材及主要参考书目
1.蒋宗礼,姜守旭. 形式语言与自动机理论. 北京: 清华大学出版社,2003年
2. John E Hopcroft, Rajeev Motwani, Jeffrey D Ullman. Introduction to Automata Theory, Languages, and Computation (2nd Edition). Addison-Wesley Publishing Company, 2001
2020/3/21
15
笛卡儿积(Cartesian product)
• A与B的笛卡儿积(Cartesian product)是一个集合, 该集合是由所有这样的有序对(a,b)组成的:其 中a∈A,b∈B ,记作A× B。
A× B={(a,b)|a∈A& b∈B }。
• 1.1 集合的基础知识 • 1.1.1 集合及其表示
– 集合:一定范围内的、确定的、并且彼此可以区 分的对象汇集在一起形成的整体叫做集合(set), 简称为集(set)。
– 元素:集合的成员为该集合的元素(element)。 – 集合描述形式。 – 基数。 – 集合的分类。
2020/3/21
7
1.1.2 集合之间的关系
Ai
i1
A{a|AS,aA}
AS
2020/3/21
11
交(intersection)
• 集合A和B中都有的所有元素放在一起构成 的集合为A与B的交 ,记作A∩B。
A∩B={a|a∈A且a∈B}
• “∩”为交运算符,A∩B读作A交B。
• 如果A∩B=Φ,则称A与B不相交。
• ⑴ A∩B= B∩A。 ⑵ (A∩B)∩C=A∩(B∩C)。 ⑶ A∩A=A。
2020/3/21
14
对称差(symmetric difference)
• 属于A但不属于B,属于B但不属于A的所有元 素组成的集合叫A与B的对称差,记作A⊕B。
A⊕B={a|a∈A且aB或者aA且a∈B}
• “⊕”为对称差运算符。A⊕B读作A对称减B。 • A⊕B=(A∪B)-(A∩B)=(A-B)∪(B-A)。
形式语言与自动机
Formal Languages and Automata
2020/3/21
1
课程目的和基本要求
• 课程性质
–技术基础
• 基础知识要求
–数学分析(或者高等数学),离散数学
• 主要特点
–抽象和形式化 –理论证明和构造性 –基本模型的建立与性质
2020/3/21
2
课程目的和基本要求
• 本专业人员4种基本的专业能力
ቤተ መጻሕፍቲ ባይዱ
2020/3/21
12
交(intersection)
⑷ A∩B=A iff AB。 ⑸ Φ∩A=Φ。 ⑹ |A∩B|≤min{|A|,|B|}。 ⑺ A∩(B∪C)=(A∩B)∪(A∩C)。 ⑻ A∪(B∩C)=(A∪B)∩(A∪C)。 ⑼ A∩(A∪B)=A。 ⑽ A∪(A∩B)=A。
2020/3/21
–计算思维能力 –算法的设计与分析能力 –程序设计和实现能力 –计算机软硬件系统的认知、分析、设计与应用能力
• 计算思维能力
–逻辑思维能力和抽象思维能力 –构造模型对问题进行形式化描述 –理解和处理形式模型
2020/3/21
3
课程目的和基本要求
• 知识
–掌握正则语言、下文无关语言的文法、识别模 型及其基本性质、图灵机的基本知识。
10
1.1.3 集合的运算
• 并(union)
• A与B的并(union)是一个集合,该集合中的元素要么 是A的元素,要么是B的元素,记作A∪B。
A∪B={a|a∈A或者a∈B} A1∪A2∪…∪An={a|i,1≤i≤n,使得a∈Ai} A1∪A2∪…∪An ∪…={a|i,i∈N,使得a∈Ai}
2020/3/21
8
1.1.2 集合之间的关系
•集合相等
–如果集合A,B含有的元素完全相同,则称集 合A与集合B相等(equivalence),记作A=B。
•对任意集合A、B、C: ⑴ A=B iff AB且BA。 ⑵ 如果AB,则|A|≤|B|。 ⑶ 如果AB,则|A|≤|B|。 ⑷ 如果A是有穷集,且AB,则|B|>|A|。
13
差(difference)
• 属于A,但不属于B的所有元素组成的集合叫做A 与B的差,记作A-B。
A-B={a|a∈A且aB}
• “-”为减(差)运算符,A-B读作A减B。
• ⑴ A-A=Φ。
⑵ A-Φ=A。 ⑶ A-B ≠ B-A。 ⑷ A-B=A iff A∩B=Φ。 ⑸ A∩(B-C)=(A∩B)-(A∩C)。 ⑹ |A-B|≤|A|。
3. John E Hopcroft, Jeffrey D Ullman. Introduction to Automata Theory, Languages, and Computation. Addison-Wesley Publishing Company, 1979
2020/3/21
6
第1章 绪论