形式语言学ch5

合集下载

形式语言学_Ch8_上下文无关语言的性质

形式语言学_Ch8_上下文无关语言的性质

8.1 上下文无关语言的泵引理
证明要点:
(1)用CNF作为CFL的描述工具。
(2)对于任意的z∈L,|≤2k-1成立。
( 3 )仅当 z 的语法树呈图 8-1 所示的满二 元树时,才有 |z|=2k-1,其他时候均有|z|<2k-1。
(4) 取N=2|V|=2|V|+1-1,z∈L,|z|≥N。
CFL也有类似性质?
8.1 上下文无关语言的泵引理
CFL的自嵌套特性:如果L是一个CFL,CFG G=(V, T, P,S) 是产生 L的文法。当 L是一个无穷语言时,必存在 w∈L, A∈V,α,β∈(V∪T) *,且 α 和 β中至少有一个不
为ε,使得如下派生成立
S* γAδ+γαAβδ+ z
uviwxiy=aN+(i-1)hbN+(i-1)fcNdNL
i≠1成立。 由泵引理,L不是CFL。

8.1 上下文无关语言的泵引理
L={anbmck|n≠m, m≠k,k≠n} 是CFL么?
取z=aNbN+ncN+m其中,n≠m, n≠0,m≠0。
只能让v或者x由若干个a组成,才有可能随着i的变化,
L1 L2 L1 L2 L1 L2
8.2 CFL的封闭性
定理8-3 CFL与RL的交是CFL。
证明: (1)构造
设PDA M1=(Q1,∑,Γ,δ1,q01,Z0,F1)
DFA M2=(Q2,∑,δ2,q02,F2)
L1=L(M1)
L2=L(M2)
8.2 CFL的封闭性
取PDA M=(Q1×Q2,∑,Γ,δ,[q01,q02],Z0,F1×F2)
8.1 上下文无关语言的泵引理

第2章形式语言概论

第2章形式语言概论
G=(VN,VT,P,S) 其中: VN={I, L, D} VT={a,b,c, … x,y,z,0,1,2,…
,P9=}{ I→L| I L| I D L→a | b | c | … | x | y | z D→0 | 1 | 2 | 3 | … | 9
S=I }
文法的形式定义
若将定义标识符的文法设计成: G=(VN,VT,P,S )
1. 字母表 元素的非空有穷集合。 例如,∑={ a, b, c } 根据字母表的定义,Σ是字母表,
它由a、b、c三个元素组成。
字母表和符号串
注意: (1) 字母表中至少包含一个元素。 (2) 字母表中的元素, 可以是字母、 数字或其他符号。 例如,∑' ={0, 1} 是一个字母表,由0、1两个元素 组成。
第2章 形式语言概论
形式语言理论是编译的重要理论 基础。本章主要介绍编译理论中用到 的有关形式语言理论的最基本概念, 重点介绍如何采用形式化的方法描述 程序设计语言。
第2章 形式语言概论
字母表和符号串 文法和语言的形式定义 文法和语言的分类 短语、直接短语和句柄 语法树和文法的二义性
概述
当n=1 L={aa, bb} L={a2n, b2n | n≥1}
当n=2 L={aaaa, bbbb} 当n=3 L={aaaaaa, bbbbbb}
…… L={aa, bb, aaaa, bbbb, aaaaaa, bbbbbb, … …} 即语言L是由偶数个a,偶数个b这样的 符号串组成的集合。
幂运算定义为:
A0={} A1=A A2=AA
… An= AA … A=AAn-1(n>0)
n
符号串的运算
例如,设A={ a, b },则 A0={} A1=A={ a, b } A2=AA={ aa, ab, ba, bb } A3=AAA=A2A

形式语言学_Ch1_基础知识

形式语言学_Ch1_基础知识

A∪B={a|a∈A或者a∈B}
n
A1∪A2∪…∪An={a|i,1≤i≤n,使得a∈Ai} i1 Ai
A1∪A2∪…∪An ∪…={a|i,i∈N,使得a∈Ai} Ai i 1
当一个集合中的元素都是集合时,我们将这样的集合称为 集族. 设S是一个集族,则S中的所有元素的并为
A {a | A S, a A}
本专业人员4种基本的专业能力 计算思维能力 算法的设计与分析能力 程序设计和实现能力 计算机软硬件系统的认知、分析、设计与应用能力
计算思维能力 逻辑思维能力和抽象思维能力 构造模型对问题进行形式化描述 理解和处理形式模型
课程目的和基本要求
知识 掌握正则语言、上下文无关语言的文法、识别模型及 其基本性质、图灵机的基本知识。
形式语言与自动机理论的产生与作用
语言学家乔姆斯基,最初从产生语言的角度研究语言。 1956年,他将语言L定义为
一个字母表∩中的字母组成的一些串的集合: L∩*。 字母表上按照一定的规则定义一个文法(grammar), 该文法所能产生的所有句子组成的集合就是该文法产 生的语言。
形式语言与自动机理论的产生与作用
A-B={a|a∈A且aB} ‚-‛为减(差)运算符,A-B读作A减B
⑴ A-A=Φ ⑵ A-Φ=A
⑶ A-B ≠ B-A
⑷ A-B=A iff A∩B=Φ
⑸ A∩(B-C)=(A∩B)-(A∩C) ⑹ |A-B|≤|A|
对称差(symmetric difference)
属于A但不属于B,属于B但不属于A的所有元素组成的集合 叫A与B的对称差,记作A⊕B
1951年到1956年间,克林(Kleene) 在研究神经细胞中, 从识别的角度,建立了识别语言的系统——有穷状态自 动机。 1959年,乔姆斯基发现文法和自动机分别从生成和识别 的角度去表达语言,而且证明了文法与自动机的等价性, 这一成果被认为是将形式语言臵于了数学的光芒之下, 使得形式语言真正诞生了。

形式语言学和功能语言学 英语

形式语言学和功能语言学 英语

形式语言学和功能语言学英语English:Formal language study and functional language study are two different approaches to understanding and analyzing language. Formal language study focuses on the structure, form, and rules of a language, including grammar, syntax, and phonetics. It aims to understand the internal logic of a language and how it is constructed. On the other hand, functional language study focuses on the use of language in context, including its social, cultural, and communicative functions. It aims to understand how language is used to convey meaning, achieve communicative goals, and express social identity. Both approaches are important for a comprehensive understanding of language, as they provide different perspectives and insights into the nature and use of language.中文翻译:形式语言学和功能语言学是理解和分析语言的两种不同方法。

语言学Chapter 5

语言学Chapter 5

Collocative meaning搭配意义
It refers to the associations a word acquires on account of its mutual expectancy with some other words which tend to occur in its environment. Example: pretty and handsome pretty {girl, boy, woman, flower, etc.} handsome {boy, man, car, vessel, etc.} cows may wander, but may not stroll. one trembles with fear, but quiver with excitement.
Social/stylistic meaning社会/文体意 义
It refers to what language conveys about the social circumstances of its use. It relates to people’s recognition of different dimensions and levels of style with the same language steed (poetic) residence (formal) horse (general) abode (poetic) nag (slang) home (general) gee-gee (baby language) domicile (very formal, official)
thereferentialtheory?古希腊哲学家柏拉图认为语言形式是语言中的一个词语义是它所代表所指示所表示的世界上的实体指称referent

第5讲 形式语言理论(2012)

第5讲 形式语言理论(2012)

无法区分诸如“old
man and woman”的语
言歧义 无法产生如 abab, aabaab这样的句子
用什么语法描述自然语言
2型文法---上下文无关文法
能够担负描写自然语言的重任
• •

1.能处理具有嵌进结构的句子 2.能生成abab, aabbaabb这样的句子 3.可以判断有歧义句子的结构
但生成一切自然语言的句子是有困难的,
如:大姐、二姐、三姐分别是二十、十八 和六十岁。 P40
用什么语法描述自然语言—总结
正则语法描述能力太弱、上下文有关语法计 算复杂度太高,上下文无关语法使用最为普 遍 从描述能力上说,上下文无关语法不足以描 述自然语言——自然语言中上下文相关的情 况非常常见 从计算复杂度来说,上下文无关语法的复杂 度是多项式的,其复杂度可以忍受 为弥补上下文无关语法描述能力的不足,需 要加上一些其他手段扩充其描述能力

其中 VN={S,A,B,C}, VT={a,b,c} P由下列规则组成:

例:G2=<VN,VT,P,S>

(1)S→ABC (4)B→Bb
(2)A→aA (5)B→b
(3) A→a

特点:与1型文法相比,多出的限制是u和v必须是 “空”的(因为规则的左边必须是非终结符),即非终 结语符的改写不受它出现的语境制约。
0型文法--例
例:G=<VN,VT,P,S>
其中 VN={S,D}, VT={0,1,2,3,…,9} P={S→D|SD D→0|1|2|3|4|5|6|7|8|9}
该文法将产生所有非负整数
解析:
S->D;
S->SD->DD; S->SD->SDD->DDD…

形式语言学_Ch9_图灵机导引

形式语言学_Ch9_图灵机导引

9.1.1 基本TM
例 9-1 设M1=({q0, q1, q2},{0, 1},{0, 1, B},δ,q0 , B ,{q2}),
其中δ的定义如下,对于此定义,也可以用表表示。
δ(q0, 0)= (q0, 0, R) δ(q0, 1)= (q1, 1, R) δ(q1, 0)= (q1, 0, R) δ(q1, B)= (q2, B, R) 0 1 B (q2, B, R)
function)。 δ(q , X)=(p , Y, R)表示M在状态q读入符号X,将状态改
为p,并在这个X所在的带方格中印刷符号Y,然后将读 头向右移一格; δ(q , X)=(p , Y , L)表示M在状态q读入符号X,将状态改 为p,并在这个X所在的带方格中印刷符号Y,然后将读 头向左移一格。
状态q0启动,读头正注视着输入带最左端的符号;
9.1.1 基本TM
FQ,是M的终止状态集,q∈F,q为M的一个终止状
态。与FA和PDA不同,一般地,一旦M进入终止状态, 它就停止运行。 Γ 为带符号表 (tape symbol),X∈Γ,X为M的一个带符
号,表示在 M的运行过程中, X 可以在某一时刻出现在 输入带上;
列如下: q01001100101100├ 1q1001100101100
├ 10 q101100101100├ 100q11100101100 ├ 1001 q2100101100├10011q300101100
M2遇到第三个1时,进入终止状态q3,输入串的后缀
00101100还没有被处理。但是,由于M2已经进入终止状 态,表示符号串1001100101100被M2接受
形式语言学
Introduction to Form

形式语言简介.ppt

形式语言简介.ppt
这是形式语言所研究的问题。
接收一个语言,目的就是使用某种自 动机模型来接收句子,该模型所接收 的所有句子,也形成一个语言。
这是自动机所研究的问题。
本章介绍形式语言的基本内容。
语言的形式定义
设是一个字母表, L*, L称为字母表上的一个语言, wL, w称为语言L的一个句子。
2.1 例子语言
A→+|-|*|/
+、-、*、/ 称为A的侯选式。
E→ i E→EAE E→(E) 也可以记为: E→ i|EAE|(E)
注意:
这组产生式 没有表示出运算符的优先级。
表示出运算符的优先级的产生式: E→E+T|E-T|T T→T*F|T/F|F F→(E)|i
其中: E代表表达式,T代表项,F代表因子 (E)代表的是带小括号的表达式。 表示:先算因子,再*、/,最后+、-。
规则(的个数)是有限的,但可以产生无 限个句子和长度无限的句子;
因为规则是递归的。
BNF的描述方式
巴科斯和诺尔采用的巴科斯-诺尔范式(BNF-Backus-Naur Form)描述规则:
<括号匹配串>::= ( )
<括号匹配串>::=(<括号匹配串>) <括号匹配串>::= <括号匹配串> <括号匹配串>
S称为非终结符,在推导过程中,可以被 代替的符号。
(和)称为终结符,在推导过程中,不可以 被代替的符号。
→ 是产生式系统的元符号,不属于非终 结符,也不属于非终结符。
例2-1:由偶数个0组成的串的语言。 规则的自然语言描述方式:
①00是该语言的基本的句子; ②若S是句子,则00S是句子。
形式化的描述方式: S→00 S→00S
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第5章 正则语言的性质
RL性质 泵引理及其应用 并、乘积、闭包、补、交 正则代换、同态、逆同态的封闭性
从RL固有特征寻求表示的一致性 Myhill-Nerode定理 FA的极小化
RL的几个判定问题 空否、有穷否、两个DFA等价否、成员关系
5.1 RL的泵引理
泵引理(pumping lemma) 设L为一个 RL ,则存在仅依赖于L的正整数N,对于 ∀z∈L,如果|z|≥N,则存在u、v、w,满足 ⑴ z=uvw; ⑵ |uv|≤N; ⑶ |v|≥1; ⑷ 对于任意的整数i≥0,uviw∈L; ⑸ N不大于接受L的最小DFA M的状态数。
封闭的可直接由定理5.4得出,关于逆同态,令DFA M满
则 L = L(B),其中B是DFA (Q, Σ,δ , q0,Q − F ) 即:A的接受状态都是B的非接受状态,反之亦然.因此 w属
于L(B)当且仅当δ^(q0,w)属于Q-F,而后者成立当且仅当 w不属于 L(A).
5.2正则集合的封闭性质

L∈{a},Σ ={a,b}
a
q0
q
b
a,b
M
d
a,b
7
5.1 RL的泵引理
⑶ 由于泵引理指出,如果L是 RL ,则对任意的z∈L, 只要|z|≥N,一定会存在u、v、w,使uviw∈L对所有的i成 立。因此,我们在选择z时,就需要注意到论证时的简洁和 方便。
⑷ 当一个特意被选来用作“发现矛盾”的z确定以后,就 必须依照|uv|≤N和|v|≥1的要求,说明v不存在(对“存在u、 v、w”的否定) 。
1
5.1 RL的泵引理
证明思想
5.1 RL的泵引理
证明: DFA在处理一个足够长的句子的过程中,必定会重复地经 过某一个状态。换句话说,在DFA的状态转移图中,必定存 在一条含有回路的从启动状态到某个终止状态的路。由于是 回 路 , 所 以 , DFA 可 以 根 据 实 际 需 要 沿 着 这 个 回 路 循 环 运 行,相当于这个回路中弧上的标记构成的非空子串可以重复 任意多次。
9
5.2正则集合的封闭性质
定理5.1 正则集合在并、连接和Kleene闭包运算下是封 闭的。
(r1 + r2),(r1r2)及(r1)* 仍是正则式,所以正则集
合的并、连接和Kleene闭包表示正则集合
定理5.2 正则集合对补运算的封闭,即若 L ⊆ Σ* 是一正则集合, L = Σ* − L 也是正则集合。 证明:令L=L(M) M为一DFA M = (Q, Σ,δ , q0,F )
果,其中 wi ∈Rai , wi为Rai 中的任意的字。
12
5.2正则集合的封闭性质
用f表示代换,则f为一个映射 f : Σ → 2∆* ∆ 为 一字母表 Σ到∆* 的字集合映射,f把 Σ 中每个符 号与一个正则集合联起来,可以把f扩展成
f : Σ* → 2∆* 1. f (ε ) = ε 2. f ( xa ) = f ( x ) f ( a )再扩充到集合上
而L(M’)恰好是R经代换后得到的集合, 所以该集合是正则集合。 例
令 f (0) = a, f (1) = b*, f (0) ={a}, f (1) ={b}*
前二者为正则表示
f (010)}{ } { }{ } F (L) = {a}* a + b* b* * = a* a + b* b* *
uviw=0N-k-j(0k)i0j1N22N =0N+(i-1)k1N22N
6
5.1 RL的泵引理
uv0w=0N+(0-1)k1N22N = 0N-k1N22N
注意到k≥1, N-k+N=2N-k<2N 0N-k1N22N ∉L 这个结论与泵引理矛盾。所以,L不是 RL。
5.1 RL的泵引理
用来证明一个语言不是 RL 不能用泵引理去证明一个语言是 RL。 ⑴ 由于泵引理给出的是 RL 的必要条件,所以,在用它 证明一个语言不是 RL 时,我们使用反证法。 ⑵ 泵引理说的是对 RL 都成立的条件,而我们是要用它 证明给定语言不是 RL ,这就是说,相应语言的“仅仅依赖 于L的正整数N”实际上是不存在的。所以,我们一定是无 法给出一个具体的数的。因此,人们往往就用符号N来表 示这个“假定存在”、而实际并不存在的数。
f (L) = U f (x) x∈ L
例:h(0)=ab, h(1)=ε定义的函数h是一个同态。任何给定由0和1组成的 串,它用ab替换所有的0并把所有的1用空串替换。如0011成为abab.
5.2 RL的封闭性
例 5-4 设∑={0,1},Δ={a,b},f(0)=a,f(1)=b*,则 f(010)=f(0)f(1)f(0)=ab*a f({11,00})=f(11)∪f(00) =f(1)f(1)∪f(0)f(0)=b*b*+aa=b*+aa f(L(0*(0+1)1*))=L(a*(a+b*)(b*)*) =L(a*(a+b*)b*)=L(a*ab*+a*b*b*) =L(a*b*)
且满足 L1 = L(M 1 )和L2 = L(M 2 )
构造
M = (Q1 × Q2 , Σ,δ ,[q1, q2 ], F1 × F2 ) δ ([p1, p2 ], a) = [δ1( p1, a),δ2 ( p2, a)]
对于所有p1 ∈ Q1, p2 ∈ Q2 ,∀a ∈ Σ
易证 : L(M ) = L(M1) I L(M 2 )
3
5.1 RL的泵引理
故, δ(q0,a1a2…ak(ak+1…aj)i aj+1…am)=qm 也就是说, a1a2…ak(ak+1…aj)i aj+1…am∈L(M) u= a1a2…ak, v=ak+1…aj, w= aj+1…am uviw∈L
5.1 RL的泵引理
例 5-1 证明{0n1n|n≥1}不是 RL。 证明:
5.1 RL的泵引理
例 5-2 证明{0n|n为素数}不是 RL。 证明:假设L={0n|n为素数} 是 RL。 取 z=0N+p ∈L , 不妨设v=0k, k≥1 从而有, uviw=0N+p-k-j(0k)i0j
=0N+p+(i-1)k
5
5.1 RL的泵引理
当i=N+p+1时, N+p+(i-1)k=N+p+(N+p+1-1)k
5.1 RL的泵引理
⑸ 与选z时类似,在寻找i时,我们也仅需要找到一个表明 矛盾的“具体”值就可以了(对“所有i”的否定)。
⑹ 一般地,在证明一个语言不是 RL 的时候,我们并不使 用泵引理的第(5)条。
⑺ 事实上,引理所要求的|uv|≤N并不是必须的。这个限制 为我们简化相应的证明提供了良好支撑——扩充了的泵 引理 。
假设L={0n1n|n≥1} 是 RL
z=0N1N 按照泵引理所述
v=0k
k≥1
此时有,
u=0N-k-j
w=0j1N
4
5.1 RL的泵引理
从而有, uviw=0N-k-j(0k)i0j1N=0N+(i-1)k1N
当i=2时,我们有: uv2w=0N+(2-1)k1N = 0N+k1N
注意到k≥1,所以, N+k>N。 这就是说, 0N+k1N∉L 这与泵引理矛盾。所以,L不是 RL。
以及δ 2 (q jk−1 , ak ) = q jk , k = 1,2,...n且q jn ∈ F2
由定义知有:
[ ] [ ] δ ( q , q ik−1
jk −1
, ak ) =
qik , q jk
对于k
= 1,2,...n
[ ] [ ] [ ] 而 qi0 , q j0 为 q1, q2 即M的初态,qin , q jn ∈ F1 × F2
= N+p+(N+p)k = (N+p)(1+k) 注意到k≥1,所以 N+p+(N+p+1-1)k=(N+p)(1+k) 不是素数。故当i=N+p+1时, uvN+p+1w=0(N+p)(1+k) ∉L 这与泵引理矛盾。所以,L不是 RL。
5.1 RL的泵引理
例 5-3 证明{0n1m2n+m|m,n≥1}不是 RL。 证明:假设L={0n1m2n+m|m,n≥1} 是 RL。 取z=0N1N22N 设 v=0k k≥1 从而有,
13
5.2正则集合的封闭性质
定理5.4 正则集合类对代换运算是封闭的
证明:设 R ⊆Σ* 为一正则集合,对每个 a∈Σ
令 Ra ⊆ ∆* 是一正则集合。 f定义 f (a) = Ra ,令正则式r表示正则集合R, 正则式ra表示正则集合Ra 把r中的每个a都替换成ra后,仍为正则式,显然, 替换后得到的正则式表示的恰好是R经过代换后得 到的集合,因此是正则集合。 或者,若R为正则集合,则有DFA M使 L(M ) = R ,
= a*ab* + a*b* = a*b*
5.2正则集合的封闭性质
同态是一种特殊的替换:即 f (a) ={x} x∈∆* ,记同 态为 h: h(a) = x,h 可以有逆同态 h−1(L) = {x h(x) ∈ L}
定理5.5 正则集合类对于同态运算和逆同态运算都是封 闭的。
证:同态是一种特殊的代换,故正则集合对同态运算是
5.2正则集合的封闭性质
Ra为正则集合,则有DFA Ma使 L(M a ) = Ra 中每条标记为a的弧做替换
,对于M
对每个Ma引入一个新的状态fa做终态,原来终态改成非
相关文档
最新文档