状态空间表示法
自动控制原理状态空间法

目录
• 引言 • 状态空间法基础 • 线性系统的状态空间表示 • 状态反馈与极点配置 • 最优控制理论 • 离散系Biblioteka 的状态空间表示01引言
状态空间法的定义
状态空间法是一种基于状态变量描述线性时不变系统的方法,通过建立系 统的状态方程和输出方程来描述系统的动态行为。
状态变量是能够完全描述系统内部状态的变量,可以是系统的物理量或抽 象的数学变量。
最优控制问题
在满足一定约束条件下,寻找一个控制输入, 使得被控系统的某个性能指标达到最优。
性能指标
通常为系统状态或输出函数的积分,如时间加 权或能量加权等。
约束条件
包括系统动态方程、初始状态、控制输入和终端状态等。
线性二次调节器问题
线性二次调节器问题是最优控制问题的一个特例, 其性能指标为系统状态向量的二次范数。
THANKS
状态方程描述了系统内部状态变量之间的动态关系,而输出方程则描述了 系统输出与状态变量之间的关系。
状态空间法的重要性
1
状态空间法提供了系统分析和设计的统一框架, 可以用于线性时不变系统的各种分析和设计问题。
2
通过状态空间法,可以方便地实现系统的状态反 馈控制、最优控制、鲁棒控制等控制策略。
3
状态空间法具有直观性和易于实现的特点,能够 直接反映系统的动态行为,便于理解和分析。
02
状态空间法基础
状态与状态变量
状态
系统在某一时刻的状态是由系统 的所有内部变量共同决定的。
状态变量
描述系统状态的变量,通常选择 系统的输入、输出和内部变量作 为状态变量。
状态方程的建立
根据系统的物理或数学模型,通过适 当的方法建立状态方程。
第三章 知识的状态空间表示法doc资料

第三章知识的状态空间表示法1 课前思考:人类的思维过程,可以看作是一个搜索的过程。
某个方案所用的步骤是否最少?也就是说它是最优的吗?如果不是,如何才能找到最优的方案?在计算机上又如何实现这样的搜索?这些问题实际上就是本章我们要介绍的搜索问题。
2 学习目标:掌握回溯搜索算法、深度优先搜索算法、宽度优先搜索算法和A搜索算法,对典型问题,掌握启发式函数的定义方法。
3 学习指南:了解算法的每一个过程和细节问题,掌握一些重要的定理和结论,在有条件的情况下,程序实现每一个算法,求解一些典型的问题。
4 难重点:回溯搜索算法、算法及其性质、改进的A*算法。
5 知识点:本章所要的讨论的问题如下:有哪些常用的搜索算法。
问题有解时能否找到解。
找到的解是最佳的吗?什么情况下可以找到最佳解?求解的效率如何。
3.1 状态空间表示知识一、状态空间表示知识要点1.状态状态(State)用于描述叙述性知识的一组变量或数组,也可以说成是描述问题求解过程中任意时刻的数据结构。
通常表示成:Q={q1,q2,……,qn}当给每一个分量以确定的值时,就得到一个具体的状态,每一个状态都是一个结点(节点)。
实际上任何一种类型的数据结构都可以用来描述状态,只要它有利于问题求解,就可以选用。
2.操作(规则或算符)操作(Operator)是把问题从一种状态变成为另一种状态的手段。
当对一个问题状态使用某个可用操作时,它将引起该状态中某一些分量发生变化,从而使问题由一个具体状态变成另一个具体状态。
操作可以是一个机械步骤、一个运算、一条规则或一个过程。
操作可理解为状态集合上的一个函数,它描述了状态之间的关系。
通常可表示为:F={ f1 , f2,……… fm}3.状态空间状态空间(State Space)是由问题的全部及一切可用算符(操作)所构成的集合称为问题的状态空间。
用三元组表示为:({Qs},{F},{Qg})Qs:初始状态,Qg:目标状态,F:操作(或规则)。
离散系统的状态空间表达式

(1)连续系统:用微分方程来表示,采用拉 普拉斯变换传递函数进行分析。
离散系统:用差分方程来描述,用Z变 换脉冲传递函数进行分析。
因此,离散系统的状态空间表达式可通过差 分方程或脉冲传递函数。
(2)离散系统的信号采用数字形式,输入和 输出都是脉冲序列或数字序列。计算机控制 系统属离散系统。
试写出其状态方程和输出方程 。
解:
x1 (k 1) 0
1
0 x1(k) 0
x2
(k
1)
0
0
1
x
2
(k
)
0
u(k)
x3 (k 1) 6 5 2x3 (k) 1
x1(k)
y(k) x(k) 1
0
0x2 (k)
x3 (k )
例1.10 已知 y(k+3)+2y(k+2)+5y(k+1) +6y(k)=3u(k+2)+2u(k+1)+6u(k)
脉冲传递函数:
G(z)
Y (z) u(z)
bmzm bm1zm1 b1z b0 zn an1zn1 a1z a0
二 、状态方程的建立
1、由差分方程
设T=1 输入仅有(kT)项,b0=1 整个方程可以写为: y(k+n)+an-1y(k+n-1)+……+a0y(k)=u(k) 设x1(k)=y(k) x2(k)=y(k+1)=x1(k+1) x3(k)=y(k+2)=x2(k+1) ……
xn(k)=y(k+n-1)=xn-1(k+1) xn(k+1)=y(k+n)=-a0 x1(k)-a1 x2(k)-
2.2.3 知识表示与问题求解(状态空间法)

2.2.3 状态空间法
2.2.3.1 问题状态空间的构成
2. 算符
•算符:引起状态中某些变量发生变化,从而使问
题由一个状态变为另一个状态的操作。
•算符可分为走步、过程、规则、数学算子、运算
符号、逻辑符号等。
•例如:在产生式系统中,每一条产生式规则就是
一个算符;而在下棋程序中,一个算符就是一个 走步。
时,世界的末日就来临了。
自动化系仪自教研室 14
2.2.3 状态空间法 Hanoi塔
19世纪,法国的一位数学家 Édouard Lucas (1842−1891) 对该课 题进行过研究,他指示,要完成这 个任务,僧侣们搬动金盘的总次数: 18446744073709551615(20位)假 设僧侣们个个身强力壮,每天24小 时不知头疲倦地工作,而且一秒钟 移动一个金盘,那么,完成这个任 务也得花5800亿年。
自动化系仪自教研室
21
2.2.3 状态空间法 在状态空间图中,从初始节点(1,1)(状态S0)到目 标节点(3,3)(状态S8)的任何一条通路都是问题的 一个解。 最短的路径长度是3,它由3个算符组成:A(1,2)、 B(1,3)、A(2,3)。
自动化系仪自教研室
22
2.2.3 状态空间法
问题的初始状态集合为S={S0},目标状态集合为 G={S8}。 自动化系仪自教研室
18
2.2.3 状态空间法
自动化系仪自教研室
19
2.2.3 状态空间法 ③定义一组算符F 算符A(i,j)表示把盘子A从第i号柱子移到第j号柱 子上的操作; 算符B(i,j)表示把盘子B从第i号柱子移到第j号柱 子上的操作。 算符组F中共有12个算符:
人工智能概论知识表示(状态空间表示法)

3 利用状态空间求解问题的过程
• 为了求解该问题,根据该状态空间的9种可能状态和12种 算符,构造它的状态空间图,如图所示从初始节点(1, 1)(状态S0)到目标节点(3,3)(状态S8)的任 何一条通路都是问题的一个解。但其中最短的路径长度是 3,它由3个算符组成,这3个算符是A(1,2)、B (1,3)、A(2,3)。
• (2)算符 引起状态中某些分量发生变化,从而使 问题由一个状态变为另一个状态的操作 称为算符。 算符可分为走步、过程、规则、数学算 子、运算符号或逻辑符号等。 例如:
在产生式系统中,每一条产生式规则就是一个算符; 在下棋程序中,一个算符就是一个走步;
1问题状态空间的构成
• (3)状态空间 • 由表示一个问题的全部状态及一切可用算符构成的集
这样定义的算符组F中共有12个算符,它们分别是
A(1,2) A(1,3) A(2,1) A(2,3) A(3,1) A(3,2) B(1,2) B(1,3) B(2,1) B(2,3) B(3,1) B(3,2)
• 至此,该问题的状态空间(S,F,G)构造完成。这就 完成了对问题的状态空间表示。
3 利用状态空间求解问题的过程
• 说明:
①可能有多个算符序列都可使问题从初始状态变到目标 状态,这就得到了多个解。其中有的使用算符较少,有 的较多,把使用算符最少的解称为最优解。这里只是从 解中算符的个数来评价解的优劣,评价解的优劣主要是 看使用算符时所付出的代价,只有总代价最小的解才是 最优解。 ②对任何一个状态,可使用的算符可能不止一个,这样 由一个状态所生成的后继状态就可能有多个。当对这些 后继状态使用算符生成更进一步的状态时,首先应对哪 一个状态进行操作呢?这属于搜索策略的问题,不同的 搜索策略其操作的顺序是不相同的。
状态空间表示法

状态空间表示法状态空间表示是一种基于解答空间的问题表示和求解方法,它是以状态和操作符为基础的。
在利用状态空间图表示时,从某个初始状态开始,每次加一个操作符,递增地建立起操作符的试验序列,直到达到目标状态为止。
由于状态空间法需要扩展过多的节点,容易出现“组合爆炸”,因而只适用于表示比较简单的问题。
状态空间是控制工程中的一个名词。
状态是指在系统中决定系统状态的最小数目的变量的有序集合。
而所谓状态空间则是指该系统的全部可能状态的集合。
简单来说,状态空间可以视为一个以状态变量为坐标轴的空间,因此系统的状态可以表示为此空间中的一个向量。
一个实际的物理系统通常以微分算子方程P(D)Z(t)=Q(D)u( t)Y(t)=R(D)Z(t)+H(D)u(t)来描述。
在一般控制原理中基于系统(2-1)的传递函数W(D)=R(D)P-1(D)Q(D)+H(D)借助于各种图解法,比如根轨图或乃氏图等来实现控制系统的分析与设计。
考虑到系统的相互耦合其传递函数相当复杂,有时为了简单,在定性分析中略去相互耦合,实现系统的近似分析。
然而,现代控制理论是基于系统的等效状态空间表示X=AX+ BuY=CX+Eu借助于数字计算机来实现系统的分析与设计,从而避免了一般控制理论中的弊病,实现了系统分析与设计的数值计算程序化。
相应于系统的传递函数为W(D)=C(DI-A)-tB+E在研究中,通常假设E=0,这样并不影响所研究的问题的实质.那么W(D)=C(DI-A)-1B注意上面式子中,为微分算子,P(D),R(D),Q(D)和H(D)是关于D的适当阶次的多项式阵,Z(t)为系统的ml维部分状态,x(t)为n维状态矢量,y(t)为P维输出矢量,u(t)为q维输入矢量,(5)式还可表示成下面扼要介绍三种状态空间表示法状态空间表达式状态空间表达式由状态方程和输出方程构成,在状态空间中对控制系统作完整表述的公式。
在经典控制理论中,对一个线性定常系统,可用常微分方程或传递函数加以描述,可将某个单变量作为输出,直接和输入联系起来。
状态空间表达式

(28) 状态空间方程实现非唯一,书p28, 图1.16b求得其对应的传递函数为: (29)
为求得 令式(29)与式(26)相等,通过对 多项式系数的比较得: 故得: (30)
也可将式(30)写成式(31)的形式,以便记忆。 (31)
将上图a的每个积分器输出选作状念变最,如图所示,得这种结构下的 状态空间表达式:
解:
→
→
u
y
-
+
例: 解: 比例积分环节: → → u y +
例:
解:
综合惯性环节、积分环节模拟结构图得:
u
y
-
+
u
y
解:选积分器的输出为状态变量得:
u
y
状态方程:
输出方程:
状态空间表达式
1.3.2 从系统的机理出发建立状态空间表达式
一般常见的控制系统,按其能量属性,可分为电气、机械、机电、气动 液压、热力等系统。根据其物理规律,如基尔霍夫定律、牛顿定律、能量守 恒定律等,即可建立系统的状态方程。当指定系统的输出时,很容易写出系 统的输出方程。
同一系统,经非奇异变换后,得:
其特征方程为:
(44)
1.5.2 系统特征值的不变性及系统的不变量
1.系统特征值
式(43)与式(44)形式虽然不同,但实际是相等的,即系统的非奇异变换,其特征值是不变的。可以证明如下:
将特征方程写成多项式形式 由于特征 值全由特征多项式的系数 唯一确定,而特征值 经非奇异变换是不变的,那么这些系统 也是不变 的量。所以称特征多项式的系数为系统的不变量。
(3)有共轭复根时,以四阶系统其中有一对共轭复根为例,即 此时
1.6 从状态空间表达式求传递函数阵
1.6.1 传递函数(阵)
第2章 知识表示方法

2.1状态空间法
2.1.2 状态图示法 图的基本概念 图由节点(不一定是有限的节点)的集合构成。一 对节点用弧线连接起来,从一个节点指向另一个节点。 这种图叫做有向图(directed graph) 有向图(directed graph)。 有向图 某个节点序列(ni1,ni2,…,nik)当j=2,3,…,k时, 如果对于每一个ni,j-1都有一个后继节点nij存在,那么 就把这个节点序列叫做从节点ni1至节点nik的长度为k的 路径。 路径。
2.1状态空间法
2.1.1 问题状态描述 状态(State) 1、状态(State)的基本概念 状态(state) (state)是为描述某类不同事物间的差别而 状态(state) 引入的一组最少变量q0,q1,…,qn的有序集合,其 矢量形式如下: Q=[q0,q1,…,qn]T (2.1) 式中每个元素qi(i=0,1,…,n)为集合的分量,称为 状态变量。给定每个分量的一组值就得到一个具体 的状态,如 Qk=[q0k,q1k,…,qnk]T (2.2)
2.2问题归约法
2、与或图的有关术语 父节点 是一个初始问题或是可分解为子问题的问 题节点; 子节点 是一个初始问题或是子问题分解的子问题 节点; 或节点 只要解决某个问题就可解决其父辈问题的 节点集合; 与节点 只有解决所有子问题,才能解决其父辈问 题的节点集合; 弧线 是父辈节点指向子节点的圆弧连线; 终叶节点 是对应于原问题的本原节点。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11 1 7 13
9 4 15 3 12 5 8 6 2 10 14
11 9 4 15 1 3 12 7 5 8 6 13 2 10 14
Hale Waihona Puke 11 1 7 139 15 3 4 12 5 8 6 2 10 14
11 1 7 13
9 3 5 2
4 15 12 8 6 10 14
11 1 7 13
9 4 15 3 8 12 5 6 2 10 14
9
2 另一个状态空间法描述的例子 假设房间里有一个人,一个箱子和一筐苹果。苹果 吊在天花板下方,人直接摘不到,需要站在箱子上才能 摘到苹果。如图所示
C
苹果
人 A
箱 B
10
(1) 状态:选择为(W,X,Y,Z) W——人所处在的水平面上的位置 X ——人所处的高度位置,在 地 面,X=0 在箱子上,X=1 Y——箱子所在的水平面上的位置 Z——是否摘到苹果的状态,=0,未摘到 =1,摘到
4
例如
假设初始状态为: 11 1 7 13 9 3 5 2 8 10 4 13 12 6 14
我们要求的目标状态为: 1 5 9 13 2 6 10 14 3 7 11 15
5
4 8 12
如何把初始状抬转换为目标状态 ——选择移动一个棋子。 每移动一次棋子,就会有一个新的状态,所有可能 的状态一起,就构成了该问题的状态空间。 解决该问题,就是尝试各种不同的走步,直到寻找 到达到目的状态的路径,到达目标状态为止。 从初始状态开始,尝试不同的走步,就构成了一个 有不同状态组成的图。
11 9 1 7 5 13 2
4 15 11 4 15 3 12 1 9 3 12 8 6 7 5 8 6 10 14 13 2 10 14
11 9 4 15 1 5 3 12 8 6 7 13 2 10 14
9 15 11 1 3 4 12 7 5 8 6 13 2 10 14
11 1 7 13
9 3 5 2
减少数据存储的一种方法是,给出某种实现状态转 换的走步策略,这样,我们只要给出了初始状态,策 略(也就是操作符F),就可以由初始状态或前一个状 态推出下一个状态,直到达到目标状态。而且这是使 用比较多的方法。 因此,要实现对某个问题的状态空间描述,需要: 确定状态描述方法,特别是初始状态的描述; 确定状态间联系的描述方法,较好的表示出不同状 态之间的联系,确定操作符集合及其对状态描述的作 用; 目标状态的描述。 我们来看一个例子
11 9 1 7 5 13 2
4 15 11 4 15 3 12 1 9 3 12 8 6 7 5 8 6 10 14 13 2 10 14
11 9 4 15 1 5 3 12 8 6 7 13 2 10 14
9 15 11 1 3 4 12 7 5 8 6 13 2 10 14
11 1 7 13
9 3 5 2
(111) → (333)
31
(111)→(113) 含义就是执行操作,将A移动到 柱子3上。
1 2 3 移动A到柱子3上 B C A
32
(113)→(123) 含义就是执行操作,将柱子1上 的圆盘B移动到柱子2上。
1 2 3 移动B到柱子2上
A C B
33
(1)将三圆盘问题分解为第二级的二圆盘问题,其 中包含一个一圆盘问题。只要解决了第二级的三个问 题,原来的问题就获得了解决。 (2)二圆盘问题就是将两个圆盘按规定的堆放顺序 堆叠在某一个柱子上。 二圆盘问题又可以再分解为第三级的一圆盘问题—— 将一个圆盘从原来的柱子上移动到另一个柱子上。这 个问题是简单的。 (3)只要解决了第三级的全部问题,则第二级的问 题也就得到了解决。 (4)只要解决了第二级的全部问题,最原始的问题 也就得到了解决。
11
(2) 句法规则 • 人走动规则——用goto(U) 描述的含义:人从原来水平位置走到新的水平 位置U,例如
(W , 0 , Y , 0 )
goto (U )
→ (U , 0 , Y , 0 )
状态为 (W,0,Y,Z) 表示人在水平位置W,处于地面, 箱子在位置Y,没摘到苹果。在goto(U)操作下,变成新 状态 (U,0,Y,Z)——人走到U,还是摘不到苹果,箱子在 位置Y,摘不到苹果。
这些符号的含义
29
2 问题的归约解决方法
首先我们约定问题的描述方法。 我们用一个数据结构来表示三个圆盘在柱子上的 位置。 格式为:(CBA) 含义为:每个位置的字母的取值,就表示对应圆 盘所在的柱子的编号。例如(1 2 3)表示圆盘C在 柱子1上,圆盘B在柱子2上,圆盘A在柱子3上。 这样,A、B、C的取值只可能是1,2,3三个数 之一。 对于以上问题,我们用归约法描述,可以表示为
20
3 状态图 状态图表示方法,就是用图论的方法来描述状态空 间的各个状态以及它们之间的相互关系。 在前面给出了一个图,它也可以叫做状态图。但是 这个图太复杂。我们用节点来表示上图中的各个实际 状态,就构成状态图。 状态图是由节点,有向弧线等构成的图。
21
实际上,就是将前面的图中的状态,用一个节点来表示
1 2 3
A B C
26
1
2
3
C=1,B=1,A=1 (111)
A B C
1 A B C
2
3
移动AB到柱子2上,是一 个移动二圆盘问题
A B
C=1,B=2,A=2 (122)
27
1
2
3
移动AB到柱子2上后
C
A B
C=1,B=2,A=2 (122)
3 移动C到柱子3上 是一个移动一园盘问题
1
2
C
A B
到苹果 的状态 标志 箱子的位置坐标
19
人的位置坐标
是否在 箱子上 的状态 标志
现假设有障碍物存在,我们的运动必须沿着特定的路 径进行:A D,D E, E F, F B, B F,F G,G C, 再爬上去苹果。 又该如何描述?
G A人 C E D B箱 F
苹果
如果需要寻找苹果的位置,又该如何描述 如果不知道障碍物的位置,需要寻找并避开障碍,又该如何描述?
13
对于与前面提到的命题,箱子原来处于B,人走到 B后,才能将箱子移动到苹果所处的位置C。将具体 的实例数据带入,得到
( A ,0 , B , Z )
goto ( B )
→ ( B ,0 , B , Z )
( B ,0 , B , Z )
pushbox (C ) (C
→ (C ,0, C , Z )
12
• 推箱子 pushbox (V) 它的作用是将箱子从原始水平位置推到新位置V。 例如:
(W , 0 , W , Z )
pushbox (V )
→ (V , 0 , V , Z )
要推箱子,我们认为人和箱子在水平面同一位置W, 人在地面故X=0,在操作pushbox(V)的作用下,人将箱 子移动到位置V。当然这时人和箱子还是在水平面同一 位置,人站在地面上,故新状态为(V,0,V,Z),Z表示 现在还不关心Z的取值,当然一般认为现在Z=0。
25
1 梵塔问题 这个问题是:有3根柱子1,2,3和大小不同的三 个圆盘A,B,C,每个圆盘的中心有一个孔,可以 让柱子穿过,从而他们可以堆叠在柱子上。最初,全 部圆盘都堆在柱子1上,最大的圆盘C在最下面,最 小的圆盘A在最上面。现要求将所有圆盘都移到柱子 3上,同时有限制条件为:每次只能移动最上面的一 个圆盘放到另一个柱子上,任何时候都不允许将大的 圆盘对方到小的圆盘之上。
15 4 12 8 6 10 14
11 1 7 13
9 3 5 2
4 15 12 6 8 10 14
11 1 7 13
9 3 5 2
4 12 15 8 6 10 14
23
状态图表示,主要是为了我们分析问题的方便,在 计算机内部,我们还是用一个数据结构来表示。
24
2.3. 2 问题的归约描述方法
所谓问题的归约描述方法,实际上就是把一个复 杂问题,分解为一组较简单的问题来描述和解决的方 法。只要解决了这些相对简单的问题,就可以解决原 来复杂的问题。 我们还是通过一个例子来讨论。
30
条件
二 圆 盘 问 题 (111) → (122) (122) → (322) (111) → (113) (113) → (123) (123) → (122) 一 圆 盘 问 题 (322) → (321) (321) →(331) (331) → (333) (322) → (333)
初始条件
由于还没有摘到苹果,应该有Z=0,这里我们还可 以不关心它。
14
• 爬到箱子上或从箱子上下来 用climbox 表示,如果原来在箱子上,该操作表 示人从箱子上下来,否则表示人从地面爬到箱子上。 需要注意这时人和箱子处于同一水平位置。例如
(W , 0 , W , Z )
c lim box
→ ( W ,1 , W , Z )
16
这样,我们就有了状态集合{ (A,0,B,0), (B,0,B,0), (C,0,C,0), (C,1,C,0), (C,1,C,1), (C,0,C,1) } 操作集合F: { goto(), pushbox(), climbox, grasp } 从初始状态(A,0,B,0),每经过一个操作,都转换 到下一个特定状态 ——从前以状态和操作符,可以确定下一个状态, 这样就不必存储每一个可能的状态,可以节省存储空 间和搜索时间。
17
(3) 该命题的状态空间描述:
goto(B)
(A,0,B,0)
pushbox(C) (B,0,B,0) (C,0,C,0)
climbox
(C,1,C,0)
grasp (C,1,C,1)