动态规划与最优控制模

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章 最优控制模型

(管理、决策方面应用,因此可说管理决策模型)

§1 最优控制的问题提法:

§1.1最优控制问题举例

一、例,详见最优控制课听课笔记第一节;

§1.2最优控制数学模型

最优控制模型问题的数学描述――最优控制模型。

寻找U )t (*u ∈

(开,闭)[]f f 0t ,t ,t 可以固定或自由,使得:

[][])t ( u J m i n

)t (*u J U

u

∈= ()

{

()()0

),( 0 ),( ,)( )( )( )( ),( ),( dt

(t)

x d

:.210

0≤=∈=∈===f f f f f f f f t t x g t t x g R t x t x M x t x x t x t t u t x f t s

其中: n R )t (x ∈ ,且1C )t (x ∈ (一阶连续可微), R U )t (u m ≤∈

[] t ,u (t), x f :

向量值函数,且)( f ⋅ 对t ),t ( u ),t ( x 连续,对t ),t ( x

连续可微。 []()()()[]。

都可微 t (t), x 对 t (t), u (t), x L ,t ),t ( x

,dt t ),t ( u ),t ( x L t ),t ( x )t ( u J f f t t f f f

ϕ+

ϕ=⎰

上述最优控制的离散模型:

求 {})

(,)(*

*

i x i u , 使得

目标泛函: ()∑-==1

N 0

i i ),i ( u ),i ( x L J 达到最小。

而且满足:

状态方程: ()⎪⎩

⎨⎧∈==+M

x x k k u k x f k x )(k x )0( ),( ),( )1( f 0

最优控制问题的求解方法:

1. 古典变分法:U 开集;

2. 极大值原理:U 闭集;现代变分法,把古典变分法看作特例 3. 动态规划:便于数值计算,并有通用算法; 发展了变分法,结果是充分条件。

§2最优控制模型的动态规划解法

§2.1动态规划方法概述

§2.2生产——库存——销售管理系统的动态规划解法

§2.1动态规划方法概述

某一类管理问题的数学模型(状态方程)是一个差分方程:

状态方程: ()⎪⎩

⎨⎧∈==+M

x x k k u k x f k x )(k x )0( ),( ),( )1( f 0

目标泛函: ()∑-==

1

N 0

i i ),i ( u ),i ( x L J 达到最小。

即:

此为一个N 阶决策问题:

动态规划法是求这一决策问题的有效办法,具有明显优点:

(ⅰ)将一个N 阶决策问题转化为多次一步决策问题,即数学上的嵌入原理——将求一条极值曲线问题,嵌入到求一族极值曲线的更广泛的类似问题中;

(ⅱ)大大简化了计算量;

(ⅲ)具有局部优,就是整体优的最优性原理:

可广泛应用于运输系统、生产库存管理系统、生产计划制定及最优投资分配问题、最优价格制定问题。

下面以最短路问题举例说明这种方法 :

一、最短路问题(最小时间问题)

1.问题:若有一辆汽车以S 城出发经过若干城市到达F 城,如图:3 ,2 ,1i ,Q ,P i i =,是一些可以通过的城镇。

·P 1 6 ·P 2 1 ·P 3

4 4 1 2 4

S · ·F 5 6 3 ·Q 1 7 · Q 2 2 ·Q 3

图中两点间的数字:可以表示两城镇之间的距离(单位10公里),也可以表示行驶两城镇所用时间(应综合考虑:距离远近,路面好坏,是否拥挤等情况)。

于是:汽车从S 到F 可经多种途径选择到达F 。

问题是:从多种途径选择方案中,决定一种使S 到F 所走路线最短。或者若图中数字表示时间,则决定一种路径使从S 到F 所用时间最短。

2.方法:

Ⅰ.决策树法(穷举法):

决策树法是最容易想到的一种方法,但运算量很大——即把所有可能选择的路途所用的时间都求出来,然后取最小值,即有最优策略(最优决策)。

即: {}3 ,2 ,1i F Q SP min F *Q *SP i i i i == 因此有:

1 P 3 4 F 15

P 2

6 1 Q 3 3 F 14 P 1 6

2 P

3

4 F 16

4 Q 2

2 Q

3 3 F 15

S

1 P 3 4 F 14

5 P 2

4 1 Q 3 3 F 13

Q 1 7 2 P 3 4 F 18

Q 2

2 Q

3 3 F 17

因此,最终得出:{}3 ,2 ,1i F Q SP min F P P SQ i i 321== 困难:这样共有8条线路可选择,每条线路要作3次运算。

第1次:22211Q Q /P Q /P S →→→;第2次:3322Q /P Q /P →; 第3次:F Q P 33→或

因此,共需24次运算:2438=⨯次,若阶段更多,则计算量更大。 II .“走一步瞧一步”(瞎子爬山?近视眼?)法:

第一步:从S 到1P 或1Q :显然 5SQ 4SP 11=<=,因此取决策1SP ;

第二步:从1P 到2P 或2Q :显然 2121Q P 6P P ==,因此取2121Q Q ,P P 均可,但从2P 到

3P 或3Q 距离为1,而2Q 到32P P 距离为2,因此,第2步决策为2P ,因此取21P P ;

第三步:2P 到3P 或2P 到3Q ,均有1Q P P P 3232==,但3Q 到F 的距离为3,因此第3步取路线32Q P 。

相关文档
最新文档