《运筹学》ch12博弈论

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

m
n
记 Sm {x R m | xi 0, i 1, , m, xi 1} Sn {y R n | y j 0, j 1, , n, y j 1}
则 Sm,Sn
分别称为局中人1和局i中1 人2的混合策略集;对
x (x1,
j 1
, xm ) Sm
第十二章 博弈论
教学要求:
了解博弈论的基本分析方法 掌握二人零和博弈模型和求解方法 会运用该模型分析一些经济和管理问题
目录
博弈论的基本概念 纯策略矩阵博弈 混合策略矩阵博弈 其它类型博弈简介(多人博弈、非零和博弈)
目录
博弈论的基本概念
纯策略矩阵博弈 混合策略矩阵博弈 其它类型博弈简介(多人博弈、非零和博弈)

合作博弈






博弈
静态博弈非合作博弈无 有限 限多 多 两 两人 人 人 人非 非 非 非零 零 零 零零 零 零 零和 和 和 和和 和 和 和

局中人2使保证对方得到的期望值最多不超过 v2

min max E(x, y)
ySn xSm
鞍点:设 x* Sm ,y* S n 。如果对任意 x Sm和任意 y Sn有:
E(x, y* ) E(x* , y* ) E(x* , y)
则称 (x* , y* ) 是矩阵博弈混合策略A (aij ) 意义下的一个鞍点。
多人非合作博弈
(1)局中人集合 I {1, , n} ; (2)每个局中人i有一个纯策略的有限集:
Si
{s(i)} {s1i , s2i ,
,
si mi
}
i 1, , n
(3)每个局中人i有一个支付函数u i ,i 1, , n 。
记为此博弈为G {I , Si ,ui }。
如果局中人1选择策略 Ai ,局中人2选择B
支付是 a,ij 则支付矩阵是:
j
,局中人1从局中人2得到的
a11 a12 a1n
A

(aij
)


a21 am1
a22 am2

a2n
amn

由上述矩阵完全确定的博弈,称为矩阵博弈。
局果行选中局元择人中素i,1人中使希1的他望选最得支择小到付策元的值略素支aA。付iij 由越,不于大 则小局越 他于中好 至m1i人a, 少mx1m1局 可 ji希n中 以n a望ij人 得a到2i则j越支希大付望越1m付好jin出n,a的ij因。此a即ij局越支中小付人越矩1好阵可。第以如i
实例
局中人1、2玩扑克牌游戏, 支付矩阵和混合策略选择概略如 下图:
局中人2
红q 黑1-q
局 中
红p -1,1 1,-1
人 1 黑1-p 1,-1 -1,1
局中人1的期望支付
u1 (1) pq 1p(1 q) 1(1 p)q (1)(1 p)(1 q) 2 p(1 2q) (2q 1)

s (i)

S
(i
i

1,
,n
)是局中人i
的一个策略,则
s (s (1) , , s (n) )
称为一个局势。对于博弈的每一个局势

每个s 局(中s (1人) ,i得, s到(n)的) 支付:
ui ui (s)
这就是博弈在纯策略下的支付函数。
非零和博弈
在经济管理问题中,经常遇到的是对 抗的双方既有对抗又有合作,双方的利益 既有所得又有所失,各参与人的目的并不 完全对立。这种如果至少存在一个结局, 使所有局中人的支付之和不为零的博弈称 为非零和博弈。
aij

min
1im
a ij
*
ai* j*

min
1 jn
ai*
j
wenku.baidu.com
min
1 jn
max
1im
aij
则称(Ai* , Bj* ) 为该矩阵博弈的鞍点
实例
局中人2
2的最优 策略(列)
局中人1
B1 B2 B3 B4
A1 1 1 0 3 A2 2 3 1 3 A3 2 2 3 4
博弈的基本要素
局中人:博弈中的决策者或参与者,至少要有2个,个人和集体都可以
作为局中人,如“齐王赛马”中的齐王和田忌。
策略:局中人在整个决策过程中一系列行动的一个方案。如用(上、中、
下)表示出场参赛的三匹马依此为上马、中马和下马,这就是局中人的 一个策略。
赢利:在决策过程的最终结局上的利害结果。如每一场比赛中的负者付

y ( y1, , yn ) Sn分别称为局中人1和局中人2的混合策略。
mn
局中人1的期望支付:E(x, y) aij xi y j xT Ay
i1 j 1

局中人1应选择 x Sm,保证自己的赢得期望值不少于
v1

max min E(x, y)
xSm ySn
局中人2的期望支付
u2 1pq (1) p(1 q) (1)(1 p)q 1(1 p)(1 q) 2q(2 p 1) (2 p 1)
局中人2 1
鞍点
1/2
1/2
1
局中人1
目录
博弈论的基本概念 纯策略矩阵博弈 混合策略矩阵博弈
其它类型博弈简介(多人博弈、非零和博弈)


动态博弈 微分博弈
最常见
目录
博弈论的基本概念
纯策略矩阵博弈
混合策略矩阵博弈 其它类型博弈简介(多人博弈、非零和博弈)
矩阵博弈
矩阵博弈 G {S1, S2 , A}
设局中人1有m个策略S1 {A1, , Am} ;局中人2有n个策略 S2 {B1, , Bn}
对于非零和博弈,可虚增一局中人使 其化为零和博弈。
给胜者一千金。
支付矩阵:把局中人、策略和赢利数字写成矩阵形式。如下为“锤子、
剪刀、布”游戏的支付矩阵。其中方案1代表出锤子,方案2代表出剪刀, 方案3代表出布。
参与者2
1
2
3


1
0
1
-1

2
-1
0
1
1
3
1
-1
0
囚徒困境
囚徒一的支付矩阵
囚徒二
坦白
不坦白
坦白
5年
释放



不坦白
8年
1年
博弈分类
同越理小,越若好局,中所人以,2选局择中策人略2可B j以,选则择他至B j ,多使失他去失m1ia去mx a的ij 。不因大局于中1m ji人nm m21i希amx望aij aij
鞍点:如果存在 i*, j* 使支付矩阵 (aij ) 的元素满足:
max
1im
min
1 jn
1的最优 策略(行)
目录
博弈论的基本概念 纯策略矩阵博弈
混合策略矩阵博弈
其它类型博弈简介(多人博弈、非零和博弈)
基本概念
设矩阵博弈G {S1, S2 , A} 的支付矩阵是 A (aij )mn ,其中S1 {A1, , Am}
S2 {B1, , Bn }
相关文档
最新文档