运筹学第十一章 二人有限零和对策剖析

合集下载

11上管理运筹学复习题

11上管理运筹学复习题

阅读使人充实,会谈使人敏捷,写作使人精确。

——培根11上管理运筹学复习题一、单选题1.能够采用图解法的进行求解的简单线性规划问题的变量个数为 ( )。

A .1个B .2个C .3个D .4个2、在中日篮球比赛(对策论问题)中,称为局中人的是 ( )。

A .双方领导人B .双方的教练C .两个国家的人民D .中日参赛的国家队 3.在决策分析中,以下不属于非确定情况下的决策准则是( )。

A .小中取大准则B .大中取大准则C .大中取小准则D .等可能性准则4.设整数规划为为整数且121212121,0,321..3max x x x x x x x t s x x f ≥≤-≥++= ,则该整数规划属于( )。

A .0—1规划B .混合整数规划C .纯整数规划D .以上答案均不对 5.对某复杂问题进行系统分析,从而得到最满意的行动方案,可能需要做这样一些工作( )(1) 对方案进行分析、比较、评价;(2) 选择满意方案; (3) 阐明问题现状;(4) 提出可行备选方案;(5)明确决策目标。

你认为正确的分析思路与程序应该是( )A. (5)—(3)—(4)—(1)—(2)B. (3)—(4)—(1)—(2)—(5)C. (5)—(4)—(3)—(1)—(2)D. (3)—(5)—(4)—(1)—(2) 6.线性规划一般模型中,自由变量可以用两个非负变量的 ( )代换。

A .和B .差C .积D .商 7.线性规划模型的特点是 ( )。

A .变量个数少 B .约束条件少C .目标函数的表达式短D .约束条件和目标函数都是线性的 8.二人零和对策中“零和”的含义是指 ( )。

A .甲方的赢得值为零B .乙方的赢得值为零C .二人的赢得值都是零D .二人的得失相加为零9.设有参加对抗的局中人A 和B ,A 的赢得矩阵为⎪⎪⎪⎭⎫⎝⎛--205634916321321αααβββ,则最优纯策略的对策值为( )A. 4B. 3C. 9D. 110.对于风险型决策问题,其各自然状态发生的概率是()的。

管理运筹学解决实际问题的步骤及内容

管理运筹学解决实际问题的步骤及内容

第三章 线性规划问题的计算机求解
教学要求
本章学习如何使用计算机软件包求解线性规划问题,并通过上机操作训练掌握较简单的线性规划问题使用计算机软件包求解的方法。
课时分配
6学时(含计算机上机操作训练)
教学内容
一、管理运筹学计算机软件包的使用说明和结构内容。
二、线性规划问题的菜单界面和输入要点。
简要介绍管理运筹学所涉及的应用领域,如生产计划、库存管理、运输问题、人事管理、市场营销、财务会计、项目评价等;介绍管理运筹学在国内外的应用和发展状况。
四、管理运筹学使用计算机软件的原则
思考题
1、简述运筹学的发展历史和发展前景。
2、管理运筹学的主要分支和应用领域有哪些?
3、使用管理运筹学计算机软件有哪些基本原则?
第十二章 排队论
教学要求
本章学习研究排队现象,主要了解和掌握在不增加固定资产投资前提下,如何把排队时间控制到一定限度内,在服务质量的提高和成本降低之间取得平衡,寻找最恰当的解。
课时分配
3学时
教学内容
一、排队过程的组成部分
二、单服务台泊松到达、负指数服务时间的排队模型
通过图解法作图过程,直观地讲解目标函数中系数的灵敏度分析、约束条件右边常数的灵敏度分析的基本原理。
思考题
1、试述可行域、目标函数等值线、松驰变量和剩余变量的含义。
2、试述线性规划图解法的基本特点、适用范围、图解法求解的基本程序,步骤和方法
3、线性规划问题是如何化为标准形式的?
三、多服务台泊松到达、负指数服务时间的排队模型
四、单服务台泊松到达、任意服务时间的排队模型
五、多服务台泊松到达、任意服务时间、损失制排队模型

管理运筹学期末复习资料【韩伯棠】

管理运筹学期末复习资料【韩伯棠】

运筹学(Operational Research)复习资料第一章绪论一、名词解释1.运筹学:运筹学是应用分析、试验、量化的方法,对经济管理系统中的人力、物力、财力等资源进行统筹安排,为决策者提供有依据的最优方案,以实现最有效的管理。

二、选择题1.运筹学的主要分支包括(ABDE )A图论B线性规划C非线性规划D整数规划E目标规划2. 最早运用运筹学理论的是( A )A . 二次世界大战期间,英国军事部门将运筹学运用到军事战略部署B . 美国最早将运筹学运用到农业和人口规划问题上C . 二次世界大战期间,英国政府将运筹学运用到政府制定计划D . 50年代,运筹学运用到研究人口,能源,粮食,第三世界经济发展等问题上第二章线性规划的图解法一、选择题/填空题1.线性规划标准式的特点:(1)目标函数最大化(2)约束条件为等式(3 决策变量为非负(4 ) 右端常数项为非负2. 在一定范围内,约束条件右边常数项增加一个单位:(1)如果对偶价格大于0,则其最优目标函数值得到改进,即求最大值时,最优目标函数值变得更大,求最小值时最优目标函数值变得更小。

(2)如果对偶价格小于0,则其最优目标函数值变坏,即求最大值时,最优目标函数值变小了;求最小值时,最优目标函数值变大了。

(3)如果对偶价格等于0,则其最优目标函数值不变。

3.LP模型(线性规划模型)三要素:(1)决策变量(2)约束条件(3)目标函数4. 数学模型中,“s·t”表示约束条件。

5. 将线性规划模型化成标准形式时,“≤”的约束条件要在不等式左端加上松弛变量。

6. 将线性规划模型化成标准形式时,“≥”的约束条件要在不等式左端减去剩余变量。

7.下列图形中阴影部分构成的集合是凸集的是A【解析】:如何判断是凸集?凸集:两点之间连线在图内凹集:两点之间连线在图外8. 线性规划问题有可行解且凸多边形无界,这时CA没有无界解 B 没有可行解 C 有无界解 D 有有限最优解9. 对于线性规划问题,下列说法正确的是( D )A. 线性规划问题可能没有可行解B. 在图解法上,线性规划问题的可行解区域都是“凸”区域C. 线性规划问题如有最优解,则最优解可在可行解区域顶点上到达D. 上述说法都正确第三章线性规划问题的计算机求解一、名词解释1.相差值:相应的决策变量的目标系数需要改进的数量,使得决策变量为正值。

运筹学_对策论

运筹学_对策论
第17页
混合策略
• 混合扩充
矩阵对策扩充 N人有限对策
• 混合平衡解
矩阵对策 N人有限对策
• 均衡解的存在性
第18页
混 合 扩 充—矩阵对策
策略集
m
S * 1
{X
( x1 , x2 ,..., xm )
xi 1, xi 0, i 1,2,..., m}
i 1
nS* 2{Y( y1 ,y2 ,...,
yn )
y j 1, y j 0, j 1,2,..., n}
j 1
支付函数
mn
E( X ,Y )
aij xi y j
i1 j1
混合扩充: *
{
S1*
,
S
* 2
,
E
(
x
,
y),
x
S1* ,
y
S
* 2
}
第19页
混 合 扩 充—N人有限对策
N 人有限对策 I {1,2,..., N }, Si , i I , H i (s), i I
• 定理1 N人有限对策的混合扩充存在平衡局势. • 定理2 矩阵对策的混合扩充存在平衡局势.
第23页
矩阵对策的解法
• 问题的简化
优超 算例
• 线性规划方法
基本思想 算例
第24页
优超
给定矩阵对策 {S1 , S2 , A} , A 是 m n 的矩阵,如果
akj alj , j 1,2,..., n
则称局中人 1 的策略 k 优超于策略 l。如果
aik ail , i 1,2,..., m
则称局中人 2 的策略 k 优超于策略 l。
注:局中人 1 的策略 k 优超于策略 l 则说明对局中人 1

上交大《物流运筹学》教学资料包 课后习题答案 第十一章

上交大《物流运筹学》教学资料包 课后习题答案 第十一章

第十一章对策论一、思考与练习(1)试述组成对策模型的三个基本要素及各要素的含义。

答对策模型的三个基本要素是局中人、策略集和支付函数(赢得函数),局中人是指在一局对策中,有决策权和自身利益的参加者。

①局中人。

局中人除了理解为个人外,还可理解为集体,也可把大自然理解为局中人。

在对策现象中,假定任一局中人都不存在利用其他局中人决策的失误来扩大自身利益的可能性。

同时,为研究问题方便起见,把那些利益完全一致的参加者们看作一个局中人。

②一局对策中,每个局中人都有供其选择的完整的行动方案。

必须指出此方案不是某一步的行动方案,而是指导对策现象中自始至终通盘筹划如何行动的一个方案。

这样的行动方案称为这个局中人的一个策略。

而把这个局中人的策略全体,称为这个局中人的策略集合。

③一局对策结束时,每个局中人的“得失”是全体局中人所取定的一组策略的函数,称为支付函数(赢得函数)。

(2)试述二人零和有限对策在研究对策模型中的地位、意义,为什么它又被称为矩阵对策?答在众多对策模型中,占有重要地位的模型是两人有限零和对策(finite two-person zero-sum game),即矩阵对策。

矩阵对策是理论研究和求解方法都比较完善的一种对策模型,而且这类对策的研究思想和理论结果又是研究其它类型对策模型的基础。

称有限两人零和对策为矩阵对策。

即参加对策的局中人只有两个,双方的利益是完全对抗的;每个局中人都有有限个可供选择的策略;且在任一局势(在对策论中,从每个局中人的策略集中各取一个策略组成的策略组)中,一个局中人的所得即为另一个局中人的所失,两个局中人的得失之和总等于零。

(3)已知两人,对策时对A的赢得矩阵如下,求双方各自的最优策略及对策值。

①214203120⎡⎤⎢⎥⎢⎥⎢⎥--⎣⎦②326202524--⎡⎤⎢⎥⎢⎥⎢⎥--⎣⎦解 在矩阵上直接计算① min 214(1) 2030120-2 max 2 ( 1 ) 4⎡⎤⎢⎥⎢⎥⎢⎥--⎣⎦ ② min-3-26-3202(0)524-4max 5 ( 0) 6⎡⎤⎢⎥⎢⎥⎢⎥--⎣⎦先求每行的最小值,在这些值中求最大值,并带上括号。

运筹学-对策论

运筹学-对策论

3.矩阵对策的混合策略
例:设一个赢得矩阵如下:
5 A = 8 max 8 6 9 6 min
j
9
min 5 max
i
6 策略α2
8 策略β1
• 思路:对甲(乙)给出一个选取不同策 略的概率分布,以使甲(乙)在各种情 况下的平均赢得(损失)最多(最少)。 -----即混合策略
重要定理
定理 任一矩阵对策G {S1,S2;A}, 任一矩阵对策G={S1,S2;A},一定存在混 合策略意义下的解。 合策略意义下的解。 • 定理 设有两个矩阵对策 • G1= G2= G1={S1,S2;A1} G2={S1,S2;A2} • 其中A1=(aij),A2=(aij+L),L为任一常数。 A1= 其中A1 (aij),A2=(aij+L), 为任一常数。 则 • (1)G1 G2同解 G1与 同解; (1)G1与G2同解; • (2)VG2 VG2= (2)VG2=VG1+L
7.4 矩阵对策的解法
• (1) 2×2矩阵对策的线性方程组法 2× • 所谓2 所谓2×2矩阵对策是指局中人Ⅰ的赢得矩阵为2×2阶的,即 矩阵对策是指局中人Ⅰ的赢得矩阵为2 是指局中人 阶的, A = a11 a12 • a21 a22 • 如果此对策有纯策略意义下的解,则很容易求解; 如果此对策有纯策略意义下的解,则很容易求解;如果没有 纯策略意义下的解, 纯策略意义下的解,则为求出各局中人的最优混合策略可求解下 列方程组: 列方程组: • a11x1+a21x2= a11y1+a12y2= a11x1+a21x2=v a11y1+a12y2=v • a12x1+a22x2= a21y1+a22y2= a12x1+a22x2=v a21y1+a22y2=v • y1+y2= x1+x2= y1+y2=1 x1+x2=1 • 当没有纯策略意义下的解时,方程组一定有严格非负解 x*= 当没有纯策略意义下的解时, x1* x2* y*=(y1*,y2*), (x1*,x2*)和y*=(y1*,y2*), 即为各局中人的最优混合策 略。

第四讲对策论

第四讲对策论

计算结果为(保留有效部分)
Global optimal solution found at iteration: 0
Objective value:
5.000000
Variable
Value Reduced Cost
V_A 5.000000
0.000000
X( 1) 0.000000
2.000000
优化建模
例1.1 “石头--剪子--布”中儿童甲的支付函数

石头
剪子

石头
0
1
-1

剪子
-1
0
1

1
-1
0
优化建模
•当局中人得失总和为零时,称这类对策为零和对策; 否则称为非零和对策。
•当局中人只有两个,且对策得失总和为零,则称为 二人零和对策,若总得失总和为常数,则称为二人常 数和对策,若得失总和是非常数的,则称为二人非常 数和对策。
在对策论中,应有以下要素:
优化建模
(1) 局中人。是指参与对抗的各方,可以是一个人, 也可以是一个集团。在例1.1的甲、乙两名儿童就 是局中人。
(2) 策略。是指局中人所拥有的对付其他局中人的 手段、方案的集合。如例1.1中共有石头、剪子、 布三种策略。
(3) 支付函数(或收益函数)。是指一局对策后各局 中人的得与失,通常用正数字表示局中人的得,用 负数字表示局中人的失。在例1.1的局中人甲的支付 函数如表所示。
j 1
的概率混合使用他的n种策略。
优化建模
当A采用混合策略,B分别采用纯策略
bj(j=1,2, …,n), A的赢得分别为
m
cij xi ( j 1,2,, n)

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件
局中人称为“i旳对手”,记为-i。
对策中利益一致旳参加者只能看成一种局中人,例:桥牌中 旳东、西两方。 对策论中对局中人旳一种主要假设:每个局中人都是“理智 旳”,即每一种局中人都不存在侥幸心理,不存在利用其他 局中人决策旳失误来扩大本身利益旳行为。
基本概念
在策略型博奕中,一种对策有下列几种基本要素: 一.局中人 二.策略(strategies):
-1
1

1
0
-1
剪刀
-1
1
0
第三节 矩阵对策旳纯策略
例:设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3 0
6
解:对局中人I而言,最大赢得是9,若想得到这个赢得,
他要选择纯策略 ,3因为局中人II也是理智旳竞争 者,他已考虑到局中人I打算出 旳3心理,则准备 以 3对付之,使局中人I不但得不到9,反而失掉10. 局中人I当然也会猜到局中人II旳心理,故而出 4
I {1,2,..., n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付有关局势旳函数----决策根据和原则 H i (s);i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
二人:参加对策旳局中人有两个;
有限:局中人旳策略集都为有限集;
零和:在任一局势下,两个局中人旳赢得之和总等于0,即,
一种局中人旳所得值恰好是另一种局中人旳所失值,双方旳 利益是完全对抗旳。
设局中人I和II旳策略集分别为
S1 {1,2 ,...,m } S2 {1, 2 ,..., n}
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
S={s1,s2,……,sm}—局中人甲的策略集 D={d1,d2,……,dn}—局中人乙的策略集 3.局势:在一局对策中,每个局中人都选定一个策略 后的各策略的组合。表示为(Si,Dj). 4.得失值(赢得函数):局中人选定某策略后相应的 收益值。表示为 R甲(si,dj)—甲的收益 R乙(si,dj)—乙的收益
3.对策问题举例 ①下棋、打牌、体育比赛等。
② 齐王赛马:齐王与大将田忌赛马,各自的 马都分为三 等,但齐王的同等马均强于 田忌。孙膑给田忌出主意, 用下----上 ,上----中,中----下, 赢 B 石头 剪子 布 A 结果田忌胜出。 石头 0 1 -1 ③猜手:小孩A与B猜手, 剪子 -1 1 0 若规定赢 得1分, 布 0 1 -1 平得0分,输得 -1分, 则 A的赢得可用右表来 表示。
8 5 7
5
(3)优超原理
若A中第i, k 行有aij akj , j 1 记si 记d j sk (可在S中取消sk ) 若A中第j, l列有aij ail , i 1 dl (可在D中取消d k )
n 称si 优超于sk 。 m 称d j 优超于dl 。
例5: 用优超原理求解下列对策
4 1 3 1
s1 s2 s3 s4 d1
d1 1 -1 2 0
d2 0 4 s3 2 s3 4
'
s1
s2
d1 d2 s3 2 2 d1 0 4 s4
d2
d1 s3 2 s3 s4 0
s3 (2)
s1 1 s2 -1 A s3 2 s4 0
d1 d2 d3 d4 s1 s2 s3 s4
1 -1 2 0 0 4 2 4 3 0 2 1 4 1 d1 3 d 1 1
s4
d3 d4
d1 d2 d3 d4
0 4 2 4 3 0 2 1
a1n a11 A= 为甲的支付矩阵 a a mn m1 其中aij为甲的得(也是乙的失),乙的得即为-aij。
M
故称G (S ,D,A)为纯策略对策模型(矩阵对策)
二、纯策略对策的解 1、纯策略分析
例1:今有甲、乙两厂生产同一种产品,它们 都想通过内部改革挖掘,获得更多得市场份额。 已知两厂分别都有三个策略措施。据预测,当 双方采取不同的策略措施后两厂的市场占有份 额变动情况如下所示。
A
故鞍点为(s3,d1) 对策值为VG*=2
练习
先用优超原理简化矩阵,再求解。
A
2 2 5 6
3 1 9 8
4 3 1 3
5 4 0 6
6 0 3 4
11.3二人有限零和对策的混合策略对策模型
一、基本概念 例:已知对策G={S,D;A}
A= 7
3
4
6
4*
3
7
S1 A=S2 S3
d1 d2 10 -1 12 10 6 8
d3 3 -5 5
请你分析,理智情况下,甲、乙两 厂最可能出现什么策略,最大收益 是多少?
分析 :甲 : 当然想出s2
d1 d2 d3 S1 10 -1 3 -1 乙:当然想出d3 A= S2 12 10 -5 -5 S3 6 8 5* 5* 12 10 5* 对甲而言,先想最坏,再想最好. 则s*=s3,V甲=5=max min aij 对乙而言,先想最坏,再想最好. 则d*=d3,V乙=5=min max aij (s3,d3)即为双方的最优策略,此时甲得5,乙失5。有 唯一最优策略。
则(x*,y*)-混合策略下的最优解
E(x*,y*)-混合策略下的最优值
二人有限零和对策的混合策略对策模型:
G*={S*,D*;E}
其中:S*={X=(x1,x2,…,xm)T ∑xi=1,xi≥0}
-甲的混合策略集
D*={y=(y1,y2,…,yn)T ∑yj=1,yj≥0}
-乙的混合策略集
E=E(X,Y)= ∑ ∑aijxiyj
甲选 max min aij si* j i 即理智局中人的选择 max aij d j* 乙选 min j i
2、纯策略对策的解
(1) 对策G的解和值:使得aij* ai* j* ai* j 的(si* , d j* )称为 G的解,si* 与d j* 分别是 甲,乙的最优纯策略,ai* j* 称为G的值,记为VG 。
11.2 二人有限零和对策的纯策略对策模型 二人:指参加对策的局中人有2个。
有限:指每个局中人的策略集为有限集。
零和:指在任一局势下,双方收益之和为0 。
一、纯策略对策模型-矩阵对策
设二人有限零和对策问题的局中人为甲和乙 S {s1,s2, D {d1,d 2, ,sm }为甲的策略集 ,d n }为乙的策略集
VG 3 ( si* , d j* ) ( s2 , d 2 )
8
例3
3
8
7
只有一个鞍点
0 2 2 -3 5 4 3 2 3 4 -4 -2
min max aij 2
j i
m下无解
在40年代发展迅速,缘于二战中军事的需 要,二战后又应用于其他领域。
50年代是对策论发展的鼎盛时期,纳什 和夏普利等提出了讨价还价模型和合作 对策的“核”的概念。 60年代,泽尔腾(1965)引入动态分析 ,提出“精练纳什均衡”概念。海萨尼 (1967-1968)则把不完全信息引入对策 论的研究。
(2)鞍点:若局势(si*,d j*)对应的 ai* j*=max min aij=min max aij
i j j i
则称(si*,d j*)为鞍点。
分析上例中的a33,它就满足ai3 a33 a3 j
定理1: G在纯策略中有解(si* , d j* )(si* , d j* )是鞍点
4 1 d1 3 d 1 1
s4
0 4 s3 2 s3 4
s1 2
s2
2 d1 d2 0 4
2 s3 0
j
(2)
i
A'
j
对于A' min max aij max min aij 2,即对策解是(s3 , d1)VG 2。
d1 10 12 6 y1
d2 -1 6 8 y2
d3 3 x1 7 x2 5 x3 y3
[案例1]企业建厂决策问题
某企业生产甲、乙两种家用电器.据预测, 若在某地建新厂则要投资100万元,每年可净收益 14万元.若将此款存入银行,则有2万元利 息.此外,还有以下信息可供决策者参考:
(1)在某地建新厂后,原厂房若不能售出,则 要维修,每年将花费3.2万元.因此,在某地建新 厂后的净收益只能是10.8万元.
-甲的期望收益 -乙的期望损失
二、混合策略对策的解 1、定义:如果混合策略对策
x y
G*={S*,D*;E}满足:
E (x* , y* ) max E (x, y ) min E (x, y ) 则称x , y 分别为局中人甲、乙的最优混合策略. (x , y )为对策G *的最优解。 VG * =E(x* ,y* )为对策G *的最优值。
4.对策的分类
动态:是连续时间的动态对策,因此从上一状态到
另一状态的转移用微分描述
对策 零和:得+失=0 二人: 静态: 非零和:得+失≠0 零和
结盟:多人在一起交换策略
多人 不结盟:多人在一起交换策略 和
非零和
零和 非零
二.对策问题的组成(几个基本要素) 1.局中人:一局对策的参加者。
2.策略:局中人在一局对策中对付对手的一个行动方 案。策略全体称为策论集。
i j
aij p( si ) p(d j )
i j
aij xi y j
i j
当甲取s1时,最少收益为:min{7x1y1,4x1y2}
当乙取d1时,最大损失为:max{7x1y1,3x2y1}
甲选 max min E ( X , Y ) xi* j i 即理智局中人的选择 max E(X,Y) y j* 乙选 min j i
6*
易知,G在纯策略意义下无解。
记 xi p( si ) 0 xi 1(i 1, 2) yi p(di ) 0 yi 1(i 1, 2)
d1 s1 7 s2 3 yj y1 d2 4 6 y2 xi x1 x2
x
i 1 2 i 1
2
i
1 1
y
i
E ( X , Y ) aij p( si , d j )
(2)据预测,今后10年中,乙产品的需求量 将下降5%(与进口无关).在此情况下,未被 吸收的固定管理费用为2.3万元,因此,建新
厂的净收益只能是11.7万元.
5
4
2
例4
6 1 8 0
5 6 5 5 -1 4 2 -1 5 7 5 5 2 6 2 0
VG 5 ( si* , d j* ) ( s1 , d 2 ), ( s1 , d 4 ), ( s3 , d 2 ), ( s3 , d 4 ) 鞍点不唯一,但值唯一。
2、定理:设G*=(S*,D*;E)为混合对策,则
* * * *
E( x, y ) E( x , y ) E( x , y)
* * * *
例6: 求解下列对策
1 -1 A 2 0 1 -1 2 0 0 4 2 4 3 0 2 1 0 4 2 4 3 0 2 1 4 1 3 1 1 d3 -1 d4 2 0
i 1,
,m
j 1,
相关文档
最新文档