第十一章 对策论
对策论概述

对策论对策论是对决策者之间的行为的相互影响的研究。
因为对对策论的研究特别强调决策者行为的理性,在过去的二十年间,对策论已被广泛地应用于经济学中。
确实大多数经济行为能够被看成是对策论的一个特殊的情形。
5.1 对策的描述一个对策是对许多决策者的行为的相互影响的正式的表示。
行为的相互影响意思是每一个人的福利不仅依赖她自己的行为而且依赖其他人的行为。
而且她可能采取的最好的行为依赖于她对其他人的行为的预期。
要想完整地描述一个对策,我们必须知道以下四件事情:(1)局中人:有那些人卷入该对策?(2)规则:谁什么时候行动?当他们行动时他们知道什么?他们能干什么?(3)结果:对于局中人的每一组行为,对策的结果是什么?(4)报酬:局中人关于各种可能的结果的偏好(也即效用函数)是什么?例子5.1.1:配对的便士(A)局中人:这里有两个局中人,分别记为1和2。
规则:两个局中人同时抛下一个便士,要么正面向上要么反面向上。
结果:如果两个便士是配对的(要么两个正面向上要么两个反面向上),那么局中人1付一元钱给局中人2;否则,局中人2付一元钱给局中人1。
报酬:每个局中人的报酬简单地等于她得到的或失去的钱的数量。
一般地,这里有两种方法描述一个对策:策略(规范)形式的表示和扩展形式的表示。
5.1.1 一个对策的策略(规范)形式表示假设这里有有限个局中人,局中人的集合为},,2,1{I 。
每一个局中人i ∈},,2,1{I 有一个策略集,记为i S 。
在一个-I 人对策中,局中人的策略组合用一个向量表示为},,{1I s s s =,这里i s 是局中人i 的策略选择。
有时我们也把策略组合s 表示成),(i i s s -,这里i s -是除了局中人i 以外的)1(-I 个局中人的策略组合。
对于每一个策略组合},,{1I s s s =,局中人i 的效用函数为),,(1I i s s u 。
一个-I 人对策的规范形式的表示记为)}]({},{,[⋅=Γi i N u S I 。
《博弈论和对策行为》

纳什均衡
博弈论和对策行为
定义1: 给定其它局中人的策略s,局中人i的最优反应 记为s,是指能给他带来最大收益的策略,即
u i(s i* ,s i) u i(s i',s i) s i' s i*
当每个局中人都选择了自己的最优反应策略,并 且这些最优反应形成一个策略组合,便形成了纳什均 衡。
一.局中人(players): 二.策略(strategies):
即指每个局中人在对策中可以选择采用的行动方 案,但这个方案必须是一个完整的行动,而不是行动 的某一步。每个局中人均有可供选择的多种策略。
.
基本概念
博弈论和对策行为
在策略型博奕中,一个对策有以下几种基本要素:
一.局中人(players): 二.策略(strategies):
.
概论
博弈论和对策行为
对策思想明确地应用于经济领域,始于Cournot (1838), Bertrand (1883), Edgeworth (1925)等人关于寡 头竞争、产量与价格垄断、产品交易行为的研究。
然而,作为一门学科的创立,则是以美国数学 家冯.诺依曼(John Von Neumann)和经济学家奥斯卡. 摩根斯坦(Oskar Morgenstern)合著的《博奕论与经济 行为》(The Game Theory and Economic Behavior) (1944)一书出版为标志,他们奠定和形成了这门学科 的理论与方法论基础。
.
博弈论和对策行为
囚徒困境在经济学上的应用
让我们再回到囚徒困境本身。纳什均衡(坦白,坦白)表明两 人共同的集体选择,但是这个选择是否是理性的?理性选择 是指使收益最大化的选择。如果两人都抵赖,各判刑1年,显 然比坦白各判刑8年好。所以,纳什均衡(坦白,坦白)并不是 一个集体理性选择。但它却是个人理性选择的一个组合。囚 徒困境正是反映了一个深刻的问题,这就是个人理性与集体 理性的矛盾。
引论第二矩阵对策第三矩阵对策的求解

5.矩阵对策解的性质
*
性质5:设一矩阵对策G={S1,S2,A} ,若在S1(或、和S2)中出现被优超的策略,那么去掉被优超的策略所形成的新的矩阵对策与原矩阵对策同解。
A =
4 0 2 3 -2 -2 1 4 -4 3 7 3 8 4 5 4 6 5 6 6 5 2 7 4 3
02
田忌:上、 中、 下
2.对策行为的基本要素
*
3.对策行为的基本假设
*
对策行为总是假定每一个局中人都是“理智的”决策者,不存在利用其他局中人的决策失误来扩大自身利益的可能性或相反。
4.对策行为的分类
*
对策
动态对策
静态对策
结盟对策
不结盟对策
联合对策
合作对策
无限对策
有限对策
二人
多人
零 和
A =
-4 2 -6 -6 4 3 5 3 8 -1 -10 -10 -3 0 6 -3
Min
Max 3
局中人甲应选择2 ,此时不管局中人乙采取什么策略,甲的赢得均不小于3。
3
6
5
4
3.矩阵对策的混合策略
*
2
4.矩阵对策的基本定理
*
定理1:设矩阵对策G={S1,S2,A}在策略意义下有解的充分必要条件是存在着局势( i* ,j* )使得对于一切i与j都有aij* ai*j* ai*j成立。 定理2:对策矩阵G={S1,S2,A}在混合策略意义下有解的充分必要条件是存在着 x * S1* , y * S2*使(x *,y *) 为E (x,y) 的一个鞍点,即对于一切x S1* , y S2* 有 E (x,y *) E (x *,y *) E (x *,y)
运筹学复习要点

运筹学复习要点运筹学复习要点第二章线性规划与单纯形法一、标准型:规定具有下述条件的线性规划问题为标准型式的线性规划问题:1、目标函数为求最大;2、约束条件为等式约束;3、决策变量为非负。
二、线性规划问题具有的特征:1、每一问题都用一组决策变量(x1, x2, . . . ,xn)表示某一方案;2这组决策变量的值就代表一个具体方案,一般这些变量值是非负的;3、存在一定的约束条件,它们可用线性等式或不等式表示;4、都有一个要求达到的目标,它们可用决策变量的线性函数表示,称目标函数。
根据问题不同,要求目标函数实现最大化或最小化。
三、图解法的结论:1、可行域一定是凸集,即该区域内任意两点间连线上的点仍在该区域内;2、线性规划最优解不可能在凸集内的点上实现;3、线性规划问题有可能存在无穷多最优解;4、如果可行域无界,则最优解可能是无界解;5、如果不存在可行域,则没有可行解,也一定不存在最优解;6图解法只适用于两个决策变量的情况。
四、单纯形法:其基本思路是首先确定一个初始基可行解,然后判断该基可行解是否为最优解。
如果是最优解,则求解过程结束;如果不是最优解,则在此基础上变换找出另一个基可行解,该基可行解的目标函数值应该优于原基可行解。
再判断新的基可行解是否为最优解,如果是最优解,则求解过程结束;如果不是最优解,则在此基础上变换再找出另一个新基可行解,如此进行下去,直到找到最优解为止。
五、最优性检验与解的形式:最优解的判别定理,若X(0) = (b′1, b′2, ……… ,b′m, 0, …… , 0)T为对应于基B的一个基可行解,且对于一切j = m + 1, …… , n,有σj6 0,则X(0)为最优解,称σj为检验数。
无穷最多解判别定理,若X(0) = (b′1, b′2, …… , b′m, 0, …… , 0)T为对应于基B的一个基可行解,且对于一切j = m + 1, …… , n,有σj6 0,又存在某个非基变量的检验数σm+k= 0,则线性规划问题有无穷多最优解。
运筹学教材习题答案详解

B1:2.0
3
需要量(套)
200
150
问怎样下料使得(1)用料最少;(2)余料最少.
【解】第一步:求下料方案,见下表。
方案
一
二
三
四
五
六
七
八
九
十
十一
十二
十三
十四
需要量
B1:2.7m
2
1
1
1
0
0
0
0
0
0
0
0
0
0
300
B2:2m
0
1
0
0
3
2
2
1
1
1
0
0
0
0
450
A1:1.7m
0
0
1
0
0
1
0
2
1
0
3
2
1
0
(2)
【解】最优解X=(3/4,7/2);最优值Z=-45/4
(3)
【解】最优解X=(4,1);最优值Z=-10
(4)
【解】最优解X=(3/2,1/4);最优值Z=7/4
(5) 【解】最优解X=(3,0);最优值Z=3
(6)
【解】无界解。
(7)
【解】无可行解。
(8)
【解】最优解X=(2,4);最优值Z=13
【解】设x1、x2、x3分别为产品A、B、C的产量,则数学模型为
1.3建筑公司需要用6m长的塑钢材料制作A、B两种型号的窗架.两种窗架所需材料规格及数量如表1-23所示:
表1-23窗架所需材料规格及数量
型号A
型号B
每套窗架需要材料
长度(m)
对策论

在日常生活中,经常可以看到一些具有相互斗 争或竞争性质的行为,
如下棋、打牌、体育比赛等 还有企业间的竞争、军队或国家间的战争、政治斗 争等,都具有对抗的性质。
这种具有竞争或对抗性质的行为称为对策行为。
在这类行为中,各方具有不同的目标和利益。为实 现自己的目标和利益,各方必须考虑对手可能采取 的行动方案,并力图选择对自己最为有利或最为合 理的行动方案。
在田忌赛马中
局中人集合I={1,2}
齐王和田忌的策略集合可分别用S1={α1,…,α6}, S2={β1,…,β6}
齐王的任一策略αi和田忌的任一策略βj就构成了一个 局势sij
如果α1 =(上,中,下), β1 =(上,中,下), 则在局势s11下,齐王的赢得为H1(s11)=3,田忌的赢 得为H2(s11)=-3
6 1 8 3 2 4 A 9 1 10 3 0 6
局中人Ⅰ当然也会猜到局中人Ⅱ的这种心理,转而出α4来对 付,使局中人Ⅱ得不到10,反而失掉6; …… 如果双方都不想冒险,都不存在侥幸心理,而是考虑到对方 必然会设法使自己所得最少这一点,就应该从各自可能出现 的最不利情形中选择一个最有利的情形作为决策一句。 这就是所谓的“理智行为”,也是对策双方实际上可以接收 并采取的一种稳妥的方法。
对策问题举例:市场购买力争夺问题
据预测,某乡镇下一年的饮食品购买力将有4000万元。乡镇企 业和中心城市企业饮食品的生产情况是:乡镇企业有特色饮食品 和一般饮食品两类,中心城市企业有高档饮食品和低档饮食品两 类产品。他们购买这一部分购买力的结局表如下。
乡镇企业所得(万元)
乡镇企业 的策略 出售特色饮食品
即局中人Ⅰ、Ⅱ的策略集分别为
《犯罪学》教学大纲(1)

天津广播电视大学开放教育法学专业《犯罪学》课程教学大纲第一部分大纲说明一、教学目的与要求通过犯罪学的学习,可以使学员掌握中国犯罪演变的历史,掌握我国各时期犯罪态势的变化和新型犯罪的发展变化,并且剖析其产生原因和治理对策,然后诉诸刑事政策与立法的修订。
尤其是在我国,治理犯罪的途径与手段,也决不仅止于刑罚,而是延伸到德法兼治的所有领域;可以说,整个社会都是运用犯罪学研究成果的舞台,对社会治安实行富于中国特色的综合治理也正基于此。
二、课内学时分配犯罪学课程3学分。
一个学期的课程。
课内学时54学时。
第二部分教学资源的配置和使用一、主要的教学资源(一)文字教材文字主教材为《犯罪学》,刘文成主编,群众出版社出版,它是教学与考试的主要依据。
同时还配置文字辅助教材。
(二)录音录象教材为适应远程开放教育的要求,满足自学需要,天津电大制作了《犯罪学》网络课程。
二、教学环节(一)自学自学是重要的学习方式,依据教学大纲的要求,保证足够的时间在听课基础上,全面系统认真阅读教材和指定参考书。
(二)面授辅导面授辅导是教学的重要方式,辅导教师要全面系统掌握教学大纲和教科书,通过讲解、辅导、答疑、组织讨论等方式帮助学生深入理解教材内容。
辅导课学习,以不少于课程内容时数的三分之一为宜。
(三)考试要求考核学生全面系统掌握教材内容的基础上,着重掌握重点、难点及运用所学基础理论分析我国各时期犯罪态势的变化和新型犯罪的发展变化,并且剖析其产生原因和治理对策,然后诉诸刑事政策与立法的修订。
题量适当并且难易搭配。
按照不同层次大致可分为:有一定难度的试题占总数的25%,中等难度的试题占总数的50%,比较容易的试题占总数的25%。
考试题型。
在一份试卷中,包括客观性试题,如填空、单项选择、多项选择;主观性试题,如名词解释、简答题、论述题,共六种题型。
根据本课程的特点,试题应引导学生掌握课程的基本内容,并重视提高理解与运用能力。
试题兼顾各种犯罪类型;兼顾主观性试题和客观性试题。
运筹学-对策论

3.矩阵对策的混合策略
例:设一个赢得矩阵如下:
5 A = 8 max 8 6 9 6 min
j
9
min 5 max
i
6 策略α2
8 策略β1
• 思路:对甲(乙)给出一个选取不同策 略的概率分布,以使甲(乙)在各种情 况下的平均赢得(损失)最多(最少)。 -----即混合策略
重要定理
定理 任一矩阵对策G {S1,S2;A}, 任一矩阵对策G={S1,S2;A},一定存在混 合策略意义下的解。 合策略意义下的解。 • 定理 设有两个矩阵对策 • G1= G2= G1={S1,S2;A1} G2={S1,S2;A2} • 其中A1=(aij),A2=(aij+L),L为任一常数。 A1= 其中A1 (aij),A2=(aij+L), 为任一常数。 则 • (1)G1 G2同解 G1与 同解; (1)G1与G2同解; • (2)VG2 VG2= (2)VG2=VG1+L
7.4 矩阵对策的解法
• (1) 2×2矩阵对策的线性方程组法 2× • 所谓2 所谓2×2矩阵对策是指局中人Ⅰ的赢得矩阵为2×2阶的,即 矩阵对策是指局中人Ⅰ的赢得矩阵为2 是指局中人 阶的, A = a11 a12 • a21 a22 • 如果此对策有纯策略意义下的解,则很容易求解; 如果此对策有纯策略意义下的解,则很容易求解;如果没有 纯策略意义下的解, 纯策略意义下的解,则为求出各局中人的最优混合策略可求解下 列方程组: 列方程组: • a11x1+a21x2= a11y1+a12y2= a11x1+a21x2=v a11y1+a12y2=v • a12x1+a22x2= a21y1+a22y2= a12x1+a22x2=v a21y1+a22y2=v • y1+y2= x1+x2= y1+y2=1 x1+x2=1 • 当没有纯策略意义下的解时,方程组一定有严格非负解 x*= 当没有纯策略意义下的解时, x1* x2* y*=(y1*,y2*), (x1*,x2*)和y*=(y1*,y2*), 即为各局中人的最优混合策 略。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1=(上,中,下) 赢得函数: H1(s11)=3 H2(s11)=-3 。
5
结 盟 对 策
三、 对 策 的 分 类
静 态 对 策 对 策
两 人 对 策 有 限 对 策
零和对策
√
非零和对策
不 结 盟 对 策
多 人 对 策
动 态 对 策
无 限 对 策
6
第二节 矩阵对策
一、矩阵对策定义:
也称为二人有限零和对策,指对策中只 有两个局中人,每个局中人都只有有限 个策略,并且对每一个局势,两个局中 人的赢得之和总是等于零,即一个局中 人的赢得恰是另一局中人的损失。
12
2.对策目标
矩阵对策给定后,每个局中人面临的问题:如 何选取对自己最为有利的策略以谋取最大的赢 得(或最少损失)。
例3 设有一矩阵对策G={S1,S2;A},其中 S1={1,2,3,4},S2 ={1,2,3},
- 6 3 A 9 - 3
1 2 -1 0
16
最少赢得中最 好结果为2,局 中人I以2为选 择对策。
局中人I与II的对策过程(II的对策)
S2 S1 1 2 3 4 选择1时的 最少赢得 1 -6 3 9 -3 选择2时的 最少赢得 2 1 2 -1 0 3 -8 4 -10 6
选择3时的 最少赢得
17
局中人I与II的对策过程(II的对策)
*
27
1.混合策略和混合局势
对G ( S1 , S 2 ; A), 记S1 {1 , 2 ,..., m }, S 2 {1 , 2 ,..., n }, A (aij ) mn 局中人I的策略集 : S {x E | xi 0, i 1,2,..., m, xi 1}
a21,a23
22
6.矩阵对策的性质
无差别性:
ai1 j1 ai2 j 2
若 ( i1 , j1 )和( i2 , j 2 )是对策G的两个解, 则
可交换性
若 ( i1 , j1 )和( i2 , j 2 )是对策G的两个解, 则 ( i1 , j 2 )和( i2 , j1 )也是解。
7
二、矩阵对策的基本理论
1.矩阵对策的数学模型
局中人:两个; 策略:有限;赢得之和: 为零。 有关概念
局中人I: 纯策略m个,
(1 , 2 ,..., m ) S1
其策略集合是 其策略集合是
( 1 , 2 ,..., n ) S2 ( i , j ) 共有mxn个纯局势。 纯局势:
3.赢得函数(支付函数)
局势: 每一个局中人从各自的策略集 中所选定的一个策略形成的策略组。 S=(S1,S2,…,Sn) 赢得函数:局中人的得失是局势的函 数,这个函数称为赢得函数。 Hi(s) -- 第i个局中人 例
4
例1 齐王赛马:
局中人:
例1 齐王赛马:
局中人集合I={1,2}
局中人I的赢得矩阵(局中人II的支付矩阵)
矩阵对策记为: G={I,II;S1,S2;A} G=(S1,S2;A}
9
例1:
齐王赛马中齐王的赢得表
1 上 中 下 3 1 1 -1 1 1 2 上 下 中 1 3 -1 1 1 1 3 中 上 下 1 1 3 1 -1 1 4 中 下 上 1 1 1 3 1 -1 5 下 中 上 1 -1 1 1 3 1 6 下 上 中 -1 1 1 1 1 3
20
5.定理:
矩阵对策G={S1,S2;A}在纯策略意义下有 解的充分必要条件是存在纯局势 (i , j ) 使得 aij* ai * j * ai * j i=1,2,…,m,j=1,2,…,n 矩阵对策G有纯策略解的充分必要条件是 G有鞍点。 定理的直观解释及对策意义:
* *
* 1 m i 1 m
局中人II的策略集 : S { y E | y j 0, j 1,2,..., n, y j 1}
* 2 n n j 1
x S , y S 称为I和II的混合策略.
* 1 * 2
( x, y ) 混合局势
28
2.混合扩充
* x S1* , y S 2 称为I和II的混合策略.
* *
*
21
例5:
1 2 2 -3
2 3 6 8
3 2 2 1
4 5 4 4
行最小
1 2 3
4 0 1 -5 3 列最大 2 8 2 5 ∴ max min aij= min max aij =2 = a11,a13 ,
i j j I
2 2 -3 -5
该最优策略为(1, 1), (1, 3), (2, 1), (2, 3)。
11
思考题
例2 甲、乙两名儿 童玩游戏,双方可分别 出拳头(代表石头), 手掌(代表布),两个 手指(代表剪刀),规 则是:剪刀赢布,布赢 石头,石头赢剪刀,赢 者得1分。若双方所出 相同,为和局,均不得 分,试列出儿童甲的赢 得矩阵。
石头 布 剪刀 石头 0 1 1 布 1 0 1 剪刀 1 1 0
策略集: 齐王 S1={1, 2 ,…, 6} 田忌 S2={1, 2 ,…, 6} 齐王的任一策略i与田忌的任 一策略i决定了一个局势Sij。 若 1=(上,中,下)
齐王与田忌
策略:
各有六个策略: 1.(上,中,下) 2.(上,下,中) 3.(中,上,下) 4.(中,下,上) 5.(下,中,上) 6.(下,上,中)
一个平衡局势 ( i , j ) 应具有这样的性质,当局 中人Ⅰ选取了纯策略 i* 后,局中人Ⅱ只能选取纯 略 j * ,否则就可能失得更多;反之,当局中人 Ⅱ 选取了纯策略 j 后,局中人Ⅰ只能选取纯略 i* , ( 否则就可能赢得更多。双方的竞争在局势 i* , j * j i v2 min max aij
j i
当v1 v2时, G存在纯策略意义下的解.
一般情形中更多的是 v1 < v2,对策不存在纯 策略意义下的解。例:赢得矩阵为 例6: v1 max min aij 7, i * 1
9 A 2
j i 7 v2 min max aij 8, j * 2 j i 8
S2 1 -6 3 9 -3 2 1 2 -1 0 3 -8 4 -10 6
局中人I与II的对策过程
S1 1 2 3 4
选择1时的最少赢得 选择2时的最少赢得
选择3时的最少赢得 选择4时的最少赢得
15
局中人I与II的对策过程(I的对策)
S2 S1 1 2 3 4 1 -6 3 9 -3 2 1 2 -1 0 3 -8 4 -10 6
v2 8 7 v1
25
混合策略
局中人I和II不存在一个双方均可接受的平衡 局势,矩阵对策 G 不存在纯策略意义下的解。 实际的想法是:在上述双方都不能固定采用任 何一个纯策略下,必须随机地选取自己的各个 纯策略,使双方捉摸不到自己使用的策略。可 否给出一个选取不同策略的概率分布,以求得 自己的期望赢得最大(或期望损失最小)。
i 局中人I的最优策略, j 局中人II的最优策略
* *
例4:
4 -3 A 6 7
-4 -4 7 3
-5 -9 -8 -9
6 由例4, 有 a a a , 1j - 2 i3 i* j * - 9 i 1,2,3,4; 5 j 1,2,3,4.
8
局中人II: 纯策略n个,
aij -- 局中人I在纯局势(αi, βj)下的赢得,则:
a11, a12 ,..., a1n a21, a22 ,..., a2 n A ............. a , a ,..., a mn m1 m 2
3 1 这就是说,局中人Ⅰ分别以概率 X ( , ) 选用 1, 2 4 4 1 1 7 * 时,至少赢得 7 ,同理,局中人Ⅱ分别以概率 Y ( , ) 选 4 8 8 1 3 1 1 7 * * 用策略 1, 2, 至多损失 7 。 但当 X ( , ) 或 Y ( , ) 时, 4 4 4 8 8 则会受到更大的损失。
-8 4 - 10 6
13
局中人I与II的对策过程
S2 S1 1 2 3 4
1 3
MAXαij?
3
2 -8
1 -6 3 9 -3
2 1 2 -1 0
4 -10 6
14
3.对策原则
双方都是理智行为,考虑到对方必然会使自己 所得最少,应从各自出现的最不利的情形中选 择一种最为有利的情形。
若局中人1以概率x选用1,以概率1-x选 用2;局中人2以概率y选1,以概率1-y 选2,则局中人1的期望赢得为:
26
9 7 y E ( X , Y ) ( x,1 x) 1 y 2 8
=8xy-6y-x+8 3 1 1 8( x )( y ) 7 4 8 4
S2 S1 1 2 3 4 1 -6 3 9 -3 2 1 2 -1 0 3 -8 4 -10 6
最少赢得中最好结果为2, 局中人II以2为选择对策。
18
局中人I与II的对策过程
S2 S1
1
1
2 1 2 -1 0
3 -8 4 -10 6
最优纯策略(2,2)-6
2 3 4
2
2.对策论: