第五章-对策论 - 360文档中心

《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法，主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统，不考虑时间变化和过程发展，只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境，如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述对策模型对策论的基本概念对策分析方法对策论的应用实例对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论，也称为博弈论，是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡，通过数学模型和逻辑推理来描述和分析竞争行为，尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择，例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下，企业间可能通过对策论的方法找到合作的可能性，例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面，对策论可以帮助理解个体和团队的行为反应，优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中，参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划，它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中，参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中，如果一个参与者的某个策略能够使其获得比其他参与者更好的结果，则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。

对策论概述

对策论对策论是对决策者之间的行为的相互影响的研究。

因为对对策论的研究特别强调决策者行为的理性，在过去的二十年间，对策论已被广泛地应用于经济学中。

确实大多数经济行为能够被看成是对策论的一个特殊的情形。

5.1 对策的描述一个对策是对许多决策者的行为的相互影响的正式的表示。

行为的相互影响意思是每一个人的福利不仅依赖她自己的行为而且依赖其他人的行为。

而且她可能采取的最好的行为依赖于她对其他人的行为的预期。

要想完整地描述一个对策，我们必须知道以下四件事情：（1）局中人：有那些人卷入该对策？（2）规则：谁什么时候行动？当他们行动时他们知道什么？他们能干什么？（3）结果：对于局中人的每一组行为，对策的结果是什么？（4）报酬：局中人关于各种可能的结果的偏好（也即效用函数）是什么？例子5.1.1：配对的便士(A)局中人：这里有两个局中人，分别记为1和2。

规则：两个局中人同时抛下一个便士，要么正面向上要么反面向上。

结果：如果两个便士是配对的（要么两个正面向上要么两个反面向上），那么局中人1付一元钱给局中人2；否则，局中人2付一元钱给局中人1。

报酬：每个局中人的报酬简单地等于她得到的或失去的钱的数量。

一般地，这里有两种方法描述一个对策：策略（规范）形式的表示和扩展形式的表示。

5.1.1 一个对策的策略（规范）形式表示假设这里有有限个局中人，局中人的集合为},,2,1{I 。

每一个局中人i ∈},,2,1{I 有一个策略集，记为i S 。

在一个-I 人对策中，局中人的策略组合用一个向量表示为},,{1I s s s =，这里i s 是局中人i 的策略选择。

有时我们也把策略组合s 表示成),(i i s s -，这里i s -是除了局中人i 以外的)1(-I 个局中人的策略组合。

对于每一个策略组合},,{1I s s s =，局中人i 的效用函数为),,(1I i s s u 。

一个-I 人对策的规范形式的表示记为)}]({},{,[⋅=Γi i N u S I 。

对策论(Theory of Games)

定义
并不是所有的对策都存在鞍点，如 A为齐王的赢得矩阵 3 1 1 1 1 -1 1 3 1 1 -1 1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 -1 1 3 1 1 1 1 -1 1 3 max(min aij)= -1 min (max aij)=3 i j j i
例如：
• 给定矩阵对策
6 5 6 A 1 4 2 8 5 7
对策的最优值为5，对策的解有两个，分别为局势 , 和 , 。
1 2 3 2
(三)矩阵对策的混合策略
1、矩阵对策的混合策略的定义
2、原则：坏中求好的原则。 3、解的存在：一定有解 4、混合策略求解：利用期望转化成线性规划问题求解。
三、矩阵对策模型
（一）矩阵对策的概念（二）矩阵对策的最优纯策略（三）矩阵对策的混合策略（四）矩阵对策的解法
（一）矩阵对策的概念 1、矩阵对策的定义 2、建立矩阵对策模型
1、矩阵对策的定义局中人只有两个，对策中各方只能从有限的策略集中确定性的选择一种，且对策双方的支付之和为零的对策称为两人零和纯策略对策。
表2
齐王上中下田忌上中下 3 上下中上中下 1 1 中下上 -1 下中上 1 下上中 1
上下中 1 中上下 1
中下上 1 下中上 1
3 1
1 -1
-1 3
1 1
1 1
3 1
1 -1
1 3
1 1
-1 1
下上中 -1
1
1
1
1
3
引例3
有两个儿童A和B在一起玩“石头-剪子布”游戏。我们规定胜者得1分，负者得 -1分，平手时各得0分。双方选定的各种出法及相应的结果可由下表列出。双方应取何种策略？

对策论

例 1：
甲、乙两名儿童玩猜拳游戏。游戏中双方可分别出拳头（代表石头）、手掌（代表布），两个手指（代表剪刀）。规则是剪刀赢布，布赢石头，石头赢剪刀，赢者得一分。若双方所出相同，算和局，均不得分。试列出游戏中儿童甲的赢得矩阵。
儿童甲的赢得矩阵：
乙甲石头布剪刀石头 0 1 -1 布 -1 0 1 剪刀 1 -1 0
在矩阵对策模型中，赢得矩阵每一行代表了局中人甲的一个策略，每一列代表了局中人乙的一个策略；行的数目表示了甲的策略集的策略数目，列的数目表示了乙的策略集的策略数目；赢得矩阵的第i行第j列的数值表示了甲出第i个策略，乙出第j个策略时，所得的损益值（所得的损益值应为该数的相反数．）
例：甲乙乒乓球队进行团体对抗赛，每队由三名球员组成，双方都可排成三种不同的阵容，每一种阵容可以看作一
★各局中人使用一定的对策形成一个局势时，一个局势就决定了各局中人的对策的结果也称为对策的损益值。 ★一般而然，当以上三个基本因素确定后一个对策模型也就确定了。 ★在众多对策模型中，占有重要地位的是二人有限零和对策。
二人有限零和对策（two-person zero score game）对策中存在有2个局中人；每个局中人的策略集的策略数是有限的；每一局势的对策都有确定的损益值，且对同一局势的两个局中人的损益值之和为零。例：齐王赛马
（上中下）（上下中）（中上下）（中下上）（下上中）（下中上）
其中：齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }，田忌的策略集：S2={ 1, 2, 3, 4, 5, 6 }。下面矩阵称齐王的赢得矩阵： 3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3

对策论

对策论----第一次精英团讲座这一次讲座，非常的成功。

内容恰当、充足，准备充分，讲述的也比较流畅，讨论比较激烈，每个人都能融入其中。

对于我们第一次讲座来说，可以说非常的成功。

好话不多说，下面我将自己对这堂课的理解拿出来分享给大家：1.如何理解对策论？（概念不予重复）1）参与决策的局中人都是足够聪明（就是你能想到的其他人也可以想到，并且各方都是绞尽脑汁的）2）局中人都是理性的（关于这个问题大家一直有着矛盾，我认为此处有理性是比较抽想的说法，可以理解为每个人都只想取胜，这里的取胜是指达到他的目的）3）对策轮中，不是哪一个人努力了就可以达到他想取得的胜利的，而是局中各方最后达成一致的结果，也就是一个稳定性的结果。

（这一点很重要，也是的研究对策论有了实际意义：就是求解这个默契的、稳定的结果）2．零和对策1）零和对策可以理解包含三个必要条件或者说是标准：1）两个人2）两人可选择的决策是有限的3)每局中对于双方来说总有一个和胜一个负（彼此的竞争是激烈的）2）零和对策中的S，代表一个n（n是人数）维矩阵（这里两个人就是简单的二维矩阵），这里可以理解为，1一个人有3种方法，第二个人有4种方法，那么对于第一个人的每一种方法都会有4种，这样决策的组合就可以记为：3⨯4的二维矩阵，如果再有第三个人（5种决策法）的话，这样对于任何一个第一个人和第二个人的组合都有5种方法，这样就又形成了一个3⨯4⨯5的三维矩阵，依次类推。

决策数的个数我就不用再说啦吧。

3）零和对策有个表示法不知道大家注意到没有：含义不多说啦，个人感觉这代表一种表示理念吧。

3.简单零和决策1）简单零和就是可以在零和矩阵中找到一个这个要求解的稳定点。

2）鞍点的求解方法是：按行来，每行取个最小的，在选择其中最大的；按列来，每列选择最大的，在选择其中最小的。

（应该是挺好理解的，个人感觉这里对于按点的性质就不用再记了，反正证明不出来，也记不住，记得这个方法就好了）4．复杂零和对策1）就是上面按行、按列方法求解到的鞍点不统一。

对策论应用示例

对策论应用示例对策理论（Game Theory）现在广泛应用于军事、经济等领域。

对策论的主要分类大致如下：§1 对策论应用举例例1 齐王与田忌赛马（孙膑对策）传说齐威王与大臣田忌赛马，每人都以上等马、中等马、下等马比赛，三局两胜制，胜者得1千金。

齐王的同等马优于田忌的同等马，田忌总输。

后来军事家孙膑为田忌出主意：田忌用上等马赢齐王的中等马、用中等马赢齐王的下等马，最后以下等马输给齐王一局，这样田忌就以总分3：2获胜。

对局图如下：齐王的马田忌的马上等马上等马中等马中等马下等马下等马在这个对策中，双方对于对方的情况十分熟悉，事先也知道比赛规则，这在对策论中叫做双方全信息的对策。

另外，在这个对策中，一方用计谋和策略，另一方不用，这不是现代意义下的对策。

现代意义下的对策，对局双方都用计谋和策略，并且双方都选择对自己有利的策略，这在对策论中叫理智的局中人（经济对策中叫理性的消费者）。

例2 1943年2月，由于战争的失败，日本舰队打算从新不列颠岛撤退到伊里安岛（如图）。

美国西南太平洋空军奉命轰炸这支日本舰队。

北日本舰队的可能撤退航线有两条：南线与北线，航程都是3天。

气象预报：未来3天，北线阴雨、南线晴天。

日本人应该选择哪一条撤退航线呢？美军的选择是重点搜索的方向：（1）非重点搜索：派少量搜索飞机，发现目标后派大量飞机轰炸；（2）重点搜索：派大量搜索飞机，发现目标后再派大量飞机轰炸。

根据气象预报，未来3天，北线阴雨，能见度很差，不利于侦察飞机巡航侦察（二战时，主要依靠飞行员目测侦察）；南线晴天，能见度好，有利于侦察机巡航侦察。

美军应该把搜索重点放在北边还是南边呢？表中第一行第一列的-2/3表示：日方若选择北线撤退，美军的重点搜索方向也在北线，日本舰队在3天中大约能安全行走一天，然后被美军侦察机发现，招来大批轰炸机，在未来2天被轰炸。

下面讨论双方应该选择的较好的策略。

日本方面：北边的损失向量（-2/3，-1/3）≥南边的损失向量（-2/3，-3/3），表示北线损失比南线小，日方司令官若是理智的决策者就应选北线作为航线。

运筹学-对策论

3.矩阵对策的混合策略
例：设一个赢得矩阵如下:
5 A = 8 max 8 6 9 6 min
j
9
min 5 max
i
6 策略α2
8 策略β1
• 思路：对甲（乙）给出一个选取不同策略的概率分布，以使甲（乙）在各种情况下的平均赢得（损失）最多（最少）。 -----即混合策略
重要定理
定理任一矩阵对策G {S1,S2;A}，任一矩阵对策G＝{S1,S2;A}，一定存在混合策略意义下的解。合策略意义下的解。 • 定理设有两个矩阵对策 • G1＝ G2＝ G1＝{S1,S2;A1} G2＝{S1,S2;A2} • 其中A1＝(aij)，A2＝(aij+L)，L为任一常数。 A1＝其中A1 (aij)，A2＝(aij+L)，为任一常数。则 • (1)G1 G2同解 G1与同解； (1)G1与G2同解； • (2)VG2 VG2＝ (2)VG2＝VG1+L
7.4 矩阵对策的解法
• (1) 2×2矩阵对策的线性方程组法 2× • 所谓2 所谓2×2矩阵对策是指局中人Ⅰ的赢得矩阵为2×2阶的，即矩阵对策是指局中人Ⅰ的赢得矩阵为2 是指局中人阶的， A = a11 a12 • a21 a22 • 如果此对策有纯策略意义下的解，则很容易求解；如果此对策有纯策略意义下的解，则很容易求解；如果没有纯策略意义下的解，纯策略意义下的解，则为求出各局中人的最优混合策略可求解下列方程组：列方程组： • a11x1＋a21x2＝ a11y1＋a12y2＝ a11x1＋a21x2＝v a11y1＋a12y2＝v • a12x1＋a22x2＝ a21y1＋a22y2＝ a12x1＋a22x2＝v a21y1＋a22y2＝v • y1＋y2＝ x1＋x2＝ y1＋y2＝1 x1＋x2＝1 • 当没有纯策略意义下的解时，方程组一定有严格非负解 x*= 当没有纯策略意义下的解时， x1* x2* y*=（y1*，y2*），（x1*，x2*）和y*=（y1*，y2*），即为各局中人的最优混合策略。

对策论

第一节：概述一、对策现象对策是决策者在竞争（对抗）条件下做出的，关于行动方案的决定，或者说，是在竞争（对抗）条件下的决策。

对策论是研究对策现象并寻求致胜策略的一门科学，是运筹学的一个重要分枝。

早在战国时期，就有一个齐王、田忌赛马的故事如出三匹马，三场比赛，输一场就输千金在现代的企业经营管理中，竞争（对抗）更加激烈，更加复杂，不过从上例，可见在竞争（对抗）中，如何寻求致胜策略是大可研究的。

二、对策现象的三要素1、局中人：齐王一方，田忌（孙膑）一方；桥牌：东、南、西、北三国：刘、孙、曹2、策略：局中人的可行的、自始自终通盘筹划的行动方案称策略：如：是三个不同的策略，策略的全体，称为策略集合。

3、一局对策的得失上下中中中上下上下从每个局中人的策略集合中采取一个策略组成的策略组，称作局势。

得失是局势的函数。

如果在任一局势中，全体局中人的“得失”相加总是等于0时，这个对策就称为“零和对策”，否则就称为“非零和对策”。

对策的分类：一、矩阵对策矩阵对策就是二人有限零和对策。

它是指这样一类对抗和争斗现象。

1、局中人：二人；2、每个局中人都仅有有限个可供选择的策略；3、在任何一局势中，两个局中人的得失之和恒为零，即局中人甲的所得，总是局中人乙的所失。

这类对策比较简单，在理论上也比较成熟。

而且这些理论奠定了研究“对策现象”的基本思路。

矩阵对策是对策论的基础。

矩阵对策：有鞍点，无鞍点二、数学模型a 2 a 21 A 2 … a 2n … … … … …a ma m1a m2…a mn其中a ij 为当甲出策略a i ，乙出策略βj 时，甲的赢得或支付； -a ij 为当甲出策略a i ，乙出策略βj 时，乙的赢得或支付；因为A=(a ij )mxn 为局中人甲的赢得矩阵； A *=(-a ij )mxn 为局中人乙的赢得矩阵。

以甲方赢得矩阵为准：S 1=(a 1，a 2，…，a m )叫甲的策略集合； S 2=(β1，β2，…，βn )叫乙的策略集合；为了和以后的（无鞍点、混合策略相区别），称a i ，βj 叫做纯策略。