《运筹学》ch12博弈论

合集下载

博弈论-中国运筹学会

博弈论-中国运筹学会中国博弈论新近进展及展望摘要1944年著名数学家冯·诺伊曼和经济学家莫根施坦合著并出版的《博弈论与经济行为》标志着博弈论作为一门独立学科的诞生。

在国际上，从1994到2012年，博弈论学家已先后获得6届诺贝尔经济学奖，对于一个运筹学分支而言这是一个奇迹。

随着运筹学的发展，博弈论在中国也取得了飞速的进步。

本报告介绍了国内外博弈论的发展历程、主要研究方向以及常用术语的中文规范。

针对八个主要方面重点介绍了国内外的研究现状以及未来五年的发展趋势展望，具体的，包括对策理论、对策论与互联网、算法博弈论、对策与社会科学、对策与可持续发展、不确定性与对策、组合拍卖以及带熵博弈局势分析。

Recent Development and Future Prospect ofGame Theory in ChinaIn 1944, the masterpiece of‘Theory of Games and Economic Behavior’ written by famous mathematician John von Neumann and economist Oskar Morgenstern marks the game theory as an independent subject. Experts in game theory have won six Nobel Prizes in economics from 1994 to 2012, which is a miracle for a branch of operation research. With the development of operations research, the study of game theory in China has been gotten rapid advances. In this chapter we first present a brief history, definition and Chinese technical terms of game theory. Then we review advances and tendencies in eight research topics including game theory, Internet and game theory, algorithmic game theory, social science and game theory, sustainable development and game theory, uncertainty and game theory, combinatorial auction, situation analysis on games with entropy.一、引言博弈论，亦名“对策论”、“赛局理论”，是运筹学的一个重要学科。

运筹学博弈论

i a 2 1 3 a c 1 3 a c c 1 3 a c 9 1 a c 2
产量博弈的古诺模型是一种囚徒困境，无法实现博弈方总体和各个博弈方各自最大利益的结论，对于市场经济组织、管理，对于产业组织和社会经济制度的效率判断，都具有非常重要的意义。说明对市场的管理，政府对市场的调控和监管都是必须的。
纳什均衡(Nash Equilibrium)
通俗地说，纳什均衡的含义就是：
给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略。
1. 纯战略Nash均衡
策略空间：每个博弈方的全部可选策略的集合 S1,Sn
博弈方 i的第 j个策略： si j Si 博弈方 i的得益：u i
每个参与人都想猜透对方的战略，而每个参与人又不愿意让对方猜透自己的战略。
这种博弈的类型是什么？如何找到均衡？
请举一些这样的例子：
✓石头、剪子、布游戏 ✓老虎、杠子、鸡、虫子游戏 ✓扑克游戏 ✓橄榄球赛 ✓战争中
大猪先到：大猪吃到9个单位，小猪吃到1个单位；小猪先到：小猪吃到4个单位，大猪吃到6个单位；同时到达：大猪吃到7个单位，小猪吃到3个单位。
局中人：大猪和小猪行动：按按钮吃东西
小猪
按
不按
大
猪
按 (5, 1) (4, 4)
不按 (9, -1) (0, 0)
24
大猪按等待
小猪的上策
寡头产量竞争——以两厂商产量竞争为例 Qq1 q2 PP(Q) aQ
u 1 q 1 P ( Q ) c 1 q 1 q 1 [ a ( q 1 q 2 ) c ]1q
u 2 q 2 P ( Q ) c 2 q 2 q 2 [ a ( q 1 q 2 ) c ]2q

《管理运筹学》12-管理博弈

衬底1
管理博弈的基本概念与分类
例12-5 产量竞争问题
一、博弈的基本要素
解企业A和B分别为两个局中人，它们的策略为各自的产量qi ϵ[0,∞)(i=1，2)，每一方都有无穷多个策略。在局势(q1 + q2)下，局中人i的赢得函数为
衬底1
管理博弈的基本概念与分类
按局中人的数量：二人博弈和多人博弈；按各局中人赢得函数的代数和是否为零：零和博弈与非零和博弈；按局中人之间是否合作：合作博弈和非合作博弈；按策略集中策略数目的有限和无限：有限博弈和无限博弈；按局中人选择策略的先后顺序：静态博弈和动态博弈；按博弈过程中对信息掌握的情况：完全信息博弈和不完全信息博弈。
采购员
自然状态
行最小
较暖
正常
较冷
采购100吨
-5
-7.75
-11
-11
采购150吨
-7.5
-7.5.
-10.5.
-10.5
采购200吨
-10
-10
-10
-10*
列最大值
-5
衬底1
管理博弈的基本概念与分类
例12-3 囚徒困境
一、博弈的基本要素
解 A和B为两个局中人，每个局中人都有两个策略：坦白或不坦白。按照各局中人的策略组合，共有四个局势：{坦白，坦白}，{坦白，不坦白}，{不坦白，坦白}，{不坦白，不坦白}。两个局中人的赢得函数可以用表12-2所示的一个双变量矩阵来表示。
β1
β2
β3
4
4
10
4
2
3
1
1
6
5
7
5*
6
5*
10
表12-4 具有鞍点的矩阵博弈的赢得矩阵

运筹学博弈论 PPT

性研究。
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗，或策略有关键作用的游戏
博弈Game，博弈论Game Theory，Game即游戏、竞技游戏和经济等决策竞争较量的共同特征：规则、结果、策
略选择，策略和利益相互依存，策略的关键作用游戏——下棋、猜大小经济——寡头产量决策、市场阻入、投标拍卖政治、军事——美国和伊拉克、以色列和巴勒斯坦
囚徒困境
坦白是B的占优战略
坦白
囚徒 B
抵赖
坦白
坦白是A的囚徒A 占优战略
抵赖
占优策略(上策)均衡
占优策略(上策)通俗来说是：
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策略组合所构成的均衡。
囚徒困境（ Prisoners’Dilemma ）
运筹学博弈论
第一节博弈论概述
一、博弈论的产生和发展
1. 博弈在中国田忌赛马Байду номын сангаас弈
华容道博弈
从孙子兵法到三十六计从田忌赛马到孙庞斗智从运筹帷幄到韬光养晦从曹刿论战到论持久战
2. 博弈论的开山之作
1943 年，冯 ·诺依曼和摩根斯顿发表《博弈论和经济行为》的一书，
标志着博弈论作为一门独立科学的开始，也标志着新古典经济学进入了一个新的发展阶段。
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略，将它剔除掉，重新构造一个不包括已剔除战略的新的博弈；然后继续剔除这个新的博弈中某一参与人的严格劣战略；重复进行这一过程，直到剩下唯一的参与人战略组合为止。这个唯一剩下的参与人战略组合，就是这个博弈的均衡解，称为“重复剔除的占优战略均衡”(iterated dominance equilibrium).

运筹学博弈论简介

弈双方是否存在有约束力的协议来分：
合作博弈
非合作博弈
二）按局中人数分类：
二人博弈多人博弈
三）按策略数分类：
•有限策略博弈 •无限策略博弈
二人非合作博弈是我们讨论的重点。
非合作博弈的进一步分类
非合作博弈
非零和的四种博弈
零和博弈
也可以有纯策略和混合
– 纯策略博弈策略博弈之分。
策略—前进或后退
支付函数
斗鸡B
前进后退
前进 -3/-3 2/0
斗鸡A
后退 0/2 0/0
五、博弈论的典型例子
市场进入阻挠—二人非合作非零和纯策略博弈
局中人—在位者和进入者策略—在位着：容忍或斗争；进入者：进入或不进入支付函数—垄断利润300，寡头利润各50；进入成本10
进入进入者
不进入
在位者容忍斗争
– 混合策略博弈
非零和博弈
动态时行动和策略
– 完全信息博弈不同，要素有五个；而
静态博弈
静态时行动与策略不加
动态博弈
区别，要素有三个。
– 不完全信息博弈
静态博弈
动态博弈
四、博弈论发展史的要件
1944年，von Neumann and Oskar Morgenstern 发表专著 The Theory of Games and Economic Behavior创立了博弈论
2000 -40万 -40万 -40万
五、博弈论的典型例子
齐王赛马—二人非合作零和博弈
局中人—齐王和田忌策略—上中下三种等级的马的组合，比三
次，有六组策略：(上，中，下)、 (中，上，下)、 (上，下，中)、 (中，下，上)、 (下，上，中)、 (下，中，上)

博弈论

Day 1
Day 2
Day 3
分析
如果是情况（2），2红1黑

那么在第一天，红头发的人会看到1红1黑，他会考虑如果自己头发颜色是黑的，那么为情况（1），他所见的红发人会在第一天黄昏自杀，如果他头发为红，为情况（2），他所见的红发人不会自杀。黑头发人看到2红，那么可排除情况（1），如果他头发为黑，则为情况（2），否则为情况（3）。到了第二天，没有人自杀。那么两个红发人都认定此为情况（2），知道自己头发为红，于第二天晚自杀。黑发人第三天发现这是情况（2），知道自己头发为黑，于当晚自杀。
分析
我们从1个海盗的情况开始讨论。（1）如果只有1个海盗，那么他显然会把 10个金币都分给自己。此时最佳方案为{10}。
分析

（2）如果有2个海盗，那么2号来制定方案。但是他无论怎么制定，1号海盗都投反对票，根据规则2号海盗会被丢入大海，并且金币被1号海盗独享。最佳方案为{死，10}。
2 1
分析

（3）如果有3个海盗，那么3号无论怎么制定方案，2号必同意（因为如果只剩2人了那么2号必死，他保命要紧），而1号必反对（因为如果只剩 2人，他将独享10金币并搞死2号）。所以3号可以给自己分10个，依然能通过。最佳方案为{10， 0，0}。 3 2 1
分析

（4）如果有4个海盗，那么4号除自己需要2票，此时3号必反对提议（因为如果到3海盗情况他将得10金币，就算现在给他 10金币他也反对因为他还想搞死4号），那么此时需要1、2号各一票。如果到3海盗情况，那么1、2号会颗粒无收。若不给他们金币让他们同样颗粒无收，他们将反对（同样都一无所获那为什么不让你死），但若给他们1人1金币，他们就会同意。所以最佳方案为{8，0，1，1}。

博弈论

百度百科博弈论又被称为对策论（Game Theory）既是现代数学的一个新分支，也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构间的相互作用。

是研究具有斗争或竞争性质现象的数学理论和方法。

博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。

生物学家使用博弈理论来理解和预测进化论的某些结果。

博弈论已经成为经济学的标准分析工具之一。

在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。

其中局中人、策略和收益是最基本要素。

局中人、行动和结果被统称为博弈规则。

理论历史博弈论[1] 是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。

博弈论思想古已有之，中国古代的《孙子兵法》等著作就不仅是一部军事著作，而且算是最早的一部博弈论著作。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上，没有向理论化发展。

博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。

近代对于博弈论的研究，开始于策梅洛（Zermelo），波莱尔（Borel）及冯·诺依曼（von Neumann）。

1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。

1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域，从而奠定了这一学科的基础和理论体系。

1950～1951年，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的策墨洛（Zermelo)策墨洛（Zermelo)基础。

纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。

运筹学中的对策论与博弈论

人工智能技术为对策论与博弈论提供新的研究工具和思路
机器学习算法在对策论与博弈论中的应用，提高决策效率和准确性
深度学习技术可以模拟复杂的博弈场景，为对策论与博弈论提供更真实的数据支持
人工智能与对策论与博弈论的结合将推动相关领域的发展和创新
对策论与博弈论在商业竞争中的应用研究
不完全信息静态博弈
定义：博弈参与者在完全信息条件下进行的一次性决策，每个参与者只能选择一种策略，并且所有参与者同时做出选择。
示例：寡头垄断市场中的价格竞争、囚徒困境等。
添加标题
添加标题
添加标题
添加标题
特点：参与者之间无法进行有效的沟通或协商，只能依靠自己的判断和决策。
应用：在经济学、政治学、社会学等领域有广泛应用。
03
对策论的主要内容
合作博弈与非合作博弈
合作博弈：参与者通过合作达成共赢，核心概念包括联盟和核心
非合作博弈：参与者追求个体理性，核心概念包括纳什均衡和优势策略
区别：合作博弈强调合作与共赢，非合作博弈注重竞争与冲突
应用场景：合作博弈常用于国际关系、经济合作等领域，非合作博弈适用于市场竞争、决策分析等场景
对策论与博弈论在商业竞争中具有重要地位，是制定竞争策略和决策的重要工具。
随着大数据和人工智能技术的发展，对策论与博弈论在商业竞争中的应用将更加广泛和深入。
对策论与博弈论可以帮助企业预测竞争对手的行动，制定更加有效的竞争策略。
在商业竞争中，运用对策论与博弈论需要综合考虑各种因素，包括市场环境、竞争对手、自身实力等。
面临的挑战与问题：如何将对策论与博弈论更好地应用于实际场景，解决复杂的问题，仍需进一步的研究和探索。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1的最优策略（行）
目录
博弈论的基本概念纯策略矩阵博弈
混合策略矩阵博弈
其它类型博弈简介(多人博弈、非零和博弈)
基本概念
设矩阵博弈G {S1, S2 , A} 的支付矩阵是 A (aij )mn ，其中S1 {A1, , Am}
S2 {B1, , Bn }
多人非合作博弈
（1）局中人集合 I {1, , n} ；（2）每个局中人i有一个纯策略的有限集：
Si
{s(i)} {s1i , s2i ,
,
si mi
}
i 1, , n
Hale Waihona Puke （3）每个局中人i有一个支付函数u i ，i 1, , n 。
记为此博弈为G {I , Si ,ui }。
第十二章博弈论
教学要求：
了解博弈论的基本分析方法掌握二人零和博弈模型和求解方法会运用该模型分析一些经济和管理问题
目录
博弈论的基本概念纯策略矩阵博弈混合策略矩阵博弈其它类型博弈简介(多人博弈、非零和博弈)
目录
博弈论的基本概念
纯策略矩阵博弈混合策略矩阵博弈其它类型博弈简介(多人博弈、非零和博弈)
同越理小，越若好局，中所人以，2选局择中策人略2可B j以，选则择他至B j ，多使失他去失m1ia去mx a的ij 。不因大局于中1m ji人nm m21i希amx望aij aij
鞍点：如果存在 i*, j* 使支付矩阵 (aij ) 的元素满足：
max
1im
min
1 jn

动态博弈微分博弈
最常见
目录
博弈论的基本概念
纯策略矩阵博弈
混合策略矩阵博弈其它类型博弈简介(多人博弈、非零和博弈)
矩阵博弈
矩阵博弈 G {S1, S2 , A}
设局中人1有m个策略S1 {A1, , Am} ；局中人2有n个策略 S2 {B1, , Bn}
局中人2的期望支付
u2 1pq (1) p(1 q) (1)(1 p)q 1(1 p)(1 q) 2q(2 p 1) (2 p 1)
局中人2 1
鞍点
1/2
1/2
1
局中人1
目录
博弈论的基本概念纯策略矩阵博弈混合策略矩阵博弈
其它类型博弈简介(多人博弈、非零和博弈)

局中人2使保证对方得到的期望值最多不超过 v2

min max E(x, y)
ySn xSm
鞍点：设 x* Sm ，y* S n 。如果对任意 x Sm和任意 y Sn有：
E(x, y* ) E(x* , y* ) E(x* , y)
则称 (x* , y* ) 是矩阵博弈混合策略A (aij ) 意义下的一个鞍点。
m
n
记 Sm {x R m | xi 0, i 1, , m, xi 1} Sn {y R n | y j 0, j 1, , n, y j 1}
则 Sm,Sn
分别称为局中人1和局i中1 人2的混合策略集；对
x (x1,
j 1
, xm ) Sm
aij

min
1im
a ij
*
ai* j*

min
1 jn
ai*
j

min
1 jn
max
1im
aij
则称(Ai* , Bj* ) 为该矩阵博弈的鞍点
实例
局中人2
2的最优策略（列）
局中人1
B1 B2 B3 B4
A1 1 1 0 3 A2 2 3 1 3 A3 2 2 3 4
实例
局中人1、2玩扑克牌游戏，支付矩阵和混合策略选择概略如下图：
局中人2
红q 黑1-q
局中
红p -1，1 1，-1
人 1 黑1-p 1，-1 -1，1
局中人1的期望支付
u1 (1) pq 1p(1 q) 1(1 p)q (1)(1 p)(1 q) 2 p(1 2q) (2q 1)
对于非零和博弈，可虚增一局中人使其化为零和博弈。

合作博弈

博弈
静态博弈非合作博弈无有限限多多两两人人人人非非非非零零零零零零零零和和和和和和和和
给胜者一千金。
支付矩阵：把局中人、策略和赢利数字写成矩阵形式。如下为“锤子、
剪刀、布”游戏的支付矩阵。其中方案1代表出锤子，方案2代表出剪刀，方案3代表出布。
参与者2
1
2
3
参
与
1
0
1
-1
者
2
-1
0
1
1
3
1
-1
0
囚徒困境
囚徒一的支付矩阵
囚徒二
坦白
不坦白
坦白
5年
释放
囚
徒
一
不坦白
8年
1年
博弈分类
设
s (i)

S
（i
i

1,
,n
）是局中人i
的一个策略，则
s (s (1) , , s (n) )
称为一个局势。对于博弈的每一个局势
，
每个s 局(中s (1人) ,i得, s到(n)的) 支付：
ui ui (s)
这就是博弈在纯策略下的支付函数。
非零和博弈
在经济管理问题中，经常遇到的是对抗的双方既有对抗又有合作，双方的利益既有所得又有所失，各参与人的目的并不完全对立。这种如果至少存在一个结局，使所有局中人的支付之和不为零的博弈称为非零和博弈。
如果局中人1选择策略 Ai ，局中人2选择B
支付是 a，ij 则支付矩阵是：
j
，局中人1从局中人2得到的
a11 a12 a1n
A

(aij
)

a21 am1
a22 am2

a2n
amn

由上述矩阵完全确定的博弈，称为矩阵博弈。
局果行选中局元择人中素i，1人中使希1的他望选最得支择小到付策元的值略素支aA。付iij 由越，不于大则小局越他于中好至m1i人a，少mx1m1局可 ji希n中以n a望ij人得a到2i则j越支希大付望越1m付好jin出n，a的ij因。此a即ij局越支中小付人越矩1好阵可。第以如i
和
y ( y1, , yn ) Sn分别称为局中人1和局中人2的混合策略。
mn
局中人1的期望支付：E(x, y) aij xi y j xT Ay
i1 j 1

局中人1应选择 x Sm，保证自己的赢得期望值不少于
v1

max min E(x, y)
xSm ySn
博弈的基本要素
局中人：博弈中的决策者或参与者，至少要有2个，个人和集体都可以
作为局中人，如“齐王赛马”中的齐王和田忌。
策略：局中人在整个决策过程中一系列行动的一个方案。如用（上、中、
下）表示出场参赛的三匹马依此为上马、中马和下马，这就是局中人的一个策略。
赢利：在决策过程的最终结局上的利害结果。如每一场比赛中的负者付