数学建模讲座之博弈论(一)

合集下载

博弈论PPT课件

有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i，对于所有的 σi∈Mi，都有ui﹙σ*﹚≥ui﹙σi，σ-i*﹚，则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中解：设猜方猜正方的概率为p，猜反方的概率则为1－
无名氏（大众）定理
无名氏定理：在无穷次重复的由n个游戏者参与的博弈里，如果在每一次重复中博弈的行动集是有限的，则在满足下列三个条件时，在任何有限次重复中所观察到的任何行动组合都是某个子博弈完美均衡的惟一结果：
条件1：贴现因子接近于1；条件2：在每一次重复中，博弈结束的概率或等于0，或为非常小的一个正值；条件3：严格占优于一次性博弈中的最小最大收益组合的那个收益组合集是n维的。
博弈方
博弈方：独立决策、独立承担博弈结果的个人或组织
博弈规则面前博弈方之间平等，不因博弈方之间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈，单人博弈是退化的博弈
策略
策略：博弈中各博弈方的选择内容策略有定性定量、简单复杂之分不同博弈方之间不仅可选策略不同，而且可
游戏和经济等决策竞争较量的共同特征：规则、结果、策略选择，策略和利益相互依存，策略的关键作用
游戏——下棋、猜大小经济——寡头产量决策、市场阻入、投标拍卖政治、军事——美国和伊朗、以色列和巴勒斯坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) （或称支付，或得益）

博弈论完整版PPT课件

R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4；
2-阶理性： C相信R相信C是理性的，C会将R4从R的战略空间中剔除, 所以 C不会选择C1；
3-阶理性： R相信C相信R相信C是理性的， R会将C1从C的战略空间中剔除, R不会选择R1；
基本假设：完全竞争，完美信息
个人决策是在给定一个价格参数和收入的条件下最大化自己的效用，个人的效用与其他人无涉，所有其他人的行为都被总结在“价格”参数之中
一般均衡理论是整个经济学的理论基石和道义基础，市场机制是完美的，帕累托最优成立，平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立：
.
19
理性共识
0-阶理性共识：每个人都是理性的，但不知道其他人是否是理性的；
1-阶理性共识：每个人都是理性的，并且知道其他人也是理性的，但不知道其他人是否知道自己是理性的；
2-阶理性共识：每个人都是理性的，并且知道其
他人也是理性的，同时知道其他人也知道自己是
理性的；但不知道其他人是否知道自己知道他们
如果你预期我会选择X，我就真的会选择X。
如果参与人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定：
只有两个厂商面对相同的线形需求曲线，P(Q)=a－Q， Q=q1+q2 两厂商同时做决策；假定成本函数为C(qi)＝ciqi
劣策略：如果一个博弈中，某个参与人有占优策略，那么
该参与人的其他可选择策略就被称为“劣策略”。

数学建模博弈模型

博弈模型在实际问题中的应用前景
政策制定
01
利用博弈模型分析政策制定中的利益关系和策略选择，为政策
制定提供科学依据。
企业竞争策略
02
利用博弈模型分析企业竞争中的策略选择和预期行为，为企业
制定合理的竞争策略。
国际关系
03
利用博弈模型分析国际关系中的利益关系和冲突解决机制，为
国际关系管理提供理论支持。
THANKS
猎鹿博弈
总结词
描述两个猎人合作与竞争的关系，揭示了合作与背叛的平衡。
详细描述
在猎鹿博弈中，两个猎人一起打猎，猎物可以平分。如果一个猎人选择合作而另一个选择背叛，则背叛者可以独吞猎物。但如果两个猎人都不合作，则都没有猎物可吃。最佳策略是合作，但个体理性可能导致两个猎人都不合作，造成双输的结果。
03
智猪博弈
总结词
描述大猪与小猪在食槽竞争中的策略，揭示了合作与竞争的平衡。
详细描述
在智猪博弈中，一个大猪和一个小猪共同生活在一个猪圈里。每天都有一桶食物放在食槽中，大猪和小猪需要竞争才能吃到食物。如果大猪和小猪同时到达食槽，大猪会因为体型优势占据更多食物。但如果小猪先到食槽等待，大猪到来时已经没有食物可吃。最佳策略是小猪等待，大猪先吃，然后小猪再吃剩下的食物。
博弈模型的基本要素
参与者
在博弈中作出决策和行动的个体或组织。
策略
参与者为达到目标而采取的行动或决策。
支付
参与者从博弈中获得的收益或损失。
均衡
在博弈中，当所有参与者都选择最优策略时，达到的一种稳定状态。
博弈模型的建立过程
策略空间
确定每个参与者的所有可能采取的策略。
均衡分析
通过分析收益函数和策略空间，找出博弈的均衡点。

博弈论讲义完整PPT课件

• 两个寡头企业选择产量的博弈：
如果两个企业联合起来形成卡特尔，选择垄断利润最大化的产量，每个企业都可以得到更多的利润。给定对方遵守协议的情况下，每个企业都想增加产量，结果是，每个企业都只得到纳什均衡产量的利润，它严格小于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章导论-囚徒困境
知识：完全信息博弈和不完全信息博弈。 ❖完全信息：每一个参与人对所有其他参与人的（对手）的特征、
战略空间及支付函数有准确的知识，否则为不完全信息。
第33页/共293页
第一章导论-基本概念
• 博弈的划分：
行动顺序信息
完全信息
静态
完全信息静态博弈纳什均衡
纳什（1950，1951）
不完全信息
不完全信息静态博弈贝叶斯纳什均衡
0，300 0，300
纳什均衡：进入，默许；不进入，斗争
第29页/共293页
第一章导论
• 人生是永不停歇的博弈过程，博弈意略达到合意的结果。 • 作为博弈者，最佳策略是最大限度地利用游戏规则，最
大化自己的利益； • 作为社会最佳策略，是通过规则使社会整体福利增加。
第30页/共293页
第一章导论-基本概念
一只河蚌正张开壳晒太阳，不料，飞来了一只鸟，张嘴去啄他的肉，河蚌连忙合起两张壳，紧紧钳住鸟的嘴巴，鸟说：“今天不下雨，明天不下雨，就会有死蚌肉。” 河蚌说：“今天不放你，明天不放你，就会有死鸟。”谁也不肯松口，有一个渔夫看见了，便过来把他们一起捉走了。
第17页/共293页
第一章导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”？
第20页/共293页

博弈论的数学模型

博弈论的数学模型作者：竺可桢学院01混合班王大方何霈邹铭摘要博弈论现在得到了广泛的应用，涉及到人的决策问题都可以用博弈论的模型加以解释。

本文首先用数学的方法表述实际生活中的博弈行为，并导出一般情况下的博弈的结果，进而讨论一些不同的外部约束条件对博弈过程的影响。

我们用经济学中的垄断竞争现象作为博弈问题的一个实例，讨论生产者在不同状态下的决策，进而分析双方共谋的动机和可能性。

（一）基本博弈模型的建立一, 博弈行为的表述博弈的标准式包括：1．1．博弈的参与者。

2．2．每一个参与者可供选择的战略集。

3．3．针对所有参与者可能选择的战略组合，每一个参与者获得的利益在n人博弈中，用Si为参与者i的可以选择战略空间，其中任意一个特定的纯战略为s i，其中任意特定的纯战略为s i，s i∈Si，n元函数u i（s1，s2，……s n）, 当n个博弈者的决策为s1，s2，……s n时,表示第I各参与者的收益函数。

二, 博弈的解当博弈进入一个稳定状态时，参与者选择的战略必然是针对其他参与者既定战略的最优反应，在此状态下没有人愿意单独背离当前的局势。

这个局势叫纳什均衡：在n个参与者标准式博弈，G={ S1，S2，……S n；u1，u2，……u n}中，若战略组合{s1*，s2*，……s n*}满足对每一个参与者i，s i*是针对{ s1*，s2*，……s i-1*，s i+1*……s n*}的最优反应战略，，目标战略组合{s1*，s2*，……s n*}为该博弈的纳什均衡。

即：u i { s1*，s2*，……s i-1*，s i*，s i+1*……s n*}≥u i { s1*，s2*，……s i-1*，s i，s i+1*……s n*}，对一切s i∈Si均成立。

纳什于1950年证明在任何有限个参与者，且每个参与者可选择的纯战略为有限个的博弈中，均存在纳什均衡。

（包括混合战略）混合战略指认某种概率分布来取一个战略空间中的战略，在本文中不加讨论。

北京大学博弈论课件第1章-博弈论概述

❖ 博弈参与者：两个人 ❖ 博弈过程：
两人在校门口集合，一起逛博物馆
❖ 博弈策略和结果
两人都去南门，成功碰面两人都去北门，成功碰面同学甲去南门，同学乙去北门，两人错过同学甲去北门，同学乙去南门，两人错过
❖ 博弈双方策略相互依赖，不独立。
其他博弈实例
❖ 棋类比赛：象棋、围棋等。古人“对弈”。 ❖ 寡头市场：
❖ 2．非合作博弈（Non-cooperative games），纳什就读于普林斯顿大学数学系的博士毕业论文，1950年。
❖ 3．讨价还价问题（The bargaining problem）。计量经济学杂志（Econometrica）18: 155 – 162，1950年。
❖ 4．非合作博弈（Non-cooperative games）数学年报（Annals of Mathematics），54: 286 – 295，1951年。
❖ 5．两人合作博弈（Two-person cooperative games）。计量经济学杂志（Econometrica），21: 128 – 140，1951年。
本章小结
❖ 本章给出了博弈的基本定义 ❖ 通过现实实例分析了博弈的基本内涵和主要思想 ❖ “囚徒困境”是博弈理论中的经典案例 ❖ 博弈的构成要素主要包括：
20 世纪 70 年代，约翰 ·海萨尼（John Harsanyi）和莱因哈德 ·泽尔腾（Reinhard Selten）等将不完全信息理论融入到博弈论的研究中。
20 世纪 90 年代之后，博弈论作为一种方法被普遍运用到经济学、政治学、生物学、军事学、统计学等领域中。
博弈理论已成为当代经济学理论不可分割的重要组成部分。
博弈论概述 POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE

博弈论最全完整ppt 讲解

完全信息
纳什均衡（NE）
子博弈完美纳什均衡（SPNE）
不完全信息
贝氏纳什均衡（BNE）
完美贝氏纳什均衡（PBNE）及序贯均衡（SE）
静态博弈与动态博弈
(static games and dynamic games)
同时决策或者同时行动的博弈属于静态博弈；先后或序贯决策或者行动的博弈，属于动态博弈
如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为一个常数，这个博弈就叫常和博弈；
相反，如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为一个常数，这个博弈就叫非常和博弈。
常和博弈也是利益对抗程度最高的博弈。非常和（变和）博弈蕴含双赢或多赢。
导论
四、主要参考文献
博弈论为众多学科提供了分析的概念和方法：经济学和商学,政治科学,生物学, 心理学和哲学。
如何在“博弈”中获胜？
日常生活中的博弈（“游戏”）往往指的是诸如赌博和运动这样的东西：赌抛硬币百米赛跑打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。策略是为了获胜所需要的一种智力的技巧。
威廉·维克瑞， 1914-1996，生于美国
詹姆斯·莫里斯 1936年生于英国
2001年诺贝尔经济学奖获得者
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由：在“对充满不对称信息市场进行分析”领域做出了重要贡献。
即使决策或行动有先后，但只要局中人在决策时都还不知道对手的决策或者行动是什么，也算是静态博弈

博弈论最全完整-讲解课件

(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为零，这个博弈就叫零和博弈；
• 相反，如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为零，这个博弈就叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后，但只要局中人在决策时都还不知道对手的决策或者行动是什么，也算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人的得益。
供万无一失的应对办法。
学习交流PPT
5
例1：无谓竞争（The GPA Rat Race）
• 你所注册的一门课程按照比例来给分：无论卷面分数是多少，只有40％的人能够得优秀，40 ％的人能得良好。
• 所有学生达成一个协议，大家都不要太用功，如何？想法不错，但无法实施!稍加努力即可胜过他人，诱惑大矣。
• 某些博弈中，由于偶然的外因可以对策略贴标签，或者参与者之间拥有某些共同的知识体验，导致了焦点的存在。
• 没有某个这样的暗示，默契的合作就完全不可能。
学习交流PPT
9
例3：为什么教授如此苛刻？
• 许多教授强硬地规定，不进行补考，不允许迟交作业或论文。
• 教授们为何如此苛刻？
• 如果允许某种迟交，而且教授又不能辨别真伪，那么学生就总是会迟交。
• 王则柯、李杰编著，《博弈论教程》，中国人民大学出版社，2004年版。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

（五）最大最小策略
不管其他决策者如何做，确保在可能的最坏结果中得到最好的结果。——风险厌恶型策略
企业2
无新产品有新产品企业1最小
无新产品 4，4
3，6
3
企业1 有新产品
6，3
2，2
2
企业2最小 3
2
纳什均衡：3，6 或6，3 该策略均衡 4，4
（六）混合策略
当不存在纯策略时，不等于局中人就不进
中石油面临的市场需求为:
Q-1/4Q=3/4Q
P
G
P1
D=f(P)
MR
中石油O 的决策为Q1:
Q
生产1/2*3/4Q需求=3/8Q的石油;
由1/2Q到3/8Q产量减少了1/8Q
中石化面临的市场需求为:
1- 3/8Q =5/8Q
P
D=f(P)
MR
F
P2
O
中石化的决策为:
Q2
Q
生产1/2* 5/8Q需求=5/16Q的石油;
（一）占优策略（上策dominant stratege）
无论其他博弈者采用何种策略，该博弈者的策略总是最好的。
（二）占优均衡（dominant equilibrium ）
在两个博弈者都采用占优策略时，称这种结果为占优均衡。
支付矩阵
一个单元
B
正常价格
低价格
正常价格 C $10 $10 E －$10 －$100 A
解决的问题：请你用博弈论的观点帮助两家巨头分析一下，两家公司如何决策会使得各自的收益最大
P D=f(P)
P1
F
MR
O
Q1
Q
中石油的决策为: 生产1/2Q需求的石油;
中石化面临的市场需求为: Q- 1/2Q需求=1/2Q
P D=f(P)
MR
P2
G H
中石化的O 决策为:
Q2
Q
生产1/2*1/2Q=1/4Q需求的石油;
由1/4Q到5/16Q产量增加了1/16Q
中石油面临的市场需求为:
1- 5/16Q =11/16Q
博弈结果
中石油的均衡产量为： Q（1/2―1/8―1/32―……）=1/3 Q
中石化的均衡产量为： Q（1/4+1/16+1/64+……）=1/3 Q
行业的均衡总产量为： 1/3 Q+1/3 Q=2/3 Q
博弈论（Game Theory）
博弈论主讲内容
对博弈论的认识完全静态博弈博弈论几个经典例子博弈论的应用（寡头垄断模型）
长街上的超市
细心的我们肯定会发现在不少的街上一些超市似乎总“喜欢” 拥挤在一起。有人指责这属于“资源浪费”现象，因为他们在想，如果把超市均匀的设在长街各处，无疑对远离中心的居民提供极大的方便。为什么会出现这种拥挤的现象呢？
非合作性均衡 1. 一个纳什均衡 2. 二个纳什均衡 3. 没有纳什均衡
一个纳什均衡
高价格
B 正常价格
高价格 C $100 $200 E -$20 $150
A
正常价格 D $150 -$30 F $10 $10
A占优策略，B没有—— 一个纳什均衡
两个纳什均衡
U 局中人1
D
局中人2
L
R
9,9
0,8
结论：当中石油和中石化的产量均为市场总需求的1/3时，两个石油公司的收益最大
与博弈论相关的赛题
2010年国际赛B题——预测犯罪地点 2010年东三省A题——企业的营销管理问题
(一)利润最大化的决策原则
1. 数学证明
T TR TC dT dTR dTC
dQ dQ dQ
Tπ：总利润 TC：总成本 TR：总收益
dT 0时，利润最大，从而有
dQ
MR MC MR:边际收益 MC：边际成本
利润最大化条件：MR=MC即当MR=MC=0时厂商的利润最大，当MR=0时，厂商的利润达到最大。
一博弈概述
（一）指导思想
在一定时间内，事物之间矛盾的对立和统一性，推动事物达到一种良好的状态。即假设你现在正面对着你的对手或你的合作伙伴，你怎样做才能达到你的利益最大化。
一博弈概述
（二）博弈论概念
博弈即一些理性个人、团队或者是组织，面对一
定的环境条件，在一定的规则下，同时或者先后，
个单位；若小猪先到，大猪吃6个单位，小猪吃4
个单位。
表 3 智猪博弈支付矩阵
小猪
按
等待
大按
5， 1
4， 4
猪等待 9， -1
0， 0
（四）寡头垄断模型
1、假设：（1）两个厂商生产同样的产品，知道市场需求总量并且需求曲线是线性的。（2）两厂商都是在已知对方产量的情况下，各自确定能够给自己带来最大利润的产量。（3）边际成本MC=0
二博弈的分类
博弈的分类和均衡
信息次序
静态
动态
信息
完全信息
纳什均衡纳什
子博弈精练纳什均衡
泽尔腾
不完全信息
贝叶斯均衡海萨尼
精炼贝叶斯均衡泽尔腾等
三完全信息静态博弈
所谓完全信息静态博弈指的是各博弈方同时决策，或者决策行动虽有先后，但后行动者不知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈。
（二）收益函数
1. 总收益TR 企业售出产品的价格(P)与数量(Q)的乘积。
TR=P Q 如果 P=a-bQ 则 TR=P Q
=（a- bQ）Q = a Q- bQ^2
2. 平均收益AR
平均每件产品给企业带来的销售收入，是企业在一定产量水平上售出的产品的市场价格。
AR TR aQ bQ2 a bQ =P
不坦白 D -8
-5 E -1 -8
-1 F -2
-2
例二，智猪博弈
猪圈里圈两头猪，一头大猪，一头小猪。猪
圈的一头有一个猪食槽，另一头安装一个安钮，
控制着猪食的供应。按一下按钮会有10单位的猪
食进槽。但谁按按钮谁就需要支付2个单位的成
本。若大猪先到，大猪吃到9个单位，小猪只能
吃1个单位；同时到，大猪吃7个单位，小猪吃3
Q
Q
3. 边际收益MR 增加一件产品给企业带来的销售收入增
加量
MR dTR a 2bQ dQ
P
O a/2b
a/b
Q
MR
MR=0时的产量是当时市场总需求产量的一半，所以厂商都会把产量定在1/2*Q需求
（三）双寡头模型（duopoly model）
中石油和中石化是我国石油行业的两大巨头，现已将中国的石油资源全部垄断。那么如果这两个厂商不考虑市场需求只想着我多卖多赚钱，从而盲目生产，这样不仅不能获得最大得益还有可能为负值。那么在什么时候这两个厂商才能不打价格战使收益最大呢？
2
期望盈利为：
u1( 1, 2)
1 (0 3
4
Hale Waihona Puke 1 251 2
6)
（局中人1取U时的期望盈利（ 1 U））
（六）混合策略
1 (0 2 1 8 1 3)
3
2
2
(局中人1取M时的期望盈利（ 1 M）)
1 (0 3 1 9 1 2)
3
2
2
（局中人1取D时的期望盈利（1 D））
11
8,0
7,7
局中人1、2都没有占优策略——存在两个纳什均衡
没有纳什均衡
上 A
下
B
左
右
00
0
-1
10
-1
3
（四）被支配策略
不管别的决策者如何决策，某策略的收益比其他一些策略收益都低。——排除法橄榄球：
防守策略
拦截带球撤回线卫突袭
进攻带球
2
策略传球
8
6
14
7
10
突袭是最差的决策——排除
决策主体(可以是个人，也可以是团体)；
2.得益：参与人在博弈结束后从博弈中获得的效
用，一般是所有参与人的策略或行动的函数，这是每个参与人最关心的东西；(在混合策略中为期望盈利)
3.信息：参与人在博弈中所知道的关于自己以及
其他参与人的行动、策略及其得益函数等知识；
一博弈概述
4.策略：指参与人选择行动的规则，即在博弈进程
U 4,3 5, 1 6,2
局中人1 M 2 , 1 D
3,0
8, 4 3,6 9, 6 2,8
（六）混合策略
若局中人1的混合策略取为
(
1
(U
),
1
(M
)
1
(
D))
(
1 3
,
1 3
,
1) 3
而局中人2的混合策略取为
(
2
(L),
2
(M
),
2
(
R))
(0,
1 2
,
1 2
)
那么在混合策略剖面（
1，
）下局中人1的
6
（六）混合策略
类似地，我们可以求得该情况下局中人2的期望盈利为：
u2
(
1
,
2)
0
1 2
(
1 3
1
1 3
4
1 3
6)
1 (1 2 1 6 1 8) 27
23 3 3
6
三、博弈论中几个著名的例子
例一，囚徒困境（prisoners’ dilemma）
囚犯B
坦白
不坦白
囚犯A
坦白 C -5
一次或者多次，从各自允许选择的行为或者策略