博弈论专题
F-博弈论专题-4-1混合纳什均衡

二、混合战略Nash均衡
问题: 在“猜硬币”游戏中,我们往往会以50%
的概率选择正面(O),以50%的概率选择反面(R), 即选择混合战略σ=(0.5,0.5)。那么有没有参与 人会偏离混合战略σi=(0.5,0.5)呢?
O 1
R
2
O
R
-1,1
1,-1
1,-1
-1,1
在“猜硬币”博弈中,当双方都选择混合战略
为准)
守
左边 右边
左边 -1,1 1,-1 攻
右边 1,-1 -1,1
例:石头、剪子、布
(3)石头、剪子、布
再看猎鹿博弈
风险与均衡
某种行动的概率
与期望收益:
猎鹿?猎兔? 如果猎兔的概率 Nhomakorabea猎 人鹿
是0.5时,均衡 1 兔子
是什么?0.6呢?
猎人2
鹿
兔子
5, 5 3, 0
0, 3 3, 3
猎鹿博弈 风险上策均衡(兔子,兔子)
社会福利博弈
流浪汉
政 府 救济
不救济
找工作 (3,2) (-1,1)
游荡 (-1,3) (0,0)
课堂测试:
求解猎人的混
合纳什均衡策
略。
即,选择两种策 略的期望收益
猎 人鹿
无差异的概率。 1 兔子
猎人2
鹿
兔子
5, 5 3, 0
0, 3 3, 3
猎鹿博弈 风险上策均衡(兔子,兔子)
察不能同时兼顾两个地方。商店价值2万元,
酒馆价值1万元。警察在这头时小偷会去另一
头行窃,但双方到底在哪边是不确定的。双方
的策略应是什么?
小偷
酒馆 商店
警察
经典:博弈论专题+应用部分

1
一、基本概念 1、参与人(players)
指的是一个博弈中的决策主体,他的目的是通过选择行动 (或战略)以最大化自己的支付(效用)水平。
自然人、团体(企业、国家)、国家集团(欧盟、北约 等)、自然。
2、行动(actions or moves) 参与人在博弈的某个时点的决策变量。 可以是连续的,也可能是离散的
29
(四)不完全信息动态博弈:精炼贝叶斯均衡
精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行 为来修正自己有关后者类型的“信念”(主观概率),并由此 来选择自己的行动。
精炼贝叶斯均衡是所有参与人战略和信念的一种结合,它满足 如下条件: (1)给定每个人有关其他人类型的信念的情况下, 他的战略选择是最优的;(2)每个人有关他人类型的信念都 是使用贝叶斯法则从所观察到的行为中获得的。
p2(1p)2p0(1p) 2q0(1q)q3(1q)
解 得 2/3,q p3/4
因此,纳什均衡为博弈方1以概率分布2/3和1/3在T和B中随机 选择;博弈方2以概率分布3/4和1/4在L和R中随机选择。 23
(三)不完全信息静态博弈:贝叶斯纳什均衡
市场进入的例子——进入者知道在位者的偏好、战略空间及各 种战略组合下的利润水平。如果进入者实际上并不完全了解在 位者的生产函数、成本函数及偏好,这就是不完全信息博弈。
坦白 囚徒A
抵赖
囚徒B
坦白
抵赖
-8,-8 -10,0
2、智猪博弈:
大猪
按 等待
小猪
按
等待
5,1 9,-1
0,-10 -1,-1
4,4 0,0
10
3、性别战: 足球
男 芭蕾
女 足球
博弈论智力题

A.逻辑推理2、请把一盒蛋糕切成8 份,分给8个人,但蛋糕盒里还必须留有一份。
3、小明一家过一座桥,过桥时是黑夜,所以必须有灯。
现在小明过桥要 1 秒,小明的弟弟要3 秒,小明的爸爸要6 秒,小明的妈妈要8 秒,小明的爷爷要12 秒。
每次此桥最多可过两人,而过桥的速度依过桥最慢者而定,而且灯在点燃后30 秒就会熄灭。
问:小明一家如何过桥?4、一群人开舞会,每人头上都戴着一顶帽子。
帽子只有黑白两种,黑的至少有一顶。
每个人都能看到其他人帽子的颜色,却看不到自己的。
主持人先让大家看看别人头上戴的是什么帽子,然后关灯,如果有人认为自己戴的是黑帽子,就打自己一个耳光。
第一次关灯,没有声音。
于是再开灯,大家再看一遍,关灯时仍然鸦雀无声。
一直到第三次关灯,才有劈劈啪啪打耳光的声音响起。
问有多少人戴着黑帽子?5、请估算一下CN TOWER电视塔的质量。
7、U2 合唱团在17分钟内得赶到演唱会场,途中必需跨过一座桥,四个人从桥的同一端出发,你得帮助他们到达另一端,天色很暗,而他们只有一只手电筒。
次同时最多可以有两人一起过桥,而过桥的时候必须持有手电筒,所以就得有人把手电筒带来带去,来回桥两端。
手电筒是不能用丢的方式来传递的。
四个人的步行速度各不同,若两人同行则以较慢者的速度为准。
Bono需花1分钟过桥,Edge需花2 分钟过桥,Adam 需花5 分钟过桥,Larry 需花10 分钟过桥。
他们要如何在17 分钟内过桥呢?11、有7克、2克砝码各一个,天平一只,如何只用这些物品三次将140克的盐分成50、90 克各一份?13、你有两个罐子,50个红色弹球,50 个蓝色弹球,随机选出一个罐子,随机选取出一个弹球放入罐子,怎么给红色弹球最大的选中机会?在你的计划中,得到红球的准确几率是多少?14、想象你在镜子前,请问,为什么镜子中的影像可以颠倒左右,却不能颠倒上下?16、如果你有无穷多的水,一个3 夸脱的和一个5 夸脱的提桶,你如何准确称出4 夸脱的水?21、假设一张圆盘像唱机上的唱盘那样转动。
博弈论专题(经济学专题)2007.9

市场进入阻挠博弈树
(3)、概念:一个纳什均衡称为精炼纳什均衡,当且只当参 与人的战略在每一个子博弈中都构成纳什均衡,即组成精炼纳 什均衡的战略必须在每一个博弈中都是最优的。因此,(进入, 斗争)不是一个精炼纳什均衡,而(进入,合作)是惟一的子 博弈精炼纳什均衡。
* “ 不可置信——承诺行动”的例子: 谈恋爱;
(2 )扩展性博弈形式的5个要素:参与人;每个参与人选择
行动的时点;每个参与人在每次行动时可供选择的行动集合;每 个参与人在每次行动时有关对手过去行动选择的信息;支付函数。
博弈树——是扩展型的一种形象化表述。 “子博弈”
(40,50) 在位者 合作
进入 进入者
不进入
斗争 (-10,0)
(0,300)
9,-1
0,0
搜集 大股东
等待
小股东
搜集
等待
5,1
4,4
9,-1
0,0
研发 大企业
等待
小企业
研发
等待
5,1
4,4
9,-1
0,0
3、性别战:
女 足球
芭蕾
男
足球 2,1
0,0
芭蕾 0,0
1,2
先动优势:若男的买票,两人就会出现在足球场;若女的买 票,两人就会出现在芭蕾舞厅;
4、斗鸡博弈: 进
A 退
(3)纳什均衡允许了不可置信威胁的存在。在市场进入的例 子中,如果在位者摆出一幅“你进入我就斗争”的架式,(不 进入,斗争)便成为一个纳什均衡。
在位者
默许
斗争
进入 进入者
40,50
不进入 0,300
-10,0 0,300
2、泽尔腾的贡献
(1)针对静态纳什均衡的问题,泽尔腾对动态博弈进行了分析, 定义了子博弈精炼纳什均衡。将纳什均衡中不可置信威胁战略剔 除出去,使均衡战略不再包含不可置信的威胁。它要求参与人的 决策在任何时点上都是最优的。决策者要“应变”,而不是 “固守”。
博弈论经典题目

博弈论经典题目
1. 背包问题:
背包问题是贪婪算法求解的一个经典例子,也是动态规划常出现的一个经典最优化算法问题。
背包问题描述是这样的:有一个背包,背包容量限制为V,现有n种物品,每种物品的体积分别是w1, w2, w3, ... wn,而价值分别是v1, v2, v3, ... vn,问如何挑选物品装入背包以使物品价值总和最大。
2. 钓鱼游戏:
钓鱼游戏是由John Von Neumann及Oskar Morgenstern于1944年出版的游戏理论研究的经典题目,它用简单的游戏表示了一个有价值的决策问题:一对捕鱼人去钓鱼,他们的成功机会各不相同,而他们的收入有几乎相同的可能性。
游戏设定两个捕鱼者就一道鱼池进行渔获,鱼库只能容纳两种鱼,一种种鱼可以产生相同价值,不过每个捕鱼者只能抓一种鱼。
他们可以在淘到鱼前决定他们抓取的鱼种以及机率。
3. 亚当斯密矩阵博弈:
亚当斯密矩阵博弈也称为亚当斯博弈,是一种两边博弈,也就是说每一方都可以改变策略,古腾堡武器竞赛中使用的最佳策略最终也确定了该博弈结果。
它是一种形式上可以实时解决的游戏,每一种游戏具有一组有限的可能性。
游戏中,双方都拥有一种完全不同的收益,这些收益对两者来说都是实际易变涉及各自的利益、代价及限制,最终
目的是达到一个最佳方案,也就是哪一方收益最大。
4. 棋盘问题:
棋盘问题是建模和强化学习算法的经典问题,是一种几何回溯问题,主要指一个棋盘下怎样移动国王,使其最终能够到达标记点,而不经过被标记的地方,并且时间费用最少。
棋盘中任何一个标记点在边框联想能表示出一种折线状的运动方式,这样的运动方式通常分为八个半径块,而国王的最终目的地则被标记在其中的任何一个格子上。
博弈论试题及答案

博弈论试题及答案【正文】博弈论试题及答案一、选择题1.博弈论是研究:A. 地理分布B. 人类视力C. 决策制定D. 古典文学答案:C2.下列哪个不是博弈论中常见的概念?A. 纳什均衡B. 优势策略C. 输家效应D. 零和博弈答案:C3.描述纳什均衡的最佳方式是:A. 所有参与者都达到最佳策略B. 至少有一个参与者达到最佳策略C. 所有参与者都达到次优策略D. 至少有一个参与者达到次优策略答案:A4.下列哪个案例体现了零和博弈的情况?A. 两国签订贸易协定B. 赌徒在赌博中争夺赌注C. 两家公司合作推出新产品D. 好友一起玩棋盘游戏答案:B5.下列哪个不是博弈论的应用之一?A. 经济决策B. 政治博弈C. 生物进化D. 音乐创作答案:D二、填空题1.博弈论最早由_____________等人于20世纪40年代提出。
答案:冯·诺依曼(John von Neumann)2.博弈论是研究参与者间的_____________和_____________的学科。
答案:互动行为;决策制定3.零和博弈是指参与者的利益总和恒为_____________。
答案:零4.博弈论中的最佳策略指的是在其他参与者采取某个策略时,使某一参与者的_____________最大化的策略。
答案:利益5.斯坦福大学的_____________教授以其对博弈论的突出贡献而获得2005年诺贝尔经济学奖。
答案:约翰·纳什(John Nash)三、简答题1.简要解释博弈论中的纳什均衡。
答:纳什均衡是博弈论中的一个重要概念,指的是在参与者选择自己最佳策略的情况下,不存在任何一个参与者可以通过单独改变自己的策略来获得更好收益的状态。
简言之,纳什均衡是一种理性选择下的稳定状态。
2.举例说明博弈论在实际生活中的应用。
答:博弈论在经济学、政治学、生物学等领域中都有广泛应用。
例如,在贸易谈判中,两个国家之间的博弈就是典型的博弈论应用。
博弈论经典例子

博弈论经典例子
1. 囚徒困境知道不?就好比两个小偷被抓了,警察分别审问他们。
要是都不坦白,那可能都判轻一点;但要是其中一个坦白了,另一个不坦白,那坦白的那个就立功减刑,不坦白的就倒霉啦!这可真是个纠结的选择啊!
2. 再来想想拍卖,大家都抢着出价,那场面紧张刺激得很!每个人都想着自己能拍到,但又担心出价太高亏了,这不就是一场精彩的博弈嘛!
3. 再说说那个商家竞争,就像肯德基和麦当劳,都拼命想办法吸引顾客,这可不是你争我夺的博弈嘛!
4. 还有股市啊,大家不都在那分析来分析去,想着怎么买卖股票能赚钱,这就是投资者之间的博弈呀!
5. 谈恋爱其实也有博弈的成分呢,你对我好,我对你咋样,不是得衡量衡量嘛,哈哈!
6. 像是两家公司研发新产品,谁先推出,谁就能抢占市场份额,这中间的算计可不少哩!
7. 选举不也是嘛,候选人们为了拉选票各显神通,这就是政治上的博弈呢!
8. 石头剪刀布也算哦,你出啥我出啥,都在猜对方的心思,可别小瞧这小游戏,也是一种博弈呢!
总之,生活中博弈无处不在,我们每天都在参与各种博弈呢!。
《博弈论前沿专题》Word版教案

《博弈论前沿专题》Word版教案第一章:博弈论概述1.1 教学目标让学生了解博弈论的基本概念及其应用领域。
使学生理解博弈论在经济学、政治学、心理学等学科中的重要性。
培养学生运用博弈论分析问题的能力。
1.2 教学内容博弈论的定义与分类博弈论的基本概念(如参与者、策略、支付矩阵等)博弈论的应用领域及发展历程1.3 教学方法采用讲授法,系统介绍博弈论的基本概念和理论体系。
案例分析法,通过具体案例使学生了解博弈论在实际问题中的应用。
1.4 教学活动引入博弈论的基本概念,引导学生思考现实生活中的博弈现象。
讲解博弈论的分类及特点,让学生了解不同类型的博弈。
分析具体案例,如囚徒困境、智猪博弈等,让学生体验博弈论在实际问题中的应用。
1.5 作业与练习课后阅读材料:博弈论相关论文或书籍。
完成课后练习题,巩固所学内容。
第二章:完全信息静态博弈让学生掌握完全信息静态博弈的基本概念和理论。
培养学生运用完全信息静态博弈分析问题的能力。
2.2 教学内容完全信息静态博弈的定义和特点支付矩阵与纳什均衡完全信息静态博弈的求解方法(如逆向归纳法)2.3 教学方法采用讲授法,系统介绍完全信息静态博弈的基本理论和方法。
案例分析法,通过具体案例使学生了解完全信息静态博弈在实际问题中的应用。
2.4 教学活动引入完全信息静态博弈的基本概念,引导学生思考现实生活中的博弈现象。
讲解支付矩阵和纳什均衡的概念,让学生了解完全信息静态博弈的解。
分析具体案例,如石头剪刀布、拍卖等,让学生体验完全信息静态博弈在实际问题中的应用。
2.5 作业与练习课后阅读材料:完全信息静态博弈相关论文或书籍。
完成课后练习题,巩固所学内容。
第三章:完全信息动态博弈3.1 教学目标让学生掌握完全信息动态博弈的基本概念和理论。
培养学生运用完全信息动态博弈分析问题的能力。
完全信息动态博弈的定义和特点博弈树与子博弈完美均衡完全信息动态博弈的求解方法(如倒推法、动态规划法等)3.3 教学方法采用讲授法,系统介绍完全信息动态博弈的基本理论和方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论专题
一、基本概念
1、参与人;2、行动;3、信息;4、战略;5、支付函数6、结果;7、均衡;
二、分类
1、静态博弈:参与人同时参与选择行动。
2、动态博弈:参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
3、完全信息:每一个参与人对所有其他参与人(对手)的特征、战略空间及支付函数有准确的知识。
4、不完全信息:每一个参与人对所有其他参与人(对手)的特征、战略空间及支付函数没有准确的知识。
(3)、概念:一个纳什均衡称为精炼纳什均衡,当且只当参与人的战略在每一个子博弈中都构成纳什均衡,即组成精炼纳什均衡的战略必须在每一个博弈中都是最优的。
因此,(进入,斗争)不是一个精炼纳什均衡,而(进入,合作)是惟一的子博弈精炼纳什均衡。
* “不可置信——承诺行动”的例子:
谈恋爱;
破釜沉舟;
红军、白军抢占小岛,炸桥断后路;
(三)不完全信息静态博弈:贝叶斯纳什均衡
市场进入的例子——进入者知道在位者的偏好、战略空间及各种战略组合下的利润水平。
如果进入者实际上并不完全了解在位者的生产函数、成本函数及偏好,这就是不完全信息博弈。
设想在位者成本函数有两种可能的情况,对应于这两种情况的支付矩阵分别如表一和表二:
解释:
在给定进入者选择进入的情况下,高成本在位者的最优战略是默许,而低成本在位者的最有战略是斗争。
低成本情况下斗争之所以比默许优,可能是由于在位者的生产成本是如此低,从而他在非常低的价格下获得的垄断利润也高于相对高的价格下分享到的寡头利润;也可能在位者有一种好斗的天性,他更乐于与进入者斗争而不是合作。
在1967年以前,遇到这种不知对手的选择情况,自己的战略自然无法选择,因此相应的问题无法解决。
海萨尼的贡献在于引进了一个虚拟的参与人—“自然”,使得上述情况可以分析。
自然首先行动——选择参与人的类型,被选择的参与人知道自己的真是类型,而其他参与人并不清楚这个被选择的参与人的真是类型,仅知道各种可能类型的概率分布。
另外,被选择的参与人也知道其他参与人心目中的这个分布函数,即分布函数是一种共同知识(common knowledge)。
•在市场进入的这个例子中,“自然”首先选择在位者的类型——高成本还是低成本;在位者本人知道自己究竟是高成本还是低成本,而进入者仅知道在位者或者高成本,或者是低成本,并且,知道高成本和低成本的可能性各为多少。
•海萨尼把“不完全信息博弈”转换成“完全但不完美信息博弈”。
•贝叶斯是一位概率统计学家,贝叶斯均衡是纳什均衡在不完全信息博弈中的自然扩展。
(四)不完全信息动态博弈:精炼贝叶斯均衡
精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行为来修正自己有关后者类型的“信念”(主观概率),并由此来选择自己的行动。
精炼贝叶斯均衡是所有参与人战略和信念的一种结合,它满足如下条件:(1)给定每个人有关其他人类型的信念的情况下,他的战略选择是最优的;(2)每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得的。
1、张三与你
(恃强欺弱、早餐——辣椒)
2、黔驴技穷
(五)纯策略、混合策略及混合策略的均衡
纯策略:每个行为人只作出一个选择并始终坚持这个选择,这种策略叫做纯策略;
混合策略:允许行为人使他们的策略随机化——对每项选择都制定一个概率,按照这些概率作出他们的选择;
混合策略的均衡:每个行为人都选定了最优频率,并在另一个行为人的频率选择给定的情况下按照这个最优频率采取他的策略;
计算题
两寡头古诺模型,,P为市场出清价格,两个厂商的边际成本不同,分别为。
如果,问纳什均衡产量各为多少?如果,则纳什均衡产量又各为多少?
Q a Q P -=)(21,c c 2/0a c i <<122,0c a c a c i +><<
思考题:
比较分析完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈,
并举例说明?
计算题:两个寡头企业进行价格竞争博弈,企业1的利润函数是:q c aq p ++--=21)(π,企业2的利润函数是:
p
b q +--=22)(π其中p 是企业1的价格,q 是企业2的价格,求
(1)两个企业同时决策的纯策略纳什均衡?
(2)企业1先决策的子博弈完美纳什均衡?
(3)企业2先决策的子博弈完美纳什均衡?。