博弈论与政治学应用讲义

合集下载

十章博弈论课件

十章博弈论课件

无新品
无新品 4 ,
厂商1
4
有新品 厂商2的最小收益 63,3
有新品 3, 6
2 2
, 2
25
威胁信号?
➢公司之间经常相互发出信号以表明他们的意图、动机 和目标。有些信号是威胁性的。
➢例如, A公司宣布,如果谁挑起价格战,它将坚决奉陪 到底,并宣称其规模在本行业中名列前茅,最有降价 的实力。
➢是否所有的威胁都是可信的?
33
重复博奕
在下图的价格博弈中,如果是静态博弈,厂商很容易陷 入囚徒的困境(低价,低价)。但如果博弈可以无限 重复下去,则厂商的最佳策略是“以牙还牙”。这样, 考虑到对手会以牙还牙,从长远和整体来看,降低价 格不会有什么好处,博弈可能达到合作的结果。
厂商2
低价
高价
低价 10, 10
100 ,-50
第十章 博奕论
通过前面分析可知,寡头想达到垄断 的结果,需要进行合作,而合作往往 难以维持。其均衡是博弈的结果。 博弈论:研究人们在各种战略情况下 如何行事。
1
囚犯的两难处境
李四
坦白
抵赖
张三 坦白 -8 ,-8
抵赖 -20 ,0
0 ,-20 -1 ,-1
2
红与黑的游戏
MAX:profit
红,红 -3, -3 黑,黑 +3,+3 红,黑 +5,-5
• 全部相互了解即为完全信息博弈; • 否则是不完全信息博弈
13
五、博弈的均衡概念
• 博弈方的不同策略将导致各种不同的均衡,而均 衡的特征又与博弈方的行为假设有密切关系。
• 首先分析静态的非合作的博弈,并且对博弈双方 的行为作出以下假设: ①假定博弈双方是理性的 ②假定博弈双方具有完全的信息 ③假定博弈双方独立地进行决策

博弈论本科讲义

博弈论本科讲义

在中观经济研究中,劳动力经济学和金融理 论都有关于企业要素投入品市场的博弈模型, 即使在一个企业内部也存在博弈问题:工人之 间会为同一个升迁机会勾心斗角,不同部门之 间为争取公司的资金投入相互竞争;从宏观角 度看,国际经济学中有关于国家间的相互竞争 或相互串谋、选择关税或其他贸易政策的模型; 至于产业组织理论更是大量应用博弈论的方法 (见Jean Tirole的《产业组织理论》)。
如果n个参与人每人从自己的Si中选择一个策略 siategy profile),参与人i之外的其他参 与人的策略组合可记为s-i=( s1,s2,﹍,si-1 , si+1 ,﹍, sn)。
例如田忌的某个策略s田忌=上中下,或中下上, 等等;S田忌={上中下,上下中,中上下,中下 上 ,下上中,下中上}
贷市场的过高利息。此外,阿克尔洛夫还把信 息不对称运用于解释各种社会问题,比如因为信 息不对称,医疗保险市场上,老年人、个体劳动 者的医疗保险利益得不到保障。
三、基本概念
1、参与人Players:一个博弈中的决策主体, 他们各自的目的是通过选择行动(策略)以最 大化自己的目标函数/效用水平/支付函数。他们 可以是自然人或团体或法人,如企业、国家、 地区、社团、欧盟、北约等。 那些不作决策或虽做决策但不直接承担决 策后果的被动主体不是参与人,而只能当做环 境参数来处理。如指手划脚的看牌人、看棋人, 企业的顾问等。 对参与人的决策来说,最重要的是必须有
教材——P5 博弈论就是系统研究各种各 样博弈中参与人的合理选择及其 均衡的理论。
关于“经济博弈论”:
博弈论是研究人们在利益相互影响的格局 中的策略选择问题、是研究多人决策问题的理 论。而策略选择是人们经济行为的核心内容, 此外,经济学和博弈论的研究模式是一样的: 即强调个人理性,也就是在给定的约束条件下 追求效用最大化。可见,经济学和博弈论具 有内在的联系。在经济学和博弈论具有的这 种天然联系的基础上产生了经济博弈论。

第六讲博弈论课件

第六讲博弈论课件
❖ 对于矩阵博弈,其主要的任务就是求出矩阵 博弈的Nash均衡解-----双方尽可能满意的结 果。
例12.1 智猪博弈模型
❖ 每次踩出6个单位的食物,按者支付2个单位 成本,小踩,(1,5)大踩(4,2)同时 (2,4)
大猪
小猪

踩 2,4 等待 4,2
等待
1,5 0,0
小猪的收入矩阵
A
2, 4,
❖ 20世纪50年代以来,纳什、泽尔腾、海萨尼 等人使博弈论最终成熟并进入实用。
三位大师主要的贡献
❖ 1950年和1951年纳什的两篇关于非合作博弈 论的重要论文,彻底改变了人们对竞争和市 场的看法。他证明了非合作博弈及其均衡解, 并证明了均衡解的存在性,即著名的纳什均 衡。从而揭示了博弈均衡与经济均衡的内在 联系。因为在现实世界中,非合作博弈要比 合作博弈普遍得多。
囚徒困境的意义
❖ “囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。
❖ 他们两人都是在坦白与抵赖策略上首先想到 自己,这样他们必然要服长的刑期。只有当 他们都首先替对方着想时,或者相互合谋(串 供)时,才可以得到最短时间的监禁的结果。
顺序和信息
❖ 博弈论非常强调时间和信息的重要性,认为 时间和信息是影响博弈均衡的主要因素。
❖ 在博弈过程中,参与者之间的信息传递决定 了其行动空间和最优战略的选择;
❖ 同时,博弈过程中始终存在一个先后问题 Sequence order,参与人的行动次序对博弈 最后的均衡有直接的影响。
分类
❖ 博弈的划分可以从参与人行动的次序和参与 人对其它参与人的特征、战略空间和支付的 知识、信息,是否了解两个角度进行。

博弈论讲义完整PPT课件

博弈论讲义完整PPT课件
• 两个寡头企业选择产量的博弈:
如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页

大学课程《博弈论及其应用》PPT课件:第二章(1234节)

大学课程《博弈论及其应用》PPT课件:第二章(1234节)

博弈方2



上 博弈方1

1,0 0,4
1,3 0,2
0,1 2,0
图 2-7 划线法
博弈的相对优势策略位置在图2-7标出,策略组合{上,中}格 子中的两个数字下面都划了短线,这个格子对应的策略组合 就是由划线法得到的纳什均衡。
第四节 箭头方法
还有一种寻找纳什均衡的方法,和划线法的分析理念的出发 点不同,这种方法的思路是对博弈中的每个策略组合进行分 析,判断各博弈方是否能够通过单独改变自己的策略而改善 自己的得益,如果可以,则从所考察的策略组合的得益引一 个箭头到改变策略后的策略组合对应的得益。这样对每个可 能的策略组合都分析考察过以后,根据箭头反映的情况来判 断博弈的结果。
博弈方2
Hale Waihona Puke 左中上 博弈方1

1,0 0,4
1,3 0,2

0,1 2,0
图 2-8 箭头法
观察图2-8,在策略组合{上,中}中只有指向的箭头,没有指 出的格子所代表的就是纳什均衡。
略“上”改变的倾向,用一个竖着的箭头表示这个倾向;横 着比较后面的得益,4比2大,4比0大,博弈方2没有改变的 动力。在策略组合{上,左}中,横着比较后面,分析博弈方2 的得益,3比0大,1比0大,所以博弈方2有从策略“左”向
策略“中”和策略“右”改变的倾向,用两个横向的箭头表 示这两个改变的倾向。
在策略组合{上,中}中,竖着比较前面的得益,还是横着比较后 面的得益,博弈方1和博弈方2都没有改变的倾向。在策略组合 {上,右}中,竖着比较前面,2比0大,博弈方1有从策略“上”
向策略“下”改变的倾向,用一个竖向的箭头表示这个倾向; 横着比较后面,3比1大,博弈方2有从策略“右”向策略“中” 改变的倾向,用一个横向的箭头表示这个倾向。

博弈论导论专题知识讲座

博弈论导论专题知识讲座
守协议来得高。而且,大家还付出了更多旳功夫。
• 正因为这么旳博弈对全部参加者存在着或大或小旳潜在成本,
怎样达成和维护互利旳合作就成为一种值得探究旳主要问题。
• 存在双赢旳博弈吗?
例2:焦点博弈 “We Can’t Take the Exam, Because We Had a Flat Tire”
博弈论所研究旳就是两个以上行为主体旳互 动决策及策略均衡。
博弈论(Game Theory) 又称为对策 论、游戏理论以及策略运筹学。它 最早由德国数学家、哲学家莱布尼
茨于1723年提出。 博弈论是研究决策主体行为发生直 接相互作用时候旳决策及谋求这种
决策旳均衡问题。
博弈论能够划分为合作博弈(cooperative game)和非合作博弈(non-cooperative game)。 纳什、泽尔腾和海萨尼旳贡献主要是在非合作 博弈方面,而且目前经济学家谈到博弈论,一
3、最带根本性意义旳原因是经济学和博弈论旳研 究模式是一样旳,即强调个人理性,也就是在给定 旳约束条件下追求利益最大化。在这一点上,博弈
论和经济学是完全一样旳。
博弈论在经济学中旳绝大多数应用模型都是在70年 代中期之后发展起来旳,大致从80年代开始,博弈论 逐渐成为主流经济学旳一部分,甚至能够说成为微观
• 也就是说,需要旳是对这么旳情况下该选什么旳预期
旳收敛。这一使得参加者能够成功合作旳共同预期旳 策略被称为焦点。e.g.心有灵犀一点通。
例2:焦点博弈 “We Can’t Take the Exam, Because We Had a Flat Tire”
• 我们无法从全部这么旳博弈旳构造中找到一般和本
质旳东西,来确保这么旳收敛。
• 某些博弈中,因为偶尔旳外因能够对策略贴标签,

大学课程《博弈论及其应用》PPT课件:第一章

大学课程《博弈论及其应用》PPT课件:第一章
2021/11/19
• 博弈方:两个嫌疑犯A和 B。 • 策略: 每个嫌疑犯的行动集是(坦白,不坦白)。 • 收益:对应于每种策略组合,有相应的收益结果。 • 策略组合:嫌疑犯A和B从可以选择的策略中选择并实施,有四种
情况(括号中前面是A的策略,后面是B的策略)。 • 每个策略组合对应下的A的结果,从优到劣,依次为: • (坦白,不坦白),结果是A被释放; • (不坦白,不坦白),A被判刑1年; • (坦白,坦白),各被判5年; • (不坦白,坦白),A被判8年。 • 同理,每个策略组合对应下的B的结果,从优到劣,依次为: • (不坦白,坦白)、(不坦白,不坦白)、(坦白,坦白)、(坦白,不坦
第一章 博弈概述
2021/11/19
第一节 海滩占位问题
我们来到海滩。夏天很多游客喜欢在在海边晒太阳,游泳。海滩有 月牙形,弧形,绵延数公里。为了研究问题方便,我们姑且把海滩 的长度抽象定为1,[0,1]区间就表示海滩的长度。 A和B是两个小商 贩,出售无差异的补给品,同质同价,同一品牌的矿泉水,面包等 。“*”表示游客均匀的分布在海滩上,游客就近购买补给品。在 沙滩上应该如何分布两个小商贩的位置呢?
• A猎兔,B猎兔,鹿逃掉,A收益一只兔子,B收益一只兔子。
• 可见,每个猎人的期望,不能由自己决定,要看对方的策略选择 ,是能够捉得到鹿,依赖对方的选择,如果对方选择捉兔子,而 你选择猎鹿,这个策略组合,对你而言,是最差的选择,也是最 坏的策略。
2021/11/19
第三节 博弈论是什么
• 博弈论:就是关于包含相互依存情况中理性行为的研究。 • 博弈的三要素: • 博弈方----参与博弈但利益不完全一致者。有二人博弈与多人博弈
的故事,它的重要性在大量情形中体现,参与者面临着与故事中嫌 疑犯面临的同样的动机。

博弈论与政治学应用讲义

博弈论与政治学应用讲义

政治学应用:
例2: 贿选(由简单到复杂,逐渐完善模型)
考虑两个候选人在一职位竞选中是否进行贿选。若两人都不贿选,候选人1胜 出的概率为P,候选人2胜出的概率为1-P。贿选给候选人带来优势。候选人1 进行贿选的话其胜出的概率提高V1(导致候选人2胜出的概率降低V1 );候 选人2进行贿选的话其胜出的概率提高V2(导致候选人1胜出的概率降低V2) 博弈均衡解?
博弈论能做什么
怎样算优美的理论
学术的突破
Out of clutter find simplicity From discord find harmony In the middle of difficulty lies opportunity.
Albert Einstein / 阿尔伯特·爱因斯坦
5, 5
混合策略纳什均衡 定理(纳什):每一个有限的非零和博弈都有至少一个混合策略纳什均衡。
政治学应用:
例1: 战国联盟 Player 2 N Payer 1 N Y 0, 0 — 10,0 Y 0,— 10 5, 5
自我实施、强化 协调、说服(vs囚徒困境) (公开课p41)投资博弈(引申:协调博弈,2NE ,party,银行挤兑、美丽人生..力挽狂澜 战国 联盟说客苏秦张仪合纵连横 协调之所以能达成在于它不同于囚徒困境,他没有去说服人们采取一 个严格劣势策略)
囚徒B 坦白 囚徒A 坦白 不坦白 — 8,—8 — 10,0 不坦白 0,— 10 — 1, — 1
求解策略式博弈的均衡解(博弈的三种不同解):
1. 占优策略与占优均衡 占优均衡:如果每一个参与人的策略都是占优策略,那么称这个策略的组 合为占优策略均衡。eg:囚徒博弈 2. 迭代剔除劣势策略与占优均衡(略)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3. 最优回应与纳什均衡
最优回应与纳什均衡
最优回应:一位参与者针对另一方的某个特定策略,选择能为自己带来最高 收益的策略
纳什均衡:如果每个参与人的策略都是对其他参与人策略的最优回应,那么 各参与人的策略组合构成一个纳什均衡。
Player 2 N Y
Payer 1
N
Y
0, 0
— 10,0
0,— 10
博弈的分类
行动次序
信息
静态(策略式)
动态(扩展式)
ห้องสมุดไป่ตู้完全信息
纳什均衡
(纳什)
子博弈精练 纳什均衡
(泽尔腾)
不完全信息
贝叶斯纳什均 精炼贝叶斯纳什 衡 均衡 (泽尔腾等) (海萨尼)
二、策略式博弈和纳什均衡 策略式(normal form)表达又称为标准式表达,在这种表达中,所有
参人同时选择自己的策略,所有参与人选择的策略一起决定每个参与人的收 益。
情景的形式化表述(建模的过程)
警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他们所犯的罪行。 如果罪犯中至少有一人供认犯罪,就能确认罪名成立。为了得到所需的口供, 警察将这两名罪犯分别关押防止他们串供或结成攻守同盟,并分别跟他们讲 清了他们的处境和面临的选择:如果他们两人都拒不认罪,则他们会被以较 轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白者立即 释放而另一人将重判10年徒刑;果两人都坦白认罪,则他们将被各判8年监禁。 问:两个罪犯会如何选择(即是坦白还是抵赖)?
博弈论简史 对于博弈论的研究开始于恩斯特·策梅洛(1913)、埃
米尔·博雷尔(1921)及冯·诺伊曼(1928),后来由冯·诺伊曼和奥斯卡·摩 根斯坦(1944,1947)首次将其系统化和形式化(参照Myerson, 1991)。 随后约翰·福布斯·纳什(1950,1951)利用不动点定理证明了均衡点的存在, 为博弈论的一般化奠定了坚实的基础。
政治学应用:
例2: 贿选(由简单到复杂,逐渐完善模型)
考虑两个候选人在一职位竞选中是否进行贿选。若两人都不贿选,候选人1胜 出的概率为P,候选人2胜出的概率为1-P。贿选给候选人带来优势。候选人1 进行贿选的话其胜出的概率提高V1(导致候选人2胜出的概率降低V1 );候 选人2进行贿选的话其胜出的概率提高V2(导致候选人1胜出的概率降低V2) 博弈均衡解?
博弈论与政治学应用
林辉程 S131920005
一、博弈论简介 二、策略式博弈—纳什均衡
形式化建模 求解(占优、最优回应) 政治学应用
三、扩展式博弈—子博弈精炼 纳什均衡
博弈树 求解(逆向归纳) 政治学应用
四、小结
一、关于博弈论 博弈论(Game theory),是研究相互依赖、相互影
响的决策主体的理性决策行为以及这些决策的均衡结果的理论。一些相互依 赖、相互影响的决策行为及其结果的组合称为博弈(Game)。
一个策略式博弈包含以下要素: 1. 参与人(players) 2. 参与人的策略(strategies) 3. 收益/效用(payoff/utility)
(效用理论的简单介绍,买房子的选择 定性描述与定量描述的转化 今天天气很好—晴,气温, 湿度,风速,pm2.5;大多数人都喜欢上田老师的课– 12位同学中的10人都喜欢;收益函数、期望 效用、效用最大化– Max 函数求导)
政治学博弈论p109 田忌赛马—混合策略……引入到下篇的扩展式博弈
二、扩展式博弈和逆向归纳法求解纳什均衡 扩展式(extensive form)表达,是博弈论的另一种常用表达形式,扩
展式博弈给出了每个策略的动态描述:参与者及其可供选择的策略,行动的 顺序及结果,以及选择时所知道的信息。扩展式博弈以博弈树的图像方式来 描述。
5, 5
混合策略纳什均衡 定理(纳什):每一个有限的非零和博弈都有至少一个混合策略纳什均衡。
政治学应用:
例1: 战国联盟 Player 2 N Payer 1 N Y 0, 0 — 10,0 Y 0,— 10 5, 5
自我实施、强化 协调、说服(vs囚徒困境) (公开课p41)投资博弈(引申:协调博弈,2NE ,party,银行挤兑、美丽人生..力挽狂澜 战国 联盟说客苏秦张仪合纵连横 协调之所以能达成在于它不同于囚徒困境,他没有去说服人们采取一 个严格劣势策略)
囚徒B 坦白 囚徒A 坦白 不坦白 — 8,—8 — 10,0 不坦白 0,— 10 — 1, — 1
求解策略式博弈的均衡解(博弈的三种不同解):
1. 占优策略与占优均衡 占优均衡:如果每一个参与人的策略都是占优策略,那么称这个策略的组 合为占优策略均衡。eg:囚徒博弈 2. 迭代剔除劣势策略与占优均衡(略)
约翰·福布斯·纳什、约翰·C·海萨尼及莱因哈德·泽尔腾因为他们对博弈论的突 出贡献而获得1994年的瑞典银行经济学奖。罗伯特·J·奥曼、肯·宾摩尔、戴 维·克瑞普斯及阿里尔·鲁宾斯坦对于博弈论也做出重大贡献。
博弈的构成要素一个博弈一般由以下几个要素组成,包括:参与
人、行动、信息、策略、收益、均衡等。 1、参与人 指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人, 也可以是团体); 2、行动 指参与人在博弈进程中轮到自己选择时所作的某个具体决策; 3、策略 指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么 行动的预先安排; 4、信息 参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及 其得益函数等知识; 5、收益 参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策 略或行动的函数,这是每个参与人最关心的东西; 6、均衡 所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博 弈分析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参 与人最终的行动或效用集合。 上述要素中,参与人、行动、结果统称为博弈规则,博弈分析的目的就是 使用博弈规则来决定均衡。
Player 2 不贿选 Payer 1 不贿选 贿选 加入监督、反腐因素后的博弈 信息、信念因素 P,1- P P+V1,1- P- V1 贿选 P - V2,1- P+V2 P+V1- V2,1- PV1+V2
政治学应用:
例3: 中位数投票者定理 其它:美苏争霸、军备竞赛 、政治改革、政治分赃、政党竞争……
相关文档
最新文档