博弈论 ppt课件
合集下载
《管理学博弈论》课件

《管理学博弈论》PPT课 件
博弈论是一门研究决策者在互动中作出最优选择的学科。在管理学中,博弈 论被广泛应用于解决策略性决策问题。
一、简介
博弈论是一门研究决策者在互动中作出最优选择的学科。本课程将介绍博弈论的基本概念和在管理学中的应用。
二、博弈论基础
博弈论的基本概念
介绍博弈论的基本概念,如 玩家、策略和利益的分析。
七、总结
1 博弈论的优点与不足
总结博弈论的优点,如帮助决策者分析和优 化策略,以及其限制和假设。
2 博弈论的未来研究方向
展望博弈论的未来研究方向,如与人工智能 和大数据分析结合的应用。Biblioteka 四、双人合作博弈1
特征函数游戏
2
介绍特征函数游戏,用于分配值给合作
博弈中的不同决策组合。
3
战略性合作博弈
讲解战略性合作博弈中的合作策略,以 实现共同利益最大化。
估价博弈
探索估价博弈,用于确定合作博弈中参 与者的收益分配。
五、多人博弈
传统博弈 极端博弈 模糊博弈
介绍多个玩家参与的传统博弈模型,如囚徒困境 和霸权竞争。
博弈的分类
讨论博弈的分类,包括双人 非合作博弈、双人合作博弈 和多人博弈。
策略和利益的分析
探讨如何分析博弈中的策略 和利益,帮助决策者做出最 优选择。
三、双人非合作博弈
策略型博弈
介绍策略型博弈,包括两个玩家 相互竞争的决策模型。
矩阵博弈
解释矩阵博弈,以方便比较各种 决策选择的结果。
纳什均衡
探索纳什均衡的概念,即无法通 过改变策略获得更好结果的状态。
讲解多人参与的极端博弈,如零和游戏和多方冲 突博弈。
解释模糊博弈的概念,其中参与者的信息和目标 存在不确定性。
博弈论是一门研究决策者在互动中作出最优选择的学科。在管理学中,博弈 论被广泛应用于解决策略性决策问题。
一、简介
博弈论是一门研究决策者在互动中作出最优选择的学科。本课程将介绍博弈论的基本概念和在管理学中的应用。
二、博弈论基础
博弈论的基本概念
介绍博弈论的基本概念,如 玩家、策略和利益的分析。
七、总结
1 博弈论的优点与不足
总结博弈论的优点,如帮助决策者分析和优 化策略,以及其限制和假设。
2 博弈论的未来研究方向
展望博弈论的未来研究方向,如与人工智能 和大数据分析结合的应用。Biblioteka 四、双人合作博弈1
特征函数游戏
2
介绍特征函数游戏,用于分配值给合作
博弈中的不同决策组合。
3
战略性合作博弈
讲解战略性合作博弈中的合作策略,以 实现共同利益最大化。
估价博弈
探索估价博弈,用于确定合作博弈中参 与者的收益分配。
五、多人博弈
传统博弈 极端博弈 模糊博弈
介绍多个玩家参与的传统博弈模型,如囚徒困境 和霸权竞争。
博弈的分类
讨论博弈的分类,包括双人 非合作博弈、双人合作博弈 和多人博弈。
策略和利益的分析
探讨如何分析博弈中的策略 和利益,帮助决策者做出最 优选择。
三、双人非合作博弈
策略型博弈
介绍策略型博弈,包括两个玩家 相互竞争的决策模型。
矩阵博弈
解释矩阵博弈,以方便比较各种 决策选择的结果。
纳什均衡
探索纳什均衡的概念,即无法通 过改变策略获得更好结果的状态。
讲解多人参与的极端博弈,如零和游戏和多方冲 突博弈。
解释模糊博弈的概念,其中参与者的信息和目标 存在不确定性。
微观经济学-第十章-博弈论初步PPT课件

12
[资料] 约翰·纳什
[资料] 约翰·纳什
❖ 1994年与泽尔腾、海萨尼 分享了诺贝尔经济学奖。
❖ 他说自己只做了两件事: 一是研究过讨价还价的问 题;二是关注了经济问题 并从数学角度加以分析。
❖ 理性决策决不会无缘无故 地损害自身的利益,也就 是一个人肯定不会故意做 出对自己不利的事。
13
[案例]“华容道”里的纳什均衡(1)
1/2
1/2
▲
▲
▲
▲
1×1/2
▲▲
27
第四节 动态博弈 一、竞争者-垄断者博弈
第四节 动态博弈
一 竞争者-垄断者博弈
竞争者
进 入 不进入
竞争者
进 入 不进入
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
900
1300
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
700
1300
23
第三节 混合策略均衡 一、混合策略与策略组合
第三节 混合策略均衡
一 混合策略与策略组合
❖ 在混合策略博弈中,对于每一个混合策略组合也
存在一个支付组合。 ❖ 参与人都以一定的概率
乙厂商
q1
q2
来选择其纯策略,相应
形成“期望支付”。 甲 p1
1
p1 0,1
q1 0.7 q1 0.7
0
q1 0,1
p1厂 0.5 p1商 0p.52
0 q1 0.7
1 p1 0.5
6– 4
[资料] 约翰·纳什
[资料] 约翰·纳什
❖ 1994年与泽尔腾、海萨尼 分享了诺贝尔经济学奖。
❖ 他说自己只做了两件事: 一是研究过讨价还价的问 题;二是关注了经济问题 并从数学角度加以分析。
❖ 理性决策决不会无缘无故 地损害自身的利益,也就 是一个人肯定不会故意做 出对自己不利的事。
13
[案例]“华容道”里的纳什均衡(1)
1/2
1/2
▲
▲
▲
▲
1×1/2
▲▲
27
第四节 动态博弈 一、竞争者-垄断者博弈
第四节 动态博弈
一 竞争者-垄断者博弈
竞争者
进 入 不进入
竞争者
进 入 不进入
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
900
1300
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
700
1300
23
第三节 混合策略均衡 一、混合策略与策略组合
第三节 混合策略均衡
一 混合策略与策略组合
❖ 在混合策略博弈中,对于每一个混合策略组合也
存在一个支付组合。 ❖ 参与人都以一定的概率
乙厂商
q1
q2
来选择其纯策略,相应
形成“期望支付”。 甲 p1
1
p1 0,1
q1 0.7 q1 0.7
0
q1 0,1
p1厂 0.5 p1商 0p.52
0 q1 0.7
1 p1 0.5
6– 4
《博弈论》课程ppt课件

10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼பைடு நூலகம்设防 成功,失败
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。
《博弈论的经典案例》课件

• 原理:囚徒之间的合作或背叛关系直接影响他们的判罚。 • 应用:虚拟囚徒困境可以帮助解释社会合作的动机和策略。
报童问题
报童问题是博弈论中的一个常见案例,涉及一个报童需要决定采购报纸的数量。 • 原理:报童必须在满足需求和最小化成本之间做出权衡。 • 应用:报童问题可应用于库存管理、供应链优化和市场需求预测。
博弈论提供了计算机科学领域中优化、决策 和人工智能算法的基础。
政治学
博弈论研究了政治家、政党和国家之间的互 动关系,探讨了选择、协商和合作的策略。
生物学
博弈论用于研究动物行为、进化和生态系统 中的竞争和合作策略。
虚拟囚徒困境
虚拟囚徒困境是博弈论的一个经典案例之一。它描述了两一个有趣而重要的领域,它研究人与人之间的互动以及决策制定的 艺术。
《博弈论的经典案例》PPT课 件
博弈论是一个研究人们在决策过程中如何选择的分支学科。
什么是博弈论
博弈论是通过数学模型和分析来研究人们在决策过程中如何选择的学科。它从战略的角度提供了准确的 分析和预测。
博弈论的应用
经济学
博弈论在经济学中被广泛应用,帮助解释市 场行为、竞争策略和合作行为等现象。
计算机科学
拍卖
拍卖是博弈论的一个重要领域,涉及多个竞标者在有限资源上的竞争。 • 原理:拍卖涉及竞标策略、价格设定和资源配置等问题。 • 应用:拍卖可见于艺术品、土地和网络广告等领域。
集体行动难题
集体行动难题是博弈论中探讨社会合作和公共利益的案例。 • 原理:集体行动需要协调个体的利益,以达到共同的目标。 • 应用:集体行动问题可应用于环境保护、公共资源管理和社会合作。
报童问题
报童问题是博弈论中的一个常见案例,涉及一个报童需要决定采购报纸的数量。 • 原理:报童必须在满足需求和最小化成本之间做出权衡。 • 应用:报童问题可应用于库存管理、供应链优化和市场需求预测。
博弈论提供了计算机科学领域中优化、决策 和人工智能算法的基础。
政治学
博弈论研究了政治家、政党和国家之间的互 动关系,探讨了选择、协商和合作的策略。
生物学
博弈论用于研究动物行为、进化和生态系统 中的竞争和合作策略。
虚拟囚徒困境
虚拟囚徒困境是博弈论的一个经典案例之一。它描述了两一个有趣而重要的领域,它研究人与人之间的互动以及决策制定的 艺术。
《博弈论的经典案例》PPT课 件
博弈论是一个研究人们在决策过程中如何选择的分支学科。
什么是博弈论
博弈论是通过数学模型和分析来研究人们在决策过程中如何选择的学科。它从战略的角度提供了准确的 分析和预测。
博弈论的应用
经济学
博弈论在经济学中被广泛应用,帮助解释市 场行为、竞争策略和合作行为等现象。
计算机科学
拍卖
拍卖是博弈论的一个重要领域,涉及多个竞标者在有限资源上的竞争。 • 原理:拍卖涉及竞标策略、价格设定和资源配置等问题。 • 应用:拍卖可见于艺术品、土地和网络广告等领域。
集体行动难题
集体行动难题是博弈论中探讨社会合作和公共利益的案例。 • 原理:集体行动需要协调个体的利益,以达到共同的目标。 • 应用:集体行动问题可应用于环境保护、公共资源管理和社会合作。
博弈论PPT课件

第1个数字表示企业1 的收入, 第2个数字表示企业2的收入。
13
7.2.2合作博弈:建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈:怎样对付欺骗者 • 重复性博弈:反复进行多次博弈 • 重复性博弈的最优策略——针锋相对:模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单,不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为,但要给欺骗行为以处罚 ☞针锋相对是宽大的,允许对方恢复合作
可以采取降价策略,使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策:投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损 失
29
7.3.4先发制人:使市场饱和
• 在各地布点,使新的进入者无法利用高运 输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策 略。
的违约问题 • 先合作,第N次违约的收入:
30+30+30+30+······+40
• 现实:不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工? • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有 利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入:30+30+30+30+······
• 不合作收入:40+20+20+20 +······
博弈论完整版PPT课件

ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战
第九章 运筹学博弈论 ppt课件

则。
1988年 法国人莫里斯-阿莱斯(Maurice Allais)
获奖理由:在市场理论及资源有效利用方面做出了
开创性贡献,并对一般均衡理论重新做了系统阐述。
1987年 美国人罗伯特-索洛(Robert M. Solow)
获奖理由:对增长理论做出贡献。提出长期的经济
增长主要依靠技术进步,而不是依靠资本和劳动力的
获奖理由:对不同汇率体制下的货币和财政政策以及最
优货币区域的分析做出了伟大贡ppt献课件。
8
1998年 印度籍经济学家阿马蒂亚-森(Amartya Sen) 获奖理由:对福利经济学以及发展经济学做出了突破
性贡献。 1997年 美国经济学家迈伦-斯科尔斯(Myron S.
Scholes)和罗伯特-默顿(Robert C. Merton) 获奖理由:前者给出了著名的布莱克-斯科尔斯期权
获奖理由:在动态宏观经济学方面做出了
巨大贡献。 2003年 美国经济学家罗伯特-恩格尔
(Robert F. Engle III)和英国经济学家克莱夫格兰杰(Clive W.J. Granger)
获奖理由:在经济时间数列中运用了统计
学的方法。
ppt课件
7
2002年 美国学者丹尼尔-卡尼曼(Daniel Kahneman)和弗农-
ppt课件
4
在国外,1912年E.Zermelo用集合论研究过下棋 问题,四十年代由于生产和战争的需要,博弈理 论得到了发展,系统博弈理论的形成则以1944 年V.Neumann,O.Morgensten合著的《博弈论 和经济行为》一书为标志.1994年瑞士皇家科 学院决定将诺贝尔经济学奖授予纳什(Nash),哈 萨尼(Harsanyi)和泽尔腾(Selten)三人,表彰他们 在博弈理论和应用研究方面作出的杰出贡献. 目前,博弈论在定价,招投标,拍卖,委托代理以及 很多重要的经营决策中得到应用,它已成为现代 经济学的重要基础.
西方经济学博弈论全解ppt课件.ppt

小猪的最优策略:等待 大猪无最优策略:即大猪的最优策略是依赖于 小猪的策略
此时用重复剔除严格劣策略的思路找出均衡:小 猪的严格劣策略为按,剔除“按”后,小猪只 有一种策略等待,大猪仍有两个策略,但此时, “等待”已成为大猪的劣策略,剔除,大猪的 最优策略——按
这是一个“多劳不多得,少劳不少得”的均衡
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论与主流经济学的发展
传统经济学的假设及其局限性
两个基本假设:完全竞争,完美信息 局限性:交易主体的数量其实很有限;信息是不对称的 一般均衡理论是整个经济学的理论基石和道义基础,市场机
博弈论与主流经济学的发展
博弈论研究的是:在策略性环境中如何进 行策略性决策和采取策略性行动的科学。 当成果无法由个体完全掌握,而结局须视 群体共同决策而定时,个人为了取胜,应 该采取什么策略
博弈论成为通用方法论,经济学、政治学、 管理、军事、外交、国际关系、公共选择、 犯罪学
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论:专门研究博弈如何出现均衡的规 律的学问
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论要点
博弈论的基本概念包括:参与人、参与人的策 略、参与人的支付(效用)
博弈有不同的种类:
从行动顺序角度:
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
此时用重复剔除严格劣策略的思路找出均衡:小 猪的严格劣策略为按,剔除“按”后,小猪只 有一种策略等待,大猪仍有两个策略,但此时, “等待”已成为大猪的劣策略,剔除,大猪的 最优策略——按
这是一个“多劳不多得,少劳不少得”的均衡
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论与主流经济学的发展
传统经济学的假设及其局限性
两个基本假设:完全竞争,完美信息 局限性:交易主体的数量其实很有限;信息是不对称的 一般均衡理论是整个经济学的理论基石和道义基础,市场机
博弈论与主流经济学的发展
博弈论研究的是:在策略性环境中如何进 行策略性决策和采取策略性行动的科学。 当成果无法由个体完全掌握,而结局须视 群体共同决策而定时,个人为了取胜,应 该采取什么策略
博弈论成为通用方法论,经济学、政治学、 管理、军事、外交、国际关系、公共选择、 犯罪学
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论:专门研究博弈如何出现均衡的规 律的学问
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论要点
博弈论的基本概念包括:参与人、参与人的策 略、参与人的支付(效用)
博弈有不同的种类:
从行动顺序角度:
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
占优均衡:一个博弈的某个策略组合中的所 有策略都是各个博弈方各自的占优,必然是 该博弈比较稳定的结果
占优均衡不是普遍存在的(性别之战)
严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去
左中
右
上 1,0 1,3 0,1
策略型(或标准型)博弈
三要素:名单、策略单和收益单。可用矩阵,或 函数形式表示的博弈收益情况。
猜硬币模型
猜硬币方
正面
反面
盖 正面 硬 币 反面 方
-1, 1 1, -1
1, -1 -1, 1
三人古诺模型 i P q i [ 2 q 0 1 q 2 q 3 ] q i
几个经典博弈模型
得益矩阵
审计博弈
简单版(B<C,F>t)
嫌疑人
偷税
不偷税
税 审计 B-C,-F B-C,-t
务 局 不审计
0,0B,-t来自性别之战是一种有两个以上纯策略均衡的博弈
看足球 何 佳 听音乐
张帅
看足球 听音乐
2,4
0,0
1,1
4,2
例子(石头、剪子、布)中的博弈方、策略和
收益
博弈方I(孩子A,孩子B)
1,-1 3,-3 -1,1 1,-1, 1,-1 1,-1
中 上 下
1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
中 下 上
1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
下 上 中
-1,1√ 1,-1 1,-1 1,-1 3,-3 1,-1
下 中 上
1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
ui(si*,s-i*)≥ui(si,s-i*), si∈Si
A
纳什均衡的求解——划线法
囚徒困境
-5, -5 -8, 0
猜硬币
-1, 1 1, -1
0, -8 -1, -1
1, -1 -1, 1
纳什均衡的求解——箭头法
审计博弈(B > C,F>t)
嫌疑人
偷税
不偷税
税 审计 B-C,-F B-C,-t
下 0,4 0,2 2,0
1,3
左 1,0 0,4
中 1,3 0,2
左 1,0
中 1,3
纳什均衡
策略空间:S1,……Sn 博弈方i的第j个策略:sij∈Si 博弈方i的得益:ui 博弈:G={S1 ,…,Sn,u1,…,un} 纳由sn*什各)均个中衡博,:弈任在方一博的i博弈各弈G一方=个s{策i*S的略1 策,组略…成,,的都S某n,是个u对策1,其略…余组,博合u弈(n}方s中1策*,,略…如的,果组
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
赌胜博弈的特点是一方得等于另一方失,不 可能双赢,属于“零和博弈”
猜硬币方
正面
反面
盖 正面 硬 币 反面 方
-1, 1 1, -1
1, -1 -1, 1
田忌赛马
取胜关键:不让对方猜到自己策略,尽可能 猜出对方策略
田忌
上中下
齐 上下中 威 中上下 王 中下上
下上中
下中上
上
上
中
下
下
中
3,-3√ 1,-1 1,-1 -1,1 1,-1 1,-1
务 局 不审计
0,0
B,-t
连续变量的纳什均衡
古诺的寡头模型
Qq1 q2 PP(Q) 8Q
c1 c2 2
u 1 q 1 P ( Q ) c 1 q 1 q 1 [ 8 ( q 1 q 2 ) 2 ] q 1 6q1q1q2q12
u 2 q 2 P ( Q ) c 2 q 2 q 2 [ 8 ( q 1 q 2 ) 2 ] q 2 6q2 q1q2 q22
选策略数量也可不同 有限博弈:每个博弈方的策略数都是有限的 无限博弈:至少有某些博弈方的策略有无限
多个
收益
收益:各博弈方从博弈中所获得的利益 收益对应博弈的结果,也就是各博弈方策略
的组合 收益是各博弈方追求的根本目标及行为和判
断的主要依据 根据收益的博弈分类:零和博弈、常和博弈、
变和博弈
策略集SA=SB={石头,剪刀,布} 收益就是这个矩阵
石头
石头
0, 0
孩
子
剪刀
-1, 1
A
布
1, -1
孩子B
剪刀 1, -1 0, 0 -1, 1
布
-1, 1 1, -1 0, 0
占优均衡
占优:不管其它博弈方选择什么策略,一博 弈方的某个策略给他带来的得益始终高于其 它的策略,至少不低于其他策略的策略 (囚徒的困境中的“坦白”)
连续变量的纳什均衡
解: 一阶最优条件为:
u1 q1
6
q2
2 q1
0
u2 q2
6 q1
2q2
0
得到:q1=q2=2
混合策略的引进
博弈论
博弈就是一些个人、队组或其他组织,面对一定的 环境条件,在一定的规则下,同时或先后,一次或 多次,从各自允许选择的行为或策略中进行选择并 加以实施,各自取得相应结果的过程。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
囚徒的困境 赌胜博弈 审计博弈 性别之战 产量决策的古诺模型
囚徒的困境
囚徒的困境是图克(Tucker)1950年提出的 该博弈是博弈论最经典、著名的博弈
囚徒 2
坦白 不坦白
囚
坦白 -5, -5 0, -8
徒
1
不坦白 -8, 0 -1, -1
赌胜博弈
赌博、竞技等构成的博弈问题,在经济中也 有许多应用,赌胜博弈也是一类重要的博弈 问题,对经济竞争和合作也有很大启示
合( s1*,…,si-1*,si+1*,…,sn* )的最佳对策,即ui( ss为1i+*1G,*,的……一,,个sis-纳1n**,什)s均i*对,衡任si+1意*,sij…∈,Si都sn*成)立≥,u则i(称s(1*,s1…*,,…si,-1*,sn*si)j,
所有别的游戏者策略的简记法
s-i=(s1,…,si-1,si+1,…, sn) 纳什均衡简述为:
占优均衡不是普遍存在的(性别之战)
严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去
左中
右
上 1,0 1,3 0,1
策略型(或标准型)博弈
三要素:名单、策略单和收益单。可用矩阵,或 函数形式表示的博弈收益情况。
猜硬币模型
猜硬币方
正面
反面
盖 正面 硬 币 反面 方
-1, 1 1, -1
1, -1 -1, 1
三人古诺模型 i P q i [ 2 q 0 1 q 2 q 3 ] q i
几个经典博弈模型
得益矩阵
审计博弈
简单版(B<C,F>t)
嫌疑人
偷税
不偷税
税 审计 B-C,-F B-C,-t
务 局 不审计
0,0B,-t来自性别之战是一种有两个以上纯策略均衡的博弈
看足球 何 佳 听音乐
张帅
看足球 听音乐
2,4
0,0
1,1
4,2
例子(石头、剪子、布)中的博弈方、策略和
收益
博弈方I(孩子A,孩子B)
1,-1 3,-3 -1,1 1,-1, 1,-1 1,-1
中 上 下
1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
中 下 上
1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
下 上 中
-1,1√ 1,-1 1,-1 1,-1 3,-3 1,-1
下 中 上
1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
ui(si*,s-i*)≥ui(si,s-i*), si∈Si
A
纳什均衡的求解——划线法
囚徒困境
-5, -5 -8, 0
猜硬币
-1, 1 1, -1
0, -8 -1, -1
1, -1 -1, 1
纳什均衡的求解——箭头法
审计博弈(B > C,F>t)
嫌疑人
偷税
不偷税
税 审计 B-C,-F B-C,-t
下 0,4 0,2 2,0
1,3
左 1,0 0,4
中 1,3 0,2
左 1,0
中 1,3
纳什均衡
策略空间:S1,……Sn 博弈方i的第j个策略:sij∈Si 博弈方i的得益:ui 博弈:G={S1 ,…,Sn,u1,…,un} 纳由sn*什各)均个中衡博,:弈任在方一博的i博弈各弈G一方=个s{策i*S的略1 策,组略…成,,的都S某n,是个u对策1,其略…余组,博合u弈(n}方s中1策*,,略…如的,果组
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
赌胜博弈的特点是一方得等于另一方失,不 可能双赢,属于“零和博弈”
猜硬币方
正面
反面
盖 正面 硬 币 反面 方
-1, 1 1, -1
1, -1 -1, 1
田忌赛马
取胜关键:不让对方猜到自己策略,尽可能 猜出对方策略
田忌
上中下
齐 上下中 威 中上下 王 中下上
下上中
下中上
上
上
中
下
下
中
3,-3√ 1,-1 1,-1 -1,1 1,-1 1,-1
务 局 不审计
0,0
B,-t
连续变量的纳什均衡
古诺的寡头模型
Qq1 q2 PP(Q) 8Q
c1 c2 2
u 1 q 1 P ( Q ) c 1 q 1 q 1 [ 8 ( q 1 q 2 ) 2 ] q 1 6q1q1q2q12
u 2 q 2 P ( Q ) c 2 q 2 q 2 [ 8 ( q 1 q 2 ) 2 ] q 2 6q2 q1q2 q22
选策略数量也可不同 有限博弈:每个博弈方的策略数都是有限的 无限博弈:至少有某些博弈方的策略有无限
多个
收益
收益:各博弈方从博弈中所获得的利益 收益对应博弈的结果,也就是各博弈方策略
的组合 收益是各博弈方追求的根本目标及行为和判
断的主要依据 根据收益的博弈分类:零和博弈、常和博弈、
变和博弈
策略集SA=SB={石头,剪刀,布} 收益就是这个矩阵
石头
石头
0, 0
孩
子
剪刀
-1, 1
A
布
1, -1
孩子B
剪刀 1, -1 0, 0 -1, 1
布
-1, 1 1, -1 0, 0
占优均衡
占优:不管其它博弈方选择什么策略,一博 弈方的某个策略给他带来的得益始终高于其 它的策略,至少不低于其他策略的策略 (囚徒的困境中的“坦白”)
连续变量的纳什均衡
解: 一阶最优条件为:
u1 q1
6
q2
2 q1
0
u2 q2
6 q1
2q2
0
得到:q1=q2=2
混合策略的引进
博弈论
博弈就是一些个人、队组或其他组织,面对一定的 环境条件,在一定的规则下,同时或先后,一次或 多次,从各自允许选择的行为或策略中进行选择并 加以实施,各自取得相应结果的过程。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
囚徒的困境 赌胜博弈 审计博弈 性别之战 产量决策的古诺模型
囚徒的困境
囚徒的困境是图克(Tucker)1950年提出的 该博弈是博弈论最经典、著名的博弈
囚徒 2
坦白 不坦白
囚
坦白 -5, -5 0, -8
徒
1
不坦白 -8, 0 -1, -1
赌胜博弈
赌博、竞技等构成的博弈问题,在经济中也 有许多应用,赌胜博弈也是一类重要的博弈 问题,对经济竞争和合作也有很大启示
合( s1*,…,si-1*,si+1*,…,sn* )的最佳对策,即ui( ss为1i+*1G,*,的……一,,个sis-纳1n**,什)s均i*对,衡任si+1意*,sij…∈,Si都sn*成)立≥,u则i(称s(1*,s1…*,,…si,-1*,sn*si)j,
所有别的游戏者策略的简记法
s-i=(s1,…,si-1,si+1,…, sn) 纳什均衡简述为: