第二章 完全信息静态非合作博弈

合集下载

非合作博弈经济管理学及财务知识分析理论

非合作博弈经济管理学及财务知识分析理论

(7,0) (5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
市场进入博弈-2阶段不完全信息动态博弈
基本思路-不完全信息动态博弈
在静态贝叶斯均衡中,参与人的信念是事前给定的,均衡 概念没有规定参与人如何修正自己的信念。但是,如果进 入者可以任意修订自己有关在位者成本函数的信念,上述 不完全信息动态博弈可以有任意均衡。
假定参与人的类型是独立分布的,参与人i有K个类型, 有h个可能的行动,өk和ah分别代表一个特定的类型和 一个特定的行动。
如果我们观察到i选择了ah,i属于өk的后验概率是多少?
p(ahk)p(k) p(ahk)p(k)
Por{b kah}
(7,0) (5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
市场进入博弈-2阶段不完全信息动态博弈
基本思路-不完全信息动态博弈
精练贝叶斯均衡是贝叶斯均衡、子博弈精练均 衡和贝叶斯推断的结合。它要求:
✓ 1、在每个信息集上,决策者必须有一个定义 在属于该信息集的所有决策结上的一个概率分 布(信念);
第二个弟子……
第三个弟子……
贝叶斯法则
在日常生活中,当面临不确定时,我们对某事 件发生的可能性有一个判断,然后,会根据新 的信息来修正这个判断。
✓ 统计学上,修正之前的判断称为“先验概率”
✓ 修正后的判断称为“后验概率”
贝叶斯法则就是人们根据新的信息从先验概率 得到后验概率的基本方法。
贝叶斯法则
基本思路-不完全信息动态博弈
成语故事:黔之驴-驴虎博弈
老虎通过不断试探来修正对毛驴的看法, 每一步行动都是给定它的信念下最优的, 毛驴也是如此。最终老虎将毛驴吃掉。

第2章_完全信息静态博弈

第2章_完全信息静态博弈


前行
退让
前行
(-10,-10) (20,-2)

退让
(-2,20) (0,0)
❖ (甲前行、乙退让)和(甲退让、乙前行)都是“斗鸡博弈” 的纳什均衡。
3.“市场争夺战”博弈
❖ 假设在市场中有两个竞争对手。一个是已经在市场中的“在位者”, 另一个是企图进入市场的“潜在进入者”。
❖ 潜在进入者有两个可以选择的策略:进入、不进入。在位者也有两个 可以选择的策略:斗争、默许。
(10,1) (2,2)
❖ 如果嫌疑人乙选择坦白,那么嫌疑人甲应该如何选择? ❖ 理性的嫌疑人甲会选择坦白。 ❖ 在嫌疑人甲选择坦白所对应的收益“5”的下方划一道短横线。 ❖ 类似可分析其他情况
❖ 2.通过“划横线法”求解“智猪博弈”的均衡
大猪
按开关 等待
小猪
按开关
等待
(5,-1)
(4,2)
(10,-2) (0,0)
❖ 如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈 另一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会 比小猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按 压开关的劳动却没有吃到食物。在此种情况下,大猪的收益为 5,小猪的收益为 -1。
❖ 如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下 开关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花 一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强 力壮的大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况 下,大猪得到的收益是 4,小猪得到的收益是 2。
❖ 将嫌疑人甲标识在支付矩阵左侧,将嫌疑人乙标识在支付 矩阵上方 。
❖ 嫌疑人甲有两个策略可以选择:坦白、不坦白。将嫌疑人 甲可能的策略纵向排列在博弈支付矩阵左侧。

博弈论第3节

博弈论第3节

情侣博弈和纳什均衡
情侣博弈
丽娟 足球 足球 大 海 电影 2,1 0,0 电影 0,0 1,2
足球显然不是大海的劣势策略。 电影也不是大海的劣势策略,因为如果丽娟坚持选电 影,大海选足球只得0,选电影还可以得1。 所以,大海没有全面的劣势策略。同样,丽娟也没有 全面的劣势策略。
情侣博弈的纳什均衡
(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略 这类博弈很多, 这类博弈很多,引出混合策略纳什均衡概念
二、混合策略、混合策略博弈 和混合策略纳什均衡
} 混合策略:在博弈G = {S1,LSn ; u1,Lun中,博弈方 i 的策略 混合策略 空间为 S i = {si1 , L sik },则博弈方 i以概率分布 pi = ( pi1 ,L p ik ) 随机在其 k 个可选策略中选择的“策略”,称为一个“混合策 j = 1,L, k 0 ≤ p ij ≤ p i1 + L 略”,其中 1 对 都成立,且+ p ik = 1
占优策略均衡
占优策略:不管其它博弈方选择什么策略,一博 占优策略 弈方的某个策略给他带来的得益始终高于其它 的策略,至少不低于其他策略的策略 囚徒的困境中的“坦白”;双寡头削价中“低 价”。 占优策略均衡:一个博弈的某个策略组合中的所 占优策略均衡 有策略都是各个博弈方各自的占优策略,必然 是该博弈比较稳定的结果 占优策略均衡不是普遍存在的
囚徒困境
囚徒 2 坦 白 囚 坦 白 徒 1 不坦白 囚徒1:坦白 囚徒2:坦白 -5, -5 不坦白 0, -8
-8, 0
-1, -1
两个罪犯的得益矩阵
在一个博弈里,如果所有参与人都有占优策略 存在,那么占优策略均衡是可以预测到的唯一的均衡, 因为没有一个理性的参与人会选择劣策略。所以在囚徒 困境博弈里,{坦白,坦白}是占优策略均衡。 囚徒困境反映了一个深刻的问题,即个人理性与 团体理性的冲突。这给我们一个启示,我们学习博弈论, 也许更应该研究的是怎样设计一种制度,在满足个人理性 的同时,去争取达到“集体理性”。

第二章完全信息静态博弈

第二章完全信息静态博弈

第二章完全信息静态博弈2在完全信息静态博弈中,各博弈方同时决策,且所有博弈方对各方得益都完全了解。

完全信息静态博弈属于非合作博弈最基本类型。

本章介绍该类博弈的一般分析方法、纳什均衡概念及分析方法的扩展。

2.1 基本分析方法3上策均衡严格下策反复消去法划线法箭头法上策均衡4 (Dominant-strategy Equilibrium)上策(Dominant-strategy) :不管其它博弈方选择什么策略,一个博弈方的某个策略给他带来的得益至少不低于其他策略。

例:囚徒困境Idea..?5上策均衡与均衡结果:上策均衡(坦白,坦白)均衡得益(-5,-5)“坦白”相对于“抵赖”是每个囚徒的上策(优势策略)-5,-50,-8-8,0-1,-1坦白抵赖坦白抵赖囚徒B囚徒A上策均衡6 (Dominant-strategy Equilibrium)上策均衡:由每个博弈方的上策所组成的策略组合。

一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果。

博弈方2博弈方1A B C a3,22,35,4 b2,11,23,3 c1,61,44,5例寻找上策(优势策略)检查一下你是否存在上策,如果有,就选择它。

站在其他方的位置上思考问题如果你没有上策,那么从其他博弈方角度考虑。

如果其他博弈方有上策,预期他将选择自己的上策。

严格下策:不管其它博弈方的策略如何变化,某种策略给一个博弈方带来的得益总比另一种策略小,称前一种策略为相对于后一种策略的“严格下策”。

1,01,30,40,2左中1,01,3左中1,01,30,10,40,22,0左中右上下211,3中上例:巡逻6,24,48,00,0巡逻不巡逻穷人不巡逻富人WELCOME富人与穷人1112处于强势的博弈方为维护自己利益采取某种决策时,为其他弱势博弈方提供了搭便车的机会公司里的大股东与小股东每一个博弈方针对其他方的每一种策略,在自己的最大可能得益下划线2,10,00,01,3时装足球时装足球丈夫妻子夫妻之争划线法13划线法:通过在最佳对策得益下划线分析博弈的方法。

应用博弈论第二讲完全信息静态博弈

应用博弈论第二讲完全信息静态博弈
33
2.2.1 纳什均衡的定义
策略空间:S1 , S n
博弈方 i的第 j 个策略:si j Si 博弈方 i的得益:u i
博弈:G {S1,Sn;u1,un}
纳什均衡:在博弈G {S1,Sn;u1,un}中,如果由各个博弈方i
的各一个策略组成的某个策略组合(si*,sn* ) 中,任一博弈方 的策略,都是对其余博弈方策略的组合 (si*,si*1, si*1,...sn* ) 的最佳对策,也即ui (si*,si*1, si*, si*1,...sn*) ui (si*,si*1, sij , si*1,...sn*)
岗位职责三工作总结项目运维项目实施银青高速视频监控东毛隧道停车场项目全面实施ip设置贵州独平高速项目全面实施监控室机柜布线四心得体会在这段时间的学习过程中我对部门很多产品从零学起刚到公司的时候感觉压力很大经过这些时间的认真学习和实际操作调整心态现已完全能融入公司的各项岗位职责和管理制度中
第二章 完全信息静态博弈
25
表1 划线法分析囚徒困境
囚徒 2

不招
囚 招 -8,-8 0,-10
徒 1
不 招
-10,0
-1,-1
26
习题3:划线法(一)
矩阵1
妻子
丈 活着 夫 死了
活着
1,1 0,-1
死了
-1,0 0,0
27
矩阵1的含义
矩阵1的纳什均衡为(活着,活 着)和(死了,死了)。这两个纳什均 衡的含义是这对夫妻要么同时活着,要 么同时死,如果有一个死了,则另一个 也宁愿选择死,而不愿单独活着。这说 明这对夫妻的感情极度恩爱,以至于单 独活着只有痛苦,甚至生不如死。
经开始对日本和德国这两个法西斯轴心国展开大反 攻。

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈

囚徒困境在经济学上有着广泛的应用。 例1:两个寡头企业选择产量的博弈。如果两个企业联合起来形成卡特尔,选择垄 断利润最大化的产量,每个企业都可以得到更多的利润。但卡特尔不是一个稳定 的均衡,因为给定对方遵守协议的情况下,每个企业都想增加生产,结果是,每 个企业都只得到小于最大利润的产量,利润严格小于卡特尔产量下的利润。 在有些情况下,个人理性和集体理性的冲突对社会来说也许是一件好事,尽管对 集体而言是一件坏事。
第2讲 完全信息静态博弈
下继续生活下去。 从囚徒困境中,我们可以引出一个很重要的结论:一种制度(体制)安排,要发 生效力,必须是一种均衡。否则,这种制度安排不能成立。
第2讲 完全信息静态博弈

3.重复剔除的占优均衡 在每个参与人都有占优战略的情况下,占优战略均衡是一个非常合理的预测,但在 绝大数博弈中,占优战略均衡是不存在的。
第2讲 完全信息静态博弈

在“智猪博弈”中,我们先剔除掉小猪的劣战略“按”,在剔除掉这个战略后的 新的博弈中,小猪只有一个战略“等待”,大猪仍有两个战略,但此时,“等待” 已成为大猪的劣战略,提出这个战略,剩下的唯一战略组合是(按,等待)。
第2讲 完全信息静态博弈

我们需要对“占优战略”和“劣战略”的概念进行重新定义。


都是(相对于si*的)劣战略。 在应用重复剔除方法寻找均衡时,一个战略是占优战略或劣 战略可能是相对于另一个特定的战略而言的。
第2讲 完全信息静态博弈
' ' ' 定义:令si 和s? 是参与人 i 可选择的两个战略(即 s i i Si, ' s’ i Si)。如果对于任意的其他参与人的战略组合s -i,参与人 ' ' i的选择si 得到的支付严格小于从选择s? i 得到的支付,即:

博弈论与信息经济学GameTheoryandInformationEconomics课件

博弈论与信息经济学GameTheoryandInformationEconomics课件
经济学家提炼出信息不对称的概念,挖 出一批“柠檬市场”,并解剖的是一大 贡献;
而提出改造世界的方案,设计出各种在 信息不对称情况下保障市场有效运转的 机制是另一大贡献,甚至认为是更大的 贡献。
一 博弈论与信息经济学
博弈论
给定信息结构,求均 衡结果 均衡理论 方法论导向 实证的
信息经济学
给定信息结构,求契 约安排 契约设计理论 问题导向 规范的
模型
隐藏行动的道德 风险
隐藏信息的道德 风险
逆向选择风险
信号传递和信息 甄别
委托人
地主 股东 住户 公民 社会 雇主 股东 原告/被告 雇主 保险公司
雇主 买方投资
代理人
佃农 经理 房东 政府官员 犯罪 雇员 经理 代理律师 雇员 投保人
工人 卖方
行动、类型或信号
耕作努力 工作努力 房屋修缮 廉洁或贪污 偷盗的次数 任务的难易/工作努力 市场需求/投资决策 赢的概率/办案努力 工作技能 感染爱滋病病毒
险模型

非对称发生在事前(签约前),逆向选择模型;

非对称发生在事后(签约后),道德风险模型。
研究不可观测行动的模型称为隐藏行动模型;
研究不可观测信息的模型称为隐藏信息(或知识)模型
隐藏行动的道德风险
签约时信息是对称的

接受
选择行动
提供合同
努力或不 自然
努力
代理人

委托人
代理人 不接受
某些可 观测的 结果
作为博弈者,最佳策略是最大限度地利 用游戏规则,最大化自己的利益;
作为社会最佳策略,是通过规则使社会 整体福利增加。
第六章 委托-代理理论(I)
一 博弈论与信息经济学 二 信息经济学的分类 三 委托-代理理论的分析思路和框架 四 对称信息下的最优合同

经济博弈论 02 完全信息静态博弈(Park)

经济博弈论 02 完全信息静态博弈(Park)
ui(S1*, ... Si-1*, Si*, Si+1*, ... Sn*) ≥ui(S1, ... Si-1*, Sij, Si+1*,… Sn*)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博 弈 方 1 A B 2, 3 3, 1 5, 2 1, 5
博弈方1的混合策略
pA 3 pB 1 pA 2 pB 5
博弈方2的混合策略
pC 2 pD 5 pC 3 pD 1
策略 收益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6
* P 1
1 * (a1 b1c1 d1 P 2 ) 2b1
* P 2
1 * (a2 b2 c2 d 2 P 1 ) 2b2
博弈论 重பைடு நூலகம்大学 刘辛 17
2015/10/22
2.3.4 公共资源问题
公共草地养羊问题
Q q1 qn V V (Q) 100 Q
一、夫妻之争的混合策略纳什均衡
丈夫 时装 妻 子 时装 足球 2, 1 0, 0 足球 0, 0 1, 3 妻子的混合策略
pw (C) 1 pw (F ) 0 pw (C) 0 pw (F ) 3
丈夫的混合策略
* * * q1 q2 q3 24
* * * u1 u2 u3 576
Q* 72
合作:总体利益最大化
u Q(100 Q) 4Q 96 Q
2015/10/22
u * 1728
Q 48 3 24 72 u 2304 3 576 1728
2015/10/22 博弈论 重庆大学 刘辛 12
2.3 无限策略分析和反应函数
2.3.1 古诺的寡头模型 2.3.2 最佳反应函数 2.3.3 伯特兰德寡头模型 2.3.4 公共资源问题 2.3.5 反应函数的问题和局限性
2015/10/22
博弈论 重庆大学 刘辛
13
2.3.1 古诺的寡头模型
(0,6) (0,3)
R1 (q2 )
R2 (q1 )
(3,0) (6,0)
q1
古诺模型的反应函数图示
2015/10/22 博弈论 重庆大学 刘辛 16
2.3.3 伯特兰德寡头模型
• 价格竞争寡头的博弈模型 • 产品无差别,消费者对价格不十分敏感
q1 q1 ( P 1, P 2 ) a1 b 1P 1 d1 P 2 q2 q2 ( P 1, P 2 ) a2 b2 P 2 d2 P 1
19
博弈论 重庆大学 刘辛
2.3.5 反应函数的问题和局限性
• 在许多博弈中,博弈方的策略是有限且非连 续时,其收益函数不是连续可导函数,无法 求得最佳反应函数,从而不能通过解方程组 的方法求得纳什均衡。 • 即使收益函数可以求导,也可能各博弈方的 收益函数比较复杂,因此各自的反应函数也 比较复杂,并不总能保证各博弈方的最佳反 应函数有交点,特别不能保证有唯一的交点。
2015/10/22
博弈论 重庆大学 刘辛
15
2.3.2 最佳反应函数
古诺模型的最佳反应函 数
q2
理性局 限和古 诺调整
maxu1 max(6q1 q1q2 q12 )
q1
q1 R1 (q2 ) 1 2 ( 6 q2 ) q2 R2 (q1 ) (6 q1 )
1 2
纳什均衡:在博弈 G {S1,Sn ; u1 ,un } 中,如果由各个博 * * 弈方的各一个策略组成的某个策略组合 (si ,sn ) 中,任一博 * 弈方i 的策略,都是对其余博弈方策略的组合(si* ,si*1 , si*1,...sn ) * * ) ui (si* ,si*1, sij , si*1,...sn ) 对 的最佳对策,也即 ui (si* ,si*1, si* , si*1,...sn 任意 si j Si 都成立,则称 (s ,s ) 为G 的一个纳什均衡
6q2 q1q2 q22
2015/10/22
博弈论 重庆大学 刘辛
14
两寡头间的囚徒困境博弈
厂商2
不突破 厂 不突破 商 1 突破 突破
4.5,4.5
5,3.75
3.75,5
4,4
以自身最大利益为目标:各生产 2单位产量,各自收益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自收益为4.5
ij
混合策略扩展博弈:博弈方在混合策略的策略空间(概 率分布空间)的选择看作一个博弈,就是原博弈的“混合策 略扩展博弈)。 混合策略纳什均衡:包含混合策略的策略组合,构成纳 什均衡。
2015/10/22 博弈论 重庆大学 刘辛 23
三、一个例子
该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析
博弈方2 C D
1, -1
-1, 1
2015/10/22
博弈论 重庆大学 刘辛
7
2.1.4 箭头法
1, 0 0, 4 囚 徒 困 境 猜 硬 币
2015/10/22
1, 3 0, 2
0, 1 2, 0 夫 妻 之 争
-5, -5 -8, 0
0, -8 -1, -1
2, 1 0, 0
0, 0 1, 3
-1, 1 1, -1
2015/10/22 博弈论 重庆大学 刘辛 1
本章分六部分
2.1基本分析思路和方法 2.2纳什均衡 2.3无限策略博弈分析和反应函数 2.4混合策略和混合策略纳什均衡 2.5纳什均衡的存在性 2.6纳什均衡的选择和分析方法扩展
2015/10/22
博弈论 重庆大学 刘辛
2
2.1 基本分析思路和方法
1, -1 -1, 1
博弈论 重庆大学 刘辛
8
2.2 纳什均衡
2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法
2015/10/22
博弈论 重庆大学 刘辛
9
2.2.1 纳什均衡的定义
•策略空间: S1 ,Sn si j Si •博弈方i 的第 j个策略: •博弈方i 的收益: ui G {S1 ,Sn ; u1 ,un } •博弈:
一、猜硬币博弈
猜硬币方 正 面 盖 硬 币 方 正 面 反 面 -1, 1 1, -1 反 面 1, -1 -1, 1
(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略
这类博弈很多,引出混合策略纳什均衡概念
2015/10/22 博弈论 重庆大学 刘辛 22
二、混合策略、混合策略博弈 和混合策略纳什均衡
混合策略:在博弈 G {S1,Sn ; u1,un} 中,博弈方i 的策略空 间为Si {si1,sik },则博弈方i 以概率分布 pi ( pi1 ,pik ) 随机 在其k 个可选策略中选择的“策略”,称为一个“混合策略”, j 1,, k 0 p 1 pi1 pik 1 其中 对 都成立,且
2015/10/22 博弈论 重庆大学 刘辛 11
2.2.3 纳什均衡与严格下策反复消去法
• 占优均衡肯定是纳什均衡,但纳什均衡不一定是占优均衡
命题2.1:在n个博弈方的博弈 G {S1,Sn ; u1,un } 中,如果严格 * ) 之外的所有策略组合, 下策反复消去法排除了除 (si* ,sn * ) 一定是该博弈的唯一的纳什均衡 那么(si* ,sn 命题2.2:在n个博弈方的博弈中 G {S1,Sn ; u1,un } 中,如果 * (si* ,sn ) 是 G 的一个纳什均衡,那么严格下策反复消 去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严 格下策反复消去法简化博弈是可行的
寡头产量竞争——以两厂商产量竞争为例
Q q1 q2 P P(Q) 8 Q
c1 c2 2
1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1
6q1 q1q2 q12 2 q2 P(Q) c2q2 q2[8 (q1 q2 )] 2q2
小偷 收益(偷)
守卫
V

小 偷 偷 不偷 V,-D 0, S
不睡
-P,0 0, 0 0 -P 1
Pg 守卫 睡的概略
- P’
加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会是的守卫更多的偷懒
2015/10/22 博弈论 重庆大学 刘辛 26
2.4.2 多重均衡博弈和混合策略
2015/10/22
博弈论 重庆大学 刘辛
5
2.1.3 划线法
1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
2015/10/22
博弈论 重庆大学 刘辛
6
囚 徒 困 境
猜 硬 币
-5, -5 -8, 0
0, -8 -1, -1
夫 妻 之 争
2, 1 0, 0
0, 0 1, 3
-1, 1
1, -1
24
2015/10/22
博弈论 重庆大学 刘辛
五、小偷和守卫的博弈
守卫 收益((睡)
守卫 睡 V,-D 小 偷 偷 不偷 0,S 不睡 -P,0 0,0
S
0
1 -D
Pt 小偷 偷的概率
- D’
加重对保安的处罚:短期中的效果是使保安真正尽职 在长期中并不能使保安更尽职,但会降低盗窃发生的概略
2015/10/22 博弈论 重庆大学 刘辛 25
第二章 完全信息静态博弈
本章介绍完全信息静态博弈。 完全信息静态博弈即各博弈方同时决策,且所 有博弈方对各方收益都了解的博弈。 囚徒的困境、齐威王田忌赛马、猜硬币、石头 剪子布、古诺产量决策都属于这种博弈。 完全信息静态博弈属于非合作博弈最基本的类 型。 本章介绍完全信息静态博弈的一般分析方法、 纳什均衡概念、各种经典模型及其应用等。
2.1.1 占优均衡 2.1.2 严格下策反复消去法 2.1.3 划线法 2.1.4 箭头法
相关文档
最新文档