第二章 完全信息静态博弈的基本理论

合集下载

博弈论(第二章)讲义

博弈论(第二章)讲义

纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪

不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者


正 盖硬币者

-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2



上 博弈方1

1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0

应用博弈论第二讲完全信息静态博弈

应用博弈论第二讲完全信息静态博弈
生活中其实有很多相关的例子。

生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖 ,即所谓“散户跟大户”的现象。

例2
为什么中小企业不会花钱去开发新产品 ?

完全信息静态博弈的内涵
完全信息静态博弈,它有两个条件,(1 )各博弈方一次性的、同时决策(如剪 刀、石头、布的游戏,以及囚徒困境) ,(2)所有博弈方对各方得益都了解的 博弈,即各博弈方都完全了解所有博弈 方在各种情况下的得益。
见下页具体实例(石头、剪子、布游戏 )来理解什么是完全信息静态博弈。

生活中的“囚徒困境”例子
至迟从休谟(1739)开始,政治哲学
和经济学家已经认识到如果公民只关注 个人福利,公共物品就会出现短缺,并
且公共资源也会过度使用。因此政府应 该积极合理的干预经济生活。

例子
为什么政府要负责修建公共设施,因
为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处为 3。如果两户居民共同出资联合修路,并平均分 摊修路成本,则每户居民获得净的好处(支付 )为3-4/2=1;当只有一户人家单独出资修路时 ,修路的居民获得的支付为3-4=-1(亏损), “ 搭便车”不出资但仍然可以使用修好的路的另一 户人家获得支付3-0=3,见表2。
在技术创新市场上,大企业是大猪,它 们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。

第二讲 完全信息静态博弈

第二讲 完全信息静态博弈

得每个参与人的策略是对其他
参与人策略的最优反应。


在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i

命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法

箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法

第2章_完全信息静态博弈

第2章_完全信息静态博弈

2. “斗鸡博弈” 斗鸡博弈”
甲、乙两人相对而行,试图通过一座独木桥。 乙两人相对而行,试图通过一座独木桥。 独木桥仅能容纳一人通行。 独木桥仅能容纳一人通行。 如果两人坚持继续前行, 如果两人坚持继续前行,那么互不相让的二人势必都掉下狭仄 的独木桥,两人都会掉到河里, 的独木桥,两人都会掉到河里,均得到收益 -10。 。 如果甲选择退让,让乙先行, 如果甲选择退让,让乙先行,那么得意的乙将得到收益 20, , 面子受损的甲 得到收益 -2。 。 如果乙选择退让,让甲先行, 如果乙选择退让,让甲先行,那么得意的甲将得到收益 20, , 面子受损的乙得到收益 -2。 。 如果甲和乙均选择退让, 如果甲和乙均选择退让,那么双方均得到收益 10。 。
2.智猪博弈 .
猪栏里养了两头猪,一头大猪、一头小猪。 猪栏里养了两头猪,一头大猪、一头小猪。 在猪圈的一端有一个盛食槽。 在猪圈的一端有一个盛食槽。 在猪圈的另一端有一个按压式开关。 在猪圈的另一端有一个按压式开关。 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 大猪和小猪都在思考是否去按压开关。 大猪和小猪都在思考是否去按压开关。
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第二章
POWERPOINT TEMPLATE POWERPOINT TEMPLATE
2.通过“划横线法”求解“智猪博弈”的均衡 .通过“划横线法”求解“智猪博弈”
小猪 按开关 按开关 大猪 等待 (10,-2) , ) (0,0) , ) (5,-1) , ) 等待 (4,2) , )

完全信息静态博弈

完全信息静态博弈

• (三)最优反应函数法 • 所谓最优反应,指的是对某个局中人而言, 当其他人的策略给定时,使自己的收益最 大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中,彼此都互为最优反 应,那么,这个结果是均衡的,我们称之 为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如 下: p (q1 q2 ) ,边际称为常数c , 产量为 qi 。
• 首先,推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组,可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因,例 如,大家都靠右边行驶。
• 交通博弈:人们可以选择靠左或靠右行驶。

R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争(Battle of Sexes)

F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球,女士偏好看戏。 • 两者既有协作,又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。 三个实验: (1)你是其中之一(男士),如何选? (2)如果女士有权声明:看戏,你如何选? (cheap talk) • (3)如果女士有权发表如上声明,但放弃 了,你如何选?
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白,而另一方不坦白。则坦白 的一方因立功而释放;不坦白的一方因抗 拒且证据确凿,从众判10年徒刑。

博弈论Game Theory2

博弈论Game Theory2

划线法


在具有策略和利益相互依存的博弈问题中,各个 博弈方的得益既取决于自己选择的策略,还与其 他策略方选择的策略有关。因此,博弈方在决策 时必须考虑其他博弈方的存在和策略选择。 依据这种思想,科学的决策思路应该是:找出自 己针对其他博弈方每种策略和策略组合的最佳对 策,即自己的可选策略与其他博弈方每种策略配 合,给自己带来最大得益的策略,然后通过对其 他博弈方策略选择的判断,预测博弈的可能结果 和确定自己的最优策略。
举例

古诺的寡头模型 设一市场有两家厂商生产同样的产品。如果厂商1 的产量为q1,厂商2的产量为q2,则市场总产量为 Q = q1 + q2 。设市场出清价格P(可以将产品全 部卖出去的价格)是市场总产量的函数P = P(Q) = 8 -Q。再设两厂商的生产都无固定成本,且每 增加一单位产量的边际成本相等,C1 = C2 = 2, 即它们分别生产q1和q2单位产量的总成本分别为2 q1和2 q2 。最后强调两厂商同时决定各自的产量, 即他们在决策之前都不知道另一方的产量。
求解纳什均衡

博弈方就是n个农户,他们各自的策略空间就是他 们可能选择的羊群数目qi(i=1,2, …,n),取值范围, 当各户羊群数为q1, …qn时,在公共草地上放牧羊群 的总数为Q= q1+ q2+…+ qn,,每只羊的产出应是羊 群总数Q的函数V=v(Q)=v(q1+ q2+…+ qn).假设每 只羊的成本是不变的常数c,则农户i养qi只羊的得益 函数为:
u i q i V ( Q ) q i c q iV ( q 1 q 2 q n ) q i c

假设 n 3 , 即只有三个农户,每只 羊的产出函 数为 V 100 Q 100 ( q 1 q 2 q 3 ), 而成本 c 4 .这时,三个农户的得益 函数分别为 u 1 q 1 [100 ( q 1 q 2 q 3 )] 4 q 1 u 2 q 2 [100 ( q 1 q 2 q 3 )] 4 q 2 u 3 q 3 [100 ( q 1 q 2 q 3 )] 4 q 3 把上述得益函数看作连 续函数。

第二章完全信息静态博弈的基本理论

第二章完全信息静态博弈的基本理论

第二章完全信息静态博弈的基本理论第二章完全信息静态博弈的基本理论0.完全信息(complete information)博弈与不完全信息(incomplete information)博弈完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识;只要有一个参与人的支付函数不是该博弈的公共知识,就意味着该博弈是不完全信息博弈。

特别提示:如果该博弈是完全信息博弈,这意味着参与人不仅知道自己是什么类型的人,也知道对手们是什么类型的人。

一.求解方法之一:剔除严格劣策略1.占优策略与劣策略。

严格占优策略与严格劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于b策略,则称a策略是相对于b 策略的严格占优策略(strictly dominating strategy),b策略是相对于a策略的严格劣策略(strictly dominated strategy)。

弱占优策略与弱劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付不低于b策略,且至少有一种情况下的支付会严格大于b策略,则称b策略是相对于a策略的弱劣策略(weakly dominated strategy );a策略则是相对于b策略的弱占优策略(weakly dominating strategy)。

占优策略就是我们平时所说的上策,劣策略就是我们平时所说的下策。

特别提示:本文对占优策略的理解与其他教材不同,本文可以将以上述方式定义出来的占优策略称为局部占优策略;如果不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于其他所有策略,则称a策略是全局严格占优策略。

类似地,可以定义局部劣策略与全局劣策略。

理性的人在博弈时绝对不会选择严格劣策略。

通过剔除严格劣策略所获得的博弈解就称之为占优策略均衡。

2.案例案例1乙坦白不坦白甲坦白-6-6-10不坦白-10-1-1案例2乙不作广告作广告甲不作广告 8810 2作广告 21044在上面的两个例子中,通过剔除严格劣策略,可以获得一个占优策略均衡(坦白,坦白),(作广告,作广告)。

经济博弈论 02 完全信息静态博弈(Park)

经济博弈论 02 完全信息静态博弈(Park)
ui(S1*, ... Si-1*, Si*, Si+1*, ... Sn*) ≥ui(S1, ... Si-1*, Sij, Si+1*,… Sn*)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章完全信息静态博弈的基本理论0.完全信息(complete information)博弈与不完全信息(incomplete information)博弈完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识;只要有一个参与人的支付函数不是该博弈的公共知识,就意味着该博弈是不完全信息博弈。

特别提示:如果该博弈是完全信息博弈,这意味着参与人不仅知道自己是什么类型的人,也知道对手们是什么类型的人。

一.求解方法之一:剔除严格劣策略1.占优策略与劣策略。

严格占优策略与严格劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于b策略,则称a策略是相对于b策略的严格占优策略(strictly dominating strategy),b策略是相对于a策略的严格劣策略(strictly dominated strategy)。

弱占优策略与弱劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付不低于b策略,且至少有一种情况下的支付会严格大于b策略,则称b策略是相对于a策略的弱劣策略(weakly dominated strategy );a策略则是相对于b策略的弱占优策略(weakly dominating strategy)。

占优策略就是我们平时所说的上策,劣策略就是我们平时所说的下策。

特别提示:本文对占优策略的理解与其他教材不同,本文可以将以上述方式定义出来的占优策略称为局部占优策略;如果不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于其他所有策略,则称a策略是全局严格占优策略。

类似地,可以定义局部劣策略与全局劣策略。

理性的人在博弈时绝对不会选择严格劣策略。

通过剔除严格劣策略所获得的博弈解就称之为占优策略均衡。

2.案例案例1乙甲坦白不坦白案例2乙不作广告甲 不作广告作广告在上面的两个例子中,通过剔除严格劣策略,可以获得一个占优策略均衡(坦白,坦白),(作广告,作广告)。

3.请思考下面这个例子是否存在占优策略均衡?甲在上与下之间作选择,乙在左中右之间作选择经过重复剔除严格劣策略,可以获得一个占优策略均衡(上,中),这就是求解方法之一——严格劣策略的迭代剔除方法。

思考:占优策略均衡(上,中)是通过不断剔除严格劣策略而获得的,为了成功地进行剔除,需要什么样的前提条件?由此可以理解公共知识的重要性。

4.思考:下面这个博弈是否存在占优策略均衡?假设甲乙两个参与人分别在上中下,左中右之间作选择:剔除严格劣策略并不适合于求解所有的博弈,许多博弈是不存在占优策略均衡的。

5.社会(或集体)困境(dilemma )、合作与非合作博弈、占优策略均衡 (1)案例案例1:霍布斯博弈假设鲁滨逊与星期五生活在一个自然状态之中。

为了生存,他们各自有两个选择:自己生产财富或掠夺对方的财富。

博弈情形如下:乙甲生产掠夺思考:面对囚徒困境、广告博弈、霍布斯博弈,请思考如何解决社会困境?(答案略;最低价格承诺实际上就是为解决寡头之间的串谋困境提供了有效的解决机制)案例2:1964年以前,美国香烟的电视广告非常普遍,1964年卫生总监的报告宣布以后,美国四大烟草公司经过协商与联邦政府达成协议,决定不再做电视广告,协议于1971年生效。

各大烟草公司的利润得以大幅增加。

(2)合作博弈与非合作博弈A合作博弈:参与人直接事先达成具有约束力的协议,以集体协商的方式选择策略,故又可称之为联盟博弈。

由此形成的策略选择与支付被称为博弈的合作解,通常以帕累托最优作为度量标准。

合作博弈其实就是指参与人在行动前能够实现进行沟通、交流,且沟通交流达成的协议是有约束力的。

B非合作博弈:又称策略博弈,参与人以独立的方式选择策略。

由此形成的策略选择与支付被称为博弈的非合作解。

C一般所说的博弈论是指非合作博弈理论。

(3)社会(或集体)困境与占优策略均衡A所谓社会(或集体)困境就是指博弈的不合作解与合作解相悖。

B凡是存在社会(或集体)困境问题的场合必定存在占优策略均衡,即社会(或集体)困境问题是存在占优策略均衡的重要博弈类型。

C注意:不要认为占优策略均衡都一定意味着社会(或集体)困境。

以下面的政治博弈为例:甲乙作为竞选的对手,分别有三种立场可以选择:左中右;选民的分布是对称的;甲乙均追求选票最大化;具体的选票情况如下:思考:该博弈存在占优策略均衡吗?该博弈存在社会困境吗?从这个博弈可以看出,只有中间立场在政治上被充分表达,绝大多数的非中间立场的选民的立场被严重忽视。

(4)占优策略均衡在制度设计中有着广泛的应用价值。

二.求解方法之二:最优反应法——符合理性人性质的方法,博弈论最重要的求解方法1.最优反应策略:给定其他所有参与人策略选择的情况下,能够给某参与人带来最大收益的策略,其思维过程为:如果对手采用……,某参与人就应该采用……。

这是一种相对优势策略。

通过最优反应方法所获得的博弈解称之为纳什均衡。

2.如何寻找纳什均衡?划线法(仅适合二人有限策略博弈)案例1 竞选博弈假设甲乙两个参与人分别在上中下,左中右之间作选择:思考(下,右)这个策略组合具有什么特点?互相构成对对手策略选择的最优反应。

案例2 选址博弈甲乙两家百货公司考虑开店,可供选择的地址有四个:市郊、市中心、城市东部、城市西部。

具体支付情况如下:思考(市中心市中心)这个策略组合具有什么特点?3.纳什均衡:它是由全部参与人所选择的策略构成的这样一个组合,在这个组合中,每个参与人的策略都是针对其他参与人人策略选择的最优反应。

特别注意,均衡是针对策略组合的,而不是支付组合的,即在上面的博弈中,(下,右)才是均衡,(6 6)是这个博弈的均衡结果,不要把均衡与均衡结果混淆,这显然与微观经济学不同,在微观经济学中均衡是针对结果而言的。

4.关于纳什均衡的体会:纳什均衡具有策略稳定性,在均衡状态之下没有人愿意单方面改变自己的策略选择,因此,纳什均衡具有自我实施特征。

特别说明:策略稳定性不同于均衡稳定性。

5.纳什均衡与占优策略均衡(1)占优策略均衡肯定也是纳什均衡,但是纳什均衡不一定是占优策略均衡。

(2)纳什均衡与占优策略均衡都是博弈的非合作解。

6.多重纳什均衡问题(1)寻找下列博弈的纳什均衡案例1 节目选择博弈甲乙两个电台各有三种节目形式可供选择,分别是摇滚乐、乡村音乐以及谈话节目案例2 夫妻博弈妻足球芭蕾夫足球芭蕾上述两个例子的共同特点就是存在多个纳什均衡,这是纳什均衡的最大缺陷,降低了纳什均衡解的预测能力,因为一旦参与人的预期不一致,就可能出现极为糟糕的结局。

(2)多重纳什均衡的精炼(refine)所谓精炼就是通过附加另外的合理的标准,使得某些不合理的纳什均衡被剔除掉,以减少纳什均衡的个数,提高理论分析对现实的预测能力(因为纳什均衡只是涵盖了理性的一个方面:最优反应)。

精炼方法之一:寻找支付帕累托占优均衡乙推不推甲推不推通过比较发现,精炼方法之二:寻找风险占优均衡通过比较发现,在上面的博弈中,(不推,不推)在风险上优于(推推)精炼方法之三:寻找焦点(focus)或谢林点(schelling point)所谓焦点就是指那些依据某种线索或信号(如:历史、习俗、惯例、经验、自然或社会标志物)能够成为所有博弈参与人共识的纳什均衡。

特别说明:一方面,习俗和惯例能够为多重纳什均衡提供解,另一方面,习俗和惯例的稳定性正在于它们是纳什均衡。

虽然依据某些线索或信号,某个纳什均衡更有可能发生,成为博弈的焦点,但是并不是所有存在多重纳什均衡的博弈都有焦点。

三.求解方法之三:最大最小(maxmin)方法,一种非常保守稳健的方法1.最大最小策略:首先确定参与人在每一个策略下所能够获得的最小支付,在所有的最小支付中最大那个支付所对应的策略就是最大最小策略。

由所有参与人的最大最小策略所构成的策略组合就是博弈的最大最小解,2.案例案例1:抢答博弈乙按不按甲按不按案例2:开车博弈乙等待前行甲等待前行3.最大最小解与纳什均衡的关系(1)零和博弈与非零和博弈;常数和博弈与非常数和博弈零和博弈:在任何博弈策略组合下所有参与人的支付总和均为零。

非零和博弈:在任何博弈策略组合下所有参与人的支付总和并不都是零。

常数和博弈:在任何博弈策略组合下所有参与人的支付总和为一个常数,其实任何常数和博弈均可以转化为零和博弈。

非常数和博弈:在任何博弈策略组合下所有参与人的支付总和不是一个常数。

(2)在常数和博弈中,最大最小解与纳什均衡解是一致的。

在非常数和博弈中,最大最小解与纳什均衡解可能不一致。

采用最大最小方法的逻辑在于无论我选择什么策略,对手的最佳反应是采取使我支付最低的策略,故这个方法特别适合于零和博弈。

特别注意:最大最小方法并不适用于求解所有的零和博弈,如配硬币博弈就是一个例子。

案例:配硬币博弈乙正面反面甲正面反面(3)当最大最小解与纳什均衡解不一致时,采用哪种方法更加合理?一般来说,纳什均衡解更加合理,但是一旦存在多重纳什均衡且无法进行精炼,博弈存在极大的不确定性时,采用最大最小方法更加合理。

思考:配硬币博弈是否存在纳什均衡?乙正面反面甲正面反面四.混合策略纳什均衡1.在配硬币博弈以及儿童常玩的“石头、剪刀、布”一类的游戏中,按照我们前面给出的寻找纳什均衡的方法,不存在纳什均衡。

对这类游戏,人们的一个经验就是避免行为的规律性,随机地选择自己的策略,使得对手摸不着北,然后看能否凭运气击败对手,即使自己的策略选择具有不可预测性。

2.混合策略(mixed strategy)与纯策略(pure strategy)(1)混合策略:参与人策略集上的概率分布,即参与人以随机方式选择策略。

假设参与人拥有两个策略,则混合策略可以写成(p,1-p);假设参与人拥有三个策略,则混合策略可以写成(p,r,1-p-r)(2)纯策略:参与人以非随机的方式选择策略,其实,纯策略是一种特殊的混合策略。

纯策略其实就是指博弈矩阵旁边标示的策略,或者说参与人策略集中所包括的策略。

3.参与人的期望支付(1)一旦参与人采取混合策略,参与人的支付就必须用期望支付来表示。

(2)一个实例:计算甲乙参加配硬币博弈的期望支付乙正面反面甲 正面反面假设甲选择正面的概率为p ;假设乙选择正面的概率为q 。

EU 甲=(11(1))p q q -∙+∙-+(1)(1(1)(1))p q q -∙+-∙-=(21)(12)q p -- EU 乙=(21)(21)q p --(3)二人博弈中计算期望支付的一般公式1mi EU ==∑甲1ni j ij j p q a =∑1mi EU ==∑乙1ni j ij j p q b =∑依据:当对手正在进行随机选择时,他一定会选择这样的概率组合,使得我选择任意纯策略的期望收益均相等,从而使我无从下手,所以我也将进行随机选择,而且我选的概率组合也会使得对手无所适从。

相关文档
最新文档