博弈论(2)

合集下载

博弈论简介2

博弈论简介2
,数量相同时守军胜。
游戏:军事游戏-进攻和防守
守军的部署方案:
A:三个师,部署在A道路; B:两个师部署在A道路, 一个师部署在B道路; C:一个师部署在A道路,两个师部署在B道路; D:三个师部署在B道路。
攻方的进攻方案:
a. 集中两个师从A道路进攻; b. 兵分两路分别从A、B道路发起进攻;
c. 集中两个师从B道路进攻。
纳什均衡
猎人2
猎鹿
猎人1 猎鹿
4
4
猎兔
0
1
猎兔
1
0
1
1
(猎鹿,猎鹿)、(猎兔,猎兔)是纳什均衡
博弈分析
鲜花博弈
两男两女:帅哥和牛粪先生,鲜花小姐和芳草姑娘。 帅哥喜欢鲜花小姐;芳草小姐喜欢帅哥。
博弈分析
•鲜花博弈
1. 如果帅哥追求鲜花而牛粪先生不追求, 那么帅哥肯定会得到鲜花小姐的芳心 。
2. 如果牛粪先生追求鲜花而帅哥不追求的话,同样牛粪先生也会得到鲜花小姐的 芳心。
不坦白
-8
0 -1 -1
博弈分析
囚徒2
坦白
不坦白
囚 徒1 坦白 -5 -5 0 -8
不坦白
-8
0 -1 -1
囚徒2
坦白
不坦白
囚 徒1 坦白 -5 -5 0 -8
不坦白
-8
0 -1 -1
纳什均衡的选择和分析方法扩展
•防共谋均衡

L
R
甲 U 0, 0, 10 -5, -5, 0 D -5, -5, 0 1, 1, -5
博弈结果表
a
攻方
c
守方
B
C
-1
+1
+1

博弈论(第二章)讲义

博弈论(第二章)讲义

纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪

不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者


正 盖硬币者

-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2



上 博弈方1

1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0

博弈论基础教程教学设计 (2)

博弈论基础教程教学设计 (2)

博弈论基础教程教学设计引言博弈论是数学的一个分支,研究在不同决策者的利益与互动下,如何进行最优选择,并通过程序设计和算法优化得出最优解。

它涉及许多领域,例如经济学、心理学、社会学、计算机科学等等。

本文将介绍博弈论基础教程的教学设计,主要面向计算机科学领域的初学者。

教学目标本课程的教学目标是使学生了解博弈论的基础概念和解法,并掌握以下内容:•博弈论概论•常用博弈模型的分析和求解方法•Nash均衡和博弈的稳定性•博弈的应用教学方法本教程采用多种教学方法,包括讲解、演示、练习和讨论等。

在课堂上,老师将主要采用讲解的方式向学生介绍博弈论的概念和解法,同时配以案例解析,并开设问答环节。

此外,老师将设计相关的程序实验和授课录屏,让学生更直观地理解和掌握相关知识。

学生需要在课后自行完成练习题和对案例的分析,并参加相应的讨论,以进一步巩固所学内容。

教学内容博弈论概论博弈论包括两部分:博弈和解决方式。

我们将重点介绍以下几个方面:•零和博弈和非零和博弈•完美信息博弈和不完全信息博弈•合作和非合作博弈•约束和非约束博弈常用博弈模型的分析和求解方法博弈论有许多用来建模和求解的模型。

在本课程中,我们将介绍以下模型:•囚徒困境•社交困境•保卫战争•博弈树Nash均衡和博弈的稳定性Nash均衡是指在一个博弈中,每个参与者都选择自己最优的策略,而无法通过单独改变策略来获得更好的结果。

在本课程中,我们将介绍以下内容:•Nash均衡的概念和计算方法•多元博弈的Nash均衡•博弈的稳定性博弈的应用博弈论在实际中有广泛的应用,例如电子商务、金融和投资、能源和环境等领域。

在本课程中,我们将介绍以下应用:•电子拍卖•股市交易和投资•能源和环境政策教学评估本教程采用多种教学评估方法,旨在全面地了解学生的掌握情况和学习效果,包括期末考试、平时作业、实验报告和课堂讨论等。

结论通过本教程的学习,我们希望学生能够初步掌握博弈论的基本概念和解法,了解博弈论在实际中的应用,并能够运用博弈论分析和解决一些实际问题。

博弈论导论 2

博弈论导论 2

图 2-5 军备竞赛
思考:现实生活中还有哪些情况属于囚徒困境? 练习:将团队生产问题模型化成囚徒困境;如何理解囚徒困境与“看不见的手”之间 的矛盾?
2.1.5 走出囚徒困境
从社会福利的角度讲,囚徒困境不是帕累托最优的,但这与理性人的假设并不矛盾。
① ②
这实际上是 Betrand 价格竞争模型。 这是 Hardin(1968)发表在 Science 上但是被经济学引用最多的例子。但是,最近有学者提出了“反公地 悲剧”理论。董志强(2007)启发我使用这个简单的收益矩阵而非复杂的数学模型。 白鲨在线 2
2.3.2 性别战
如图 2-12。两个博弈相同的地方在于:(1)存在多重均衡,而且双方各自偏向一个 均衡;(2)任何一个均衡结果都是帕累托最优的。信念扮演了重要的作用。在这个博弈中, 假设男方是一个有名的拳击手,而女方也知道这点,那么(拳击,拳击)应该是一个均衡结 果,而(芭蕾,拳击)不应该出现。
白鲨在线 5
2.3.4 协调博弈
如图 2-14,史密斯公司和琼斯公司独立地决定选择何种智能手机操作系统。若两家公 司选择同样的操作系统,销售会更好。 特征:存在多重均衡,但是一些均衡帕累托优于另一些均衡,这与性别战和斗鸡博弈 都不同。 提示:一定要注意不同博弈模型的结构性特征,而不是过于关注具体数字。 思考:现实生活中有哪些博弈是性别战、斗鸡博弈和协调博弈?
图 2-1 双边优势
图 2-2 单边优势
2.1.2 定义优势策略均衡
并且,我们有 命题:如果一个博弈 N ,{Si }i 1 ,{vi ()}i 1 存在优势策略均衡 s ,那么 s 就是惟一的 优势策略均衡,并且也是惟一的纳什均衡。 证明过程略(可做思考题或作业)。
白鲨在线 1

博弈论讲义2

博弈论讲义2
13
尽管许多博弈中重复剔除的占优均衡是一个合理 的预测,但并不总是如此,尤其是大概支付是某 些极端值的时候。
参与人B
L
参与人A
R -1000,9
U
8,10
D
7, 6
6, 5
U是A的最优选择,但是,只要有1/1000的概率B选R, A就会选D
14
斗鸡博弈
进 A 独木桥 纳什均衡:A进,B退;A退,B进 对于相当多的博弈,我们无法运用重复剔除劣战略的 方法找出均衡解。
1、Cournot Model of Duopoly
按竞争程度划分的市场类型(就卖方来说):
A 完全竞争市场 B 寡头竞争市场 C 独家垄断市场
29
市场类型不同,厂商之间行为特征不同,A与C 类型中,厂商的决策都是个体优化决策,而B类 型中寡头垄断竞争的本质就构成博弈,他们都 是理性的决策者,他们的行为既影响自身,又 影响对方。尽管两寡头由于垄断能给他们带来 一些共同的利益,但是他们的根本利益并不是 完全一致的。如果两寡头之间可以签定有约束 力的协议,彼此之间达成合作,形成完全垄断, 此时的博弈是一种合作博弈。然而在大多数情 况下,彼此之间很难达成有约束力的协议,这 样就是非合作博弈。
7
注意:
与占优战略均衡中的占优战略和劣战略不同,
这里的占优战略或劣战略可能只是相对于另一个
特定战略而言。
8
案例1-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 4大于1
0,0
0大于-1
按是小猪的严格 劣战略-剔除 “按”是大猪的占优战略,纳什均衡:大猪按,小猪等待
9
案例2
U 行先生
s * 是一个纳什均衡: 或者用另一种表达方式: 当且仅当 si* 是下述最大化问题的解时,

博弈论课程设计 (2)

博弈论课程设计 (2)

博弈论课程设计1、引言博弈论是现代数学中的一个重要分支,是由经济学家和数学家共同合作发展起来的。

博弈论主要研究人类社会中的决策行为和相互关系,以及在涉及决策行为和相互关系的情景中个体或组织如何做出理性的决策。

博弈论在生物学、心理学、社会学、管理学、工程学等领域也有广泛的应用。

在博弈论的学习过程中,理论与实践相结合是必不可少的。

本文将介绍一些博弈论的课程设计,旨在帮助学生更好地理解和应用博弈论的知识。

2、课程设计2.1 美国拍卖模拟实验美国拍卖是一种竞价拍卖。

在竞拍过程中,买家通过不断提高他们的出价来争夺商品,最后出价最高者获得商品所有权。

美国拍卖的特点是出价者可以随时根据拍卖过程中的信息改变他们的出价。

该模拟实验的目的是通过竞卖过程的模拟来让学生学习博弈论中的核心概念,如策略、博弈纳什均衡等。

该实验还可以帮助学生分析竞价策略与结果的关系,提高学生思考和策略制定的能力。

2.2 博弈纳什均衡实验博弈纳什均衡是博弈论中的一个重要概念。

在一个博弈中,如果所有参与者都选择了他们各自的最优策略,那么这个博弈就到达了一个均衡状态,称为纳什均衡。

该实验可以让学生自己尝试找到博弈的纳什均衡,提高学生的逻辑推理和自主思考能力。

同时,这个实验中涉及到的博弈模型也可以用来分析和解决现实生活中的问题。

2.3 连续混合策略实验连续混合策略是博弈论中的一个重要概念,它在实际应用中有广泛的应用。

在连续混合策略中,玩家有一个概率分布,他们可以随机选择他们的行动。

在竞争和合作的情况下,连续混合策略被用来描述下注、选择行为模型等。

在本实验中,学生将学习如何制定连续混合策略并评估它们的效果。

通过该实验,学生将加深对复杂博弈策略的理解和应用,提高学生的计算能力和分析能力。

3、结语博弈论不仅仅是一种专业的数学知识,它已经成为了理解和解决社会问题的一种重要的工具。

实践是理论的检验,课程设计可以帮助学生更好地理解和应用博弈论的知识。

希望本文介绍的三个课程设计能够为读者提供一些启示,帮助读者更好地理解博弈论的知识和应用。

博弈论(第二章)

博弈论(第二章)
设某个村庄有三个农户,该村有一片大家都可以 自由放牧羊群的公共草地。由于这片草地的面积 有限,因此只能让不超过某一数量的羊吃饱,如 果在这片草地上的放牧的羊只的数量超过这个数 量,则每只羊都无法吃饱,从而每只羊的产出 (毛,皮和肉的总价值)就会减少,甚至有些羊 就会饿死。
假设这些农户在夏天才到公共草地放羊,而每年 的春天就要决定养羊的数量。
(2)严格下策反复消去法也不能解决所有的博弈分析 问题 。
严格下策反复消去法的思考问题:
(1)“严格下策”和“上策”之间有没有对应关系, 什么
情况下有对应关系? (2)使用严格下策反复消去法所得到的均衡结果,是
否与消去的严格下策的次序有关。
严格下策反复消去法的练习
例2:下图中的得益矩阵表示两博弈方的一个静态博 弈,试使用严格下策反复消去法进行分析。
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪

不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者


正 盖硬币者

-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,

博弈论Game Theory2

博弈论Game Theory2

划线法


在具有策略和利益相互依存的博弈问题中,各个 博弈方的得益既取决于自己选择的策略,还与其 他策略方选择的策略有关。因此,博弈方在决策 时必须考虑其他博弈方的存在和策略选择。 依据这种思想,科学的决策思路应该是:找出自 己针对其他博弈方每种策略和策略组合的最佳对 策,即自己的可选策略与其他博弈方每种策略配 合,给自己带来最大得益的策略,然后通过对其 他博弈方策略选择的判断,预测博弈的可能结果 和确定自己的最优策略。
举例

古诺的寡头模型 设一市场有两家厂商生产同样的产品。如果厂商1 的产量为q1,厂商2的产量为q2,则市场总产量为 Q = q1 + q2 。设市场出清价格P(可以将产品全 部卖出去的价格)是市场总产量的函数P = P(Q) = 8 -Q。再设两厂商的生产都无固定成本,且每 增加一单位产量的边际成本相等,C1 = C2 = 2, 即它们分别生产q1和q2单位产量的总成本分别为2 q1和2 q2 。最后强调两厂商同时决定各自的产量, 即他们在决策之前都不知道另一方的产量。
求解纳什均衡

博弈方就是n个农户,他们各自的策略空间就是他 们可能选择的羊群数目qi(i=1,2, …,n),取值范围, 当各户羊群数为q1, …qn时,在公共草地上放牧羊群 的总数为Q= q1+ q2+…+ qn,,每只羊的产出应是羊 群总数Q的函数V=v(Q)=v(q1+ q2+…+ qn).假设每 只羊的成本是不变的常数c,则农户i养qi只羊的得益 函数为:
u i q i V ( Q ) q i c q iV ( q 1 q 2 q n ) q i c

假设 n 3 , 即只有三个农户,每只 羊的产出函 数为 V 100 Q 100 ( q 1 q 2 q 3 ), 而成本 c 4 .这时,三个农户的得益 函数分别为 u 1 q 1 [100 ( q 1 q 2 q 3 )] 4 q 1 u 2 q 2 [100 ( q 1 q 2 q 3 )] 4 q 2 u 3 q 3 [100 ( q 1 q 2 q 3 )] 4 q 3 把上述得益函数看作连 续函数。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章完全信息静态博弈博弈论的基本概念及战略式表述纳什均衡纳什均衡应用举例混合战略纳什均衡纳什均衡的存在性与多重性第一节博弈论的基本概念与战略式表述博弈论的基本概念与战略式表述博弈论(game theory )是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

博弈的战略式表述:G={N,(S i )i ∈N ,(U i )i ∈N }有三个基本要素:(1)参与人(players )i ∈N={1,2,…,n};(2)战略(strategies ),s i ∈S i (战略空间);(3)支付(payoffs ),u i =u i (s -i ,s i )。

均衡与均衡结果均衡战略(坦白,坦白)均衡支付(-6,-6)第二节纳什均衡占优战略均衡重复剔除的占优战略均衡纳什均衡完全信息静态博弈的几点特性同时出招,出招一次;知道博弈结构与游戏规则(共同知识); 不管是否沟通过,无法做出有约束力的承诺(非合作)一、占优战略均衡占优战略:不管对手战略为何,该参与人可找到一最佳战略。

定义:在博弈G={N,(S i )i ∈N ,(U i )i ∈N }中,如果对所有的参与人i,s i *是它的占优战略,那么所有参与人选择的战略组合(s 1*,…,s n *)成为该对策的占优战略均衡。

“囚犯困境”的扩展两个寡头企业选择产量公共产品的供给军备竞赛经济改革结论:一种制度安排,要发生效力。

必须是一种纳什均衡;否则,制度安排便不能成立。

案例2:智猪博弈猪圈里圈两头猪,一头大猪,一头小猪。

猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。

按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就要付出2个单位的成本。

若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。

支付如表。

智猪博弈的扩展股份公司承担监督经理职能的大股东与小股东股票市场上炒股票的大户与小户市场中大企业与小企业在研发、广告上的博弈公共产品的提供(富户与穷户)改革中不同利益分配对改革的推动二、重复剔除的占优战略均衡 绝对劣势战略:s i 是一绝对劣势战略当且仅当存在另一战略s i ’∈S i 使得u i (s i ,s -i )< u i (s i ’,s -i ) 对所有s -i ∈S -i 均成立。

(s i ’未必是优势战略)重复剔除的占优战略均衡:逐次删去绝对劣势战略得到唯一的占优战略。

三、纳什均衡定义:指一战略组合有以下特性:当参与人持此战略后,任一参与人均无诱因偏离这一均衡;s*=(s 1*,…,s n *)=(s i *,s -i *)是一纳什均衡,当且仅当对所有参与人而言,u i (s i *,s -i *)≥u i (s i ’,s -i *)对所有s i ’∈S i 均成立。

简单而言,当s 1*是对s 2*的最适反应,s 2*也是s 1*的最适反应时,(s 1*,s 2*)就是二人博弈的纳什均衡。

命题1:纳什均衡在占优战略重复剔除解法中不会被剔除 命题2:重复剔除的严格占优战略均衡一定是纳什均衡。

第三节纳什均衡应用举例古诺(Cournot)寡头模型沙滩卖冰豪泰林(Hotelling)价格竞争模型公共地的悲剧一、古诺寡头模型特点:存在两家厂商;同时行动确定产量。

通过预测另一家厂商的产量来选择自己的利润最大化产量,寻求预测均衡。

厂商1表示为:max p(y 1+y 2e )y 1-c(y 1),得出y 1=f 1(y 2e ),同理得出y 2=f 2(y 1e ),称为反应函数,两条曲线的交点为古诺模型的解。

y1例题:古诺模型的解假设p=a-(y1+y2),C1=y1c,C2=y2c则根据利润最大化的一阶条件分别得到反应函数y 1=f1(y2)=(a-y2-c)/2,y 2=f2(y1)=(a-y1-c)/2,求出均衡产量为(1/3(a-c),1/3(a-c)),为纳什均衡,均衡利润为(1/9(a-c)2,1/9(a-c)2)古诺模型的解:与垄断市场的比较假设为一垄断企业,则有:Max π=y(a-y-c), 得到垄断企业的最优产量y=1/2(a-c) <y 1+y 2=2/3(a-c)垄断利润为π=1/4(a-c)2 >2/9(a-c)2 寡头竞争的总产量大于垄断产量的原因在于每个企业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应。

三、豪泰林模型寡头企业竞争战略是价格伯川德(Bertrand)模型:产品同质,均衡价格等于边际成本,类似于完全竞争市场均衡。

豪泰林(Hotelling)模型:存在产品差异,均衡价格不等于边际成本,垄断性提高豪泰林模型:以空间上差异为例根据两个商店的利润函数,π1=(p 1-c)x, π2=(p 2-c)(1-x)选择使利润最大化的价格,得到一阶条件,求得p 1*=p 2*=c+t,均衡利润π1=π2=t/2旅行成本越高,产品差异越大,均衡价格从而均衡利润也越高。

原因:随着旅行成本上升,不同商店出售的产品之间的替代性下降,每个商店对附近的消费者的垄断能力加强, 当旅行成本为零时,不同商店的产品之间具有完全的替代性,则为伯川德均衡结果。

四、公共地的悲剧生物学家和生态学家哈丁(Garrett Harden)在《科学》(1968年,第162卷)发表《公地的悲剧》。

考虑一块对所有的人都开放的牧场,在着的制度下,可以预期,每一个放牧的人都会在公地上放牧尽可能多的牲口。

增加一头牲口既有正效用,也有负效用。

正效用是牲口的销售收入,增加一头为+1负效用使每增加一头带来的过度放牧的损失,每一个放牧着承担-1/n放牧者合理的决策是增加牲口,直至马瘦毛长,公地毁灭。

四、公共地的悲剧资源没有排他性产权:草地放牧、公海捕鱼、小煤窑的过度开发;另一类是人们向其中排放废物的公地。

草地放牧:n个农民,每个拥有羊的数量为g i,G=Σg i,v(G)代表每只羊的价值,与草地上放牧的总数G相关,饲养量增加到一定程度,随着数量继续增加,羊的价值会下降,即v’(G)<0农民的利润函数πi=g i v(Σg j)-g i c最优化的一阶条件:∂πi/∂g i=v(G)+g i v’(G)-c=0增加一只羊有正效应(羊的价值)、负效应(新增羊使之前所有羊的价值下降)个人边际成本小于社会边际成本,个人最优决定的饲养总量大于社会最优决定的饲养总量“斗鸡博弈”的扩展夫妻间吵架警察与游行队伍公共产品的供给(两富户修路)第四节混合战略纳什均衡混合战略(mixed strategies)定义:σ*=(σ1*,…,σn *)=(σi *,σ-i *)是一纳什混合战略均衡,当且仅当对所有参与人而言,σi *是σ-i *的最适反应,u i (σi *,σ-i *)≥u i (σI ’,σ-i *),对所有σi ’∈Σi 成立)。

持混合战略的前提是在均衡时两种战略的报酬会相等,是预期支付最大化的推导结果。

掷硬币的分析给定参与人1(q,1-q),参与人2的支付是:q+(-1)(1-q)(正面)=(-1)q+(1-q)(反面); 给定参与人2(p,1-p),参与人1的支付为:p(-1)+(1-p)(正面)=p+(-1)(1-p)(反面); 求得(1/2,1/2)是纳什混合战略均衡如果两种战略报酬不相等,那么就变为纯战略(pure strategies)了。

混合战略均衡的博弈原则两博弈方不能让对方知道或猜到自己的选择,因而必须在决策时利用随机性;两博弈方选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过针对性地倾向某一策略而在博弈中占上风。

例:在掷硬币的博弈中,参与人1选正面、反面的概率q,1-q,一定要使参与人2选正面的和反面的期望得益相等。

单纯战略与混合战略的定义G={N,S,U}是一个战略式有限博弈,参与人i 的战略空间S中的任一元素s i 称为i的一个单纯战略(pure strategy);定义在S i 上的一个概率分布函数p i (s i )代表了一个混合战略(mixed strategy)——这个战略的内容是:参与人i以概率p i (s i j )选择单纯战略s i j ,而Σp i (s i j )=1。

单纯战略是混合战略的特例,因为任一单纯战略s i 都可以理解为i以概率1选择s i ,以0概率选取其他所有单纯战略。

引入混合战略,参与人的目标需要修改为“最大化自己的期望支付”Selton:小偷和守卫的博弈一小偷欲偷窃有一守卫看守的仓库,如果小偷偷窃时守卫在睡觉,则小偷就能得手,偷得价值为V的赃物;如果小偷偷窃时守卫没有睡觉,则小偷就会被抓住。

设小偷被抓后要坐牢,负效用为-P,守卫睡觉而未遭偷窃有S的正效用,因睡觉被窃要被解雇,其负效用为-D。

而如果小偷不偷,则他既无得也无失,守卫不睡意味着出一份力挣一分钱,他也没有得失。

(守卫睡的概率)齐威王田忌赛马古代齐威王与大将田忌赛马,田忌的谋士孙膑运用计谋帮助田忌以弱胜强。

比赛规则:田忌与齐威王各出三匹马,一对一比赛三场,每一场的输方要赔1000斤铜给赢方。

双方的马按实力都可以分为上、中、下,但齐威王的上、中、下均优于田忌的上、中、下。

实际上,田忌的上马、中马要优于齐威王的中马、下马。

比赛结果:田忌连输三场;后孙膑建议,以上对中、以中对下、以下对上,结果以2:1赢得比赛。

齐威王田忌赛马前述为单方面运用策略的故事,如果齐威王预料到田忌的做法,必然会改变各匹马出场的次序。

本博弈中博弈双方的利益是完全对立的,是严格竞争的零和博弈,不会有纯策略纳什均衡,必然是一个混合策略均衡。

假设齐威王采取六种战略的概率分别为p a,p b,p c,p d,p e,p f(加总为1),则田忌采取六种战略的期望得益相等,则得出齐威王与田忌均以1/6的相同概率随机选择各自的六个纯策略,构成本博弈唯一的混合策略纳什均衡。

齐威王田忌赛马在上述混合策略下,齐威王的期望得益为1/6(3+1+1+1+1-1)=1;田忌的期望得益为1/6(1-3-1-1-1-1)=-1,即多次进行这样的赛马,齐威王平均每次能赢田忌1000斤铜,这是因为齐威王三匹马的总体实力略胜田忌三匹马总体实力的缘故混合策略反应函数将博弈方的策略空间扩展到包括混合策略,将纳什均衡扩展到包括混合策略纳什均衡以后,求纳什均衡反应函数的分析方法也可以扩展到求混合策略纳什均衡。

反应函数即一博弈方对另一博弈方每种可能的决策内容的最佳反映决策构成的函数。

在纯策略的范畴内,反应函数是各博弈方选择的纯策略对其他博弈方纯策略的反应。

在混合策略的范畴内,博弈方的决策内容为选择概率分布,反应函数就是一方对另一方的概率分布的反应。

相关文档
最新文档