博弈中的“嵌套问题”-修订版

合集下载

博弈理论

博弈理论目录0．为何要学习博弈论别人的信封诱人吗一元面钞的价格悖论肯德鸡和麦当劳的恶性竞争陆贾分金享天年模仿还是创新法不责众的尴尬1．博弈论的基本知识一些基本概念博弈的类型2．完全信息静态博弈占优策略均衡纳什均衡和严格均衡标准对策式的纳什解求法混合策略的纳什均衡纳什均衡的存在性多重纳什均衡的确定3．完全且完美信息动态博弈完全且完美信息动态博弈的一般概述博弈的展开型表述扩展式表述的纳什均衡子博弈精炼纳什均衡后向归纳法后向归纳法的缺陷4．重复博弈多阶段博弈的信息结构有限次重复博弈无限次重复博弈重复博弈的变异结构5．完全但不完美信息动态博弈不完美信息博弈的一般概述完美贝叶斯均衡6．不完全信息静态博弈静态贝叶斯博弈的一般表述贝叶斯均衡不完全信息与混合战略7．不完全信息动态博弈动态贝叶斯博弈的一般概述精炼贝叶斯纳什均衡精炼贝叶斯均衡的发展策略不确定性和均衡的演化8．合作均衡纳什谈判解：二人合作n人合作对策9．博弈结构与均衡礼仪分配先占优势和后发优势耐心与纳什均衡多数和少数的互动实力、成本、信息和地位新古典经济学认为，经济学是研究稀缺资源如何有效配置的；而张维迎（1996，2）1认为经济学是研究理性的人如何行为的。

实际上，两种理解都存在很大的偏颇，它们的根本缺陷都是将研究的手段当成了目的。

我们认为，经济学研究的目的是探讨经济运行的规律以及如何提高人们的生活水平，或者如黄有光所说，是为了增进人们的快乐。

因此，一般来说，经济学研究的主要内容就包括两个方面，一是人与人之间的社会关系方面，其中主要的就是生产方式以及与之相适应的生产关系；另一个是人与自然的关系方面，即技术关系方面，主要是研究稀缺性资源的配置问题。

由于人与人之间的快乐存在冲突，因此人们往往希望最大限度的增进自己的快乐和福利，因此，就必然存在种种的互动行为，博弈论就是探讨人们之间的这种行为的。

究其实质，博弈论是一种分析工具，用来探讨人们的互动行为，是人们为增进快乐或福利的手段；研究的视角不同，如合作的与非合作的，为他利己的和为己利他的，揭示的博弈机制也必然不同。

博弈论复习题及答案

博弈论判断题（每小题1分，共15分）1、囚徒困境说明个人的理性选择不一定是集体的理性选择。

（√）2、子博弈精炼纳什均衡不是一个纳什均衡。

（×）3、若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。

（）4、博弈中知道越多的一方越有利。

（×）5、纳什均衡一定是上策均衡。

（×）6、上策均衡一定是纳什均衡。

（√）7、在一个博弈中只可能存在一个纳什均衡。

（×）8、在一个博弈中博弈方可以有很多个。

（√）9、在一个博弈中如果存在多个纳什均衡则不存在上策均衡。

（√）10、在博弈中纳什均衡是博弈双方能获得的最好结果。

（×）11、在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。

（×）12、上策均衡是帕累托最优的均衡。

（×）13、因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。

（×）14、在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。

（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。

15、囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。

（×）16、纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。

（√）17、不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。

（√）18、多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。

心理博弈测试题库答案及解析

心理博弈测试题库答案及解析在进行心理博弈测试时，解析答案是十分重要的，因为它能够揭示我们在心理博弈中的行为模式和思维方式。

下面是一些常见的心理博弈测试题目以及它们的答案和解析。

题目一：A和B两人共同合作完成一个项目，他们将获得一笔奖金作为回报。

奖金的大小将由他们的合作表现来决定。

如果A和B都合作，则奖金将平均分配给他们；如果其中一人选择不合作而另一人选择合作，则不合作的人将获得全部奖金，而合作的人将一无所得。

如果两人都选择不合作，则他们都将一无所获。

答案及解析：这是一个典型的囚徒困境问题。

理性的选择是不合作，因为不合作确保了至少能获得全部奖金的可能性。

另一方面，合作需要对另一人也选择合作的行为做出假设。

在这种情况下，最优的选择是不合作。

题目二：A和B两人被告知他们将进行一场竞争性的考试，考试将评选出一个得分最高的人。

然而，如果A和B的得分相同，则他们将获得相等的奖励。

这时你是A还是B?答案及解析：这个问题考察的是人们在竞争中的态度。

如果你选择A，那你可能更加倾向于领先和胜利。

反之，如果你选择B，那你可能更加倾向于平等和公平。

这个问题没有绝对的正确答案，而是取决于每个人的价值观和思维方式。

题目三：A和B两人面临一个合作的机会，他们可以共同努力完成一个任务，并共享奖励。

然而，如果其中一人决定放弃任务，另一个人将独自承担任务和相应的风险。

在这种情况下，你会选择合作还是放弃？答案及解析：这个问题涉及到合作与自利之间的权衡。

如果你选择合作，那你可能更注重团队合作和共同利益。

反之，如果你选择放弃，那你可能更注重个人的风险和利益。

同样地，这个问题没有绝对的正确答案，而是取决于每个人的价值观和思维方式。

通过解析这些心理博弈测试题目的答案，我们可以更好地了解自己的行为模式和决策方式。

在现实生活中，我们常常面临各种各样的心理博弈，了解自己的偏好和思维方式能够帮助我们做出更明智的决策。

以上是心理博弈测试题库的答案及解析。

博弈对策练习题

博弈对策练习题博弈论是研究决策者在多方参与的情况下进行决策的数学理论。

在博弈中，每个参与者都追求自己的利益，并且根据其他参与者的策略来进行决策。

为了更好地理解博弈论的概念和原理，以下是一些博弈对策练习题，帮助你更好地掌握该理论。

题目1：假设有两个参与者，参与者A和参与者B。

两个参与者分别有两种策略可供选择：策略X和策略Y。

他们的收益矩阵如下所示：参与者BX Y参与者AX 2,2 0,3Y 3,0 1,1请回答以下问题：1. 如果两个参与者都只追求自己的个人利益，他们应该选择什么策略？2. 如果两个参与者追求最大化两者的总收益，他们应该选择什么策略？3. 是否存在一种策略组合，能够实现两个参与者的最佳利益？题目2：假设有两个参与者，参与者A和参与者B，他们需要同时选择一个数字。

他们可以选择的数字范围是1到10。

如果两个参与者选择的数字之和大于等于15，则参与者A获胜；否则，参与者B获胜。

如果两个参与者选择的数字相同，则为平局。

请回答以下问题：1. 参与者A和参与者B应该选择什么数字才能使自己的获胜概率最大化？2. 为了增加自己的获胜概率，参与者A应该如何反应参与者B的选择？题目3：假设有三个参与者，参与者A、参与者B和参与者C。

他们需要同时选择一个方向：左侧(L)或右侧(R)。

他们的利益矩阵如下所示：参与者CL R参与者AL 2,2 0,4R 3,1 1,3请回答以下问题：1. 如果每个参与者都只追求自己的个人利益，他们应该选择什么方向？2. 是否存在一种策略组合，能够实现每个参与者的最佳利益？以上是关于博弈对策的练习题。

通过解答这些问题，你可以更好地理解博弈论中的决策策略与利益的关系。

祝你在博弈中取得好成绩！。

嵌套博弈下的政府单边治理——对我国农村公共物品低效率供给的分析

．
ｎｓｎｔｃｕｎｕｅｈｏｅｍｅｔｕｉｔｒｌｇｖｒａｃ，ｄｔｉｓｔｅｍａｎｒｇｏａｅｄｏｔｅｉｓｆｃｅｃｆｐｖｓｏｅｔｇｓｕｔｒｉｄｃｓｔｅｇｖｒｉｒｅｎｎａｎｌｅａｏｅｎｅａｓｉｈｉｓｎｔｔｌａｓｔｎｕｉｉｎｙｏｒｉｉｎｌａｎｎｈｅｈｈｏ
古典经济学主要研究独立的、非社会化的人类行为，这只是继承了功利主义的传统。这些理论通过假设而忽略了社会结构及社会
关系对生产、分配和消费的影响，因而不能正确解释一些社会问
新农村建设是政府解决“ 三农” 问题、促进城乡协调发展的重大举措，也是建设和谐社会、落实科学发展观的战略措施之一。理论界新农村建设的主要倡导人林毅夫等特别强调，农村公共物品的供给是新农村建设的核心内容，农村公共物品的供给状况已成
解决收入差距过大的问题是治理经济过热必要的前提我们必须要在收入分配上下功夫解决收入差距过大的问题使广大的低收入者的收入不仅仅只用满足简单的劳动再生产和购置生活的必需品宏观经济中的贸易顺差过大信贷投放过多投资增长过快这所谓三过问题其根源是国民收入分配存在很大问题
维普资讯
ｅｉｉｎｙ．ｆｃｅｃ
Ｋｅｏｄ：ｕａｕｌｏｄ；ｓｅａ；ｉｔｒｌｇｖｍａｅ；ｆｅｅｅｙＷｒｓＲｒｌｐｂｉｇｏｓｃＮｅ ቤተ መጻሕፍቲ ባይዱ ｄｇｍｅＵｎａｅａｏｅｎｅＥｆｉｎｙｌｉ
一
、
引言
理的实质及其负面影响。二、嵌套博弈的基本内涵

博弈问题简介

五、树上删边游戏1．游戏规则从某一棵树上删除一条边，同时删去所有在删除边后不再与根相连的部分。

双方轮流进行，无法再进行删除者判定为失败，也就是比你拿掉最后一部分你就赢了。

一个游戏中有多棵树，我们把它们的根都挂在天花板上…或者说，放在地板上也行..这么做是为了方便后面的一些解释和处理。

在这篇文章中，我们讨论的将是公平游戏，也就是双方可以删除任意的边，我们称这个游戏为：Green Ha2．竹子竹子！为了更好地解决树上删边游戏的相关问题，我们引入“竹子”。

竹子长的像下面这样图2.1根据上面的游戏规则，拿掉竹子上的某一节，那么竹子上面的那些也会跟着被删掉。

仔细想想会发现，这不就是最简单的Nim游戏吗？有很多堆火柴，每次只能拿走某一堆火柴中的任意数量的火柴。

而这里则是有很多个种在地板上的竹子，我们每次只能选一根出来，任意砍掉一部分或者全部。

既然发现这是Nim游戏了，那么相应3．克朗原理(Colon Principle)搞定竹子之后，我们就可以来研究树上删边游戏究竟要怎么解决。

其实，树上删边游戏就是个披了层树皮的Nim游戏。

为什么这么说呢，我们介绍克朗原理克朗原理：对于树上某一个点，它的分支可以转换为以这个点为根的一根竹子，这个竹子的长度等于它各个分支的边的数量的异或和。

（怕翻译不好所以把原文放上来：When branches come together at a vertex, one may replace the branches by a non-branching stalk of length equal to their nim sum.）现在我们来分析下图所示的树上删边游戏。

图3.1对于第一个图，1号点有2个分支，分支上的边树分别为1、1，异或和为0，所以1号点的分支被替换为长度为0的竹子，也就是说上面两个分支被删掉了。

所以对于2号点，就剩下2个分支，同理被消掉。

最后这个图被转化为一根长度为1的竹子，其SG值为1。

第6章博弈镶嵌

越王勾践事夫差
行为者在彼此镶嵌的大小两个博弈之中的行为取向是相
互颠倒的；小博弈的行动表现，掩盖了大博弈的行动意图。

一招得胜，满盘皆活
行为者将小博弈镶嵌到更大的博弈之中，以锐化其在小
博弈中的行为取向，而强化其在大博弈中的行为取向。

丢卒保车，田忌赛马
行为者将小博弈镶嵌到更大的博弈之中，以钝化其在小
阴谋和阴谋论的普遍性阿Q精神的普遍性宗教的普遍性
6
镶嵌博弈的假定

在任何一个标准博弈框架中参与人除了拥有常规策略之外，还拥有许多可能是暂时未知的可以具体改变博弈框架的行动。
人的认知因此变得特别重要，人际间的认知差异
可能导致博弈对部分人更有利。
少算少胜；多算多胜。
7
镶嵌博弈的类型
第6章博弈镶嵌
中国人民大学社会学系王水雄
1
主要内容

什么是镶嵌博弈镶嵌博弈的例子
ቤተ መጻሕፍቲ ባይዱ
镶嵌博弈的普遍性
镶嵌博弈的假定镶嵌博弈的类型镶嵌博弈的作用电影
2
什么是镶嵌博弈？

一个博弈被镶嵌到另一个相对更大的博弈之中，或者在一个博弈之中镶嵌上相对较小的博弈。
小嵌大：上访大套小：抽签决定
博弈中的行为取向，而强化其在大博弈中的行为取向。
8
镶嵌博弈的作用

明哲保身，忍辱负重，让真理和价值在人世间永续：
笑到最后，才算笑得最好！留得青山在，不怕没柴烧。

组织中权威的确立：
杀人立威，杀鸡儆猴

社会秩序的维持：
仁义待人，不跟小人一般计较； “这是上帝在考验我”：宗教信仰的作用

嵌套式金融恐慌模型构建的博弈分析——厘因“公地悲剧”与银行挤兑

，
致集体的非理性使本应有效率
，
的集体合作失衡
，
对其最具代表
“
行为对自己可能的影响通过选
，
性描述的模型是 ( t he
t
ra
公地悲剧
c o mmo ns
”
择最佳行动策略来寻求收益或
，
g e dy
o
f t he
o
公地悲剧弈模型分析
，
…
G
益 j 中突
上升
，
达成合作的机率也会
心的要素
。
参与人
、
策略集和效
。
图 I 每只羊的价值函数随牧羊总数
因为每个个体在未来时
用构成了
一
个基本的博弈
，
间内
道
z
。
，
都会与另
，
一
方反复打交
，
在博弈中每个参与者在采
，
博弈论已经成
“
自己的收益至于自己的行为是
否会影响其它金融机构总体运行
的不良后果当个体依据其他行
，
为决策主体之间
非合作
一
合
”
为主体的行为而选取类似的行动时就会产生
“
作
”
选择均衡
。
“
最优理性决策
效率这样的集体利益
，
次银行挤兑浪潮直接反应了由于

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈中的“嵌套问题”
Phybi
Math group
Humanity group
Carridon University
1.无间道-谍中谍
参见电影《无间道-I，II》，这个希望后来者详细分析.
2.剪刀石头布
二人A，B博弈，策略空间维数都为3，且两空间相等.我们令其元素剪刀石头布为{a，b，c}收益空间均为{胜，平，负}，我们用{1，0，-1}表示.很容易写出A，B两人的收益函数.
开始出拳应该是随机的，之后双方都会观察对方的出拳套路，如果允许的思考时间足够长，则其中会出现“嵌套问题”，比如：前手A出两次剪刀，B出两次石头；A就会猜测对方可能继续出石头，以及B则猜测对方继续出剪刀，我们称这
两个个现象为一阶嵌套.考虑A的一阶嵌套，则描述一阶嵌套的公式为fA1=fA（B）B的二阶嵌套为fB2=fB（fA1）=fB（fA（B））
而更复杂的是，A猜测：B猜测自己（A）要出剪刀，它必然出石头，于是A采取出布的策略.我们称此为“二阶嵌套”.简而言之，一阶嵌套就是“A猜（B 猜A），并且根据B因其对A的猜想，做出的获胜测量，采取恰当策略获胜”.这是一个三阶嵌套，用公式表示为：fA3=fA（fB2）=f（fB（fA（B）））
为了更好地理解嵌套的概念，我们最后举例说明“三阶嵌套”.A猜测，B已经猜测到了A能猜到自己B猜测A的策略，即A将出布，则B将出剪刀，于是A采取出石头的策略期望获胜.用公式表示为fA（fB（fA（B）））.此种嵌套理论上可以无限循环下去，但现实意义不大，特别是多因素下，过高阶的嵌套是无意义的.
我们可以认为，有应用价值的嵌套，应该不超过5阶.
3.贾贵-黑藤嵌套
在抗日情景喜剧《地下交通站》某集中，有这样一个剧情.敌人（日伪和日军）（简称D）获得八路军（简称B）的情报（在高庄开会），如果B不知道D知道（自己开会的消息），则D可以成功攻击B.然而贾贵在黑藤的授意下，在鼎香楼散布D攻击B的消息.最终野尻依然下令按原计划，贾贵说，这难道不会扑空吗？野尻的逻辑是，既然八路知道了敌人要攻击的消息，并且敌伪知道自己走漏了消息，比如会认为敌伪不会攻击，因而放松警惕，照常开会；如果这样，攻击就能成功.
然而，石青山猜到了野尻的这个逻辑，设下伏击，大获全胜.下面我们就用嵌套公式来描述这个过程.先看敌军方面，一阶：敌人知道八路军开会的消息：
fD1=fD（B），三阶：敌人知道八路军知道自己知道八路军要开会的消息：fD3=fD （fB（fD（B）））于是采取按原计划攻击的策略，以为能获得成功.
对于八路军B，二阶嵌套：八路军知道敌人知道自己要开会的消息:嵌套公式为fB2=fB（f1D）=fB（fD（B）），四阶嵌套，八路军知道敌人知道，八路军知道，敌人知道，八路军知道（攻击计划泄露），嵌套公式为fB4=fB（fD3）=fB（fD（fB（fD （B）））），即八路军敌人在fD3的嵌套公式下，会按计划攻击，所以设下伏击.
从上面的演算可知，二维博弈中，嵌套公式可以用AB相互的低阶嵌套公式递推.即：A的高阶基于B的次一低阶嵌套.反之亦然，即B的高阶基于A的次一低阶嵌套.所以，我们很容易写出任何阶数的嵌套公式.递推公式为：
fA N=fA（fB N-1）
以及：
fB N=fB（fA N-1）
-phybi嵌套公式-
此处还有一个需要讨论的是，二人博弈的嵌套问题中，我们需要设置一个起点，可以是A，也可以是B，但是现实的状况是，可能会有自然的，确定的一个起点，比如上述例子中，八路军开会的消息，就很自然地成为嵌套的起点.而剪刀石头布案例中，游戏双方都可以作为分析起点——他们是等价的.将嵌套理论应用于博弈论，我们不知道起点的选择，是否会对决策和收益产生影响，后继的研究，留给后来者吧！
尾论
基于本小研究，我们认为博弈论应该纳入一个新空间：信息空间.而“嵌套问题”的研究，是这个信息空间结构的重要组成部分.希望有兴趣的研究者继续.此外，本研究只考虑了信息空间，由信息空间映射的决策空间，也存在嵌套现象，其代数结构也留给后继者.
2020.07.10。