不完全信息条件下的非合作博弈

合集下载

博弈类型及其表述形式

博弈类型及其表述形式

1博弈的分类博弈模型一般分为合作博弈( cooperative game )和非合作博弈( non- cooperativegame),如图。

合作博弈是以单个参与者的可能行动集合为基本元素,而非合作博弈是以参与人群的可能联合行动集合为基本元素( Martin and Ariel Rub in stein ,2000, P2),也就是说,在合作博弈中,博弈中所有参与者都独立行动,不存在有约束力的合作、联合或联盟的关系,而在非合作博弈中,在一些参与者之间存在着有约束力的合作、联合或联盟的关系,并因为这种关系影响到博弈的结局。

合作博弈强调的是团体理性( collectiverati on ality )、效率、公正和公平;非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是低效率或无效率的(张维迎,1996,P5)。

20世纪50年代,合作博弈的研究达到鼎盛期,同时开始出现对非合作博弈的研究,此后,博弈论的研究主流逐步转向在非合作博弈领域。

有些人认为非合作博弈模型比合作博弈更“基本”,但有些人认为两者不相上下(Martin and Ariel Rubinstein ,2000,P2)。

合作博弈,有时也叫做联盟博弈( coalitional game ),一般根据有无转移支付而分为两类:可转移支付联盟博弈( coalitio nal game with tran sferable payoff )和不可转移支付联盟博弈(coalitional game with non-transferable payoff )。

可转移支付也叫有旁支付(side payment ),可转移支付联盟博弈假设博弈中各参与者都用相同的尺度来衡量他们的赢得,且各联盟的赢得可以按任意方式在联盟成员中分摊;否则,就是不可转移支付联盟博弈。

可转移支付合作博弈合作博弈不可转移支付合作博、非合作博弈非合作博弈的分类主要从两个角度进行划分。

博弈论类型[宝典]

博弈论类型[宝典]

博弈类型博弈的分类根据不同的基准也有不同的分类。

一般认为,博弈主要可以分为合作博弈和非合作博弈。

合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。

完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。

不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。

目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。

非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。

与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(subgame perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。

博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型,等等。

纳什均衡定义纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。

不完全信息 动态 斯塔克尔伯格博弈模型

不完全信息 动态 斯塔克尔伯格博弈模型

不完全信息动态斯塔克尔伯格博弈模型下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。

文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!本店铺为大家提供各种类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor. I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you! In addition, this shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts, other materials and so on, want to know different data formats and writing methods, please pay attention!不完全信息动态斯塔克尔伯格博弈模型1. 引言斯塔克尔伯格博弈模型是一种常见的非合作博弈模型,它描述了市场上的领导者和追随者之间的相互作用。

第三讲非合作博弈的解:(4)

第三讲非合作博弈的解:(4)

例子:斯坦伯尔伯模型。两个厂商垄断某个市场,其中厂商 1处于支配地位,它先行动,然后从属企业2后行动。假定 市场需求函数为p=a-Q。厂商的单位产品的成本c。这些是 企业1和2的公共知识。问:厂商1和2是如解。
假定厂商1和2所决定的产量分别为q1,q2。 企业2后行动,对于企业1的任何行动,即任意给定的产量,
• 例子:假定甲在开采一个价值4万元的金矿时需要1万元 资金,乙有1万元资金。甲向乙借钱来开金矿。在这个 博弈的第一阶段,甲向乙承诺: 如果乙借钱给他的话, 那么他就会将采到的金子与乙对半分成,即(2,3)—— 乙得到2万元的金子,同时收回自己的1万元投资。对于 甲的承诺,乙如果不借钱给甲的话,那么博弈到此为止, 双方收益为(0,1)。如果乙借钱给甲的话,那么博弈进 入第二个阶段。在第二阶段中,若甲遵守他的承诺,分 给乙一半的金子,这样两人的收益为(2,3),其中1万 元为投资成本。然而,若甲违背自己的承诺,博弈就会 进入到第三个阶段: 如果乙同甲打官司,那么由于打官 司费时费力, 两个人的收益为(0,1);若乙不打官司, 那么两个人的收益就为(5,0)。
安娜
2 1
鲍伯
1 4
安娜
4 3 蜈蚣博弈
鲍伯 2n+1
3 6
安娜 鲍伯
2n+2
2n 2n-1
2 n-1 2 n+2
• 这个博弈有两个参与人安娜和鲍伯。该博弈从安娜开始,她有两 个策略“合作”和“不合作”,若她选择“不合作”,博弈即刻 终止,安娜得到2,鲍伯得到1;若她选择“合作”,那么博弈继 续进行,由鲍伯开始选择。鲍伯同样有“合作”和“不合作”两 种策略。在这第二轮选择中,若鲍伯选择“不合作”,博弈终止, 选择“合作”,博弈继续进行……在这个博弈最后一轮,即第2n 轮,若鲍伯选择“不合作”,他所得2n+1,安娜得2n-1;若他选 择“合作”,鲍伯得2n+1安娜得2n+2。

博弈与决策题库

博弈与决策题库

题库一、名词解释1.动态博弈动态博弈是指在博弈中,参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动。

2.逆向归纳法对于动态博弈,特别是在完全信息条件下,最简单的方法就是逆向归纳法。

就是从最后一个阶段或者最后一个子博弈开始逆推向上,逐步向前倒推以求解动态博弈均衡。

3.重复博弈重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题。

4. 第二价格密封拍卖是由1996年诺贝尔经济学奖获得者威廉•维克瑞设计的,因而又被称为是“维克瑞拍卖”,具体规则如下:每个竞标者分别向拍卖方提交自己的报价,而且他们不知道别人的出价,出价最高的竞标者获得该物品,并按所有的出价中仅次于最高出价的第二高价格支付给卖家。

5.完全信息是指所有参与者各自选择行动的不同组合所决定的收益对所有参与者来说是共同知识。

共同知识就是你知道,我知道,你知道我知道的信息。

6.子博弈直观的含义是原博弈的一个部分,它本身也可以作为一个博弈进行分析,博弈树的一个子树所代表的博弈就是子博弈,子博弈的起始点是某个选择的终点,包括这个终点及所有后续结及枝及终点结之后的收益,构成了一个子博弈树,这个博弈树所代表的博弈称为子博弈。

7.公共信息如果有些信息是博弈参与者都知道的,或者是所有有关的参与者都知道的,这些信息就叫“公共信息”或者“共同知识”。

8.贝叶斯纳什均衡不完全信息静态博弈的均衡称为贝叶斯纳什均衡。

是指在不完全信息静态博弈中在给定自己类型以及其他参与者的类型与策略选择之间关系的条件下,使得自己的期望效用最大。

9.博弈论博弈论是指研究多个个体或团队在特定条件制约下的对局中,利用相关方的策略而实施对应策略的科学。

10.纳什均衡对于每一个参与者来说是这样一种组合,即给定其他参与者的策略,每一个参与者的这个策略能使其效用最大化。

其含义为:当博弈的所有参与者在某一选定的策略组合下都没有动机(单方面)偏离自己选定的策略时,该组合策略就是纳什均衡。

博弈模型汇总

博弈模型汇总

博弈模型汇总如下:
1.合作博弈与非合作博弈:这是根据参与者之间是否可以达成具
有约束力的协议来划分的。

合作博弈强调团队合作和协作,目标是达成共赢;而非合作博弈则强调个人利益最大化,不考虑其他参与者的利益。

2.静态博弈与动态博弈:这是根据参与者做出决策的时间顺序来
划分的。

静态博弈是指所有参与者同时做出决策,或者决策顺序没有影响;动态博弈是指参与者的决策有先后顺序,后行动者可以观察到先行动者的决策。

3.完全信息博弈与不完全信息博弈:这是根据参与者对其他参与
者的偏好、策略和支付函数了解的程度来划分的。

完全信息博弈是指所有参与者都拥有完全的信息,能够准确判断其他参与者的策略和支付函数;不完全信息博弈则是指参与者只拥有部分信息,无法准确判断其他参与者的策略和支付函数。

4.零和博弈与非零和博弈:这是根据所有参与者的总收益是否为
零来划分的。

零和博弈是指所有参与者的总收益为零,一方的收益等于另一方的损失;非零和博弈则是指所有参与者的总收益不为零,各方的收益和损失不一定相关。

5.竞争博弈与合作博弈:这是根据参与者之间是否存在竞争或合
作关系来划分的。

竞争博弈是指参与者之间存在竞争关系,目标是追求个人利益最大化;合作博弈则是指参与者之间存在合作关系,目标是追求共同利益最大化。

6.微分博弈与离散博弈:这是根据决策变量的连续性来划分的。

微分博弈是指决策变量是连续变化的,需要考虑时间、速度等因素;离散博弈则是指决策变量只有有限个可能的取值,通常只考虑状态的变化而不考虑时间、速度等因素。

博弈论的基本结构

博弈论的基本结构

博弈论的基本结构
博弈论的基本结构包括以下几个要素:
1.参与者(Player):博弈中的决策主体,他们可以是个人或组织,各自追求自己的利益。

2.策略(Strategy):参与者在给定信息结构下的选择空间或行动方案,也被称为纯策略或混合策略。

3.效用(Utility):可以定义或量化的参与者的利益,也是所有参与者的真正关心的东西,又称偏好或支付函数。

效用决定了参与者对博弈结果的满意程度。

4.信息结构(Information Structure):描述了参与者所拥有的信息,包括完全信息或不完全信息。

5.博弈的结局:反映了在每个可能发生的结果下,所有参与者的利益状态。

同时,根据合作与否,博弈可以分为合作博弈和非合作博弈;根据是否知晓对手的类型,博弈可以分为静态博弈和动态博弈;根据是否知晓所有参与者的类型,博弈可以分为完全信息博弈和不完全信息博弈。

以上内容仅供参考,建议查阅关于博弈论的书籍文献获取更多专业内容。

博弈论“囚徒困境”的四种形式

博弈论“囚徒困境”的四种形式

博弈论中的“囚徒困境”摘要:“囚徒困境”模型是博弈论中的经典范例,它是1950年Tucker提出的,其完全信息下的静态博弈为广大博弈论的工作者和初学者所掌握,成为解释生活现象的有力工具。

其实“囚徒困境”模型随着博弈论的深入发展,具有各种不同的形式,通常分为:完全信息的静态博弈,完全信息的动态博弈,不完全信息的静态博弈及不完全信息的动态博弈四种形式。

本文将对“囚徒困境”的这四种形式作一个简单的介绍和分析。

关键词:博弈论囚徒困境经济一、完全信息静态“囚徒困境”博弈完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。

它的基本模型是:警察抓住了两个合伙犯罪的罪犯,由于缺乏足够的证据指证他们的罪行,所以希望这两人中至少有一人供认犯罪,就能确认罪名成立。

为此警察将这两个罪犯分别关押以防止他们串供,并告诉他们警方的政策是“坦白从宽,抗拒从严”:如果两人中只有一人坦白认罪,则坦白者立即释放,而另一人则将重判5年徒刑;如果两个同时坦白认罪,则他们将各判3年监禁。

当然罪犯知道如果他们两人都拒不认罪,则警方只能以较轻的妨碍公务罪判处他们1 年徒刑。

用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益,第二个数字是囚徒2的得益) :囚徒2囚徒1(表1)假定两个罪犯熟悉彼此,这便是一个同时行动的完全信息静态博弈。

容易看出,由于对于每个囚徒而言,无论对方选择什么策略,坦白都是自己的最优策略,所以(坦白,坦白) 是博弈的Nash均衡。

二、完全信息动态“囚徒困境”博弈——重复“囚徒困境”博弈研究重复博弈的意义在于基本博弈会重复进行,比如犯罪团伙会被警方多次审讯,日常生活中买卖会重复进行,国际间的战争此伏彼起。

而且人们也发现基本博弈的重复进行并非基本博弈的简单累加,比如商业中的回头客问题。

下面继续以表1所示的“囚徒困境”模型为例对多重博弈进行探讨。

首先观察“囚徒困境”的有限博弈,以T记基本博弈的重复次数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 不完全信息静态博弈
1.2 不完全信息静态博弈 不完全信息静态博弈也称为贝叶斯静态博弈. 在不完全信息静态博弈中,不仅至少有一个参与者 不知道其他参与者的收益函数,而且所有参与者进 行决策时并不知道其他参与者的策略或行动 . q1
Pi(t-I/ti)= P (t-I,ti )/p(ti)= P (t-I,ti )/ P (t-I,ti )
择自己的最优行动,先行动者则尽量传递对自己有利的信息,避 免传递对自己不利的信息.因此,博弈过程是参与者不断修正信 念的过程.
2不完全信息动态博弈 2.3 信号博弈
信号博弈就是两个参与者之间的不完全信息动 态博弈.
a1
m1 接收者 t1 a1 m2 a2 接收者 自然 接收者 a1 m1 a2 m2 a2 扩简 展单 式的 表信 述号 博 弈 :
与者自己知道自己的类型,但其它参与者到并不知道;在自然选
择之后,参与者开始行动,参与者的行动具有先后次序,后行动 者可以观测到先行动者的行动.但无法观察到先行动者的类型. 但是,因为参与者的行动的类型是依存的,每个参与者的行动都 传递着有关自己类型的某种信息,后行动者可以通过观察先行
动者选择的行动来推断类型或修正对类型的先验概率,然后选
2不完全信息动态博弈
接受者的四个纯策略:
1.如果发送者选择信号m1,选择行动a1;如果发送者选择 信号m2,选择行动a1 2.如果发送者选择信号m1,选择行动a1;如果发送者选择 信号m2,选择行动a2
3.如果发送者选择信号m1,选择行动a2;如果发送者选择 信号m2,选择行动a1
4.如果发送者选择信号m1,选择行动a2;如果发送者选择 信号m2,选择行动a2
2不完全信息动态博弈
2.1 不完全信息动态博弈
与不完全信息静态博弈相比较,不完全信息动态 博弈的每个参与者的行动是有先后次序的,不是同时 的。现实中的许多经济问题都属于动态贝叶斯博弈, 市场交易中普遍存在的讨价还价模型就是典型的例子.
2不完全信息动态博弈
2.2 求解动态贝叶斯博弈的基本思路 在不完全信息动态博弈中,自然首先选择参与者的类型,参
不完全信息条件下的非合作博弈
不完全信息博弈的含义 ? 讨价还价模型? 信号博弈?
1 不完全信息静态博弈 2 不完全信息动态博弈
• 不完全信息博弈的含义、讨价还价模型、 博弈 • 不完全信息静态博弈
• 不完全信息动.1 不完全信息博弈的定义 不完全信息动态博弈也称为贝叶斯博弈。在前面讨论 的完全信息博弈中,参与者的收益函数是共同知识,而在 不完全信息博弈中,至少有一个参与者不能确定其他参与 者的收益函数。例如:市场交易中的买者不知卖者能够接 受的最低价格是多少,卖者也不知道买者愿意出的最高价 格是多少.当某个企业进入某个市场时,他并不清楚市场上 已经存在的企业的成本函数等
a2 a1
t2 发送者
2不完全信息动态博弈
发送者具备的四个纯策略:
1.如果自然赋予类型t1,选择信号m1;如果自然赋予类型t2, 选择信号m1 2.如果自然赋予类型t1,选择信号m1;如果自然赋予类型t2, 选择信号m2 3.如果自然赋予类型t1,选择信号m2;如果自然赋予类型t2, 选择信号m1 4.如果自然赋予类型t1,选择信号m2;如果自然赋予类型t2, 选择信号m2
第九章 小
讨论题:

1、什么是不完全信息博弈?
2、什么是信号博弈?
3、信号博弈的内容?
4、讨价还价模型的描述?
相关文档
最新文档