合作博弈

合集下载

合作博弈论

合作博弈论

(nucleolus),最后再举出静态合作在现实的经济方面的
各种解法的应用例子。
导论
先回忆一下囚徒困境的例子:
坦白
抵抗
坦白 抵抗
-8,-8 -10,0
0,-10 -1,-1
在囚徒困境中,还有另外一个策略组合<抵抗,抵抗>, 该组合为参与人带来的支付是<-1,-1>。由<-8,-8>到 <-1,-1>,每个参与人的支付都增加了,即得到一个帕 累托改进。
合作博弈的结果必须是一个帕累托改进,博 弈双方的利益都有所增加,或者至少是一方的利 益增加,而另一方的利益不受损害。合作博弈研 究人们达成合作时如何分配合作得到的收益,即 收益分配问题。合作博弈采取的是一种合作的方 式,合作之所以能够增进双方的利益,就是因为 合作博弈能够产生一种合作剩余。至于合作剩余 在博弈各方之间如何分配,取决于博弈各方的力 量对比和制度设计。因此,合作剩余的分配既是 合作的结果,又是达成合作的条件。
合作博弈是指参与者能够联合达成一个具有约束力且可强 制执行的协议的博弈类型。合作博弈强调的是集体理性,强调效 率、公正、公平。
合作博弈最重要的两个概念是联盟和分配。每个参与者从 联盟中分配的收益正好是各种联盟形式的最大总收益。每个参 与者从联盟中分配到的收益不小于单独经营所得收益。
合作博弈的基本形式是联盟博弈,它隐含的假设是存在一个 在参与者之间可以自由流动的交换媒介(如货币),每个参与者的 效用与它是线性相关的。这些博弈被称为“单边支付”博弈,或 可转移效用(Transferable Utility ,TU)博弈。
• 合作博弈的运用研究主要涉及企业、城市、区域经济 以及国家之间的合作等多个方面问题。
• 参考教材:

博弈模型汇总

博弈模型汇总

博弈模型汇总如下:
1.合作博弈与非合作博弈:这是根据参与者之间是否可以达成具
有约束力的协议来划分的。

合作博弈强调团队合作和协作,目标是达成共赢;而非合作博弈则强调个人利益最大化,不考虑其他参与者的利益。

2.静态博弈与动态博弈:这是根据参与者做出决策的时间顺序来
划分的。

静态博弈是指所有参与者同时做出决策,或者决策顺序没有影响;动态博弈是指参与者的决策有先后顺序,后行动者可以观察到先行动者的决策。

3.完全信息博弈与不完全信息博弈:这是根据参与者对其他参与
者的偏好、策略和支付函数了解的程度来划分的。

完全信息博弈是指所有参与者都拥有完全的信息,能够准确判断其他参与者的策略和支付函数;不完全信息博弈则是指参与者只拥有部分信息,无法准确判断其他参与者的策略和支付函数。

4.零和博弈与非零和博弈:这是根据所有参与者的总收益是否为
零来划分的。

零和博弈是指所有参与者的总收益为零,一方的收益等于另一方的损失;非零和博弈则是指所有参与者的总收益不为零,各方的收益和损失不一定相关。

5.竞争博弈与合作博弈:这是根据参与者之间是否存在竞争或合
作关系来划分的。

竞争博弈是指参与者之间存在竞争关系,目标是追求个人利益最大化;合作博弈则是指参与者之间存在合作关系,目标是追求共同利益最大化。

6.微分博弈与离散博弈:这是根据决策变量的连续性来划分的。

微分博弈是指决策变量是连续变化的,需要考虑时间、速度等因素;离散博弈则是指决策变量只有有限个可能的取值,通常只考虑状态的变化而不考虑时间、速度等因素。

合作博弈的解及其应用

合作博弈的解及其应用

合作博弈的解及其应用在我们生活的这个大千世界里,合作博弈就像是一场精彩绝伦的舞蹈。

你想想,当一群人齐心协力,目标一致,结果肯定是比单打独斗更美妙。

就像打麻将,一个人再怎么厉害,四个人一起玩,才是真正的高手。

说到合作博弈,咱们常常听说“利益共享,风险共担”这句老话。

真的是这么回事儿,大家一同努力,利益自然也就能分享得更好。

合作博弈就像是一场巧妙的拉锯战。

大家都在为自己的利益着想,但只要在适当的时候达成共识,利益最大化就水到渠成。

这时候,大家就会发现,合作的力量是无穷的。

就好比你在公司里,大家齐心协力完成项目,最后领导给个大红包,哇,那种感觉简直棒极了。

你说,谁不想要那种甜头呢?再说说这个“解”。

在合作博弈中,解就是大家达成的共识。

你可以把它想象成一道菜,大家一起出主意,最后弄出一道色香味俱全的佳肴。

没错,合作博弈的解就是这么简单。

每个人都有自己的想法和建议,经过讨论和磨合,最后就成了大家都满意的结果。

就像讨论去哪儿吃饭,有的人想吃火锅,有的人想吃烧烤,最后大家找到个中间地带,哇,真是幸福啊!合作博弈的应用还真不少。

比如,在商界,大家常常会通过合作博弈来进行资源的整合。

你想,两个公司合作,互相分享技术和市场资源,最终实现双赢。

这就好比是两个朋友一起去开一个小摊,大家各自拿出自己的拿手好戏,生意自然红火。

大家都明白,单打独斗的时代已经过去了,合作才是王道。

在日常生活中,咱们也时常能看到合作博弈的影子。

比如,几个朋友一起拼车出游,成本降低了,玩的也开心,何乐而不为呢?这时候,每个人都像是一颗星星,合在一起就是璀璨的银河。

合作博弈让我们体会到,团结就是力量,大家齐心协力,总能克服困难,抵达终点。

就像古人说的“众人拾柴火焰高”,说的就是这个理儿。

合作博弈也不是说说而已,真要实现,还是得靠智慧和技巧。

怎么分配利益、如何保持公平,都是一门大学问。

这时候,有的人可能会想,哎呀,这太复杂了吧!其实不然,简单说来,沟通和信任是关键。

第9讲合作博弈论

第9讲合作博弈论

那么,我们称该合作博弈 N , v 是可加的。 定义1.6 在合作博弈 N , v 中,若对于任意的
v(T ) v(S T ) v(S T )
则称特征函数 具有凸性,相对应的博弈称为凸博弈。
从上述定义中可以看出,参与人对某个联盟的边际贡 献随着联盟规模的扩大而增加。也就是说,在凸博弈中, 合作是规模报酬递增的。显然,特征函数满足凸性的一定 满足超可加性。特征函数的凸性表示联盟越大,新成员的 实际贡献就越大。
第9讲 合作博弈
• 一般来说,博弈论可以分为合作博弈( cooperative games)与非合作博弈(non-cooperative games),现 代大多经济学家谈到的博弈论往往指的是非合作博弈论, 很少提到合作博弈论,甚至很多博弈论教材也未曾提到合 作博弈。实际上,合作博弈的出现和研究比非合作博弈要 早,早在1881年,Edgeworth在他的《数学心理学》一书 中就已经体现了合作博弈的思想。 合作博弈的运用研究主要涉及企业、城市、区域经济 以及国家之间的合作等多个方面问题。


定义1.1 设博弈的局中人集合为 N {1,2,, n},则对于任 意 S N ,我们称S 为 N 的一个联盟(coalition)。这里, 允许取 S 和 S N 两种特殊情况,我们把S N 称为一个大 联盟。
1 2 n Cn Cn 2 n。正式的合 若N n ,则N 中联盟个数为 Cn 作博弈的定义是以特征函数(characteristic function form) 的 N , v 形式给出的,简称博弈的特征性,也称联盟型。


定义1.2 给定一个有限的参与人集合 N ,合作博弈的特 征型是有序数对 N , v ,其中特征函数 v 是从2 N {S | S N} 到 实数集 R N的映射,即 N , v : 2 N R N ,且v ( ) 0 。

合作博弈

合作博弈

一、合作博弈的概念及其表示
定义6.1.1 在 n 人博弈中,参与人集用N {1, 2 , , n}
N 的任意子集 S 称为一个联盟(coalition)。
表示,
S 是一个联盟, v ( S )是指 S 和 定义6.1.2 给定一个 n人博弈, v(S) 称为联盟 N S {i | i N,i S} 的两组博弈中S 的最大效用, S 的特征函数(characteristic function)。
n
二、分配
所谓分配就是博弈的一个n 维向量集合,之所以是 n 维向 量,是由于每个参与人都要得到相应的分配。 n 维的分配 向量称为博弈的“解”,各种方法即各种解概念代表着分 配的不同观点。 定义6.2.1 对于合作博弈( N , v), N 1, 2,, n ,对每个参与 人 i N ,给予一个实值参数 xi ,形成 n 维向量 x ( x1 , , xn ) n 且其满足:
u v ( N )
存在无限个正向量 u (u1 , u2 , , un ) ,满足 u u1 u2 ,, un 。 用 E(v) 表示一个博弈 ( N , v ) 的所有分配方案组成的集合。
v (i) 0
n i 1
显然如下的 x ( x1 , , xn ) 都是分配,其中 xi v i ui ,1 i n 。
例6.1 设有一个3人合作对策,每个参与人各有两个纯策略A 和B。当三人不合作时,其支付见下表。假设采用最稳妥 策略,即最坏情况下选择最好,求合作博弈的支付函数
超可加性表示两个不相交的联盟分别行动,其分别单干的结 果不如组成一个联盟的联合而共同行动,这是大联盟形成的 动因。特征函数只有满足超加性,才有形成新联盟的必要性 。否则,如果一个合作博弈的特征函数不满足超可加性,那 么,其成员没有动机形成联盟,已经形成的联盟将面临解散 的威胁。

合作博弈_精品文档

合作博弈_精品文档

哥本哈根气候峰会博弈
1 发达国家 欧、美、日为代表
2 发展中国家 中、印、巴西、印尼
3 气候敏感国家和贫穷国家 图瓦卢、马尔 代夫、斐济等太平洋小岛国 ;非洲
各国的立场
中国,到2020年单位国内生产总值二氧 化碳排放比2005年下降40%-45%
美国将在哥本哈根气候变化大会上承诺 2020年温室气体排放量在2005年基础上 减少17%。
Shapley 值是其中重要的解概念之一
Shapley 值
Shapley公理 Shapley 提出了看上去比较 合理的几个公理假设
在这些假设下,Shapley 证明了任何合 作博弈 (N, v)存在唯一的Shapley值。可 作为合作分配的一个解概念。
Shapley 值
参与人集合N的一个置换 (permutation),是 任一函数π:N N,使得对于N中的每个j, N 中恰好存在一个i, 使得π(i) =j( π是单射,又 是满射)
英国:承诺到2020年和2050年分别减排 2005年的34%和80%,
各国立场
欧盟:通过包括气候与能源一揽子计划和各 种能效措施,无条件承诺到2020年较1990年 减排20%以上。同时承诺抬高减排幅度至30%, 前提是各工业化国家同意相当水平的减排力 度,同时发展中国家做出重大贡献,共同促 成国际条约的签署 。
给定上述置换π和任一联盟博弈v, 令πv为满足 π v ({π (i) | i∈S})=v (S), S为N的任一子集
的联盟博弈。
Shapley 值
Shapley 公理1(对称性)对于合作博弈 (N, v), 在任一参与人的置换映射π(i) 下, 分配结果应保持不变,即有
φπ(i) (πv) = φi(v) 公理1表明:一个参与人在博弈中的角

第六章、合作博弈 《经济博弈论基础》PPT课件

第六章、合作博弈 《经济博弈论基础》PPT课件
与摩根斯特恩提出来的概念,有时被 记为VN-M解。记所有可能分配组成的集合为E(V),则稳定 集定义如下:
• 定义4:对于n人合作博弈(N,V),分配集 W E(V )为稳定集, 则W满足:
(1)(内部稳定性)不存在 x, y W ,满足 x y; (2)(外部稳定性)对 y W ,x W,使得 x y 。
(N,V),有 i[U V ] i[U] i[V ]
4、夏普利值(Shapley value)
• 公理 (S1)反映了帕累托最优性的要求,表示分配收益时,不
七、策略型博弈向特征函数型博弈的转化
对于特征函数的上述求法,主要的批评是:它忽略 了联盟外局中人使联盟面临最坏处境时,自己也将付 出代价(有时代价很高)。
Harsayni认为,特征函数的取值应该由联盟与其对 立联盟(联盟外所有局中人形成的联盟)之间的一次 谈判而决定。
第二节 合作博弈解
一、合作博弈求解思路 合作博弈理论求解的目的: 得到博弈的“理性”最终分配,主要方法有 两种:优超与赋值。
(2) 分配:合作博弈的一个分配是指对n个局中人来说,存
在一个向量 x (x1,, xn ) ,满足:
(1) xi V (N) ;(2) xi V (i)。
其中V(N)表示n个局中人总的最大收益,V(i)表示局中人i不 与任何人结盟时的收益。
三、分配定义中两个条件的含义
条件(1)是群体理性,说明个人分配的收益和正好 是各种联盟形式总的最大收益;
七、策略型博弈向特征函数型博弈的转化
V(Φ)=0,没有人的联盟是不会有任何收益的;
V(1)=0,局中人2能使局中人1面临的最坏情形是局中人2取
策略
s
1 2
,局中人1将不得不在0与-1之间选择。

第九章合作博弈理论初步

第九章合作博弈理论初步

效用配置集

仅有分配概念还不够。 博弈方的风险态度和主观价值评价,尤其是当双方 存在差异时,可能影响讨价还价的态度和结果。 讨价还价对象是一批图书,一个是读书人,另一 个是收废品的,同样的分配对双方的效用不同。
效用配置集

果农和粮农分土地,种粮食和水果利润分别为每亩 500元和800元,同样的分配对双方价值不一样。
两人讨价还价一般表示

一个两人讨价还价问题需要设定可行分配集、破裂点,博弈
方各自的效用函数 B(S,d; u1,u2)

具体问题可能还有一些具体情况和特征需要设定。 两人讨价还价问题可以是完全对称的,也可以是不对称的。 双方在立场地位、效用函数、破裂点等方面都无差异,可用 效用配置集的对称性,也就是若(u1,u2)U 则 (u1,u2)U 表示。

两人讨价还价合作博弈解的帕累托效率要求可用“帕累托效率
公理”表示。
帕累托效率公理
如果 (s1,s2) 和 (s1’,s2’) 都是该讨价还价问题可行分配
集合中的点,且满足u1(s1)>u1(s1’) ,和 u2(s2)>u2(s2’) ,那 么(s1’,s2’) 肯定不是讨价还价博弈的结果。

作为博弈的解 (u1*,u2*)必须满足u1*=u2* 。
图形表示对称性公理,就是图9.2这个对称讨价还价问 题的解必须落在粗线条表示的对称线上。
对称性公理图示

图9.2 对称性公理图示
u2
对称线
d2 d1
u1

帕累托效率和对称性公理可解对称两人讨价还价问题。 以关于100元现金的讨价还价为例:

必须引进能分析联合理性合作行为的合作博弈理论。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

合作博弈
博弈论又称为对策论,是一门应用极其广泛的学科,它既是一个数学分支,又属于经济学和管理科学范畴,其应用涉及经济学、管理学、社会科学以及计算机科学等众多学科领域。

在过去的几十年中,博弈论在国内外发展迅速,既有对传统非合作博弈的突破,更有新的理论分支,比如合作博弈、模糊合作博弈等的飞速发展。

如今,博弈论在经济学中的地位日益凸显,已经成为一种标准用于衡量生产活动的经济性。

博弈论发展至今的种类繁多,可以根据不同标准进行不同分类。

按博弈中的参与者采用的对策能否在博弈开始前确定,可以将博弈分为策略型博弈和展开型博弈。

根据博弈的周期是否与时间长短有关,分为动态博弈和静态博弈。

如果一场博弈活动中,参与者之间互不关联,参与者在进行博弈时禁止任何形式的信息往来,同时禁止参与者互相签订任何形式的强制性约定,则称这种博弈为非合作博弈(non-cooperative game);合作博弈(cooperative game)则是指参与者在进行博弈前可以互相沟通,交换信息,共同完成博弈过程,合作博弈中相互合作的参与者通常称之为一个联盟。

本文主要针对合作博弈进行讨论。

合作博弈理论主要关系的是联盟(即参与者集合),协调他们的行动并且经营他们的收益。

因此,合作博弈研究的重点问题是如何在组成联盟的成员之间分配他们的额外收益(或节省的费用)。

分配该额外收益的结果或方法称为合作博弈的解。

由于合作博弈的解能够适用于复杂或者运算量较大的系统,因此合作博弈解法在电力工业中的应用已经得到国内外学者的广泛研究,其模型涵盖输配电竞价、电网建设招投标、输电定价、系统费用分摊等领域。

与采用传统的非合作博弈模型求解相比,合作博弈解可以为市场中的参与者提供良好的经济信号,刺激参与者互相竞争获得更大的利益。

通常情况下,生产活动中的参与者(或局中人)通过某种协定形成联盟,各联盟之间的参与者通过协商并联合行动,来实现联盟整体利益的最大化,进一步实现个体利益的最优分配。

参与者在追求整体和个体利益最大化的同时,也受到相互之间协定的约束,从而避免自身获取利益的行为造成其他参与者利益的损失。

由于参与者采用合作博弈方法进行生产活动时,各自分配的利益能够被全体参与者所接受,因此对合作博弈方法的研究很有必要。

令N为参与者(这些参与者考虑不同的合作可能性)的非空有限集合,即{}
=,每个子集S看作是参与者不同的合作组成的一个联盟,则联盟N n
1,2,3,...,
∈。

对于每一个联盟S,其中的参与者均通过协商采取一致的策略行动,为S N
实现该联盟的总利益最大而互相合作。

集合N称为大联盟,集合φ称为空联盟。

将联盟的集合,即N 的所有子集用2N 表示,对于一个参与者为n 的大联盟,其子联盟有2n 个,用()N ϕ表示所有联盟的全体。

实值函数()V S 在理解时可认为为当联盟S 合作时其成员可以获得的最大收益或可节省的最大成本。

一般设博弈(,)N V 的特征函数为V 。

换句话说,对于()N ϕ中的任意一个联盟S ,该联盟与其他联盟进行博弈的过程中,总能够根据调整策略使其总收益最大化,该收益记为()V S 。

因此,联盟φ的特征函数值为零,即:
()0V φ= (2.1)
现实中的很多合作博弈的是超可加性博弈,超可加性是指若()N ϕ中的两个联盟的交集为空集,则它们合作后所获得的总收益(或节省的费用)应当不少于两个联盟不进行合作单独产生的收益(或节省的费用)之和,即当S ,T 满足{}S T φ⋂=,则有:
()()()V S T V S V T ⋃≥+ (2.2)
式(2-2)所表示的超可加性也可以理解为:对于公式中的()V S T ⋃,联盟S 和联盟T 合作对抗N S T --;对于公式中的()()V S V T +,联盟S 同时对抗
N S T --和T (T 在()V S 中)
,联盟T 同时对抗N S T --和S (S 在()V S 中)。

可见联盟S 和T 合作后获得的总利益应当不少于它们同时对抗其他联盟的利益之和。

也就是说式(2-2)表明联盟S 和T 进行合作能够使产生的利益之和更大,从而分别使各自获得更大的利益;反过来,当对生产成本进行分摊时,则式(2-2)表明联盟S 和T 进行合作博弈后完成生产活动所需的总成本小于等于它们各自独立进行生产活动所需的成本之和。

对于满足超可加性的博弈,进行合作博弈对于博弈中的每个参与者或联盟来讲都是有利的。

在合作博弈中,参与者通过彼此间的合作协议而受到约束。

当大联盟中存在n (n >2)个参与者时,参与者相互之间可能进行合作博弈活动,从而分别组成联盟。

因此,在建立合作博弈模型之前,应当首先确定参与者形成联盟的数量和种类。

联盟的数量和参与者的组合不同直接影响合作博弈的结果。

在确定了参与者的所有可能组合以及联盟数量之后,需要分别对这些联盟所产生的收益(或节省的费用)进行计算。

大联盟中的参与者进行合作博弈时,特征函数()V S 只代表联盟的总收益,随之产生的问题是如何将该总收益在所有参与者中合理分配,从而满足参与者进行合作博弈的基本要求。

因为一旦分配结果不能被所有参与者所接受,合作联盟就没有了存在的意义,即使是对于已存在的联盟也会因此而分裂。

对于一次合作博弈活动,需要解决的最重要问题就是所有参与者合作时所获得的收益(或节省的费用)如何在个体参与者之间进行分配,同时这个分配需要考虑所有参与者形
成不同联盟时可能存在的潜在收益。

在实际生产活动中,每个参与者都希望自己所选择的策略是最优的,即选择能够进入能够使自身在生产活动中获利最大的联盟,参与者为加入这样的联盟所采取的策略也会随之改变,从而影响其他参与者的策略。

因此,在各联盟形成前,联盟就应向其参与者提供可能获得的收益信息,使参与者自由选择合作对象形成联盟。

对于分配联盟获取的总收益,需要引入分配向量的概念进行说明。

分配向量代表联盟中每个参与者所获收益的一组函数值。

在参与者为n 的合作博弈中,分配向量通常为{}12,,...,n x x x =x ,其中i x 表示参与者i 分配到的收益,1,2,3,...,i n =。

分配向量通常满足一下两个约束:
(1)群体合理性
1()n i i x
V N ==∑ (2.3)
(2)个体合理性
()i x V i ≥ (2.4)
其中群体合理性表明对于所有参与者组成的大联盟N ,其特征函数V 必须得到完全分配,否则不会被参与者认可;同时总的分配也不能超过特征函数V ,否则就会导致某些参与者无法获得收益,出现所谓的“空头支票”。

个体合理性表明,对任意一个参与者来说,加入联盟进行合作后的所分配的收益应当不少于其独立进行生产活动的获得,否则加入联盟对其没有意义。

合作博弈中的分配方案通常不止一种,当出现另一个分配向量时,需要对两种方案的优劣进行对比。

此时,各参与者往往会采取不同的策略,因为两种分配方案都应当满足式(2.3)中的群体合理性,即:
11
()n n i i i i x
V N y ====∑∑ (2.5) 对于两种分配方案,可能存在参与者i ,使得分配向量i i x y >,因此对参与者i 而言,生产活动中加入前者进行合作对自身更为有利。

同样,也会存在参与者j ,在生产活动中加入后者进行合作对自身更为有利。

在此时为了表示在联盟S 中所有参与者对两种分配方案的支持与否,需要引入分配支配的定义:
对于分配方案x 和y 及联盟S ,如果i i x y > ,i S ∀∈,有()i i S
x V S ∈≤∑,则
称x 关于联盟S 支配y 。

相关文档
最新文档