专题一:零和博弈剖析

合集下载

税企之间的零和博弈分析

税企之间的零和博弈分析

税企之间的零和博弈分析【摘要】企业追求的是利润最大化,税务机关代表国家无偿征税,企业和税务机关利益相悖。

企业总是想办法避税,而税务机关要对其依法稽查,税企陷入困境,他们的博弈是零和博弈。

由于税务机关对企业稽查的概率存在,恰当的概率不仅达到博弈的纳什均衡,促进企业依法纳税,在资源配置上达到帕累托最优。

【关键词】税企困境;零和博弈;纳什均衡;概率0.引言税收是政府为了满足社会公共需要,凭借政治权利,强制、无偿的取得财政收入的一种形式。

它是国家凭借其政治权力取得财政收入、进行国民收入分配和再分配的一种主要形式。

国家征税的目的是满足提供社会产品的需要,以弥补市场失灵、促进公平分配等的需要。

国家通过征税,将一部分社会产品由纳税人所有权转变为国家所有,因此征税的过程实际上是国家参与社会产品的分配过程。

国家征税以后对具体纳税人既不需要直接偿还,也不付出任何直接形式的报酬,是国家凭借政治权利,通过法律形式对社会产品进行强制性分配,而非纳税人的一种自愿交纳。

企业作为微观经济的主体,其经营的目的就是利润的最大化,我们称之为逐利行为。

利润是经济“游戏规则”的核心,即收入超过成本的部分。

当成本超过收入时,利润为负,即经营损失,就是向所有者发出明确信号—--此经营在减少他的财富。

衡量管理者决策成功与否,最重要的唯一标准就是这个决策将创造更高的利润还是降低了利润。

1.“税企困境”零和博弈的模型为分析方便,假设企业经营的唯一目的就是逐利(不考虑其他社会责任),税务机关唯一的活动就是征收税款。

税企之间只有税款和缴纳税款的关系(不考虑人情因素),即税务机关依法征收税款,企业依法缴纳税款。

由于税收具有无偿性和强制性,而企业经营的目的就是利润的最大化;若税务机关不能征到税款就会损害国家的经济利益,而企业缴纳税款就会降低企业的利润。

为此,企业在逐利行为的驱使下总是想方设法出具虚假的财务信息,从而逃避税收;鉴于企业的举动,为加大税收的征管力度,税收机关总是对企业财务进行稽查,若发现企业有逃避税收的行为税务机关除要求企业补缴税款外,还要依法对企业进行经济处罚。

博弈的分类——负和博弈、零和博弈、正和博弈

博弈的分类——负和博弈、零和博弈、正和博弈

博弈的分类——负和博弈、零和博弈、正和博弈一方获益,另一方损失,这只是博弈的一种结果。

除此之外,博弈的结果还可能是两败俱伤,或者双方共赢。

按照博弈的结果来分,博奔分为负和博弈、零和博弈与正和博弈。

负和博弈是指博弈的参与者最后得到的收获都小于付出,都没有占到便宣,是一种两败俱伤的博弈。

网络上流传着这样一个笑话,甲、乙两个经济学家走在路上突然发现了路边有一蛇狗屎,甲便对乙说:“你要是把它吃了,我给你5000万元。

”乙一想,尽管臭了点,不过5000万元也不是个小数目啊,犹像了半天之后还是把它吃了。

二人续往前走,心中都有些不平衡。

甲想,5000万元也不是一笔小数目,我本想开开玩笑,现在倒好,白白花了5000万元,什么也没得到。

乙想,虽然得了5000万元,可吃狗屎的滋味太难受了,说不定这件事情传出去还会被人耻笑。

就在这时,两人又发现了一蛇狗属。

乙便提议说,你要是把它吃了,我也给你5000万元o甲本来就有点心疼自己的钱,再说乙都吃了,自己为什么不能吃?于是他便吃了。

按理说,两个人又找回了心理和金钱上的平衡,但是两个人怎么想都觉得不对,谁也没有得到什么,平白无故每人吃了一坨狗屎。

他们把这件事告诉了自己的导师,导师听完之后大吃一惊,说道:“你们知道自己做了什么吗?一转眼你们就创造了一个亿的GDP啊!”虽然只是一个笑话,但是其中蕴含着一场博弈,就结果来看是一场典型的负和博弈,也就是双方的收获都小于付出,两败俱伤零和博弈是指参与者中一方获益,另一方损失,并且参与者之间获得的利益与损失之和为零。

赌博便是零和博弈最好的体现,只要有贏家就会有输家,赢家赢的钱与输家输的钱肯定是一样多。

这与物理上的能量守恒定律是一个道理,不管能量怎样变动,总量是不变的。

我们用一个扑克牌游戏来解释一下零和博奔。

甲、乙两个人玩猜扑克游戏,游戏规则是每个人随便抽一张牌,然后一起打开,若是颜色相同,甲给乙1元钱,若是颜色不同,乙给甲1元钱。

为了保证没有歧义,先将牌中的“大王”和“小王”拿出来。

零和博弈

零和博弈

零和博弈(重定向自零和游戏原理)零和博弈(Zero-sum Game),也称零和游戏、定和博弈[编辑]零和博弈简介零和博弈是博弈论的一个概念,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”。

双方不存在合作的可能。

零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分。

当你看到两位对弈者时,你就可以说他们正在玩“零和游戏”。

因为在大多数情况下,总会有一个赢,一个输,如果我们把获胜计算为得1分,而输棋为-1分,那么,这两人得分之和就是:1+(-1)=0。

这正是“零和游戏”的基本内容:游戏者有输有赢,一方所赢正是另一方所输,游戏的总成绩永远是零。

零和游戏原理之所以广受关注,主要是因为人们发现在社会的方方面面都能发现与“零和游戏”类似的局面,胜利者的光荣后面往往隐藏着失败者的辛酸和苦涩。

从个人到国家,从政治到经济,似乎无不验证了世界正是一个巨大的“零和游戏”场。

这种理论认为,世界是一个封闭的系统,财富、资源、机遇都是有限的,个别人、个别地区和个别国家财富的增加必然意味着对其他人、其他地区和国家的掠夺,这是一个“邪恶进化论”式的弱肉强食的世界。

但20世纪人类在经历了两次世界大战,经济的高速增长、科技进步、全球化以及日益严重的环境污染之后,“零和游戏”观念正逐渐被“双赢”观念所取代。

人们开始认识到“利己”不一定要建立在“损人”的基础上。

通过有效合作,皆大欢喜的结局是可能出现的。

但从“零和游戏”走向“双赢”,要求各方要有真诚合作的精神和勇气,在合作中不要耍小聪明,不要总想占别人的小便宜,要遵守游戏规则,否则“双赢”的局面就不可能出现,最终吃亏的还是自己。

[编辑]零和博弈的例子零和博弈的例子有:赌博、期货等。

最新专题一:零和博弈剖析

最新专题一:零和博弈剖析
❖相反,如果一个博弈在所有各种对局下全 体参与人之得益总和不总是保持为零,这 个博弈就叫非零和博弈。
❖零和博弈是利益对抗程度最高的博弈。
山西财经大学经济学院 康旭华
3
2020/11/11
零和博弈:掷硬币
支付
2
1
正面
反面
正面 -1,1 1,-1
反面 1,-1 -1,1
山西财经大学经济学院 康旭华
4Hale Waihona Puke 2020/11/11山西财经大学经济学院 康旭华
17
U 参与人1 M
D
2020/11/11
最小最大方法:3
参与人2
L
M
R
5
3
1
6
2
1
1
0
山西财经大学经济学院 康旭华
0
18
U
参与人 M 1
D
2020/11/11
最小最大方法:3
参与人2
L
M
R
5,-5
3,-3
1,-1
6,-6
2,-2
1,-1
1,-1
0,0
0,0
山西财经大学经济学院 康旭华
山西财经大学经济学院 康旭华
10
内容提要
2020/11/11
零和博弈 最小最大方法
直线交叉法 对抗性排序
山西财经大学经济学院 康旭华
11
最小最大方法
2020/11/11
❖由冯·诺依曼提出
❖基本思想:
作为局中人,对手将采取对他自己最有利的策 略;相应的,对手会选择使你获得尽可能差的 支付的策略。
由于零和博弈的特点和性质,以上思想即为: 任何使对手得到最好结果的策略,都会使你获 得最差的结果。 双方都具有这样的理性!

双人零和博弈

双人零和博弈

一、双人零和博弈的概念零和博弈又称零和游戏,与非零和博弈相对,是博弈论的一个概念,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,一方收益多少,另一方就损失多少,所以博弈各方的收益和损失相加总和永远为“零”.双方不存在合作的可能.用通俗的话来讲也可以说是:自己的幸福是建立在他人的痛苦之上的,二者的大小完全相等,因而双方在决策时都以自己的最大利益为目标,想尽一切办法以实现“损人利己”.零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分.二、双人零和博弈的模型的建立建立双人零和博弈的模型,就是要根据对实际问题的叙述确定参与人(局中人)的策略集以及相应的收益矩阵(支付矩阵).我们记双人零和博弈中的两个局中人为A和B;局中人A的策略集为a1,…,am,局中人B的策略集为b1,…,bn;cij为局中人A采取策略ai、局中人B采取策略bj 时A的收益(这时局中人B的收益为- cij).则收益矩阵见下表表1那么下面我们通过例子来说明双人零和博弈模型的建立: 例1甲、乙两名儿童玩猜拳游戏.游戏中双方同时分别或伸出拳头(代表石头)、或手掌(代表布)、或两个手指(代表剪刀).规则是剪刀赢布,布赢石头,石头赢剪刀,赢者得一分.若双方所出相同,算和局,均不得分.试列出对儿童甲的赢得矩阵.解 本例中儿童甲或乙均有三个策略:或出拳头,或出手掌,或出两个手指,根据例子中所述规则,可列出对儿童甲的赢得矩阵见表2.表2例2 从一张红牌和一张黑牌中随机抽取一张,在对B 保密情况下拿给A 看,若A 看到的是红牌,他可选择或掷硬币决定胜负,或让B 猜.若选择掷硬币,当出现正面,A 赢p 元,出现反面,输q 元;若让B 猜,当B 猜中是红牌,A 输r 元,反之B 猜是黑牌,A 赢s 元.若A 看到的是黑牌,他只能让B 猜.当B 猜中是黑牌,A 输u 元,反之B 猜是红牌,A 赢t 元,试确定A 、B 各自的策略,建立支付矩阵.解 因A 的赢得和损失分别是B 的损失和赢得,故属二人零和博弈.为便于分析,可画出如图3的博弈树图.图3中,○为随机点,□分别为A 和B 的决策点,从图中看出A 的策略有掷硬币和让B 猜两种,B 的策略有猜红和猜黑两种,据此可归纳出各种情况下A 和B 输赢值分析的表格,见表4.图3抽到红牌正面反面抽到黑球○□□○□1/2掷硬币让B 猜1/21/2猜红猜黑猜黑猜红1/2让B 猜p-q-rst-u表4对表4中各栏数字可以这样来理解:因让A 看到红牌时或掷硬币或让B 猜.若A 决定选掷硬币这个策略,当出现正面,这时不管B 猜红或猜黑,A 都赢p 元;当出现反面,不管B 猜红或猜黑,A 都输q 元.同样A 选择让B 猜的策略后,他的输赢只同B 猜红或猜黑有关,而与掷硬币的正反面无关.又若抽到的牌是黑牌,A 的决定只能让B 猜,因而掷硬币策略对A 的胜负同样不起作用.考虑到抽牌时的红与黑的概率各为1/2,掷硬币时出现正反面的概率也各为1/2,故当A 采取“掷硬币”策略,而B 选择“猜红”策略时,A 的期望赢得为:⎪⎭⎫ ⎝⎛-q p 212121+t 21=()t q p 241+- 当A 采取让B 猜策略,B 选择“猜红”策略时,A 的期望赢得为:()()⎪⎭⎫ ⎝⎛-+-r r 212121+t 21=()t r +-21 相应可求得其他策略对A 的期望赢得值.由此可列出本例的收益矩阵,见表5.表5三、双人零和博弈的求解定理1(极小极大定理)在零和博弈中,对于给定的支付矩阵U ,如果存在混合战略1σ*=(1σ*1,…1σ*m )和2σ*=(2σ*1,…2σ*n )以及一个常数v 满足,对任意j 有∑=mi i ij a 11*σ≥v ,对任意的i 有∑=nj j ij a 12*σ≤v ,那么战略组合(1σ*,2σ*)为该博弈的Nash 均衡.其中,v 为参与人1在均衡中所得到的期望支付,亦称该博弈的值.这个极小极大定理,其基本思想就是:参与人1考虑到对方使自己支付最小的最优反应,从中选择使自己最好的策略.参与人2也遵循同样的思路,这样才能满足Nash 均衡的互为最优反应的条件.这样我们就可以得到双人零和博弈Nash 均衡的计算方法了,如以下定理定理2 对于给定的零和博弈,如果博弈的值v 大于0,则博弈的Nash 均衡(1σ*,2σ*)为以下对偶线性规划问题的解Min ∑=mi i p 1s.t. ∑=mi i ij p a 1≥1 (j=1,…,n)i p ≥0 (i=1,…,m) 和Max ∑=nj j q 1s.t. ∑=nj j ij q a 1≤1 (i=1,…,m)j q ≥0 (j=1,…,n) 其中,Nash 均衡支付∑∑====nj jmi iqpv 1111Nash 均衡战略),,,,(1*1m i vp vp vp =σ,),,,(1*2n j vq vq vq =σ由于此定理只适用于v 大于0的情形,因此对于v 小于等于0的情形,该定理所给出的方法需做适当的修改.命题 如果支付矩阵U=mxn ij a )(的每个元素都大于0,即ij a >0,那么博弈的值大于0,即v >0.定理3 如果支付矩阵U '=mxn ij a )('是由U=mxn ij a )(的每个元素都加上一个常数c 得到,即c a a ij ij +=',那么支付矩阵U 和U '所对应的零和博弈的Nash 均衡战略相同,博弈的值相差c.根据以上定理,可以得到如下求解一般零和博弈Nash 均衡的方法:(1) 若支付矩阵U 中的所有元素都大于零,则可以直接根据定理进行计算;若支付矩阵U 中有小于0的元素,可以通过加上一个常数使它们都大于0,然后再根据定理进行计算. (2) 求解定理中的两个对偶线性规划问题.下面通过实例来说明如何求解双人零和博弈的Nash 均衡.例3 求解下图中战略式博弈的Nash 均衡. 参与人2L M RU参与人1 C D通过求解对偶线性规划问题求零和博弈的Nash 均衡解 根据前面的介绍,可知该博弈的支付矩阵为U=⎪⎪⎪⎭⎫ ⎝⎛224132312不难发现,该博弈的支付矩阵U=()33x ij a 的每个元素都大于0,即ij a >0,那么博弈的值大于0,即v>0.设参与人1和参与人2的混合战略分别是1σ=(321,,vp vp vp )和2σ=(321,,vq vq vq ),利用对偶线性规划求解方法求解该战略式博弈的Nash 均衡,构造规划问题如下.Min {321p p p ++}s.t. 321422p p p ++≥1 32123p p p ++≥1 32123p p p ++≥1 1p ≥0,2p ≥0,3p ≥0 和Max {321q q q ++}s.t. 32132q q q ++≤1 32132q q q ++≤1 321224q q q ++≤1 1q ≥0,2q ≥0,3q ≥0求解第一个规划问题,得到1p =1/4, 2p =1/4, 3p =0,参与人1的支付v=2.因此,参与人1的混合战略1σ*=(1/2,1/2,0).同理,对对偶问题求解,得到1q =0,2q =1/4, 3q =1/4,参与人2的损失v=2,因此参与人的混合战略2σ*=(0,1/2,1/2).所以,该博弈存在一个混合战略Nash 均衡((1/2,1/2,0)(0,1/2,1/2),).例4 求解下图中的战略式博弈的Nash 均衡.参与人2L M R U 参与人1 C D通过求解对偶线性规划问题求零和博弈的Nash 均衡解 该博弈的支付矩阵为U=⎪⎪⎪⎭⎫ ⎝⎛--203011122 在上树支付矩阵U=33)(x ij a 中,12a <0, 21a <0.为了利用对偶线性规划模型求解博弈的解,构造支付矩阵U '=33')(x ij a ,其中a 'ij=ij a +c.令c=2,那么新构造的支付矩阵为U '=⎪⎪⎪⎭⎫ ⎝⎛425231304 设参与人1和参与人2的混合战略分别是1σ=(v 'p 1, v 'p 2, v 'p 3)和2σ=(v 'q 1, v 'q 2 v 'q 3,),v 为原博弈的值,v '为新博弈的值,且v '=v+2,利用对偶线性规划求解方法求解新战略式博弈的Nash 均衡,构造规划问题如下.Min {321p p p ++} s.t. 32154p p p ++≥13223p p +≥1 321423p p p ++≥11p ≥0, 2p ≥0, 3p ≥0Max {321q q q ++}s.t. 3134q q +≤1 32123q q q ++≤1 321425q q q ++≤1 1q ≥0,2q ≥0,3q ≥0通过求解对偶问题,得到1p =0,2p =3/13, 3p =2/13,参与人1的支付v '=13/5, 1q =1/13, 2q =4/13, 3q =0,参与人2的损失v '=13/5.因此,参与人1的混合战略1σ*=(0,3/5,2/5), 参与人2 的混合战略2σ*=(1/5,4/5,0),原博弈的值v= v '-2=3/5.所以,博弈存在一个混合战略Nash 均衡((0,3/5,2/5),(1/5,4/5,0)).。

双人零和博弈(精品)

双人零和博弈(精品)

一、双人零和博弈的概念零和博弈又称零和游戏,与非零和博弈相对,是博弈论的一个概念,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,一方收益多少,另一方就损失多少,所以博弈各方的收益和损失相加总和永远为“零”.双方不存在合作的可能.用通俗的话来讲也可以说是:自己的幸福是建立在他人的痛苦之上的,二者的大小完全相等,因而双方在决策时都以自己的最大利益为目标,想尽一切办法以实现“损人利己”.零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分.二、双人零和博弈的模型的建立建立双人零和博弈的模型,就是要根据对实际问题的叙述确定参与人(局中人)的策略集以及相应的收益矩阵(支付矩阵).我们记双人零和博弈中的两个局中人为A和B;局中人A的策略集为a1,…,am,局中人B的策略集为b1,…,bn;cij为局中人A采取策略ai、局中人B采取策略bj 时A的收益(这时局中人B的收益为- cij).则收益矩阵见下表表1那么下面我们通过例子来说明双人零和博弈模型的建立: 例1甲、乙两名儿童玩猜拳游戏.游戏中双方同时分别或伸出拳头(代表石头)、或手掌(代表布)、或两个手指(代表剪刀).规则是剪刀赢布,布赢石头,石头赢剪刀,赢者得一分.若双方所出相同,算和局,均不得分.试列出对儿童甲的赢得矩阵.解 本例中儿童甲或乙均有三个策略:或出拳头,或出手掌,或出两个手指,根据例子中所述规则,可列出对儿童甲的赢得矩阵见表2.表2例2 从一张红牌和一张黑牌中随机抽取一张,在对B 保密情况下拿给A 看,若A 看到的是红牌,他可选择或掷硬币决定胜负,或让B 猜.若选择掷硬币,当出现正面,A 赢p 元,出现反面,输q 元;若让B 猜,当B 猜中是红牌,A 输r 元,反之B 猜是黑牌,A 赢s 元.若A 看到的是黑牌,他只能让B 猜.当B 猜中是黑牌,A 输u 元,反之B 猜是红牌,A 赢t 元,试确定A 、B 各自的策略,建立支付矩阵.解 因A 的赢得和损失分别是B 的损失和赢得,故属二人零和博弈.为便于分析,可画出如图3的博弈树图.图3中,○为随机点,□分别为A 和B 的决策点,从图中看出A 的策略有掷硬币和让B 猜两种,B 的策略有猜红和猜黑两种,据此可归纳出各种情况下A 和B 输赢值分析的表格,见表4.图3抽到红牌正面反面抽到黑球○□□○□1/2掷硬币让B 猜1/21/2猜红猜黑猜黑猜红1/2让B 猜p-q-rst-u表4对表4中各栏数字可以这样来理解:因让A 看到红牌时或掷硬币或让B 猜.若A 决定选掷硬币这个策略,当出现正面,这时不管B 猜红或猜黑,A 都赢p 元;当出现反面,不管B 猜红或猜黑,A 都输q 元.同样A 选择让B 猜的策略后,他的输赢只同B 猜红或猜黑有关,而与掷硬币的正反面无关.又若抽到的牌是黑牌,A 的决定只能让B 猜,因而掷硬币策略对A 的胜负同样不起作用.考虑到抽牌时的红与黑的概率各为1/2,掷硬币时出现正反面的概率也各为1/2,故当A 采取“掷硬币”策略,而B 选择“猜红”策略时,A 的期望赢得为:⎪⎭⎫ ⎝⎛-q p 212121+t 21=()t q p 241+- 当A 采取让B 猜策略,B 选择“猜红”策略时,A 的期望赢得为:()()⎪⎭⎫ ⎝⎛-+-r r 212121+t 21=()t r +-21相应可求得其他策略对A 的期望赢得值.由此可列出本例的收益矩阵,见表5.表5三、双人零和博弈的求解定理1(极小极大定理)在零和博弈中,对于给定的支付矩阵U ,如果存在混合战略1σ*=(1σ*1,…1σ*m )和2σ*=(2σ*1, (2)σ*n )以及一个常数v 满足,对任意j 有∑=mi i ij a 11*σ≥v ,对任意的i 有∑=nj j ij a 12*σ≤v ,那么战略组合(1σ*,2σ*)为该博弈的Nash 均衡.其中,v 为参与人1在均衡中所得到的期望支付,亦称该博弈的值.这个极小极大定理,其基本思想就是:参与人1考虑到对方使自己支付最小的最优反应,从中选择使自己最好的策略.参与人2也遵循同样的思路,这样才能满足Nash 均衡的互为最优反应的条件.这样我们就可以得到双人零和博弈Nash 均衡的计算方法了,如以下定理定理2 对于给定的零和博弈,如果博弈的值v 大于0,则博弈的Nash 均衡(1σ*,2σ*)为以下对偶线性规划问题的解Min ∑=mi i p 1s.t. ∑=mi i ij p a 1≥1 (j=1,…,n)i p ≥0 (i=1,…,m) 和Max ∑=nj j q 1s.t. ∑=nj j ij q a 1≤1 (i=1,…,m)j q ≥0 (j=1,…,n) 其中,Nash 均衡支付∑∑====nj jmi iqpv 1111Nash 均衡战略),,,,(1*1m i vp vp vp =σ,),,,(1*2n j vq vq vq =σ由于此定理只适用于v 大于0的情形,因此对于v 小于等于0的情形,该定理所给出的方法需做适当的修改.命题 如果支付矩阵U=m xn ij a )(的每个元素都大于0,即ij a >0,那么博弈的值大于0,即v >0.定理3 如果支付矩阵U '=m xn ij a )('是由U=m xn ij a )(的每个元素都加上一个常数c 得到,即c a a ij ij +=',那么支付矩阵U 和U '所对应的零和博弈的Nash 均衡战略相同,博弈的值相差c.根据以上定理,可以得到如下求解一般零和博弈Nash 均衡的方法:(1) 若支付矩阵U 中的所有元素都大于零,则可以直接根据定理进行计算;若支付矩阵U 中有小于0的元素,可以通过加上一个常数使它们都大于0,然后再根据定理进行计算. (2) 求解定理中的两个对偶线性规划问题.下面通过实例来说明如何求解双人零和博弈的Nash 均衡.例3 求解下图中战略式博弈的Nash 均衡. 参与人2L M RU参与人1 C D通过求解对偶线性规划问题求零和博弈的Nash 均衡解 根据前面的介绍,可知该博弈的支付矩阵为U=⎪⎪⎪⎭⎫ ⎝⎛224132312不难发现,该博弈的支付矩阵U=()33x ij a 的每个元素都大于0,即ij a >0,那么博弈的值大于0,即v>0.设参与人1和参与人2的混合战略分别是1σ=(321,,vp vp vp )和2σ=(321,,vq vq vq ),利用对偶线性规划求解方法求解该战略式博弈的Nash 均衡,构造规划问题如下.Min {321p p p ++}s.t. 321422p p p ++≥1 32123p p p ++≥1 32123p p p ++≥1 1p ≥0,2p ≥0,3p ≥0 和Max {321q q q ++}s.t. 32132q q q ++≤1 32132q q q ++≤1 321224q q q ++≤1 1q ≥0,2q ≥0,3q ≥0求解第一个规划问题,得到1p =1/4, 2p =1/4, 3p =0,参与人1的支付v=2.因此,参与人1的混合战略1σ*=(1/2,1/2,0).同理,对对偶问题求解,得到1q =0,2q =1/4, 3q =1/4,参与人2的损失v=2,因此参与人的混合战略2σ*=(0,1/2,1/2).所以,该博弈存在一个混合战略Nash 均衡((1/2,1/2,0)(0,1/2,1/2),).例4 求解下图中的战略式博弈的Nash 均衡.参与人2L M R U 参与人1 C D通过求解对偶线性规划问题求零和博弈的Nash 均衡解 该博弈的支付矩阵为U=⎪⎪⎪⎭⎫ ⎝⎛--203011122 在上树支付矩阵U=33)(x ij a 中,12a <0, 21a <0.为了利用对偶线性规划模型求解博弈的解,构造支付矩阵U '=33')(x ij a ,其中a 'ij =ij a +c. 令c=2,那么新构造的支付矩阵为U '=⎪⎪⎪⎭⎫ ⎝⎛425231304 设参与人1和参与人2的混合战略分别是1σ=(v 'p 1, v 'p 2, v 'p 3)和2σ=(v 'q 1, v 'q 2 v 'q 3,),v 为原博弈的值,v '为新博弈的值,且v '=v+2,利用对偶线性规划求解方法求解新战略式博弈的Nash 均衡,构造规划问题如下.Min {321p p p ++} s.t. 32154p p p ++≥13223p p +≥1 321423p p p ++≥11p ≥0, 2p ≥0, 3p ≥0Max {321q q q ++}s.t. 3134q q +≤1 32123q q q ++≤1 321425q q q ++≤1 1q ≥0,2q ≥0,3q ≥0通过求解对偶问题,得到1p =0,2p =3/13, 3p =2/13,参与人1的支付v '=13/5, 1q =1/13, 2q =4/13, 3q =0,参与人2的损失v '=13/5.因此,参与人1的混合战略1σ*=(0,3/5,2/5), 参与人2 的混合战略2σ*=(1/5,4/5,0),原博弈的值v= v '-2=3/5.所以,博弈存在一个混合战略Nash 均衡((0,3/5,2/5),(1/5,4/5,0)).。

[读书使人明智]零和博弈与非零和博弈

[读书使人明智]零和博弈与非零和博弈

[读书使人明智]零和博弈与非零和博弈众所周知,博弈是为争夺利益而进行的一场竞争,竞争的结局在大多数情况下,总会有一个赢,有一个输,如果我们把获胜计算为1分,而输者得-1分,那么,这两人得分之和就是:1+(-1)=0。

在博弈论中,这种情形的博弈被称为“零和博弈”。

要了解零和博弈的原理,我们可以从《拉封丹寓言》中所讲的一则关于狐狸与狼的一场博弈中得到最为形象的解释。

有一天晚上,一只狐狸踱步来到了水井旁,低头俯身看到井底水面上月亮的影子,它以为那是一块大奶酪。

这只饿得发昏的狐狸跨进一只吊桶下到了井底,把与之相连的另一只吊桶升到了井面。

下到井底,它才明白这“奶酪”是吃不得的,自己已铸成大错,处境十分不利,长期下去就只有等死了。

如果没有另一个饥饿的替死鬼来打这月亮的主意,以同样的方式,落得同样悲惨的下场,而把它从眼下窘迫的境地换出来,它怎能指望再活着回到地面上去呢?两天两夜过去了,没有一只动物光顾水井。

时间一分一秒地不断流逝,银色的上弦月出现了。

沮丧的狐狸正无计可施时,刚好一只口渴的狼途经此地,狐狸不禁喜上眉梢,它对狼打招呼道:“喂,伙计,我免费招待你一顿美餐,你看怎么样?”看到狼被吸引住了,狐狸于是指着井底的月亮对狼说:“你看到这个了吗?这可是块十分好吃的奶酪,这是森林之神用牛奶做出来的。

假如神王朱庇特病了,只要他尝到这美味可口的食物就会胃口大开。

我已吃掉了这奶酪的一半,剩下这一半也够你吃一顿的了,就请委屈你钻到我特意为你准备好的桶里下到井里来吧。

狐狸尽量把故事编得天衣无缝,这只狼果然中了狐狸的奸计。

狼下到井里,它的重量使狐狸升到了井口,这只被困两天的狐狸终于得救了。

这个故事中狐狸和狼所进行的博弈就是蒙和博弈。

狐狸和狼一只在上面,一只在下面,下面的想上去,就得想办法让上面的下来。

零和博弈原理揭示的实质是这种博弈的双方的博弈结果永远是零。

在社会生活中有太多的情况与零和博弈有类似的局面,胜利者的喜悦常常建立在失败者的痛苦之上,胜利者的光荣背后往往隐藏的是失败者的辛酸与苦涩。

生活中零和博弈的例子

生活中零和博弈的例子

生活中零和博弈的例子
在生活中,我们经常会面对各种各样的博弈情境,有些是合作共赢的,有些则是零和博弈的。

零和博弈是指参与者之间的利益完全对立,一方的利益的增加必然导致另一方的利益减少。

这种情况下,参与者往往会采取竞争、对抗的态度,而非合作共赢。

一个生动的例子是工作场合上的竞争。

在职场上,每个人都希望能够获得更好的职位和更高的待遇,但是职位和待遇是有限的,因此同事之间往往会陷入零和博弈的状态。

他们会争夺资源和机会,甚至采取一些不道德的手段来排挤竞争对手,这样一来,整个团队的氛围就会变得紧张和不友好。

另一个例子是家庭中的争斗。

比如兄弟姐妹之间为了争夺父母的关注和爱,会展开激烈的竞争,这种竞争往往会导致家庭关系的紧张和破裂。

父母也可能会陷入争夺家庭资源和权力的博弈中,这样一来,家庭氛围就会变得紧张和不和谐。

在社会层面上,不同国家之间的竞争也是零和博弈的典型例子。

各国为了争夺资源、市场和地缘政治的影响力,往往会采取竞争和对抗的态度,这样一来,国际关系就会变得紧张和不稳定。

面对零和博弈的情境,我们应该如何应对呢?首先,我们要意识到零和博弈并非唯一的选择,合作共赢同样是一个可行的选择。

我们可以通过合作、沟通和妥协来寻求双赢的解决方案,从而化解博弈带来的负面影响。

其次,我们要学会换位思考,尊重他人的利益和权利,避免为了自己的利益而伤害他人。

最后,我们要注重建立良好的人际关系,通过互相支持和信任来化解博弈带来的紧张和矛盾。

总之,生活中的零和博弈无处不在,我们需要学会正确的应对方式,才能够化解博弈带来的负面影响,实现合作共赢的局面。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

6,-6
1,-1
2,-2
0, 0
1,-1
0, 0
山西财经大学经济学院 康旭华
19
2018/10/25
最小最大方法:4
参与人2 L U 参与人 1 M M R
5
3
2
6
1
4
6
3
0
D
山西财经大学经济学院 康旭华
20
2018/10/25
最小最大方法:4
参与人2 L U 参与人 1 M D M R
5,-5
山西财经大学经济学院 康旭华 29
2
正面
反面
山西财经大学经济学院 康旭华
8
非零和博弈: 囚犯困境(蕴含双赢或多赢)
支付
2018/10/25
嫌疑 人B
抵赖
坦白
嫌疑人A
抵赖 坦白 -1,-1 0,-9 -9,0 -6,-6
山西财经大学经济学院 康旭华
9
2018/10/25
行局中人的支付
支付 1 正面
反面
2
正面 -1
1
反面 1
-1
山西财经大学经济学院 康旭华
专题一:零和博弈
Zero-Sum Game
2018/10/25
1
2018/10/25
内容提要
零和博弈
最小最大方法 直线交叉法 对抗性排序
山西财经大学经济学院 康旭华 2
2018/10/25
零和博弈与非零和博弈 (zero-sum game and non-zero-sum game)
如果一个博弈在所有各种对局下全体参与 人之得益总和总是保持为零,这个博弈就 叫零和博弈;
q-混合
-q+(1-q)

1
max=1
-1
max=1
q-(1-q)
max=?
山西财经大学经济学院 康旭华
27
2018/10/25
参与人2的q-混合策略图解
2的支付
1
1反
1/2
1正
1
0
1 2的q混合策略
-1
-1
山西财经大学经济学院 康旭华
28
2018/10/25
内容提要
零和博弈
最小最大方法 直线交叉法 对抗性排序
山西财经大学经济学院 康旭华
6
常和博弈:掷硬币 常和为-1:偏零因子-1/2
支付 1 正面 反面 -1.5,0.5 0.5,-1.5 0.5,-1.5 -1.5,0.5 2 正面 反面
2018/10/25
山西财经大学经济学院 康旭华
7
2018/10/25
归零博弈:支付减去-0.5
支付 1 正面 反面 -1,1 1,-1 1,-1 -1,1
14
2018/10/25
最小最大方法:1
支付 2


1 上

1,-1
2,-2
4,-4
3,-3
山西财经大学经济学院 康旭华
15
2018/10/25
最小最大方法:2
支付 1 上 下 1 4 2 3 2 左 右
山西财经大学经济学院 康旭华
16
2018/10/25
最小最大方法:2
支付 1 2
左 1,-1
4
2018/10/25
常和博弈与非常和博弈 (constant-sum game and variable-sum game)
如果一个博弈在所有各种对局下全体参与人之得 益总和总是保持为一个常数,这个博弈就叫常和 博弈; 相反,如果一个博弈在所有各种对局下全体参与 人之得益总和不总是保持为一个常数,这个博弈 就叫非常和博弈。 常和博弈也是利益对抗程度最高的博弈。
-p+(1-p)
-1
p-(1-p)
min=-1
min=?
山西财经大学经济学院 康旭华
25
2018/10/25
参与人1的p-混合策略图解
1的支付
1
2正
1/2
2反
1
0
1 1的p混合策略
-1
-1
山西财经大学经济学院 康旭华
26
2018/10/25
2的选择
支付 2 1 正 正 (q) -1 反 (1-q) 1
山西财经大学经济学院 康旭华 12
2018/10/25
最小最大方法的应用
支付 甲 上 下 -3 10 4 6 min=-3 min=6 乙 左 右
max=10
max=6
山西财经大学经济学院 康旭华
13
2018/10/25
最小最大方法:1
支付 1 2 左 右


1
2
4
3
山西财经大学经济学院 康旭华
3,-3
2,-2
6,-6
1,-1
4,-4
6,-6
3,-3
0, 0
山西财经大学经济学院 康旭华
21
2018/10/25
内容提要
零和博弈
最小最大方法 直线交叉法 对抗性排序
山西财经大学经济学院 康旭华 22
2018/10/25
最小最大方法: 适用于零和博弈的纯策略纳什均衡 扩展的最小最大方法 (直线交叉方法): 适用于零和博弈的混合策略纳什均衡 在非零和博弈中,可能存在共同利益。
山西财经大学经济学院 康旭华
5
2018/10/25
常和博弈与归零博弈
设G是一个n人常和博弈,那么在G的每种战略组合
下博弈的n个参与人的支付的总和是一个常数。常
数的1/n称为常和博弈支付的偏零因子。
对于每个n人常和博弈G,可以从每个参与人的支付 中减去博弈的偏零因子,将G转换为零和博弈G/,把 G/叫做常和博弈G的归零博弈。
10
2018/10/25
内容提要
零和博弈
最小最大方法 直线交叉法 对抗性排序
山西财经大学经济学院 康旭华 11
2018/10/25
最小最大方法
由冯· 诺依曼提出 基本思想: 作为局中人,对手将采取对他自己最有利的 策略;相应的,对手会选择使你获得尽可能差 的支付的策略。 由于零和博弈的特点和性质,以上思想即为: 任何使对手得到最好结果的策略,都会使你获 得最差的结果。 双方都具有这样的理性!
山西财经大学经济学院 康旭华 23
2018/10/25
无纯策略纳什均衡的零和博弈
支付 1 正 反 -1 1
max=1 max=1
2

反 1 -1
min=-1 min=-1
山西财经大学经济学院 康旭华
24
2018/10/25
1的选择
支付
1 正(p) -1 1
min=-1
2


反(1-p)
p-混合
1
4,-4
右 2,-2
3,-3


山西财经大学经济学院 康旭华
17
2018/10/25
最小最大方法:3
参与人2 L U 参与人1 M D
0
山西财经大学经济学院 康旭华
0
18
2018/10/25
最小最大方法:3
参与人2 L U M R
5,-5
3,-3
1,-1
参与人 1
M D
相反,如果一个博弈在所有各种对局下全 体参与人之得益总和不总是保持为零,这 个博弈就叫非零和博弈。 零和博弈是利益对抗程度最高的博弈。
山西财经大学经济学院 康旭华 3
2018/10/25
零和博弈:掷硬币
支付 2 正面 反面
1 正面
反面
-1,1
1,-1
1,-1
-1,1
山西财经大学经济学院 康旭华
相关文档
最新文档