博弈论全套上课课件ch5 不完全信息静态博弈

合集下载

博弈论原理 第5讲 不完全信息静态博弈

博弈论原理  第5讲 不完全信息静态博弈

贝叶斯纳什均衡
不完全信息博弈-无法避免的不确定性
有一次,主人派伊索进城。半路上,他遇见一位法官。法官严厉 地盘问:“你要去哪儿?” 伊索回答说“不知道” 。法官起了 疑心,派人把伊索关进了监狱,严加审问。“法官先生,要知道, 我讲的是实话。”伊索说,“我确实不知道我会进监狱”。
5.1 不完全信息与不完全信息静态博弈
二、静态贝叶斯博弈的表示 在静态贝叶斯博弈中,各博弈方虽然知道自己的 得益函数,但却无法了解其他博弈方的得益函数,按照 一般静态博弈分析方法无法解决该问题。为此,我们可 以这样来考虑:虽然一些博弈方(如博弈方k)不能确定 其他博弈方在一定策略组合下的得益,但一般知道其他 博弈方(如博弈方i)的得益有哪些可能的结果,而具体哪 种可能的结果会出现则取决于博弈方属于哪种“类型” (Type)。这些“类型”是博弈方自己清楚而他人博弈 方无法完全清楚的有关私人内部信息。
低成本情况 斗争 -10,100 0,400

进入者关于在位者成本信息是不完全的,进入者的最优选择依赖于他在多大程度上 认为在位者是低成本的。 假定进入者认为在位者是高成本的概率是p,低成本的概率是(1-p),那么,进入 者选择进入的期望利润是p(40)+(1-p)(-10),选择不进入的利润是0,因此, 进入者的最优选择是:如果p>=1/5,进入,如果p<1/5,当p=1/5时,进入与不进 入是无差异的,我们假定其进入。
密封拍卖一般有这样几个基本特征: (1)各方的报价放在密封的信封里上交 (2)在统一的时间里公证开标; (3 )每一个报价方知道自己对标的的估 价,但不知 道其他报价方对标的的估价 (4)一般是标价最高者中标
显然, 拍卖或招投标问题属于不完全信息博弈,包括不 完全信息静态博弈和不完全信息动态博弈。

博弈论完整版PPT课件

博弈论完整版PPT课件

ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战

精品课程《博弈论》PPT课件(全)

精品课程《博弈论》PPT课件(全)
人博弈 两人博弈有多种可能性,博弈方的利益方向可
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16

完全信息静态博弈教学课件

完全信息静态博弈教学课件

完全信息静态博弈的解决方法
1
纳什均衡
纳什均衡是指在某个策略配置下,没有参与者希望通过改变自己的策略来获得更多的收益。
2
完美均衡
完美均衡是指在完全信息静态博弈中,每个参与者都做出了最优策略,并且没有其他可行的 更优策略。
3
计算方法
我们将学习计算纳什均衡和完美均衡的方法,并通过案例演示应用技巧。
案例讲解和应用பைடு நூலகம்
完全信息博弈
完全信息博弈是指所有参与者都清楚地知道博弈的规则、对手的策略和每个参与者的收益函数。 我们将探讨完全信息博弈的特点,并了解如何在这种情况下进行决策和制定最优策略。
静态博弈
静态博弈是指所有参与者一次性做出决策,没有机会进行反复决策。 我们将学习静态博弈的概念和分类,为后续的解决方法打下基础。
国际象棋中的博弈
我们将用国际象棋为例,讲解完 全信息静态博弈的应用和分析过 程。
谈判中的博弈
探讨在谈判中的决策制定者之间 如何利用博弈论分析对方策略, 并制定最优的谈判策略。
拍卖中的博弈
了解不同类型的拍卖博弈以及竞 拍者如何制定最佳出价策略。
完全信息静态博弈教学课 件PPT
博弈论是研究决策制定者之间相互影响的数学模型。本课件将介绍完全信息 静态博弈的定义、特点以及解决方法,并通过案例讲解和应用帮助理解。
什么是博弈论?
博弈论研究经济和社会决策制定者之间的相互关系和互动方式。它提供了一种分析和预测决策结果的工具。 我们将深入探讨博弈论的应用和它在现实生活中的重要性。

第五章 不完全信息静态博弈及应用 《博弈论与经济》 PPT课件

第五章  不完全信息静态博弈及应用  《博弈论与经济》 PPT课件

p(t-iti ) p(ti )
p(t-i ti )
p(t-i ti
)
pi
t-i
▪ 它描写了参与人i依据自己的类型 ti 对其余局中人类型 t-i 的推断或信
念。
▪ 以下用
G T1, T2,, Tn; A1, A2,, An; u1, u2,, un; P1, P2,, Pn
弈模型。
表示贝叶斯博
因而局中i人的策略是定义在局中人的信息集 上,Ti 取值于行动集合
的映射A:i
si : Ti Ai


si (ti ) ai , ti Ti , ai Ai
▪ 局中人的条件期望 支付函数
▪ 由于局中人i的支付函数 ui ui (a1, a2 ,, an ; t1, t2 ,, tn ) 是随机的,因而需 用期望支付作为决策的依据。对给定的其余局中人的策略组合
参与人2关于参与人1的最优反应策略为 s2(t) (C, D)
▪ 2. 求参与人1关于参与人2的最优反应策略。
▪ 对于固定的 s2(t),参与人1选择 s1 a1 ,最大化自己的期望支付,即
求解最大化问题

max u1(a1, s2 (t1),t1) (1- )u1(a1, s2(t2 ),t2) a1
己以及对手的支付值,因为支付还依赖于对手的成本是H还是L。而局 中人对于对手的这一私人信息还不了解,这样当然无法选择出对自己 有利的策略。为解决这个问题,海萨尼提出了解决的方法—海萨尼转 换。
▪ 海萨尼转换
▪ 1.海萨尼从不完全信息模型的特征入手,引入一个概念,类
型: ti Ti , i 1,2,, n 。Ti 称为局中人的类型空间或类型集合,
▪ 故 : (C, (C, D)) 是贝叶斯纳什均衡。

不完全信息静态博弈.ppt

不完全信息静态博弈.ppt
决策目标就是在给定自己的类型和别人的类型依从战 略的情况下,最大化自己的期望效用。
贝叶斯纳什均衡就是:给定自己的类型和 别人类型的概率分布的情况下,每个参与 人的期望效用达到了最大化。
求爱博弈:
品德优良者求爱

接受
不接受
求爱 求爱者
不求爱
100,100 -50,0 0,0 0,0
品德恶劣者求爱
假定进入者认为在位者高成本的概率是p, 低成本的概率为1-p。则进入者选择进入 的期望收益值为:
40p+(1-p)(-10) 选择不进入的收益为0 因此,进入者的最优选择是: 当p≥1/5时,进入 当p<1/5时,不进入
进入者似乎是与两个不同的在位者博弈, 一个是高成本的在位者,一个是低成本的 在位者。
不完全信息动态博弈:精炼贝叶斯均衡
“自然”首先选择参与人的类型,参与人自己知道,其他参 与人不知道。
在自然选择后,参与人开始行动。由于行动有先后次序, 后行动者可以观察到先行动者的行动。
虽然参与人不能直接观测其他参与人的类型,但因为参与 人的行动是类型依存的,每个参与人的行动都传递着有关 自己类型的某种信息,后行动者可以通过观察先行动者所 选择的行动获得有关后者偏好、战略空间等方面的信息, 修正自己对其所属类型的先验概率判断,然后选择自己的 行动。
不完全信息静态博弈:贝叶斯纳什均衡
完全信息博弈的基本假设是所有的参与人都知 道博弈的结构,博弈的规则,和博弈的支付函 数。例如在“市场进入”博弈中,进入者知道 在位者的偏好、战略空间和各种战略组合下的 利润水平,反之亦然。当然,这个假设在许多 情况下是不成立的。
哈桑尼(Harsanyi)定义了“贝叶斯纳什均衡”:
知道企业2的最优反应是
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
* a-i ( -i )的情况下最大化自己的期望效用函数 i。 * 即战略组合a* a1 (1 ),...,an ( n ))是一个贝叶斯纳什均衡, ( *
如果对于所有的i,ai A i (i ),
ai
* ai* (i ) max pi ( i | i )ui ( ai , ai ( i );i , i )
14
海萨尼转换 N
高 低
[P]
不进入
进入者
进入 不进入
[1-P]
进入 在位者
斗争
(0,300)
B
合作
在位者
斗争
(0,400)
B
合作
(40,50) (-10,0)
(30,80) (-10,100)
15
海萨尼转换-类型
类型:一个参与人拥有的所有的个人信息(即 所有不是共同知识的信息)称为他的类型。
根据这个定义,甚至允许参与人不知道其他参 与人是否知道自己的类型。 不完全信息意味着,至少有一个参与人有多个 类型。
17
海萨尼转换-类型
用θ-i=(θ1,…, θi-1, θi+1, …θn)表示 除i之外的所有参与人的类型组合。称pi(θ-i / θi )为参与人i的条件概率。 p( i ,i ) p( i ,i ) 则
pi ( i i ) p(i )
i i

p( i ,i )
1 1 5 * q (1 q2 ); q2 ( q1 ) 2 2 4
* 1
纳什均衡产量为 如果企业2的成本是5/4,则纳什均衡产 5 1 量为 q ;q
完全信息静态博弈的一般表达式:
G {S1 , , S n ; u1 , , un }
静态贝叶斯博弈的一般表达式:
G { A1 , , An ;1 , , n ; p1 , , pn ; u1 , , un }
21
(2)静态贝叶斯博弈的时间顺序
1、自然选择类型向量 (1 , , n ),其中i i , 参与人i观测到i,但参与人j(j i)只知道p j ( j j ), 观测不到i 2、n个参与人同时选择行动a a1 , , an),其中ai A i i) ( ( 3、参与人i得到ui ui (a1 , , an , i )
qi :第i个企业的产量 Ci:代表第i个企业的成本
假定逆需求函数为:P(Q) a (q1 q2 )
第i个企业的利润函数为:


i (q1 , q2 ) qi ( P(Q) ci ), i 1,2
27
不完全信息古诺模型
企业1


企业2
假定a=2, c1=1, c2l=3/4,c2h=5/4。
25
二 贝叶斯纳什均衡应用举例 1、不完全信息古诺模型
企业1

企业2
参与人:企业1、企业2; 行动顺序:同时行动
不完全信息:企业1单位成本c1是共同知识,企业2的成 本可能是c2l或c2h,企业1只知道c2=c2l的可能性是1/2,这 是共同知识。
26
不完全信息古诺模型
企业1

企业2
4
司马懿自马上远远望之,见诸葛亮神态自 若,顿时心生疑忌,犹豫再三,难下决断。又 接到远山中可能有埋伏的情报,于是叫后军做 前军,前军做后军,急速退去。司马懿之子司 马昭问:“莫非诸葛亮无军,故做此态,父何 故便退兵?”
司马懿说:“亮平生谨慎,不曾弄险,今 大开城门,必有埋伏,我兵若进,必中计也。” 孔明见魏军退去,抚掌而笑,众官无不骇 然。诸葛亮说,司马懿“料吾生平谨慎,必不 弄险,疑有伏兵,所以退去。吾非行险,盖因 不得已而用之,弃城而去,必为之所擒。”
24
N 市 场 进 入 博 弈
高 低
[P]
不进入
进入者
进入 不进入
[1-P]
进入 在位者
斗争
(0,300)
B
合作
在位者
斗争
(0,400)
B
合作
(40,50) (-10,0)

(30,80) (-10,100)
在市场进入的例子里,贝叶斯均衡是:高成本的在位者选 择默许,低成本的在位者选择斗争;当仅当高成本的概率 p≥1/5时,进入者才选择进入,否则不进入。
19
练习-将下列博弈进行海萨尼转换

接受 求爱博弈: 品德优良者求爱 求爱
100,100
不接受
-50,0 0,0
求爱者
不求爱 0,0
求爱者品德优良的概率是p

求爱博弈: 品德恶劣者求爱 求爱者 接受 求爱 不接受
100,-100 -50,0 0,0
20
不求爱 0,0
3、 静态贝叶斯博弈 (1)表达式
23
(3)贝叶斯纳什均衡
贝叶斯纳什均衡定义:
静态不完全信息博弈G { A1 , , An ;1 , , n ; p1 , , pn ; u1 , , un } 的纯战略贝叶斯纳什均衡是一个类型依存战略组合,a (i ) ,
* i n i=1
其中每个参与人i在给定自己的类型i和其他参与人类型依存战略
1 1 l h E 1 q1 (1 q1 q2 ) q1 (1 q1 q2 ) 2 2
29
1 q (q1 , t ) (t q1 ) 2
* 2
不完全信息古诺模型
最优化一阶条件得企业1的反应函数为:
1 1 1 l 1 * q1 (1 q h 2 q2 ) (1 Eq2 ) 2 2 2 2
计策:使用各种手段迷惑司马懿,为的是不让对方知道其策略的 结果(支付)。迫使其认为,撤退比进攻好,降低其进攻的预期 收益。
7
不完全信息博弈
如果在一个博弈中,某些参与人不知道其 他参与人的收益,则这个博弈被称为不完 全信息博弈。
8
不完全信息博弈-收益
在信息不完全的情况下,博弈参与者不 是使自己的支付或效用最大,而是使自 己的期望效用或支付最大. 如让你在50%的概率获得100元与10%的概 率获得200元两者之间选择的话,前者的 期望所的是50元,后者是20元,故选前 者。
如果类型的分布是独立的,则
pi ( i i ) p( i )
18
海萨尼转换
海萨尼转换把不完全信息博弈转换成不完美信息动态博弈
1.引进虚拟自然博弈方,可称为博弈方0,其作用是在博弈方选择 之前,为每个实际博弈方按随机方式确定他们的类型,构 成向量 (1 , , n ),其中i i , i 1, , n 2.博弈方0让每个实际博弈方知道自己的类型,但不让(全部或 部分)博弈方知道其他博弈方的类型 3.在前述基础上,再进行原来的静态博弈,即各个实际博弈方 同时从各自的行动空间中选择行动方案a1 , , an 4.各博弈方得益ui ui (a1 , , an , i ), i 1, , n
3
“空城计”
街亭失守,司马懿引大军蜂拥而来,当时 孔明身边只有一班文官,军士一半已经运粮草 去了,只有2500军士在城中。
众官听得这个消息,尽皆失色。孔明登 城望之,果然尘土冲天,魏兵分两路杀来。
孔明令众将旌旗尽皆藏匿,打开城门, 每一门用20军士,扮作百姓,洒扫街道。而孔 明羽扇纶巾,引二小童携琴一张,于城上敌楼 前凭栏而望,焚香操琴。
9
求爱博弈
接受 品德优良者求爱 求爱者
你 不接受
-50,0
0,0
求爱
100,100
不求爱 0,0
100x+(-100)(1-x)=0 当x大于1/2时,接受求爱 求爱 你
接受
不接受
100,-100 -50,0 0,0
10
品德恶劣者求爱
求爱者
不求爱 0,0
房地产开发博弈
需求大的情况 开发商B 开发 不开发 开发
13
海萨尼转换
海萨尼(1967-1968)年提出了一个处理不 完全信息的方法-引入一个虚拟的参与人 “自然”,自然首先行动,选择决定参 与人的特征(如成本函数),参与人知 道自己的特征,其他参与人不知道。 这样不完全信息博弈就转换为完全但不 完美信息博弈,可以利用标准的分析技 术进行分析,这就是“海萨尼转换”。
第五章
不完全信息静态博弈
1
主要内容
一 不完全信息静态博弈和贝叶斯纳什均衡 1、不完全信息博弈 2、海萨尼转换 3、不完全信息静态博弈的战略式表述和贝叶 斯纳什均衡 二 贝叶斯纳什均衡应用举例 三 贝叶斯纳什均衡与混合战略均衡 四 机制设计理论与显示原理
2
1、不完全信息博弈
不确定性具有普遍性。 探讨如何在不确定性的情况下做出理性、一致 的决策 虽然自己没有办法做到无所不知,但也不至于 一无所知,而应该或尽可能有效运用自己所知 的一切为自己谋利。
30,80 0,ቤተ መጻሕፍቲ ባይዱ00
-10,100 0,400

假定进入者认为在位者是高成本的概率是p,低成本的概率 是(1-p),那么,进入者选择进入的期望利润是p(40)+ (1-p)(-10),选择不进入的利润是0,因此,进入者的 最优选择是:如果p>=1/5,进入,如果p<1/5,当p=1/5 时,进入与不进入是无差异的,我们假定其进入。
1 l 1 h Eq2 q2 q2 是企业1关于企业2产量的期望值 2 2 均衡意味着两个反应函数同时成立,解两个 反应函数得贝叶斯均衡为:
1 l* h q ; q2 11 / 24; q2 * 5 / 24 3
* 1
30
与NE的比较
如果企业2的成本是3/4,那么,反应函 数分别为
给定企业2知道企业1的成本,企业2将选择q2最大化利润函数:
* 2 q2 (t q1 q2 )
相关文档
最新文档