博弈论(11级 郭俊聪)11172434
合集下载
博弈论完整版PPT课件

R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
博弈论及经典案例简介PPT课件

⑶ 上策均衡是纳什均衡的一种特殊情况,但纳什均 衡却不一定是上策均衡。
-
纳什均衡的意义
21
纳什均衡是指在对手策略既定的情况下,各自对局者所选择 的策略都是最好的。 合作是有利的“利己策略”。但它必须符合以下黄金律: 按照你愿意别人对你的方式来对别人,但只有他们也按同 样方式行事才行。也就是中国人说的“己所不欲勿施于 人”。但前提是人所不欲勿施于我。
– 博弈的过程就是一个策略上的相互作用过程。这使得任何一方的 行为都必须考虑到对方可能作出的反映。
-
博弈论研究对象 10
博弈论是研究理性的决策主体在其行为发生直接的相 互作用时的策略选择及策略均衡的理论。
博弈分析的关键步骤是找出在别人选择既定的情况 下自己的最优反应策略(给自己带来最大收益的策略)。
论和经济行为”,推动了博弈论在经济管理中的应 用; (5)近年来,由于纳什、泽尔腾、海萨尼获诺贝尔 经济学奖(1994),进一步推动了博弈论的研究。
-
博弈论的产生和发展 12
1. 博弈在中国
-
《学弈》(《孟子•告 子》) :弈秋,通国之善 弈也。使弈秋侮二人弈, 其一人专心致志,惟弈秋 之为听;一人虽听之,一 心以为有鸿鹄将至,思援 弓缴而射之。虽与之俱学, 弗若之矣。为是其智弗若 与?吾曰:非然也。
其次,“纳什均衡”是一种非合作博弈均衡,在现实中 非合作的情况要比合作情况普遍。
所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作 博弈理论的重大发展,甚至可以说是一场革命。
-
故事模型
A、B、C三人决斗,每人有2颗子弹,每次发一枪。
A、B、C的命中概率分别为0.3、0.8、1.0。
三人依次发射,两轮后对决结束。
13
博弈又称博戏,是一门古老的游戏。《世 本》说,“乌曹作博”,乌曹乃是夏代著 名之能工巧匠。千百年来,博弈更是与人 们的生活紧紧相连,从博棋到牌戏,从斗 戏到彩票,中华民族的历史长河中就这样 形成了别具风情的博弈文化
-
纳什均衡的意义
21
纳什均衡是指在对手策略既定的情况下,各自对局者所选择 的策略都是最好的。 合作是有利的“利己策略”。但它必须符合以下黄金律: 按照你愿意别人对你的方式来对别人,但只有他们也按同 样方式行事才行。也就是中国人说的“己所不欲勿施于 人”。但前提是人所不欲勿施于我。
– 博弈的过程就是一个策略上的相互作用过程。这使得任何一方的 行为都必须考虑到对方可能作出的反映。
-
博弈论研究对象 10
博弈论是研究理性的决策主体在其行为发生直接的相 互作用时的策略选择及策略均衡的理论。
博弈分析的关键步骤是找出在别人选择既定的情况 下自己的最优反应策略(给自己带来最大收益的策略)。
论和经济行为”,推动了博弈论在经济管理中的应 用; (5)近年来,由于纳什、泽尔腾、海萨尼获诺贝尔 经济学奖(1994),进一步推动了博弈论的研究。
-
博弈论的产生和发展 12
1. 博弈在中国
-
《学弈》(《孟子•告 子》) :弈秋,通国之善 弈也。使弈秋侮二人弈, 其一人专心致志,惟弈秋 之为听;一人虽听之,一 心以为有鸿鹄将至,思援 弓缴而射之。虽与之俱学, 弗若之矣。为是其智弗若 与?吾曰:非然也。
其次,“纳什均衡”是一种非合作博弈均衡,在现实中 非合作的情况要比合作情况普遍。
所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作 博弈理论的重大发展,甚至可以说是一场革命。
-
故事模型
A、B、C三人决斗,每人有2颗子弹,每次发一枪。
A、B、C的命中概率分别为0.3、0.8、1.0。
三人依次发射,两轮后对决结束。
13
博弈又称博戏,是一门古老的游戏。《世 本》说,“乌曹作博”,乌曹乃是夏代著 名之能工巧匠。千百年来,博弈更是与人 们的生活紧紧相连,从博棋到牌戏,从斗 戏到彩票,中华民族的历史长河中就这样 形成了别具风情的博弈文化
第八章博弈论简要课件

11
第八章 博弈论
四、重复博弈和序列博弈
➢静态博弈是指局中人同时决策或虽非同时 决策,但后决策者不知道先决策者采取什么 策略的博弈。 ➢动态博弈是指局中人决策有先有后,后决 策者能观察到先决策者决策情况下的博弈。
12
第八章 博弈论
动态博弈的例子
进入
在位者甲
合作 斗争
进入者乙
(400 ,500) ( -100 ,100)
6
第八章 博弈论
3、策略集合: 是指所有局中人可能采取 的行动方案总和。例如:都坦白,都抵赖, 坦白与抵赖,抵赖与坦白 4、收益: 是指在每种组合情况下,局中 人采取特定策略得到的结果。例如:判3年, 6年,释放等
7
第八章 博弈论
三、上策均衡和纳什均衡
1、上策: 是指不管其他局中人采取什么策 略,某一局中人都采取自认为对自己最有 利的策略。 2、均衡: 是指博弈中所有局中人都不想改 变自己策略的一种相对静止状态。
1
第八章 博弈论
博弈论字面的意思是游戏策略,及用类 似游戏中解决问题的方法,揭示解决社会、 经济及其他领域问题的策略、对策,因此有 的还把博弈论译成对策论。准确的说博弈论 是在给定的条件下寻求最优策略,这里给定 的条件包含其他人的策略以及本人的决策对 其他决策主体的影响。
2
第八章 博弈论
策略性活动在社会、经济、政治生活中 大量存在,也可以说,整个社会、经济、政 治生活都是博弈行为。因此,博弈论作为一 种方法,广泛的应用在经济、政治、军事、 外交中,只是博弈论在经济学中应用的最广 泛、最成功。如前面介绍过的古诺均衡,就 属于经济学中的博弈过程。
8
第八章 博弈论
3、上策均衡: 不管其他局众人采取什么策 略,每个局中人都选择了对自己最有利的策 略所构成的一个策略组合。 4、纳什均衡: 是指参与博弈的每一局中人 在给定其他局中人策略的条件下选择上策所 构成的一种策略组合。 注:所有上策均衡都是纳什均衡,但不能反 过来说所有纳什均衡都是上策均衡。
博弈论最全完整-讲解课件

(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
混合的策略纳什均衡

流浪汉 寻找工作 流浪
救济 政府
不救济
2 3,
1 -1,
3 -1,
0 0,
虽这模型没有PNE,却有下述的MNE:参与人以一定的概率选择某种 策略,然后计算相应于不同概率的期望效用。
2020/6/17
9
设:政府救济的概率θ=1/2 ; 不救济的概率1-θ=1/2。 流浪汉寻找工作的期望效用: 1/2×2+1/2 ×1=1.5 流浪的期望效用: 1/2×3+1/2 ×0=1.5
✓ 每个参与人都想猜透对方的策略,而每个 参与人又不愿意让对方猜透自己的策略。
这种博弈的类型是什么?如何找到均衡?
2020/6/17
3
2. 混合策略、混合策略博弈和混合策略纳什均衡
• 策略:
– 参与人在给定信息集的情况下选择行动的规则,它规定参与人在 什么情况下选择什么行动,是参与人的“相机行动方案”。
E1(正面)=(-1)×r+1×(1-r)=1-2r 参与人1选取反面的期望效用为
E1(反面)=1×r+(-1)×(1-r)=2r-1
2020/6/17
15
参与人1的期望效用为 E1= E1(正面)×q + E1(反面)×(1- q ) =(1-2r)(2q-1)
类似地,得到参与人2的期望效用为
E2= E2(正面)×r + E2(反面)×(1- r ) =(1-2q)(2r-1)
参与人2
正面
反面
参与人1
正面 反面
-1, 1 1,-1
1,-1 -1, 1
由划线法可知,该博弈不存在纳什均衡。 所以采取纯策略不存在稳定的纳什均衡解。
2020/6/17
2
博弈论

Day 1
Day 2
Day 3
分析
如果是情况(2),2红1黑
那么在第一天,红头发的人会看到1红1黑,他会考虑如果自己头发颜色是黑的, 那么为情况(1),他所见的红发人会在第一天黄昏自杀,如果他头发为红, 为情况(2),他所见的红发人不会自杀。黑头发人看到2红,那么可排除情况 (1),如果他头发为黑,则为情况(2),否则为情况(3)。到了第二天, 没有人自杀。那么两个红发人都认定此为情况(2),知道自己头发为红,于 第二天晚自杀。黑发人第三天发现这是情况(2),知道自己头发为黑,于当 晚自杀。
分析
我们从1个海盗的情况开始讨论。 (1)如果只有1个海盗,那么他显然会把 10个金币都分给自己。此时最佳方案为{10}。
分析
(2)如果有2个海盗,那么2号来制定方案。 但是他无论怎么制定,1号海盗都投反对票, 根据规则2号海盗会被丢入大海,并且金币 被1号海盗独享。最佳方案为{死,10}。
2 1
分析
(3)如果有3个海盗,那么3号无论怎么制定方 案,2号必同意(因为如果只剩2人了那么2号必 死,他保命要紧),而1号必反对(因为如果只剩 2人,他将独享10金币并搞死2号)。所以3号可 以给自己分10个,依然能通过。最佳方案为{10, 0,0}。 3 2 1
分析
(4)如果有4个海盗,那么4号除自己需要2票,此时3号必反 对提议(因为如果到3海盗情况他将得10金币,就算现在给他 10金币他也反对因为他还想搞死4号),那么此时需要1、2号 各一票。如果到3海盗情况,那么1、2号会颗粒无收。若不给 他们金币让他们同样颗粒无收,他们将反对(同样都一无所获 那为什么不让你死),但若给他们1人1金币,他们就会同意。 所以最佳方案为{8,0,1,1}。
博弈论与竞争策略ppt课件

结局(outcome):对参与人的不同行动,这场博弈 的结果或结局是什么
报酬(payoff)(支付)与报酬函数(payoff function):博弈的结果给参与人带来的好处。可 以用报酬矩阵(支付矩阵、得益矩阵、赢得矩阵)
3
2、博弈均衡的基本概念
(1)占优策略均衡 占优策略:无论其他参与者采取什么策略,
博弈论就是用数学方法研究决策相互影响的理性人是 如何进行决策以获取最大收益的。
博奕:多人决策过程 引例:田忌赛马
2
1、博奕论的基本要素
参与者(player)(博奕方、局中人、对局者):即 有哪些人参与博弈。一般至少有两个参与者。
策略(strategy)与策略空间(strategy set):什么人 在什么时候行动;当他行动时,他具有什么样的信 息;他能做什么,不能做什么。
-1 -12
不坦白
-12 -1
-2 -2
5
• 如果两个疑犯都能够选择不坦白的话,他们 将明显地得到一个更大的收益,但由于两人 的信息无法沟通,选择不坦白并不是两人的 理性选择。对于两人而言,不管对方坦白或 是不坦白,自己选择坦白都是更优的选择, 因而,{坦白,坦白}就是均衡战略。
6
占优策略均衡
犯人招供与黑社会制裁
嫌犯B
坦白
嫌犯A
坦白
-∞ -∞
不坦白
-12 -∞
不坦白 -∞ -12 -2 -2
7
(2)纳什均衡
纳什均衡:在一个纳什均衡里,任何一个 参与者都不会改变自己的策略,如果其他 参与者均不改变各自的策略。
博弈中双方都没有绝对的最优策略,一方 的最优策略取决于对方的选择。
占优策略均衡一定是纳什均衡,但纳什均 衡不一定是占优策略均衡。
报酬(payoff)(支付)与报酬函数(payoff function):博弈的结果给参与人带来的好处。可 以用报酬矩阵(支付矩阵、得益矩阵、赢得矩阵)
3
2、博弈均衡的基本概念
(1)占优策略均衡 占优策略:无论其他参与者采取什么策略,
博弈论就是用数学方法研究决策相互影响的理性人是 如何进行决策以获取最大收益的。
博奕:多人决策过程 引例:田忌赛马
2
1、博奕论的基本要素
参与者(player)(博奕方、局中人、对局者):即 有哪些人参与博弈。一般至少有两个参与者。
策略(strategy)与策略空间(strategy set):什么人 在什么时候行动;当他行动时,他具有什么样的信 息;他能做什么,不能做什么。
-1 -12
不坦白
-12 -1
-2 -2
5
• 如果两个疑犯都能够选择不坦白的话,他们 将明显地得到一个更大的收益,但由于两人 的信息无法沟通,选择不坦白并不是两人的 理性选择。对于两人而言,不管对方坦白或 是不坦白,自己选择坦白都是更优的选择, 因而,{坦白,坦白}就是均衡战略。
6
占优策略均衡
犯人招供与黑社会制裁
嫌犯B
坦白
嫌犯A
坦白
-∞ -∞
不坦白
-12 -∞
不坦白 -∞ -12 -2 -2
7
(2)纳什均衡
纳什均衡:在一个纳什均衡里,任何一个 参与者都不会改变自己的策略,如果其他 参与者均不改变各自的策略。
博弈中双方都没有绝对的最优策略,一方 的最优策略取决于对方的选择。
占优策略均衡一定是纳什均衡,但纳什均 衡不一定是占优策略均衡。
博弈论理和对策行为

略数也是有限的)往往用矩阵形式表示。
博弈论和对策行为
策略型博弈的实例和解(囚徒困境)
例1. 囚徒困境(prisoner’s dilemma) 在对博奕局势进行描述后,博奕论分析就是要求
出局中人进行策略选择的理性结局,或者说找出博奕 问题的解。在非合作博奕中,有两种解的技术:一种 是纳什均衡,一种是优超解。
概论
博弈论和对策行为
博奕论是一门内容广泛且复杂的学科,不仅是经 济学,政治学、军事、外交、国际关系、公共选择, 还有犯罪学等,都涉及到博奕论。
实际上,很多人把博奕论看成数学的一个分支, 博奕论的一个重要代表人物---纳什(Nash,曾获1994 年诺贝尔经济学奖,该年度的诺贝尔经济学奖授与了 三位博奕论专家),在1951年的一篇奠基性的文章就 是发表在数学杂志上,而非在经济学杂志上。
对囚徒B作同样分析:如果囚徒A的策略是“坦白”,则 他采取“坦白”策略为好;如果囚徒A的策略是“抵赖”,他 还是采取“坦白”策略好,所以囚徒B对囚徒A的最优反应也 是“坦白”。
两个最优反应形成了一个策略组合(坦白,坦白),这就是 一个纳什均衡。
博弈论和对策行为
囚徒困境在经济学上的应用
两个寡头企业选择产量的博奕就是一个囚徒困 境问题。
博弈论和对策行为
囚徒困境在经济学上的应用
以上的分析告诉我们,用经济学的观点来看,只有由满足 个人理性选择的策略组成的集合才是均衡的,或者说只有纳 什均衡才是稳定的。
博弈论和对策行为
囚徒困境在经济学上的应用
看两个寡头合谋与价格卡特尔的情形,它也存在 个人理性与集体理性的冲突。
在两个寡头合谋条件下的产量与价格决定,是基 于两个寡头利润总和的最大化目标,而不是每个企业 自己的利润最大化。因此这种最大化目标下的产量分 配符合两家企业的共同利益,却不是使每家企业自己 的利润最大化的产量,换言之,并不是每家企业自己 的“最优反应”。所以,卡特尔产量分配不是一个纳 什均衡。正因为此,卡特尔下一定会有违约冲动,卡 特尔具有不稳定性。
博弈论和对策行为
策略型博弈的实例和解(囚徒困境)
例1. 囚徒困境(prisoner’s dilemma) 在对博奕局势进行描述后,博奕论分析就是要求
出局中人进行策略选择的理性结局,或者说找出博奕 问题的解。在非合作博奕中,有两种解的技术:一种 是纳什均衡,一种是优超解。
概论
博弈论和对策行为
博奕论是一门内容广泛且复杂的学科,不仅是经 济学,政治学、军事、外交、国际关系、公共选择, 还有犯罪学等,都涉及到博奕论。
实际上,很多人把博奕论看成数学的一个分支, 博奕论的一个重要代表人物---纳什(Nash,曾获1994 年诺贝尔经济学奖,该年度的诺贝尔经济学奖授与了 三位博奕论专家),在1951年的一篇奠基性的文章就 是发表在数学杂志上,而非在经济学杂志上。
对囚徒B作同样分析:如果囚徒A的策略是“坦白”,则 他采取“坦白”策略为好;如果囚徒A的策略是“抵赖”,他 还是采取“坦白”策略好,所以囚徒B对囚徒A的最优反应也 是“坦白”。
两个最优反应形成了一个策略组合(坦白,坦白),这就是 一个纳什均衡。
博弈论和对策行为
囚徒困境在经济学上的应用
两个寡头企业选择产量的博奕就是一个囚徒困 境问题。
博弈论和对策行为
囚徒困境在经济学上的应用
以上的分析告诉我们,用经济学的观点来看,只有由满足 个人理性选择的策略组成的集合才是均衡的,或者说只有纳 什均衡才是稳定的。
博弈论和对策行为
囚徒困境在经济学上的应用
看两个寡头合谋与价格卡特尔的情形,它也存在 个人理性与集体理性的冲突。
在两个寡头合谋条件下的产量与价格决定,是基 于两个寡头利润总和的最大化目标,而不是每个企业 自己的利润最大化。因此这种最大化目标下的产量分 配符合两家企业的共同利益,却不是使每家企业自己 的利润最大化的产量,换言之,并不是每家企业自己 的“最优反应”。所以,卡特尔产量分配不是一个纳 什均衡。正因为此,卡特尔下一定会有违约冲动,卡 特尔具有不稳定性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
站长素材
认识博弈论
by郭俊聪
互动测试
• 规则:在纸上写下1—100之间的任 意数,最接近平均数2/3的人获胜。
LOGO
• 奖励:胜者为一人,请看电影一场 或35元现金;胜者多于一人,均分 20元钱。
博弈论的发展
• 1928年,冯·诺依曼证 明了博弈论的基本原理,从 而宣告了博弈论的正式诞生。 • 1944年,冯·诺依曼和 摩根斯坦共著的划时代巨著 《博弈论与经济行为》将二 人博弈推广到n人博弈结构并 将博弈论系统的应用于经济 领域,从而奠定了这一学科 的基础和理论体系。 • 1950~1951年,ห้องสมุดไป่ตู้ 翰·福布斯·纳什(John Forbes Nash Jr)利用不动 点定理证明了均衡点的存在, 为博弈论的一般化奠定了坚 实的基础。——纳什均衡 (Nash equilibrium )
如果其中一人是你,你如何抉择? 绝对优势策略
到底什么是博弈?
LOGO
• 博弈(game playing):在多决策主体 之间行为具有相互作用时,各主 体根据所掌握信息及对自身能力 的认知,做出有利于自己的决策 的一种行为。 • 满足博弈的三个条件:参与者, 策略,收益
基本分析方法
• 情景假设:假设你现在是钟会要去攻打蜀国,你有 两队人马。蜀国守将姜维有两队人马 • 你有两种路线方案: • 1、入剑阁经大道步步为营攻下成都; • 2、偷渡阴平,直取蜀汉。同样姜维也有对应的防守 策略。 • 注意: • 1、走阴平因路途坎坷你会直接损失一队人马; • 2、相同兵力遭遇以双方都全军覆没算,2v1,2方剩 1,1方无。 • 3、双方都只能选择一条路线 • 请问,为了取得胜利,你会如何安排进攻?
LOGO
2012诺贝尔奖获得者夏普利 夏普利值——n人博弈
经典案例
囚徒困境(博弈论的非零和博弈中具代表性的例子,反
映个人最佳选择并非团体最佳选择。虽然困境本身只属模 型性质,但现实中的价格竞争、环境保护等方面,也会频 繁出现类似情况。)
LOGO
两个嫌疑犯作案后被警察抓住,分别关在不同 的屋子里接受审讯。警察知道两人有罪,但缺 乏足够的证据。警察告诉每个人:如果两人都 抵赖,各判刑一年;如果两人都坦白,各判八 年;如果两人中一个坦白而另一个抵赖,坦白 的放出去,抵赖的判十年。
LOGO
基本分析方法
• • 收益假设:你所剩余的人马为你的收益 ,姜维消灭的你的人马为姜维的收益。 问题分析——二维表
LOGO
姜维 剑阁 钟 会 ( 你 ) 剑 阁 阴平
(0,2) (2,0) (1,1) (0,2)
阴 平
Thank you
认识博弈论
by郭俊聪
互动测试
• 规则:在纸上写下1—100之间的任 意数,最接近平均数2/3的人获胜。
LOGO
• 奖励:胜者为一人,请看电影一场 或35元现金;胜者多于一人,均分 20元钱。
博弈论的发展
• 1928年,冯·诺依曼证 明了博弈论的基本原理,从 而宣告了博弈论的正式诞生。 • 1944年,冯·诺依曼和 摩根斯坦共著的划时代巨著 《博弈论与经济行为》将二 人博弈推广到n人博弈结构并 将博弈论系统的应用于经济 领域,从而奠定了这一学科 的基础和理论体系。 • 1950~1951年,ห้องสมุดไป่ตู้ 翰·福布斯·纳什(John Forbes Nash Jr)利用不动 点定理证明了均衡点的存在, 为博弈论的一般化奠定了坚 实的基础。——纳什均衡 (Nash equilibrium )
如果其中一人是你,你如何抉择? 绝对优势策略
到底什么是博弈?
LOGO
• 博弈(game playing):在多决策主体 之间行为具有相互作用时,各主 体根据所掌握信息及对自身能力 的认知,做出有利于自己的决策 的一种行为。 • 满足博弈的三个条件:参与者, 策略,收益
基本分析方法
• 情景假设:假设你现在是钟会要去攻打蜀国,你有 两队人马。蜀国守将姜维有两队人马 • 你有两种路线方案: • 1、入剑阁经大道步步为营攻下成都; • 2、偷渡阴平,直取蜀汉。同样姜维也有对应的防守 策略。 • 注意: • 1、走阴平因路途坎坷你会直接损失一队人马; • 2、相同兵力遭遇以双方都全军覆没算,2v1,2方剩 1,1方无。 • 3、双方都只能选择一条路线 • 请问,为了取得胜利,你会如何安排进攻?
LOGO
2012诺贝尔奖获得者夏普利 夏普利值——n人博弈
经典案例
囚徒困境(博弈论的非零和博弈中具代表性的例子,反
映个人最佳选择并非团体最佳选择。虽然困境本身只属模 型性质,但现实中的价格竞争、环境保护等方面,也会频 繁出现类似情况。)
LOGO
两个嫌疑犯作案后被警察抓住,分别关在不同 的屋子里接受审讯。警察知道两人有罪,但缺 乏足够的证据。警察告诉每个人:如果两人都 抵赖,各判刑一年;如果两人都坦白,各判八 年;如果两人中一个坦白而另一个抵赖,坦白 的放出去,抵赖的判十年。
LOGO
基本分析方法
• • 收益假设:你所剩余的人马为你的收益 ,姜维消灭的你的人马为姜维的收益。 问题分析——二维表
LOGO
姜维 剑阁 钟 会 ( 你 ) 剑 阁 阴平
(0,2) (2,0) (1,1) (0,2)
阴 平
Thank you