博弈论基础1-绪论

合集下载

博弈论百度百科

博弈论百度百科

博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。

在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。

按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。

所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。

博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。

此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。

按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。

不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。

博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

博弈论基础PPT精品课程课件全册课件汇总

博弈论基础PPT精品课程课件全册课件汇总

自己处于c还是d。即K缺乏信息。 P
c
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
参与人对于结果的偏好性。K是否更希望博弈
终止点f而不是h上结束?
我们必须知道参与人关心什么,才能将终止
点根据每个参与人的偏好排列。通常用数字
表述参与人的偏好排序最为简便。这也称为
1 概述
这个理论在许多方面都是有用的。 首先,它提供了一种语言。 其次,它提供了应该框架,能够指导我们建立策略环 境模型。 其三,它有助于我们追朔,对行为假设的逻辑推理过 程。
1 概述
好几百年前,数学家就开 始研究室内游戏,试图构 造最优的游戏策略。
在1713年,沃尔德格雷夫 就某种纸牌游戏的解决方 法,与他的同事德莫特和 贝努利进行交流。沃尔德 格雷夫的解决方法,与现 代理论的结论相一致。
支付(payoff),或者效用(utilities)。
P
c
P
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
我们引入一些数学符号来考察博弈。
我们来看看一个市场博弈,两个厂商通过选择高价或者低价进行 竞争。
我们用参与人i表示任何一个参与人的数字代码。即在一个有n个 参与人的博弈中,i=1,2,…,n。 在某些博弈中,一个参与人可以在无限多个行动中进行选择。

博弈论概述

博弈论概述
“坦白”是A的占优策略。同样,“坦白”也是B的占优策略。
一般地,称 si*为局中人i的(严格)占优策略, 若对应所有的
si , s i*是i的严格最优策略 , 即:
ui (si*, si ) ui (si' , si ) si , si' si*
对应地,所有的 si' si* 被称为“劣策略”。注意:这
甲的策略
1
2
3
乙的策略
1
7
8
9
2
6
2
3
3
5
4
0
1.乙先行动。若乙选1,则甲选3;乙选2,则甲选1;乙选3, 则甲选1。乙在行动时会估计到甲的行动,它估计三种选择 中的最高代价为策略1(损失900万),其次为策略2(损失 600万),最低为策略3(损失为500万)。因此,乙必选代 价最低的策略3。——最大最小原理。结论:乙选择3,甲选 1作为回应,乙损失500万,甲获益500万。
在博弈论里,一个博弈可以有两种表述方式:一种是策 略式(strategic form representation)表述,另一种是 扩展式( extensive form representation )表述。前者 适合于讨论静态博弈,后者适合于讨论动态博弈。在策略式 表述中,所有参与人同时选择各自的策略,所有参与人选择 的策略一起决定每个参与人的支付。
2007 - Leonid Hurwicz, Eric S. Maskin, Roger B. Myerson 2005 - Robert J. Aumann, Thomas C. Schelling 2001 - George A. Akerlof, A. Michael Spence, Joseph E.

博弈论讲义完整PPT课件

博弈论讲义完整PPT课件
• 两个寡头企业选择产量的博弈:
如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页

纳什均衡——博弈论的基础

纳什均衡——博弈论的基础

纳什均衡——博弈论的基础下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。

文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by the editor. I hope that after you download them, they can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!In addition, our shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts, other materials and so on, want to know different data formats and writing methods, please pay attention!纳什均衡——博弈论的基础引言博弈论作为一门交叉学科,融合了数学、经济学、政治学等多个领域的知识,旨在研究决策者在相互影响下的最佳策略选择。

《博弈论基础》

《博弈论基础》
01-3-2 6
2、博弈规则(续)
( 3) 行 动 的 先 后 顺 序 ● 静 态 ( S tatic 同 时 ) ● 动 态 ( D y nam ic 先 后 ) ( 4) 信 息 结 构 : 参 与 人 在 行 动 时 知 道 了 什 么 (5)战略(Strategy) S = ( s 1, s 2, … , s k) = ( s k, s -k)
01-3-2
17
2、NE的求解
例 1:囚犯困境 C C 囚犯 A DC
-10 0 -2 -2 -5 -5 0
囚犯 B DC
-10
●验证:{s*1=(C,C) ;s*2=(C,C)}为 NE 战略 ●但 Pareto 改进(-2,-2)未能自发达到——外部性 ●个人理性与集体理性产生冲突
<The Theory of Games & Economic Behavior> ●John Harsanyi & John Nash & Reinhard Selten
01-3-2 1
3、应用阶段
(1)宏观经济学:●政策动态一致性(SPNE) ●劳动力市场 ●(金融)信贷市场 (2)微观经济学 ●外部性 ●公共产品的投资激励 ●工资(薪酬)决定
四、博弈的表示方式
1. 矩 阵 博 弈 例 : 囚 犯 困 境 囚 犯B C
囚 犯C A -5 -5 0 -2 0 -2
DC
-10
DC -10
01-3-2
12
例:性别战(Battle of Sexes)
● 新婚夫妇: Opera Opera Sandy Football ● 百年夫妻: Opera Opera Sandy Football
01-3-2

《博弈论初步》课件


THANKS
感谢观看
02
纳什均衡是一种非合作博弈均衡 ,其中每个参与者都认为当前策 略是最好的,不会受到其他参与 者的欺骗或影响。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的策略,逐步逼近纳什均衡。这 种方法适用于较简单的博弈模型,但对于复杂的博弈模型 可能收敛速度较慢。
线性规划法
将纳什均衡问题转化为线性规划问题,通过求解线性规划 来找到纳什均衡。这种方法适用于具有线性特征的博弈模 型,但计算复杂度较高。
价格战与非价格战
博弈论分析了价格战和非价格战的利弊,为企业制定营销策略提供 博弈论可以用来分析选民的投票行为和政治立场,预测选举结果。
02
候选人策略
博弈论为候选人提供了制定最优竞选策略的方法,帮助他们在选举中获
胜。
03
政治联盟与利益交换
博弈论中的合作博弈理论可以用来分析政治联盟的形成和利益交换机制
特征值法
利用特征值和特征向量的性质来求解纳什均衡。这种方法 适用于具有矩阵特征的博弈模型,但需要一定的数学基础 。
纳什均衡的应用实例
1 2
价格竞争
在寡头市场中,企业之间通过价格策略进行竞争 ,最终形成价格均衡,即纳什均衡。
劳资谈判
劳资双方在谈判中会提出自己的工资要求,最终 达成工资协议,这也是一种纳什均衡。
博弈类型
合作博弈
定义
01
参与者通过合作达成共赢的博弈。
特点
02
存在合作协议,强调集体行动和收益分配。
应用场景
03
国际关系、商业合作、团队协作等。
非合作博弈
定义
应用场景
参与者追求各自利益最大化的博弈。
市场竞争、个人决策、资源分配等。

博弈论第1章-导论


第一章 导论 1.2 策略环境中的博弈思维 策略
确定策略集合? 可行策略清单。 两类人: 一是有自己的策略但是不知道用哪个好的人(强化自 己的策略性思考能力即可); 二是没有一个策略集合。(这个比较难) 自己无法决策,也没有可选择的策略,这就是难点

第一章 导论 1.2 策略环境中的博弈思维 策略
下上中 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1 下中上 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3
1.2.2 赌胜博弈
二、猜硬币博弈
猜硬币方
正面
盖 硬 币
反面
正面
-1,1
反面
1,-1 -1,1

1,-1
该博弈与上一个例子相似,即取胜的关键都是不能 让另一方猜到自己的策略而同时自己又要尽可能猜出对 方的策略。
一场是同等级马或 者田忌说的对称结 果 上马对下马,中马 对上马,下马对中 马
一、齐威王田忌赛马
田忌 比赛结 输赢结果 果 三场全 输3000金 负
两胜一负
一胜两负
赢1000金
两负一 胜
一负两 胜
输1000金
赢1000金
输1000金 田忌说的那种情况,
1.3.2 赌胜博弈
一、齐威王田忌赛马
如果齐王采取策略,赛马就变成了策略相依的决策 较量,构成了典型的赌胜博弈。
第一章 导论 1.2 策略环境中的博弈思维 预测与均衡


预测与均衡 在预测对手的策略是,要站在对手的角度评价, 思考这几种策略组合能为他带来多少利益。 N方的行动决定
N社的标题
经济
经济
A社的标题
政治
3 4
政治
6

博弈论初步


第三节 混合策略均衡
一 混合策略与策略组合

以有限的纯策略为基础的混合策略一定是无限 的,源于概率取值的无限性。 乙厂商
q1 p1 4 3 p2 7 – 2 6 – 9 – 8 – q2 1

甲厂商和乙厂商的混
合策略组合就是一个 概率向量组合。 与纯策略不同,每一 个概率向量是相应参

甲 厂 商
与人的一个混合策略。
类型 区别 静态 内容 动态

完全信息 完全信息
完美信息 不完全信息
纳什均衡 精炼纳什均衡 针对策略集和支付集
针对记忆 (过程),信息结点是唯一的 贝叶斯 -纳什均衡 精炼贝叶斯-纳什均衡
第二节 纯策略均衡 一、寡头博弈和支付矩阵
第二节 纯策略均衡
一 寡头博弈和支付矩阵

假定在某个寡头市场上,有甲、乙两个厂商。 这是一个只有两方参加 乙厂商

他说自己只做了两件事: 一是研究过讨价还价的问 题;二是关注了经济问题 并从数学角度加以分析。
理性决策决不会无缘无故 地损害自身的利益,也就 是一个人肯定不会故意做 出对自己不利的事。

[案例] “华容道”里的纳什均衡(1)
曹操 小道 大路 小 道 大 路
被擒 擒住 逃脱 空等 逃脱 空等
被擒
[案例]“华容道”里的纳什均衡(1)
博弈论 (Game Theory) 是研究在策略性环境中 如何策略性地进行决定和采取行动的科学。 1944 年, 冯· 诺依曼和摩根斯顿共著《博弈论 与经济行为》,将博弈论用于经济领域。 博弈论在政治学、计算机科学、国际关系、军 事料] 会下棋的机器
[资料] 会下棋的机器
1/2 ▲
1/2 ▲

博弈论知识点总结完整版

博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。

即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。

1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。

1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。

两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。

倘若不能,则称非合作博弈(Non-cooperative game)。

合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。

目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。

博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。

把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

QSC
Page:8
博弈的标准式表示
参与者2
策略1 策略2 …… 策略n
参 与 者 1
策略1 策略2
…… 策略m
u1,v1 u2,v1
…… um,v1
u1,v2 u2,v2
…… um,v2
…… ……
…… ……
u1,vn u2,vn
…… um,vn
QSC
博弈论基础. Copyright © 2005 ECUST. All rights reserved. 华东理工大学版权所有, 翻印必究。
小猪 按 等
按 大 猪 等
5,1
4,4
9,-1
0,0
博弈论基础. Copyright © 2005 ECUST. All rights reserved. 华东理工大学版权所有, 翻印必究。
QSC
Page:3
博弈的基本概念
定义:博弈就是一些个人、队组或其他组织,面对一定的环 境条件,在一定的规则下,同时或先后,一次或多次,从各 自允许选择的行为或策略中进行选择并加以实施,各自取得 相应结果的过程。
-1,-1
-9, 0
博弈论基础. Copyright © 2005 ECUST. All rights reserved. 华东理工大学版权所有, 翻印必究。
QSC
Page:2
智猪博弈
猪圈里有一头大猪一头小 猪。猪圈一头有一个食槽, 另一头装有一个按钮。按 一下按钮有10个单位猪食 进食槽。若大猪先到,大 猪吃9个单位,小猪吃1个 单位;若小猪先到,大猪 吃6个单位,小猪吃4个单 位;若同时到,大猪吃7个 单位,小猪吃3个单位。按 按钮者须扣除两个单位作 为成本
非合作博弈的均衡概念
行动顺序 信息结构
静态
动态
完全信息
完全信息静态博 完全信息动态博 弈: 弈: 子博弈精炼纳什 纳什均衡 均衡 不完全信息静态 不完全信息动态 博弈: 博弈: 贝叶斯纳什均衡 精炼贝叶斯纳什 均衡
不完全信息
博弈论基础. Copyright © 2005 ECUST. All rights reserved. 华东理工大学版权所有, 翻印必究。
Page:4
博弈分类
合作博弈
非合作博弈
博弈论基础. Copyright © 2005 ECUST. All rights reserved. 华东理工大学版权所有, 翻印必究。
QSC
Page:5
非合作博弈的简单分类
按 博 弈 方:单人博弈、两人博弈、多人博弈 按 策 略: 有限博弈、 无限博弈 按 得 益: 零和博弈、常和博弈、变和博弈 按博弈过程:静态博弈、动态博弈、重复博弈
经济学研究的对象越来越转向个体研究,放弃没有微
观基础的一些假设:消费函数、投资函数等,转向从 在约束条件下个人效用最大化行为所导致的均衡。
经济学越来越转向人与人关系的研究,特别是人与人
之间行为的相互影响与作用、人们之间利益冲突与一 致、竞争与合作的研究。
经济学越来越重视对信息的研究,特别是信息不对称
Page:9
博弈的扩展式表示
仿冒和反仿冒博弈
企业 仿冒 政府 制止 不制止 (0,10) 企业 不仿冒 (5,5) 不仿冒 沉默 (-1,-1) 沉默
囚徒的困境
囚徒1
囚徒2
坦白 囚徒2 坦白
坦白 沉默
(-2,5) 仿冒 政府 制止 (2,2) 不制止
(-9,0) (0,-9) (-6,-6)
(10,4)
The foundation of Game Theory
客户1
存款 客户2 存款 不存款 存款 不存款 不存款
博弈论基础E-mail: scqian@
提前 客户2 提前
(1,1) (1,1)(1,1)
客户1 到期 到期 提前 到期
华东理工大学商学院
博弈论基础. Copyright © 2005 ECUST. All rights reserved. 华东理工大学版权所有, 翻印必究。
QSC
Page:10
主流经济学发展对博弈论的需求
新古典经济学的两个基本假设:
市场参与者的数量足够多从而市场是竞争性的 参与者之间不存在信息不对称问题
主流经济学:
博弈论基础. Copyright © 2005 ECUST. All rights reserved. 华东理工大学版权所有, 翻印必究。
QSC
Page:6
信息结构的博弈分类
完全信息博弈:各博弈方都完全了解所有博弈
方各种情况下的得益
不完全信息博弈:至少部分博弈方不完全了解
其他博弈方得益的情况的博弈,也称为“不对 称信息博弈”
(0.8,0.8) (1,0.6) (0.6,1)(1.2,1.2)
博弈论基础. Copyright © 2005 ECUST. All rights reserved. 华东理工大学版权所有, 翻印必究。
QSC
Page:1
囚徒的困境——Tucker1950年提出
两个犯罪嫌疑人分别 关押,每个犯罪嫌疑 人均可选择一种策略 沉默 囚徒 1 坦白 0,-9 -6,-6 囚徒 沉默 2 坦白
对个人选择与制度安排的影响
博弈论基础. Copyright © 2005 ECUST. All rights reserved. 华东理工大学版权所有, 翻印必究。 QSC
Page:11
核心方面: 参与者—博弈中选择行动以最大化自己效用的决策主体 行动 —参与人采取的行为 信息 —参与人所掌握的知识 策略 —参与人选择行动的规则 支付函数—参与人从博弈中获得的效用水平 均衡 —所有参与人最优策略或行动的组合
QSC
博弈论基础. Copyright © 2005 ECUST. All rights reserved. 华东理工大学版权所有, 翻印必究。
完美信息博弈:每个轮到行为的博弈方对博弈
的进程完全了解的博弈
不完美信息博弈:至少某些博弈方在轮到行动
时不完全了解此前全部博弈的进程的博弈
博弈论基础. Copyright © 2005 ECUST. All rights reserved. 华东理工大学版权所有, 翻印必究。
QSC
Page:7
相关文档
最新文档