博弈论的基本表达方式

合集下载

博弈论知识简要

寻找混合策略纳什均衡的思路
• 令各博弈方随机选择纯策略的概率分布，满足使其他博弈方采用不同策略的期望得益相同，从而计算出各个博弈方随机选择各纯策略的概率。
• 在猜硬币博弈中，设盖硬币方出正面的概率为p，出反面的概率为1-p。则猜硬币方猜正面的期望得益为p·1+（1-p）·(-1)=2p-1，猜反面的期望得益是p·(-1)+(1-p) ·1=1-2p,令二者相等，得p=1/2。盖硬币方的混合策略是以（1/2,1/2）的概率随机选择正面和反面。类似的，可以计算出猜硬币方的混合策略。
S
i

1,2,...
表示 Si 中的某个特定策略。在静态博弈中，Si 中包含
的所有
S
i
就是第
i 个参与人的所有可选择的行动；ui
是第 i 个参与人的得益函数，它是所有参与人选择的
某个特定策略组合的函数，即
ui
ui
S1
,...,
S
i
,...,
S
n
。
•例两寡头的产量博弈中，参与人就分别是编号为1和2的两个企业；其各自的策略选择就是选择各自的产量；其各自的策略空间就是其各自所能够生产的各种产量的集合。如果假设两个企业，都能够生产大于0的任何数量的产量，那
下选择什么行动的预先安排； • 行动：参与人在博弈过程中轮到自己选择时所作的某个具体决策； • 得益：参与人从博弈中获得的效用，一般是所有参与人的策略
或行动的函数，这是每个参与人最关心的东西；
• 信息：参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识；
• 均衡：所有参与人的最优策略或行动的组合；
精炼贝叶斯均衡泽尔腾等

博弈论概述

“坦白”是A的占优策略。同样，“坦白”也是B的占优策略。
一般地，称 si*为局中人i的(严格)占优策略，若对应所有的
si , s i*是i的严格最优策略 , 即:
ui (si*, si ) ui (si' , si ) si , si' si*
对应地，所有的 si' si* 被称为“劣策略”。注意：这
甲的策略
1
2
3
乙的策略
1
7
8
9
2
6
2
3
3
5
4
0
1.乙先行动。若乙选1，则甲选3；乙选2，则甲选1；乙选3，则甲选1。乙在行动时会估计到甲的行动，它估计三种选择中的最高代价为策略1（损失900万），其次为策略2（损失 600万），最低为策略3（损失为500万）。因此，乙必选代价最低的策略3。——最大最小原理。结论：乙选择3，甲选 1作为回应，乙损失500万，甲获益500万。
在博弈论里，一个博弈可以有两种表述方式：一种是策略式（strategic form representation）表述，另一种是扩展式（ extensive form representation ）表述。前者适合于讨论静态博弈，后者适合于讨论动态博弈。在策略式表述中，所有参与人同时选择各自的策略，所有参与人选择的策略一起决定每个参与人的支付。
2007 - Leonid Hurwicz, Eric S. Maskin, Roger B. Myerson 2005 - Robert J. Aumann, Thomas C. Schelling 2001 - George A. Akerlof, A. Michael Spence, Joseph E.

高级微观经济学第八章博弈论

第八章博弈论前面章节对经济人最优决策的讨论，是在简单环境下进行的，没有考虑经济人之间决策相互影响的问题。

本章讨论这个问题，建立复杂环境下的决策理论。

开展这种研究的的理论叫做博弈论，也称为对策论(Game Theory)。

最近十几年来，博弈论在经济学中得到了广泛应用，在揭示经济行为相互制约性质方面取得了重大进展。

大部分经济行为都可视作博弈的特殊情况，比如把经济系统看成是一种博弈，把竞争均衡看成是该博弈的古诺-纳什均衡。

博弈论的思想精髓与方法，已成为经济分析基础的必要组成部分。

第一节博弈事例博弈是一种日常现象，例如棋手下棋，双方都要根据对方的行动来决定自己的行动，双方的目的都是要战胜对方，互不相容，互相影响，互相制约。

一般来讲，博弈现象的特征表现为两个或两个以上具有利害冲突的当事人处于一种不相容的状态中，一方的行动取决于对方的行动，每个当事人的收益都取决于所有当事人的行动。

当所有当事人都拿定主意作出决策时，博弈的局势就暂时确定下来。

博弈论就是研究这种不相容现象的一种理论，并把当事人叫做局中人(player)。

博弈论推广了标准的一人决策理论。

在每个局中人的收益都依赖于其他局中人的选择的情况下，追求收益最大化的局中人应该如何采取行动？显然，为了确定出可行的策略，每个局中人都必须考虑其他局中人面临的问题。

下面来举例说明。

例1．便士匹配(Matching Pennies)(二人零和博弈)设博弈中有两个局中人甲和乙，每个局中人都有一块硬币，并且各自独立安排硬币是否正面朝上。

局中人的收益情况是这样的：如果两个局中人同时出示硬币正面或反面，那么甲赢得１元，乙输掉１元；如果一个局中人出示硬币正面，另一个局中人出示硬币反面，那么甲输掉１元，乙赢得１元。

对于这个博弈，每个局中人可选择的策略都有两种：正面朝上和反面朝上，即甲和乙的策略集合都是{正面，反面}。

当甲和乙都作出选择时，博弈的局势就确定了。

显然，该博弈的局势集合是{(正面,正面)，(正面,反面)，(反面,正面)，(反面,反面)}，即各种可能的局势的全体，也称为局势表，即表1。

博弈论教程

囚徒A 坦白不坦白
－5,－5
－10,0
0,－10
－1,－1
2.1.2 严格下策反复消去法（逐步剔除严格劣战略）例
L M R
U M 8,3 2,1 5,1 8,4 6,2 3,6
D
3,0
9,6
2,8
可以预测该博弈的合理结局为(U,L),即参与人A
选择策略U,而参与人B选择策略L。
2.2 Nash 均衡 2.2.1 Nash 均衡的定义 Nash 均衡是指这样的策略组合(或剖面): 为了极大化自己的收益(或效用), 每一个参与人所采取的策略一定应该是关于其他参与人所采取的策略的最佳反应. 因此没有一个参与人会轻率地偏离这个策略组合而使自己蒙受损失。
博
弈
论
第一章导论
1.1什么是博弈论(Game Theory) 1.1.1 从游戏到博弈
游戏都有一些共同的特点:
1.都具有一定的规则; 2.都有一个结果; 3.策略至关重要; 4.策略和利益有相互依存性
一、博弈论概述
1.1.1 博弈论的定义
博弈论研究的是人与人之间利益相互制约下策略选择时的理性行为及相应结局。豪尔绍尼（John C.Harsanyi）1994年诺贝尔经济学奖获奖致词：博弈论是关于策略相互作用的理论。博弈论研究人与人之间“斗智”的形式和后果，当人们利益存在冲突时，每个人所获得的利益不仅取决于自己所获取的行动，还依赖于其他人采取的行动，每个人都需要针对对方的行为选择作出对自己最有利的反应。
定义在有n个参与人的博弈 G={S1,S2…Sn;u1,u2,…un)中,策略组合 s*=(s1 *,s2 *,…sn *)是一个Nash均衡,如果对于每一个i, si*是给定其他参与人的选择: S-i*=(s1*,…si-1*,si+1*,…sn*)的情况下,第i个人的最优策略,即 ui(si*,s-i*)≥ui(si,s-i*) ,对所有的i∈Γ 或者用另一种表示方式,si*是下述最大化问题的解: si*∈arg ui(s1*,…si-1*,si,si+1*,…sn*),i=1,2,…n S *∈Si 因此,当且仅当没有一个参与人能从单方面背离某个策略组合的预见中增加自己的得益时,这个策略组合就是Nash均衡。

博弈论算法讲义

博弈论算法一、博弈的战略式表述及纳什均衡的定义在博弈论里，一个博弈可以用两种不同的方式来表述：一种是战略式表述（strategic form representation ），另一种是扩展式表述（或译为“展开式表述”）（extensive form representation ）。

从分析的角度看，战略式表述更适合于静态博弈，而扩展式表述更适合于讨论动态博弈。

1.1博弈的战略式表述战略式表述又称为标准式表述（normal form representation ）。

在这种表述中，所参与人同时选择各自的战略，所有参与人选择的战略一起决定每个参与人的支付。

战略式表述给出：1.博弈的参与人集合：(),1,2,,i n ∈ΓΓ=。

2.每个参与人的战略空间：,1,2,,i S i n =。

3.每个参与人的支付函数：12(,,,),1,2,,i n u s s s i n =。

我们用()11,,;,,n n G S S u u =代表战略式表述博弈。

例如在两个寡头产量博弈里，企业是参与人，产量是战略空间，利润是支付;战略式表述博弈为：{}121122120, 0; (,), (,)G q q q q q q ππ=≥≥ (1.1)这里i q 、i π别表示第i 个企业的产量和利润。

1.2纳什均衡的定义有n 个参与人的战略式表述博弈()11,,;,,n n G S S u u =，战略组合{}1,,,,i n s s s s ****=是一个纳什均衡。

如果对于每一个i 、i s *是给定其他参与人选择{}111,,,,,i i i n s s s s s *****--+=的情况下第个参与人的最优战略，即(,)(,),,i i i i i i i i u s s u s s s S i***--≥∀∈∀ (1.2)或者用另一种表述方式，i s *是下述最大化问题的解:111argmax (,...,,,,...,),1,2,..., ;i i i i i n i i s u s s s s s i n s S *****-+∈=∈(1.3)我们用这个定义来检查一个特定的战略组合是否是一个纳什均衡。

博弈论初步

博弈论的基本知识
• 一、博弈理论(Game theory)的起源极其发展 • 代表人物：1、冯•诺依曼（Von Neumann)；摩根斯（Morgenstern) 1944年《博弈论与经济行为》提出了预期效用理论 • 2、塔克（Tucker) “囚犯难题“ • 3、纳什（Nash) 1950《N个人对策的均衡点》和《讨价还价问题》 • 两人奠定了非合作博弈理论的基础 • 4、泽尔腾（Selten) 1965 《需求减少条件下寡头垄断模型的对策论描述》 • 5、海萨尼（Harsanyi) 1967 《由贝叶斯局中人参加的不完全信息博弈》 • 6、克瑞普斯（Kreps)及威尔逊（W ilson),提出更高级的序列均衡问题
完全信息的动态博弈
• • • • • • 博弈的扩展式表达扩展式表达包括５个要素：１、参与人集合，２、参与人行动顺序，３、每个参与人在每次行动时的行动集合，４、每个参与人在每次行动时有关对手过去行动选择的信息（信息集）， • ５、支付 • ６、外生事件的概率分布
房地产开发案例
• 假定行动顺序如下：１、开发商Ａ首先行动，选择开发与否２、Ａ决策后自然选择市场需求的大小,３、Ｂ开发商在在观察到B开发商决策和市场需求后作决策 • • • • • • B 大 N
博弈的表达方式
• • • • • • • • • • 1、战略式表达；标准式表达，2、扩展式表达战略式表达给出： 1、参与人集合：i∈Γ 2、每个参与人的战略空间:si 3、每个参与人的支付函数： Ui(s1 s2… si… . sn) G={s1 s2… si… . sn, u1 u2… ui… . un;} 两寡头产量博弈： G={q1 >0 ,q2>0, , π1 (q1, q2), , π2 (q1, q2) ;} 有限博弈：参与人有限，策略有限，两个参与人博弈可用矩阵表示

《产业经济学》第五章--(博弈1)讲解

在上述“囚徒困境”的例子中，每个囚徒都有两种可选择的策略：坦白或抵赖。显然不论同伙选择什么策略，每个囚徒的最优策略是 “坦白”。如果一个博弈中，某个参与人有占优策略，那么该参与人的其他可选择策略就被称为“劣策略”。
在一个博弈里，如果所有参与人都有占优策略存在，那么占优策略均衡是可以预测到的唯一的均衡，因为没有一个理性的参与人选择劣策略。所以在“囚徒困境”博弈里，“坦白、坦白”是占优策略均衡。
第五章博弈
第一节博弈论的基本概念与应用
一、博弈论的定义博弈论，英文为Game theory，是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。一些相互依赖、相互影响的决策行为及其结果的组合称为博弈。博弈论研究的是存在相互外部效应条件下的主体的决策问题。
在寡头垄断的市场上，只有少数几家厂商在相互竞争，寡头们面对的市场环境或者说竞争对手的行为将随着他们本身的决策行为而变动，即寡头们的决策是相互作用的，每个企业的得益和利润不仅取决于自身的决策，也取决于其他厂商的决策。寡头厂商之间可能有激烈的竞争，这些竞争涉及价格、产量、广告、投资等许多方面的决策，在分析寡头垄断市场中的企业决策行为时，就必须把各种决策者之间的策略相互作用纳入到经济模型中，这就是一种博弈分析。
1．从行动的先后次序来划分，博弈可以分为静态博弈和动态博弈。静态博弈指在博弈中，参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取了什么具体行动；动态博弈指的是参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动的博弈。
2．从参与人对其他参与人的各种特征信息的获得差异来划分，博弈可分为完全信息博弈和不完全信息博弈。完全信息博弈指的是每一个参与人对所有其他参与人的特征，如策略集合及得益函数都有准确完备的知识；否则就是不完全信息博弈。

博弈论公式大全

博弈论公式大全
博弈论中的公式和定理有很多，以下是一些常见和重要的博弈论公式：
1. 纳什均衡公式：对于任意的策略组合s1，s2，如果对于所有的i，pi(s1, s2) >= pi(si(1), s2) 和 pi(s1, s2) >= pi(s1, si(2))都成立，则称(s1, s2)为纳什均衡。

2. 零和博弈公式：在零和博弈中，一方的收益等于另一方的损失，即总和为零。

常见的零和博弈有剪刀石头布游戏、赌博等。

3. 优势策略均衡公式：如果对于任意的对手策略s2，玩家i的策略s1都是最优的，则称(s1, s2)为优势策略均衡。

4. 纯策略与混合策略公式：在博弈论中，玩家的策略可以分为纯策略和混合策略。

纯策略是指玩家在每个信息集上选择固定的行动，而混合策略则允许玩家以一定的概率在多个行动中进行选择。

5. 贝叶斯均衡公式：在非完全信息博弈中，如果每个玩家都采用贝叶斯纳什均衡策略，那么这个策略组合就是贝叶斯均衡。

6. 最大最小值定理：对于完全二叉树博弈，如果每个节点都有正的权重，那么最大最小值就是所有叶子节点的权重的最大最小值。

7. 尼姆定理：在非零和博弈中，如果每个玩家都追求自己的最大收益，则至少有一个玩家会获得零收益。

8. 约翰逊定理：在完全信息博弈中，如果存在一个玩家有严格优势策略，那么这个玩家将获得所有收益。

9. 拉姆齐定理：在非完全信息博弈中，如果每个玩家都采用最优混合策略，那么这个策略组合就是拉姆齐最优。

以上是一些常见的博弈论公式，它们在博弈论的研究和应用中发挥着重要的作用。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

信息经济学（ INFORMATION ECONOMIC）西南科技大学
7.2博弈的表达方式
1 两种表达方式：
在博弈论里，一般可以用两种不同的表达方式来表达一个博弈：一种是标准式表达，一种是扩展式表述，从理论上讲，两种表达方式是等价的，任何博弈都既可以用标准式表示，又可以用扩展式表示。但相对而言，标准式表达更适合于静态博弈，扩展式表述更适合于动态博弈
西南科技大学
7.1 博弈论概述
3 博弈论的基本概念
博弈论的基本概念包括参与者、行动、信息、策略、收益、均衡和结果等。要描述一个具体的博弈，参与者、策略和收益是最基本的要素，这些基本要素通过行动和信息构建成一个博弈过程。参与者、行动和结果被称为博弈规则，博弈分析的目的就是在给定条下，运用博弈规则预测均衡。根据策略的数量可以将博弈分为有限策略博弈和无限策略博弈
信息经济学（ INFORMATION ECONOMIC）
西南科技大学
7.2博弈的表达方式
2.标准式表述
囚徒2 坦白
不坦白
-6，-6
坦白
0，-10 -1，-1
囚徒1
不坦白
-10，0
信息经济学（ INFORMATION ECONOMIC）
西南科技大学
7.2博弈的表达方式
3.扩展式表述中国联通
进入
中国电信默许
甲
反面
信息经济学（ INFORMATION ECONOMIC）
西南科技大学
7.1 博弈论概述
（2）囚徒的困境:博弈论中最经典的例子,其本身部分的奠定了非合作博弈论的理论基础
囚徒2 坦白
不坦白
-6，-6
坦白
0，-10 -1，-1
囚徒1
不坦白
-10，0
信息经济学（ INFORMATION ECONOMIC）
研究决策主体发生直接作用时的决策(或行动)
以及这种决策(或行动)的均衡问题的。
博弈可以分为：合作博弈与非合作博弈
信息经济学（ INFORMATION ECONOMIC）
西南科技大学
7.1 博弈论概述
2、几个典型的博弈问题
（1）猜硬币游戏:博弈论中最简单的例子
乙
正面
正面
反面
-1，1 1，-1
1，-1 -1，1
不进入
默许 (30.80)
阻挠
阻挠
(0.200)
西南科技大学
(-10.100) (0.200)
信息经济学（ INFORMATION ECONOMIC）
7.3 非合作博弈的类型
四种不同类型的博弈：
行动顺序静态信息完全信息静态完全信息
动态
完全信息动态博弈博弈纳什均衡子博弈精炼纳纳什（1950、什均衡 1951）塞尔腾（1965）不完全信息静态博弈贝叶斯纳什均衡豪尔绍尼）
第七章
博弈论基础
博弈论的基本概念？典型的博弈问题？博弈论的基本表达方式？非合作博弈的基本类型？
7.1 博弈论概述
7.2 博弈的表达方式
7.3 非合作博弈的基本类型
信息经济学（ INFORMATION ECONOMIC）西南科技大学
7.1 博弈论概述
1.博弈论的概念博弈论源自博弈论也称为“对策论”，是不完全信息
不完全信息动态博弈
信息经济学（ INFORMATION ECONOMIC）
西南科技大学