博弈论

合集下载

博弈论定义与主要思想

博弈论定义与主要思想

Selten and Harsanyi
泽尔腾(1965)将纳 而海萨尼则发展了刻
什均衡的概念引入了 动态分析,提出了 “精炼纳什均衡”概念; 以及进一步刻画不完 全信息动态博弈的 “完备贝叶斯纳什均
画不完全信息静态博 弈的“贝叶斯纳什均 衡”(1967-1968)。 总之,他俩进一步将 纳什均衡动态化,加 入了接近实际的不完 全信息条件。他们的
著名经济学家保罗.萨缪尔森说:“要想在现代 社会做一个有文化的人,您必须对博弈论有一 个大致了解。”
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的 思想,每个个体都是理性的,所以必须了解竞 争对手的思想。商业关系被认为是一种相互作 用。但博弈论并不是疗法,并不是处方,它并 不告诉你该付多少钱买东西,这是计算机或者 字典的任务。博弈论只是提供一些关系的例证, 一些有用的解决问题的方法。这种思维方法也 许是企业家应该学习的。对于经济学家,也许 需要学习它的理论模型,它的实验方式 。
2005年诺奖授予有以色列和美国双重国籍的罗 伯特·奥曼和美国人托马斯·谢林,以表彰他们 在博弈论领域作出的贡献。
主要思想
博弈论并不是经济学的一个分支,它只是一种 方法,这也是为什么许多人将其看成数学的一 个分支的缘故。
在对参与者行为研究这一点上,博弈论和经济 学家的研究模式是完全一样的。经济学越来越 转向人与人关系的研究,特别是人与人之间行 为的相互影响和相互作用,人与人之间利益和 冲突、竞争与合作,而这正是博弈论的研究对 象。
4、信息指的是参与人在博弈中所知道的 关于自己以及其他参与人的行动、策略 及其得益函数等知识;
5、得益是参与人在博弈结束后从博弈中 获得的效用,一般是所有参与人的策略 或行动的函数,这是每个参与人最关心 的东西;

博弈论是什么

博弈论是什么

博弈论是什么博弈论是一门研究决策和策略的数学理论,它研究决策者在互动中作出最佳选择的数学模型。

博弈论的研究对象是决策者之间的相互作用,无论是个体、组织还是国家之间的相互作用。

在博弈论中,个体决策者通常被称为“球员”(players),决策者们的决策被称为“策略”(strategies)。

博弈论分析的目标是找到在各种不同策略组合中,球员可以通过分析其他球员的行动,作出最佳决策的方法。

博弈论通过建模和分析不同策略的结果,以及不同决策者之间的冲突和合作,来解决决策问题。

博弈论的起源可以追溯至20世纪的数学家、经济学家和游戏理论家。

它被广泛应用于经济学、政治学、社会科学和计算机科学等领域,以解决各种决策和策略问题。

博弈论有两个重要的分支,一是非合作博弈论,二是合作博弈论。

非合作博弈论研究的是在决策者之间缺乏合作的情况下的决策问题。

非合作博弈论分析的是每个决策者如何在互动中作出最佳决策,而不考虑其他决策者的影响。

其中最著名的非合作博弈论模型是“囚徒困境”。

囚徒困境是一种经典的非合作博弈论问题,描述了两个同时被捕的囚犯面临的决策问题。

如果两个囚犯都保持沉默,则他们将因不够证据而被判轻刑;如果一个人选择坦白,而另一个保持沉默,则坦白的囚犯将获得从刑期的豁免,而另一个将被判重刑;如果两个人都选择坦白,则他们将受到较重的刑期。

在这个例子中,每个囚犯的最佳策略是选择坦白,然而,当两个囚犯都选择坦白时,他们都会陷入囚徒困境,因为他们的总体利益会受到损害。

合作博弈论研究的是在决策者之间存在合作的情况下的决策问题。

合作博弈论分析的是决策者通过协商和合作来达成一致,并在互动中作出最佳决策。

其中最著名的合作博弈论模型是“合作对策”(cooperative games)。

合作对策是一种多人博弈论问题,在这种情况下,参与者通过协调策略,共同提高整体收益。

合作对策的目标是通过合作和协商,找到一种合理的分配方式,使得每个参与者都能获得相对公平和最大化的收益。

博弈论百度百科

博弈论百度百科

博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。

在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。

按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。

所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。

博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。

此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。

按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。

不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。

博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

博弈论名词解释

博弈论名词解释

博弈论名词解释博弈论是一种研究冲突和合作决策的数学理论。

在博弈论中,玩家通过制定决策来实现自己的利益,同时也要考虑其他玩家的决策对自己利益的影响。

博弈论的研究对象是在有限的资源和信息条件下,决策制定者之间的相互作用。

以下是一些常见的博弈论名词解释:1. 纳什均衡(Nash equilibrium):是指在博弈过程中,每个玩家依据其他玩家的行为选择自己的最佳策略,而没有动机单方面改变策略。

纳什均衡是一种稳定状态,即每个玩家的策略都是最优的。

2. 零和博弈(zero-sum game):是指一个玩家的收益与另一个玩家的损失完全相等,总收益为零。

在零和博弈中,一个玩家的利益的增加必然导致另一个玩家的利益的减少,双方利益存在完全的对立关系。

3. 非零和博弈(non-zero-sum game):是指一个玩家的利益的增加不一定导致另一个玩家的利益减少。

在非零和博弈中,玩家之间的利益可以相互协调、互利互惠。

4. 博弈树(game tree):是博弈论中常用的一种图形表示方式,用于展示博弈过程中的决策步骤和可能的结果。

博弈树由顶点和边组成,顶点表示玩家的决策点,边表示不同的行动选择。

5. 最优策略(optimal strategy):在博弈论中,最优策略是指玩家的最佳选择,使得在对手的任何策略下,自身获得最大利益。

最优策略可能根据玩家的目标和信息不同而变化。

6. 合作与背叛(cooperation and defection):博弈论中常涉及到的两个关键概念。

合作指玩家之间通过协调行动来获得共同利益,背叛指玩家为了自身利益而选择对方不合作。

7. 博弈矩阵(game matrix):是一种表示博弈参与者和策略选择关系的表格。

博弈矩阵以参与者为行,以策略选择为列,用数字表示参与者在不同策略下的收益情况。

8. 支配策略(dominant strategy):在博弈论中,一种策略如果在所有可能的对手策略下都能带来最佳结果,则被称为支配策略。

博弈论

博弈论

2.2.1 博弈论的定义现代经济学的最新发展有一个特别引人注目的特点,那就是博弈论在经济学中越来越受到重视。

博弈论,又称为对策论,它是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题①。

简单地说,就是研究决策主体的行为在发生直接相互作用时,他们如何进行决策,以及这种决策的均衡问题。

1944 年冯·诺依曼和摩根斯特恩(Morgenstern)合作出版了《博弈论与经济行为》(The Theory of Games and Economic Behavior),开始将博弈论引入经济学,成为现代经济博弈论研究的开端。

20 世纪50 年代纳什(John F. Nash)、塔克(Tucker)等人的研究,奠定了现代博弈论的基石。

在其后的几十年里,许多经济学家致力于博弈论的研究,1965 年泽尔腾(Reinhard Selten)将纳什均衡的概念引入了动态分析;1967-1968 年,海萨尼(John C. Harsanyi)把不完全信息分析引入博弈论的研究;1982 年克瑞普斯(David M. Kreps)和威尔逊(RobertWilson)分析了动态不完全信息条件下的博弈问题。

1994 年诺贝尔经济学奖授予了纳什、泽尔腾和海萨尼三位博弈论专家,此后在2001 年诺贝尔经济学奖同样授予了三位博弈论的专家②。

博弈论是一种关于行为主体策略相互作用的理论,它已形成了一套完整的理论体系和方法论体系。

它具有基本假设的合理性、研究对象的普遍性、研究结论的真实性、方法论的实证性等特点。

正是因为这些特点,博弈论的产生和发展引发了一场深刻的经济学革命,使得现代经济学从方法论,到概念和分析的方法体系,都发生了很大的变化。

正如克瑞普斯(Kreps)在《博弈论与经济模型》一书中指出“在过去一二十年中,经济学在方法论,以及语言、概念等等方面,经历了一场温和的革命,非合作博弈已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不①懂纳什均衡能够‘消化’近代文献的领域。

博弈论百度百科

博弈论百度百科

博弈论百度百科博弈论是一门研究决策制定和决策结果的学科,它是应用数学的一个分支,通过运用数学和逻辑工具,探讨参与者在互动决策中的最佳策略选择。

在博弈论中,参与者被称为玩家,他们根据自身利益和目标来做出决策。

博弈论适用于各种不同领域的情境,包括经济学、政治学、生物学等。

一、概述博弈论的研究对象是策略性互动。

在一个博弈中,每个玩家都会依据一定的策略选择进行行动,而这个选择可能会受到其他玩家的影响。

博弈论试图理解和分析在这种互动中,参与者如何做出决策,并找到最优的解决方案。

博弈论的核心概念是博弈,一个博弈可以用一个四元组表示:(N, A, U, F),其中:- N表示参与博弈的玩家集合;- A表示每个玩家可选的行动集合;- U表示每个玩家的效用函数,用于衡量不同结果对该玩家的好坏程度;- F表示每个玩家的信息集合。

信息集合是指每个玩家在博弈过程中所了解的信息。

二、博弈论的重要概念1. 纳什均衡纳什均衡是博弈论中最重要的概念之一,指的是在一个博弈中,所有玩家选择的策略组合,使得任何玩家都没有动机单方面改变自己的策略。

纳什均衡是一个稳定状态,玩家之间不再有改变策略的动机。

2. 零和博弈与非零和博弈博弈可以分为零和博弈和非零和博弈。

零和博弈是指参与博弈的玩家的收益之和为零,即一方获利必然导致另一方的损失。

非零和博弈是指参与博弈的玩家的收益之和不为零,即可以存在多方共同受益的情况。

3. 微观博弈与宏观博弈微观博弈是指研究个体玩家之间的策略性互动,关注的是个体决策的结果。

宏观博弈是指研究整体群体之间的策略性互动,关注的是全局结果。

三、应用领域博弈论的研究在众多领域中都具有广泛的应用。

以下是博弈论在一些领域的应用举例:1. 经济学博弈论在经济学领域中有着广泛的应用。

它可以用来研究市场竞争、合作与冲突、价格形成等经济问题。

例如,博弈论可以用来分析竞争市场中的价格战和垄断市场中的价格定价策略。

2. 政治学博弈论在政治学领域中也有着重要的应用。

博弈论完整版PPT课件

博弈论完整版PPT课件
R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。

什么是博弈论?

什么是博弈论?

什么是博弈论?博弈论是一门研究策略决策的学科,它涉及到两个或多个参与者的博弈过程。

博弈论的研究对象可以是经济、政治、社会等领域,也可以是日常生活中的人际交往。

下面,我们来详细了解一下这门学科。

一、博弈论的起源博弈论起源于20世纪40年代,当时美国数学家冯·诺依曼(John von Neumann)和经济学家奥斯卡·莫根斯特恩(Oskar Morgenstern)合著了《博弈论与经济行为》一书。

这是一本奠定博弈论基础的重要著作,它将博弈论应用于经济学领域,从而成为博弈论的奠基之作。

二、博弈论的基本概念1.参与者博弈论的参与者指的是博弈过程中参与决策的个体或组织,例如一个独立的个人、两个公司或国家之间的竞争。

2.策略策略是指参与者在博弈中所采用的行为方式或决策方法。

不同的策略可能导致不同的博弈结果,因此博弈过程中策略的选择非常重要。

3.收益收益是博弈过程中参与者所能获取的利益,包括经济利益、社会地位、权力等。

收益对参与者而言是决策的目的和结果,因此其大小和分布会影响博弈的结果。

4.博弈形式博弈形式指的是博弈参与者、策略和收益之间的关系,是博弈过程的精神核心。

博弈形式一般分为合作博弈和非合作博弈两种,而在这两种博弈形式下,又分别有多种复杂的形式。

三、博弈论的应用1.经济学领域博弈论在经济学领域的应用最为广泛。

经济学研究的主题之一是市场竞争,而博弈论可以帮助我们透彻理解市场竞争的规律。

例如,博弈论可以用来研究企业之间的价格战、垄断行为、拍卖等问题。

2.政治学领域博弈论在政治学领域的应用也非常重要。

政治学研究的主题之一是国家之间的竞争和协作,而博弈论可以帮助我们研究国际关系、外交政策等问题。

例如,博弈论可以用来研究国际贸易谈判、军备竞赛等问题。

3.人际交往领域博弈论在人际交往领域的应用也相当重要。

通过博弈论,我们可以学习如何有效地沟通和合作,避免双方的冲突和误解。

例如,博弈论可以用来研究双方的协调、合作等问题。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

sulting
sum.
For
example,
given
mi
=
1 3
H
+
2 3
T
and
m′i
=
1 2
H
+
1 2
T
we
have
mi[H/m′i]
=
1 3
(
1 2
H
+
1 2
T
)
+
2 3
T
=
1 6
H
+
5 6
T
.
We also use the following identification of mixed strategies over two sets
Suppose now that the strategy si is strictly dominated in R by a mixed strategy mi from R. Define
m′i := mi[t1i /n1i ]. . .[tki /nki ].
Then by (b) and (10.1) si is strictly dominated in R by m′i and support(m′i) ⊆ Ri′,
Suppose that Ri \ Ri′ = {t1i , . . ., tki }. By definition for all j ∈ {1, . . ., k} there exists in R a mixed strategy mji such that tji is strictly dominated in R
Strict dominance by a mixed strategy leads to a stronger form of strategy elimination. For example, in the game
LR T 2, 1 0, 1 M 0, 1 2, 1 B 0, 1 0, 1
85
mi, m′i and a strategy si we denote by mi[si/m′i] the mixed strategy obtained
from mi by substituting the strategy si by m′i and by ‘normalizing’ the re-
i.e., m′i is a mixed strategy in R′.
2
The following is a counterpart of the Strict Elimination Lemma 1 and will be used in a moment.
Lemma 38 (Strict Mixed Elimination) Given a finite strategic game G consider two restrictions R and R′ of G such that R →SM R′.
gies. We denote the corresponding reduction relation between restrictions of
a finite strategic game by →SM .
First, we introduce the following notation. Given two mixed strategies
In what follows we discuss for these two forms of dominance the counterparts of the results presented in Chapters 3 and 4.
10.1 Elimination of strictly dominated strategies
For some α ∈ (0, 1] and a mixed strategy n1i with t1i ∈ support(n1i ) we have
m1i = (1 − α)t1i + α n1i .
By assumption t1i is strictly dominated in R by m1i , so by (a) t1i is strictly dominated in R by n1i , which proves (10.1) for j = 1.
pi(m) = pi(si, m−i).
m′i′ = (1 − α)tℓi+1 + α nℓi+1.
By (a) tℓi+1 is strictly dominated in R by nℓi+1. Also support(nℓi+1)∩{t1i , . . ., tℓi+1} = ∅, which proves (10.1) for j = ℓ + 1.
of strategies Si′ and Si such that Si′ ⊆ Si. We view a mixed strategy mi ∈ ∆Si such that support(mi) ⊆ Si′ as a mixed strategy ‘over’ the set Si′, i.e., as an element of ∆Si′, by limiting the domain of mi to Si′. Further, we view each mixed strategy mi ∈ ∆Si′ as a mixed strategy ‘over’ the set Si, i.e., as an element of ∆Si, by assigning the probability 0 to the elements in Si \ Si′.
Assume now that ℓ < k and that (10.1) holds for all j ∈ {1, . . ., ℓ}. By assumption tℓi+1 is strictly dominated in R by mℓi+1.
Let m′i′ := mℓi+1[t1i /n1i ]. . பைடு நூலகம்[tℓi /nℓi ].
By the induction hypothesis and (b) tℓi+1 is strictly dominated in R by m′i′ and support(m′i′) ∩ {t1i , . . ., tℓi} = ∅.
For some α ∈ (0, 1] and a mixed strategy nℓi+1 with tℓi+1 ∈ support(nℓi+1) we have
86
by mji . We first prove by complete induction that for all j ∈ {1, . . ., k} there exists in R a mixed strategy nji such that
tji is strictly dominated in R by nji and support(nji ) ∩ {t1i , . . ., tji } = ∅. (10.1)
∀s−i ∈ S−i pi(mi, s−i) > pi(si, s−i), and that si is weakly dominated by a mixed strategy mi if ∀s−i ∈ S−i pi(mi, s−i) ≥ pi(si, s−i) and ∃s−i ∈ S−i pi(mi, s−i) > pi(si, s−i).
( ⇒ ) It suffices to show that m is also a joint mixed strategy in R′, i.e., that for all i ∈ {1, . . ., n} we have support(mi) ⊆ Ri′.
Suppose otherwise. Then for some i ∈ {1, . . ., n} a strategy si ∈ support(mi) is strictly dominated by a mixed strategy m′i ∈ ∆Ri. So
(a) for all α ∈ (0, 1], if si is strictly dominated by (1 − α)si + α mi, then si is strictly dominated by mi,
(b) if si is strictly dominated by mi and s′i is strictly dominated by m′i, then si is strictly dominated by mi[s′i/m′i].
dominated by a mixed strategy. As in Chapter 3 we would like to clarify
whether it affects the Nash equilibria, in this case equilibria in mixed strate-
Suppose that a strategy si ∈ Ri is strictly dominated in R by a mixed
strategy from R. Then si is strictly dominated in R by a mixed strategy from R′.
Proof. We shall use the following, easy to establish, two properties of strict dominance by a mixed strategy in a given restriction:
相关文档
最新文档