2.2求解分钱博弈的纳什均衡
博弈论-纳什均衡(非合作博弈均衡)

完全理性:理性指一种行为方式,它适合实现指定目标,而且在给定条件和约束的限度之内。
在不同的学科领域,理性所涵盖的内容存在着差异完全理性的内涵具有完全理性的行为人是个无所不知的超人,他具有纵向和横向方面完备的知识。
在纵向方面,他可以预测未来;在横向方面,他通晓资源、交易伙伴和环境等情况。
具体而言,行为人的完全理性包括以下隐含内容。
(1)不存在不确定性,即使存在不确定性,也可以预知不确定性的概率分布。
也就是说,对于具有完全理性的行为人来说,一切信息都是确定的。
(2)行为人具有可以确定的效用函数(消费者的效用函数和厂商的利润函数可以统称为效用函数),同时行为人具有同质性以及一致性的偏好体系。
(3)选择结果具有描述不变性、程序不变性和前后关系独立性。
描述不变性要求行为人选择的先后顺序不应依赖于所描述或显示的选项,也就是说如果行为人经过再三思考,将两种描述视为同一问题的同义表达,那么它们必定导致相同的选择——即这种思考不存在异处;程序不变性要求不同方式的等价学说揭露相同的偏好次序;前后关系独立性指一项选择与其他替代方案互为独立的原则,它要求在给定Z而不提供有关X或Y 的新的信息的情况下,X与Y的优先权顺序不应该依赖于Z是否有效。
(4)行为人具备完备的计算和推理能力,可以像计算机一样在数秒内从事无穷尽的计算步骤,同时也不存在感性因素对选择的干扰。
(5)选择意味着在各种方案或选择集中进行比较和挑选,因此完全理性的行为人可以设计出所有的被选方案,以及各项方案所产生的全部后果。
(6)一个确定的报酬函数,即行为人可以确定地赋予每项行动结果一个具体的量化价值或效用。
(7)确定性的结果,也就是行为人町以实现效用最大化或最优目标(消费者效用最大化和企业利润最大化)。
在上述条件下,建立在完全理性假设的基础上的主流经济学的方法论,即行为人的选择或决策意味着在资源约束的条件下实现效用最大化或利润最大化。
行为人在选择过程中,可以遵循确定性原则、极大极小法则、边际原理以及概率法则(也就是主观期望原则)。
纳什均衡

纳什均衡简介纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。
如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。
一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。
纳什均衡的得来关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在普林斯顿大学攻读博士学位时完成的。
实际上,博弈论的研究起始于1944年冯·诺依曼(Von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈论和经济行为》。
然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。
阿尔伯特·塔克(Alberttucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。
它发展了本身很有意义的n人有限非合作博弈的概念和性质。
并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。
在概念和方法两方面,该论文都是作者的独立创造。
”纳什均衡例子博弈论中一个著名的例子就是囚徒困境。
囚徒困境是一个非零和博弈,说的是两个嫌疑犯甲和乙私人民宅联手作案,被警方逮住但未获证据。
警方于是将两个嫌疑犯分开审讯。
警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑3个月,对方将被判刑10年;若两人都不招供则因未获证据但私人民宅将各拘留1年;如果两人均招供,每人将被判刑5年。
博弈论和纳什均衡

博弈论和纳什均衡引言博弈论是一门研究决策制定者之间相互作用的学科。
纳什均衡是博弈论中的一个重要概念,表示在每个决策制定者根据自己的利益进行选择的情况下,不存在个体可以通过单独改变自己的策略来进一步获益的状态。
本文将介绍博弈论的基本概念和纳什均衡的理论,并探讨其在现实生活中的应用。
博弈论基本概念博弈论研究的对象是决策制定者之间的相互作用,其中包括两个或更多个决策制定者,每个决策制定者可以选择不同的策略。
博弈论的基本元素包括玩家、策略和收益。
玩家是决策制定者的角色,策略是玩家在每个决策点上可以采取的行动,收益是每个玩家在不同策略组合下所获得的利益。
博弈论中常见的博弈形式包括合作博弈和非合作博弈。
在合作博弈中,玩家之间可以进行合作并达成协议,而在非合作博弈中,玩家之间相互独立且没有协作的能力。
纳什均衡的概念纳什均衡是博弈论中的一个重要概念,由诺贝尔经济学奖得主约翰·纳什提出。
纳什均衡指的是在每个决策制定者根据自己的利益进行选择的情况下,不存在个体可以通过单独改变自己的策略来进一步获益的状态。
具体来说,在一个博弈中,如果每个玩家选择了一个策略组合,且任何一个玩家单独改变自己的策略都无法提高自己的收益,那么这个策略组合就是一个纳什均衡。
纳什均衡可以通过数学方法进行计算,其中最常用的方法是利用最优响应函数。
最优响应函数指的是一个玩家在其他玩家的策略给定时,可以最大化自己的收益的策略选择。
纳什均衡的特性纳什均衡具有以下几个重要的特性:1.独立于个体的理性决策:纳什均衡的形成不依赖于玩家之间的协商或合作,而是由每个玩家根据自己的利益进行独立的决策而达成的。
2.稳定性:在纳什均衡中,每个玩家都在最优响应下选择策略,没有动机或能力单独改变自己的策略来获得更好的结果。
这种稳定性使得纳什均衡成为一种理想的博弈状态。
3.不一定最优:纳什均衡并非一定是博弈的最优结果,即每个玩家获得的收益并不一定是最大化的。
纳什均衡是一种均衡状态,每个玩家在给定其他玩家的策略下无法获得更多的收益。
博弈中的黑马——纳什均衡

博弈中的黑马——纳什均衡博弈中的黑马——纳什均衡在《童区寄传》的故事中,牧童区寄假装软弱,扮猪吃象,杀死一名强盗,又以做一个人奴仆的美好前景打消了第二名强盗试图杀死自己的意图,保全了自己,再利用强盗睡觉之际,杀死对方。
这其中的情节一波三折,惊心动魄。
对于这场对垒,我们称之为博弈,区寄的策略称之为博弈策略。
那么,什么是博弈,博弈的核心概念又是什么?掌握点博弈知识对我们有些什么裨益呢?博弈是个外来词,在英文中用game来表示,如果直译的话,博弈就是游戏。
但东方的游戏和西方的game还是有较大差别的。
我们所理解的游戏中是一种纯粹的娱乐,而在英文中的game 的含义,却是指这种游戏是在一定规则之下的活动,而目的是要自己赢。
所以,如果直接把“博弈”理解为东方的“游戏”,显然玩的味道太浓,很容易让人把它当作小孩子“玩家家”一类不登大雅之堂的小儿科,会让这门学科失去严肃性。
于是,我们把西方的“博弈”翻译成game theory。
这样,博弈又称为“博弈论”,就使得博弈有了理论的色彩和意味。
博弈或者博弈论的准确定义应该是:一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。
由于博弈的内容和方式是不一样的,我们可以从不同角度对博弈进行分类:一是分为合作博弈与非合作博弈。
如果各博弈方能达成某种有约束力的契约或默契,以选择共同的策略,此种博弈就是合作博弈。
反之,就属于非合作博弈。
博弈论和纳什均衡

(记为:Q=a-bP),并且A、B两个厂商都准确地了解市 场的需求曲线(完全信息)。 5. A、B两个厂商各自再作出决策时都假定另一个厂商的行 为是既定不变的。厂商都是在已知对方产量的情况下, 各自确定能够给自己带来最大利润的产量。即每一个产 商都是消极地以自己的产量去适应对方已确定的产量。 6. 两个厂商同时决策,无行动的先后差别。
博弈论和纳什均衡
.
1
博弈无处不在
2
三国中的博弈——联吴抗魏
诸葛亮在《隆中对》中提出“跨有 荆益、东有孙权、北图中原”,他 舌战群儒,力劝东吴孙权与刘备联 盟。
3
三国中的博弈—华容道
火烧赤壁一战,孙刘联军大败曹操,曹操北 逃。诸葛亮明知关羽重义气,必然放走曹操, 为何还将捉曹重任交给关羽? 结论:诸葛亮并不想杀掉曹操——曹操一死,刘备亦亡矣!
11
案例扩展—性别大战
“性别战”:一对恋人有两种选择,或去看足球 比赛,或去看芭蕾舞。男方偏好足球,女方偏好 芭蕾,但他们宁愿在一起,不愿分开。
12
在这个博弈中,如果双方同时决定,则有两个纳 什均衡,即都去看足球比赛或者都去看芭蕾演出。 但是到底最后他们去看足球比赛还是去看芭蕾演 出,并不能从中获得结论。
* i
的最好的策略。
纳什均衡的定义
定义2.1 设 G N,S1,,Sn , u1,, un 为一具有完全信息的策略型博弈模型,称
策略组合s*
(s
* i
,
s
* i
),
s
* i
S i ,
s
*
i
S
\ Si
为G的一个纳什均衡。如果对
纳什均衡——博弈论的基础

纳什均衡——博弈论的基础下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。
文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by the editor. I hope that after you download them, they can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!In addition, our shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts, other materials and so on, want to know different data formats and writing methods, please pay attention!纳什均衡——博弈论的基础引言博弈论作为一门交叉学科,融合了数学、经济学、政治学等多个领域的知识,旨在研究决策者在相互影响下的最佳策略选择。
纳什均衡求解方法

纳什均衡求解方法
纳什均衡是博弈论中的一个重要概念,主要用于描述多个参与者选择一个策略后,达到一种相互协调的状态。
通常来说,纳什均衡被认为是一种不可协调的状态,因为所有参与者都没有动机改变自己的策略。
求解纳什均衡可以利用以下方法:
1. 策略消元法:这是一种非常基本的求解方法,适用于简单的博弈模型。
该方法的核心思想是根据参与者的策略做出相应的推理,将局面简化为更容易分析的形式。
最终得到的一个或多个均衡状态就是纳什均衡。
2. 迭代删除劣势策略法:该方法适用于有限的博弈模型,可以通过迭代删除每个参与者的劣势策略逐步缩小均衡的可能性。
最终会得出一个或多个纳什均衡状态。
3. 前瞻解法:该方法主要适用于完全信息博弈,通过加权平均和后验概率的计算方法,可求解出参与者的最佳策略组合。
最终的最优解就是纳什均衡。
需要注意的是,纳什均衡的求解并不总是存在,并且可能存在多个均衡状态。
而一旦找到了均衡状态,参与者就不会再改变策略,因为任何人的单方面行动都可能导致良性均衡的破裂。
(完整版)博弈中纯策略纳什均衡点

《博弈论及其应用》 (汪贤裕) 9
完全信息静态博弈三要素
完全信息静态博弈就是在上述三要素的基础上,分 析各局中人为实现自身利益最大化的策略行为分析。
简记为: G [N ,{Si },{Pi }]
《博弈论及其应用》 (汪贤裕) 10
§2.1.2 占优均衡
(s
||
s
(i h
)
)
(2.1.1)
i 则称,局中人 的策略 sk(i) 严格占优策略 sh(i),或称策略 sh(i)相
对于sk(i)是严格劣策略。
《囚徒困境》中、犯罪嫌疑人A和B策略(承认)就是一个严
格占优策略。
《博弈论及其应用》 (汪贤裕) 12
定义2.1.2 占优均衡
在博弈G [N,{Si},{Pi}]中,若每一个局中人 i
定理2.2.1
在n 人非合作博弈 G [N ,{Si },{Pi }] 中:
若, s
都存在一个策略
s
' i
Si
, (i
N
)
,使得
si'占优于
Si \ {si' }
中任何策略,那么策略组合
s'
(
s1'
,
s
' 2
,
sn' )
称为 G 的占优策略均衡,简称占优均衡。对应的
{Pi (s') | i N} 称为占优均衡结果。
《博弈论及其应用》 (汪贤裕) 13
定义2.1.2 占优均衡(续)
《博弈论及其应用》 (汪贤裕) 17
§2.2.1 纯策略纳什均衡
定义2.2.1 纯策略纳什均衡点和均衡结果 定理2.2.1 重复剔除占优均衡与纯策略纳什均衡 ※ 纳什均衡点与多目标规划求解比较