纳什均衡的存在性定理中的相关解释
纳什均衡

(-8,0)
(-1,-1)
精品课程《运筹学》
第二节 纳什均衡
对囚徒l来说,囚徒2有坦白和不坦白两种选 择,假设囚徒2选择的不坦白,则对囚徒l来说, 不坦白得益为一l,坦白得益为O,应该选择坦 白;假设囚徒2选择的是坦白,则囚徒1不坦白 得益为一8,坦白得益为一5,他更应该选择坦 白。囚徒2唯一的选择也是坦白。 例8.2.2 设某村庄有3个农户,该村有一片大 家都可自由牧羊的公共草地。由于这片草地的 面积有限,草的数量只能让数量有限的羊吃饱, 如果在此草地上放牧的羊的实际数量超
人的策略集为Si Si1,,Sik ,则他以概率分布
pi pi1, pik 随机在其k 个可选策略中选择的
“策略”称为一个混合策略,其中
精品课程《运筹学》
第二节 纳什均衡
O≤ pij≤1对 k
j=1,…, k都成立,且
pij =1。
j 1
由定义可以看出,纯策略也可看作混合策略。
定义8.2.3 如果一个策略 G =S1,S2,Sn;h1,h2,hn中,
S1*
,
S
* i
,
S
* i1
S
* n
的最佳策略,即
hi
(S1*
, S i*1
,
Si*
,
S
* i1
,
S
* n
)
hi (S1*,Si*1, Sij , Si*1,Sn*)
对任意 S ij Si 都成立则称
S1*
,
S
* 2
,
S
* n
为
一个纯策略纳什均衡。
精品课程《运筹学》
第二节 纳什均衡
例8.2.1 “囚徒的困境” 警察抓住了两个罪犯,但 是警察局缺乏足够的证据指证他们所犯的罪行。如果 罪犯中至少有一人供认犯罪,就能确认罪名成立。为 了得到所需的口供,警察将这两名罪犯分别关押以防 止他们串供或结成攻守同盟,并分别跟他们讲清了他 们的处境和面临的选择:如果他们两人都拒不认罪, 则他们会被以较轻的妨碍公务罪各判1年徒刑;如果两 人中有一人坦白认罪,则坦白者立即释放而另一人将 重判8年徒刑;如果两人都坦白认罪,则他们将被各判 5年监禁。
Nash均衡存在性证明

x* = f ( x *) 。
Kakutani’s 不动点定理: X 是 ℜl 空间中非空,紧的凸子集, f : X → X 是一个对应。如
果 f 满足:
(i) 对于所有的 x∈X,集合 f(x)非空且为凸, (ii) f 的图像是闭的,即,如果 xn→x,yn∈f(xn),yn→y,那么 y∈f(x)(或者说对应 f 是上半
di
s
i
,σ
∗ −i
σ
∗ i
si
= di
si ,σ −i * ,
同乘
ui
si
,σ
∗ −i
− ui
σ
∗ i
, 对 si加总
s i ∈Si
( ( ) ( )) ( ) ( ( ) ( )) ( ) ∑ ( ) ∑ ∑ ⎛
⇒⎜
σ
∗ i
si
ui
si
,
σ
∗ −i
− ui
σ
∗ i
⎞ ⎟
di
s
i
,σ
∗ −i
连续的(upper hemi-continuous,uhc)),
那么则存在 x* 使得 x*∈f(x*)。
( ) ( ) 引理 1.1:σ ∗ 是纳什均衡当且仅当 ui
σ∗
≥ ui
si
,
σ
∗ −i
对所有 i 与 si ∈ Si 均成立。
( ) ( ) 证 明 : 当 ui
σ∗
≥ ui
si
,σ
∗ −i
( ) 即存在 s∗ 使得 si∗ ∈ b s−∗i 对所有 i 成立。
纳什均衡理论

纳什均衡理论“纳什均衡”:在经济学中,我们都知道市场是一只看不见的手在配置资源,个人追求利益最大化,构成纳什均衡,但并非能达到整体最优。
市场可以说是在供求关系博弈中实现纳什均衡,众所周知市场仍有一定的缺陷,是否意味着纳什均衡无法达到最优呢?如今,纳什均衡已成为经济学中的新课题。
一、纳什均衡定义纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。
假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的),则此策略组合被称为纳什均衡。
所有局中人策略构成一个策略组合。
从实质上说,纳什均衡是一种非合作博弈状态。
纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。
纳什均衡也不意味着博弈双方达到了一个整体的最优状态,个人最优状态未必达到整体最优。
从经济学角度来看,所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。
换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
以两家公司的价格大战为例,纳什均衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。
于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是纳什均衡。
类似的推理当然也可以用到选举,群体之间的利益冲突,潜在战争爆发前的僵局等。
二、纳什均衡分类纳什均衡可以分成两类:“纯战略纳什均衡”和“混合战略纳什均衡”。
要说明纯战略纳什均衡和混合战略纳什均衡,要先说明纯战略和混合战略。
所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。
特别地是,纯战略决定在任何一种情况下要做的移动。
战略集合是由玩家能够施行的纯战略所组成的集合。
博弈论纳什均衡

博弈论纳什均衡什么是纳什均衡?1、纳什均衡(Nash equilibrium ),又称非合作博弈均衡,是博弈论概念,指的是:一种博弈稳定结果,谁单方改变策略,谁就会损失。
两个囚徒互相揭发,就是一种纳什均衡。
对于每个囚徒来说,如果打破纳什均衡,在对方实施揭发策略时,改变揭发策略,保持沉默,自己就会由判刑2年,变成判刑5年。
也就是说,两个囚徒互相揭发是稳定博弈结果,谁单方改变策略,就会受到损失。
这也就是均衡涵义所在,两个囚徒从利己角度,都不会单方改变策略。
博弈策略稳定,博弈结果也稳定。
之所以命名为纳什均衡,是因为提出者是经济学家、博弈论创始人约翰.纳什。
之所以称为非合作博弈均衡,原因就是:两个囚徒如果合作,互相保持沉默,各自只要坐牢1年;但最终博弈结果,也就是纳什均衡显著特征,是不合作。
2、纳什均衡意义重大。
纳什均衡提出,震动整个经济学界。
诺贝尔经济学奖得主萨缪尔森曾说:“你只要教会鹦鹉说‘需求和供给’,它也是经济学家。
”博弈论专家坎多瑞则说:“这只鹦鹉现在必须多学一个词了,那就是‘纳什均衡’。
”诺贝尔经济学奖得主迈尔森也说:“发现纳什均衡意义,可以和生命科学中发现DNA 双螺旋结构相媲美。
”纳什也因为提出纳什均衡,创立博弈论,而获得1994年诺贝尔经济学家奖。
纳值均衡意义重大,简单来说,就是它对于经济学具有重大意义。
读友们如果了解经济学看不见的手原理,就知道,古典经济学认为,通过市场这只‘看不见的手’调节,个体追求私利行为,会促进集体利益最大化。
但纳什均衡却违反上述原理:两个囚徒分别追求私利行为,并没有促进集体(囚徒整体)利益最大化,反而是损人不利己。
这正是市场失灵软肋之处,通过博弈论视角可以得到合乎逻辑解释,更有条件找到合适解决方案。
从上述这点,读友们可以“一斑窥全豹”,感受到博弈论重要性。
更重要的是,纳什均衡非常普遍,小至个人沟通,中到公司竞争,大到国家往来,都可以观察到。
Q2:怎样运用纳什均衡?1、分析囚徒困境。
纳什均衡解释

纳什均衡解释纳什均衡解释是20世纪最经典的经济理论之一,被称为“经济学家荣誉柱”。
该理论源于美国经济学家纳什(John F. Nash Jr.)1950年提出的“均衡等式纳什均衡”理论。
根据这一理论,当玩家之间的利益冲突变得越来越激烈时,他们为了获得更多的利益而不断修改解决方案,直到达到均衡,这就是“纳什均衡”,也就是政治、经济学和公共政策分析中用于分析博弈类任务的核心思想。
“纳什均衡”理论涉及到一个两人游戏,玩家之间会根据收益最大化或收益最小化来决定选择的行为方式,最终的结果就是“均衡”,也就是说这两个玩家可以不断改变自身的收益,最终形成某种“均衡状态”。
纳什均衡的本质是,当双方都能选择的行动受到约束时,两个玩家所选择的行动必须是双方收益最大化的行动,或者也可以说是收益最优化的行动,这就是经济学家所说的“纳什均衡”。
纳什均衡解释了现实社会中各个方面,从经济学到行为经济学,具有极其重要的理论价值。
例如,在经济学中,纳什均衡理论可以用来解释价格形成以及市场供求关系;在政治学中,经济学家可以借助纳什均衡理论来研究国家之间的博弈关系和利益冲突;而在行为经济学中,纳什均衡理论也可以用来解释个人行为模式,包括玩家的信息处理、判断和选择行为等。
此外,纳什均衡还有助于社会决策者和管理者来识别某种决策面临的均衡点,从而采取合理的行动,改进政府决策模式,减少社会问题并营造有利于社会发展的良好氛围。
例如,在政治斗争中,在政府正确识别纳什均衡点的前提之下,对于某些利益集团的处理更加客观公正,从而解决利益冲突并促进公平正义。
综上所述,纳什均衡是一个十分重要的理论,它已经成为经济学和行为经济学中一项重要的核心理论,并且在政治、经济学和公共政策分析中有着重要的作用。
研究人员和决策者应借助纳什均衡理论来识别面临决策的均衡点,从而能够采取更准确、更务实的措施,促进社会和谐稳定发展,促进公平正义。
每日一词:纳什均衡

每日一词:纳什均衡1、术语解释️纳什均衡Nash Equilibrium,是指非合作博弈中,所有的博弈当事人都维持自己的支配性策略的均衡状态。
值得说明的是,支配性策略是参与方各自的最优策略,但不一定是总体的最佳策略。
相关概念解释:合作博弈cooperative game:博弈双方达成一致意见,双方基于互相信任的前提下,按照事先约定的策略来做决策。
非合作博弈non-cooperative game:只考虑自己的利益,而不和别人串谋的情况下进行博弈。
支配性策略dominant strategy:对任何一个博弈参与方,无论对手方采取什么策略,自己都维持不变的策略。
支配性策略是参与方的占优策略。
(如备考,不管科目难易,都得认真学习,认真学习就是考生的支配性策略)纳什均衡的几个注意点:•是非合作博弈,不允许串谋。
•博弈当事人都是理性人。
•博弈各方是同时出招的。
•不是任何博弈都会产生纳什均衡的。
2、知识扩展纳什均衡的应用:囚徒困境Prisoners' Dilemma假设情景:AB都是小偷,被警察逮住了,逮住以后要判罪,但警察也没有其他证据。
警察就把AB分别关在两个小黑屋里,按下表所示逐个进行审问,然后根据两个人的招供结果来判罪。
警察是这么审问的:先去A那边问,你到底招不招,可以招可以不招,但是要想清楚后果。
如果你沉默,你兄弟也保持沉默,那关个半年就把你们放了。
如果你沉默,你兄弟坦白了,那你兄弟会立即释放,而你会被关10年。
如果你坦白,你兄弟保持沉默,你会被立即释放,而你兄弟会被关10年。
如果你坦白,你兄弟也坦白了,那就各关你们2年。
然后警察去了B那边,和B讲了同样的话。
然后警察暂时撤离,留他们自己思考。
A心里会嘀咕:B无非就两种选择,要么坦白,要么沉默。
B沉默时:如果我也沉默,我会被关半年,如果我坦白,我不会关。
所以我还是坦白好;B坦白时:如果我也坦白,会被关两年,如果我沉默,会被关10年。
所以我还是坦白好。
纳什均衡

纳什均衡在政治学中的应用
选举策略:候选人在竞选活动中的决策和策略选择 政治谈判:国家间在谈判过程中的策略选择和利益平衡 国际关系:国家间在合作与竞争中的决策和策略选择 政治制度设计:政治制度设计中的决策和策略选择,如选举制度、议会制度等
纳什均衡在管理学中的应用
战略决策:企业在市场竞争中,通过纳什均衡分析,制定最优策略。 组织结构:纳什均衡理论可以帮助企业优化组织结构,提高管理效率。 激励机制:纳什均衡理论在企业激励机制设计中,可以指导企业制定有效的激励措施。 谈判与合作:纳什均衡理论在企业谈判与合作中,可以帮助企业实现利益最大化。
纳什均衡的应用
博弈论:纳什均衡是博弈论的核心概念,用于分析各种博弈问题 经济学:纳什均衡在经济学中广泛应用,如市场均衡、价格均衡等 政治学:纳什均衡在政治学中用于分析政治博弈,如选举、谈判等 社会学:纳什均衡在社会学中用于分析社会现象,如群体行为、社会规范等
纳什均衡的求解方法
第二章
纳什均衡的求解条件
纳什均衡
目录
CONTENTS
01 纳什均衡的概念 02 纳什均衡的求解方法 03 纳什均衡与博弈论 04 纳什均衡的局限性
05 纳什均衡纳什均衡的定义
纳什均衡是指在 一个博弈中,每 个参与者的策略 都是对其他参与 者策略的最优反 应。
纳什均衡是博弈 论中的一个重要 概念,由约翰·纳 什提出。
纳什均衡的求解步骤
确定博弈的 参与者和策 略集
建立支付矩 阵,表示参 与者在不同 策略下的收 益
计算每个参 与者的最佳 反应策略
检查是否存 在纳什均衡, 即每个参与 者的策略都 是对其他参 与者策略的 最佳反应
如果存在纳 什均衡,则 求解得到均 衡策略;如 果不存在, 则重新调整 策略集或支 付矩阵,重 复步骤3-4。
2. Nash均衡存在性

School of Management, USTC
—4—
扩展知识点:Hessian矩阵 vs Jacobian矩阵
海赛(Hessian)矩阵 针对的函数类型 元素构成 元素形式 矩阵维度 说明 f(x)的梯度为
f ( x) f ( x) f ( x ) f , , , x2 xn x1
类似一元函数的导数 在给定点处得到对可微函数的最 优线性估计(切线)。
School of Management, USTC
—5—
不动点定理(Fixed Point Theorems)
Brouwer不动点定理:
设C是Rn中的非空紧凸子集,函数f: C→C连续,则必存在x∈C,使 x=f(x)。该点称为不动点(fixed point)。
a
f(λa+(1-λ)b)
λa+(1-λ)b
b
拟凸函数(quasi-convex function):
实值函数f(.)是拟凸的 iif 函数f(.)的定义域C为凸集 且∀a, b∈C和∀λ∈[0, 1],均有 f(λa+(1-λ)b)≤max{f(a), f(b)} 改为<则为严格拟凸,改为≥即为拟凹函数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
纳什均衡的存在性定理中的相关解释
教材(《经济博弈与应用》)p33,图2.1表明不动点是曲线()⋅f 与45o 线的交点。
当函数()x f 定义在[]1,0∈x 区间上且因变量()x f y =的值域也为[]1,0区间时,如果()x f 是连续的,则必然存在不动点。
图2.1 [0,1]区间上的自变换函数的不动点
直接用来证明纳什存在性定理的不动点定理不是Brouwer 不动点定理,而是角谷静夫(Kakutani)不动点定理。
定义1 S 是凸的(Convex)当且仅当对任意的M M R y R x ∈∈,及满足10≤≤λ的λ,只要S x ∈和S y ∈,则有
()S y x ∈-+λλ1
定义2 S 是闭的(Closed)当且仅当对每个收敛的序列()}{∞=1
j j x ,如果对每个j 都有()S j x ∈,则有
()S j x j ∈∞→lim 定义3 R M 中的子集S 是开的(open)当且仅当它的补集R M /S 是闭的。
定义4 S 是有界的(bounded)当且仅当存在某个正数K 使得对S 中的每个元素x 都有
∑∈≤M
m m K x
定义5 当函数()x f 满足下述性质时,我们称其为凹的:
()()()()()[]n R x x x f x f x x f ∈∈-+≥-+212121, 1,0,11λλλλλ
x )(x f x 1
如果当()1,0∈λ时上面的不等式严格成立,则称()x f 为严格凹的。
一个函数()x f 是凸的当且仅当函数-()x f 是凹的;()x f 为严格凸函数当且仅当-()x f 为严格凹函数。
拟凹函数是凹函数概念的一种推广,它包括了凹函数在内的一大类函数,而这类函数在经济学中有着广泛应用,关于拟凹函数的定义如下:
定义6 函数()x f 定义在R n 中的子集D 上,当且仅当()x f 满足如下性质时,()x f 是拟凹的:
()()()()()2121,m in 1x f x f x x f ≥-+λλ ∈λ[0,1]
显然,凹函数是拟凹的,但反过来并不成立,即拟凹函数不一定是凹函数。
在下图中,函数()x f 是拟凹的,但不是凹的。
图 不是凹函数的拟凹函数
x 1 y 0 x 2 x ()
x f。