博弈论与纳什均衡

合集下载

博弈论的主要均衡概念及其比较

博弈论的主要均衡概念及其比较

博弈论的主要均衡概念及其比较
均衡概念是博弈论的核心概念,它指的是一种状态,在这种状态下,双方玩家的策略都是最优的,没有一方可以通过改变自己的策略而获得更好的结果。

主要的均衡概念有:
1、纳什均衡:纳什均衡是博弈论中最重要的均衡概念,它是由美国经济学家纳什提出的,它是指当双方玩家的策略都是最优的,没有一方可以通过改变自己的策略而获得更好的结果,即每个玩家都没有动力改变自己的策略。

2、Nash-Subgame均衡:Nash-Subgame均衡是由美国经济学家纳什提出的,它是指在一个博弈中,每个玩家都有一个最优的策略,这种策略可以使每个玩家获得最大的利益,且每个玩家都不会改变自己的策略,从而使得博弈的结果是一个稳定的状态。

3、博弈树均衡:博弈树均衡是由美国经济学家John Nash提出的,它是指在博弈树中,每个玩家都有一个最优的策略,这种策略可以使每个玩家获得最大的利益,且每个玩家都不会改变自己的策略,从而使得博弈的结果是一个稳定的状态。

纳什均衡和Nash-Subgame均衡是两种最重要的均衡概念,它们都是基于每个玩家都有一个最优的策略,而博弈树均衡则是基于博弈树模型的均衡概念。

它们之间的区别在于,纳什均衡和Nash-Subgame均衡是针对一般情况的均衡概念,而博弈树均衡是针对博弈树模型的均衡概念。

博弈论和纳什均衡

博弈论和纳什均衡

博弈论和纳什均衡博弈论是一门研究决策者在特定情境下进行策略选择的学科,它主要研究个体或团体之间的冲突与合作关系,并提供一种分析和解决这些问题的方法。

在博弈论中,纳什均衡是一个非常重要的概念,它被广泛应用于社会科学、经济学、政治学、生物学等领域。

一、博弈论的基本概念1. 博弈博弈是指在特定情境下,两个或多个决策者进行策略选择的过程。

每个决策者都有自己的目标和利益,他们通过选择不同的策略来达到自己的目标。

2. 策略策略是指在博弈中每个决策者可以采取的行动方案。

每个决策者根据自己的利益和目标选择最优的行动方案。

3. 支配策略支配策略是指在某种情况下,一个决策者采取某种行动方案时,其他所有决策者都会采取同样的行动方案。

这种情况下,该行动方案被称为支配策略。

4. 纳什均衡纳什均衡是指在博弈中,每个决策者都采取最优的策略,且没有任何一方可以通过改变自己的策略来获得更多的利益。

在纳什均衡下,每个决策者都做出了最优的选择,整个博弈过程达到了一个稳定状态。

二、纳什均衡的应用1. 社会科学在社会科学领域中,纳什均衡被广泛应用于研究人类行为和社会现象。

例如,在政治学中,研究政治家之间的竞争和合作关系时可以使用博弈论模型,并通过计算纳什均衡来预测政治家们可能采取的行动。

2. 经济学在经济学领域中,博弈论和纳什均衡被广泛应用于市场竞争分析、价格战、拍卖等问题。

例如,在拍卖中,参与者可以根据自己的信息和目标选择不同的出价策略。

通过计算纳什均衡,可以预测最终获胜者以及他所支付的价格。

3. 生物学在生物学领域中,博弈论和纳什均衡被用于研究动物之间的竞争和合作关系。

例如,在动物群体中,个体之间会存在资源的竞争和合作,通过使用博弈论模型并计算纳什均衡,可以预测不同类型的动物在不同情境下采取的行动。

三、纳什均衡的局限性虽然纳什均衡在博弈论中被广泛应用,并且在很多情况下能够提供准确的预测结果,但是它也存在一些局限性。

1. 纳什均衡不一定是唯一的在某些情况下,博弈模型可能存在多个纳什均衡。

盘点博弈论纳什均衡囚徒困境零和博弈智猪博弈

盘点博弈论纳什均衡囚徒困境零和博弈智猪博弈

盘点博弈论&纳什均衡&囚徒困境&零和博弈&智猪博弈1.博弈论是什么博弈论(game theory),又译为对策论,或者赛局理论,经济学的一个分支,1944年冯·诺伊曼与奥斯卡·摩根斯特恩合著《博弈论与经济行为》,标志着现代系统博弈理论的的初步形成,因此他被称为“博弈论之父”。

博弈论被认为是20世纪经济学最伟大的成果之一。

目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

主要研究公式化了的激励结构(游戏或者博弈)间的相互作用。

是研究具有斗争或竞争性质现象的数学理论和方法。

也是运筹学的一个重要学科。

具有竞争或对抗性质的行为称为博弈行为。

在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。

为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。

比如日常生活中的下棋,打牌等。

博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。

2.纳什均衡(Nash equilibrium)3.囚徒困境(Prisoner’s Dilemma)纳什平衡的经典例子就是囚徒困境。

囚徒困境(Prisoner’s Dilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。

或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。

虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

1950年,由就职于兰德公司的梅里尔·弗勒德和梅尔文·德雷希尔拟定出相关困境的理论,后来由顾问艾伯特·塔克以囚徒方式阐述,并命名为“囚徒困境”。

经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。

于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

博弈论和纳什均衡

博弈论和纳什均衡

博弈论和纳什均衡引言博弈论是一门研究决策制定者之间相互作用的学科。

纳什均衡是博弈论中的一个重要概念,表示在每个决策制定者根据自己的利益进行选择的情况下,不存在个体可以通过单独改变自己的策略来进一步获益的状态。

本文将介绍博弈论的基本概念和纳什均衡的理论,并探讨其在现实生活中的应用。

博弈论基本概念博弈论研究的对象是决策制定者之间的相互作用,其中包括两个或更多个决策制定者,每个决策制定者可以选择不同的策略。

博弈论的基本元素包括玩家、策略和收益。

玩家是决策制定者的角色,策略是玩家在每个决策点上可以采取的行动,收益是每个玩家在不同策略组合下所获得的利益。

博弈论中常见的博弈形式包括合作博弈和非合作博弈。

在合作博弈中,玩家之间可以进行合作并达成协议,而在非合作博弈中,玩家之间相互独立且没有协作的能力。

纳什均衡的概念纳什均衡是博弈论中的一个重要概念,由诺贝尔经济学奖得主约翰·纳什提出。

纳什均衡指的是在每个决策制定者根据自己的利益进行选择的情况下,不存在个体可以通过单独改变自己的策略来进一步获益的状态。

具体来说,在一个博弈中,如果每个玩家选择了一个策略组合,且任何一个玩家单独改变自己的策略都无法提高自己的收益,那么这个策略组合就是一个纳什均衡。

纳什均衡可以通过数学方法进行计算,其中最常用的方法是利用最优响应函数。

最优响应函数指的是一个玩家在其他玩家的策略给定时,可以最大化自己的收益的策略选择。

纳什均衡的特性纳什均衡具有以下几个重要的特性:1.独立于个体的理性决策:纳什均衡的形成不依赖于玩家之间的协商或合作,而是由每个玩家根据自己的利益进行独立的决策而达成的。

2.稳定性:在纳什均衡中,每个玩家都在最优响应下选择策略,没有动机或能力单独改变自己的策略来获得更好的结果。

这种稳定性使得纳什均衡成为一种理想的博弈状态。

3.不一定最优:纳什均衡并非一定是博弈的最优结果,即每个玩家获得的收益并不一定是最大化的。

纳什均衡是一种均衡状态,每个玩家在给定其他玩家的策略下无法获得更多的收益。

博弈论与纳什平衡

博弈论与纳什平衡

博弈论与纳什平衡博弈论(game theory)对人的基本假定是:人是理性的(rational,或者说自私的),理性的人是指他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。

纳什(John Nash)编制的博弈论经典故事"囚徒的困境",说明了非合作博弈及其均衡解的成立,故称"纳什平衡"。

所有的博弈问题都会遇到三个要素。

在囚徒的故事中,两个囚徒是当事人(players)又称参与者;当事人所做的选择策略(strategies)是承认了杀人事实,最后两个人均赢得(payoffs)了中间的宣判结果。

如果两个囚徒之中有一个承认杀人,另外一个抵赖,不承认杀人,那么承认者将会得到减刑处理,而抵赖者将会得到最严厉的死刑判决,在纳什故事中两个人都承认了犯罪事实,所以两个囚徒得到的是中间的结果。

类似的:我们也能从“自私的基因”等理论中看到“纳什平衡”的体现。

在互联网这个原始丛林中:最优策略是如何产生的呢?一、博弈中最优策略的产生艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。

也就是说,个人可以完全按照自己利益最大化的企图进行决策。

在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。

社会实践中有很多合作的问题。

比如国家之间的关税报复,对他国产品提高关税有利于保护本国的经济,但是国家之间互提关税,产品价格就提高了,丧失了竞争力,损害了国际贸易的互补优势。

在对策中,由于双方各自追求自己利益的最大化,导致了群体利益的损害。

对策论以著名的囚犯困境来描述这个问题。

A和B各表示一个人,他们的选择是完全无差异的。

选择C代表合作,选择D代表不合作。

如果AB都选择C合作,则两人各得3分;如果一方选C,一方选D,则选C的得零分,选D的得5分;如果AB都选D,双方各得1分。

博弈论纳什均衡

博弈论纳什均衡

博弈论纳什均衡什么是纳什均衡?1、纳什均衡(Nash equilibrium ),又称非合作博弈均衡,是博弈论概念,指的是:一种博弈稳定结果,谁单方改变策略,谁就会损失。

两个囚徒互相揭发,就是一种纳什均衡。

对于每个囚徒来说,如果打破纳什均衡,在对方实施揭发策略时,改变揭发策略,保持沉默,自己就会由判刑2年,变成判刑5年。

也就是说,两个囚徒互相揭发是稳定博弈结果,谁单方改变策略,就会受到损失。

这也就是均衡涵义所在,两个囚徒从利己角度,都不会单方改变策略。

博弈策略稳定,博弈结果也稳定。

之所以命名为纳什均衡,是因为提出者是经济学家、博弈论创始人约翰.纳什。

之所以称为非合作博弈均衡,原因就是:两个囚徒如果合作,互相保持沉默,各自只要坐牢1年;但最终博弈结果,也就是纳什均衡显著特征,是不合作。

2、纳什均衡意义重大。

纳什均衡提出,震动整个经济学界。

诺贝尔经济学奖得主萨缪尔森曾说:“你只要教会鹦鹉说‘需求和供给’,它也是经济学家。

”博弈论专家坎多瑞则说:“这只鹦鹉现在必须多学一个词了,那就是‘纳什均衡’。

”诺贝尔经济学奖得主迈尔森也说:“发现纳什均衡意义,可以和生命科学中发现DNA 双螺旋结构相媲美。

”纳什也因为提出纳什均衡,创立博弈论,而获得1994年诺贝尔经济学家奖。

纳值均衡意义重大,简单来说,就是它对于经济学具有重大意义。

读友们如果了解经济学看不见的手原理,就知道,古典经济学认为,通过市场这只‘看不见的手’调节,个体追求私利行为,会促进集体利益最大化。

但纳什均衡却违反上述原理:两个囚徒分别追求私利行为,并没有促进集体(囚徒整体)利益最大化,反而是损人不利己。

这正是市场失灵软肋之处,通过博弈论视角可以得到合乎逻辑解释,更有条件找到合适解决方案。

从上述这点,读友们可以“一斑窥全豹”,感受到博弈论重要性。

更重要的是,纳什均衡非常普遍,小至个人沟通,中到公司竞争,大到国家往来,都可以观察到。

Q2:怎样运用纳什均衡?1、分析囚徒困境。

博弈论-混合策略纳什均衡

博弈论-混合策略纳什均衡
,以达到均衡状态。
政治学的案例分析
总结词:国际关系
详细描述:在国际关系中,混合策略纳什均衡可以用来解释 国家之间的竞争和合作。例如,两个国家可能会以一定的概 率选择不同的外交政策,例如结盟、中立或对抗,以达到各 自的利益最大化。
生物学的案例分析
总结词
捕食者-猎物博弈
详细描述
在生物学中,混合策略纳什均衡可以用来解释捕食者与猎物之间的博弈。例如,捕食者 可能会采用追逐和放弃两种策略来捕猎猎物,而猎物也可能会采用逃跑和装死两种策略 来避免被捕食。最终,捕食者和猎物都以一定的概率随机选择不同的策略,以达到均衡
非合作博弈论
研究个体如何在不知道其 他个体如何行动的情况下 做出最优决策。
博弈论的基本概念
参与者
参与博弈的决策主体, 可以是个人、组织或国
家。
行动
参与者根据给定的信息 所做出的决策。
信息
参与者在进行决策时所 拥有的数据、情报或知
识。
策略
参与者为达到最优结果 而采取的一系列行动的
方案。
博弈论的应用场景
状态。
生物学的案例分析
总结词:繁殖竞争
VS
详细描述:在生物种群中,不同个体 之间会存在繁殖竞争。为了最大化自 己的遗传贡献,个体可能会采用不同 的交配策略,例如追求高繁殖成功率 的策略或避免过度竞争的策略。混合 策略纳什均衡可以用来描述这种竞争 状态下的交配行为。
THANKS FOR WATCHING
繁殖博弈
在繁殖博弈中,生物个体通过选择不同的繁殖和竞争策略来繁衍后代。混合策略纳什均衡可以用来分 析繁殖过程的均衡结果,解释生物多样性的形成机制。
05 混合策略纳什均衡的案例 分析
经济学的案例分析

博弈论和纳什均衡

博弈论和纳什均衡
相同,边际成本MC为常数)。 4. 两个厂商面临共同的市场的线性需求曲线
(记为:Q=a-bP),并且A、B两个厂商都准确地了解市 场的需求曲线(完全信息)。 5. A、B两个厂商各自再作出决策时都假定另一个厂商的行 为是既定不变的。厂商都是在已知对方产量的情况下, 各自确定能够给自己带来最大利润的产量。即每一个产 商都是消极地以自己的产量去适应对方已确定的产量。 6. 两个厂商同时决策,无行动的先后差别。
博弈论和纳什均衡
.
1
博弈无处不在
2
三国中的博弈——联吴抗魏
诸葛亮在《隆中对》中提出“跨有 荆益、东有孙权、北图中原”,他 舌战群儒,力劝东吴孙权与刘备联 盟。
3
三国中的博弈—华容道
火烧赤壁一战,孙刘联军大败曹操,曹操北 逃。诸葛亮明知关羽重义气,必然放走曹操, 为何还将捉曹重任交给关羽? 结论:诸葛亮并不想杀掉曹操——曹操一死,刘备亦亡矣!
11
案例扩展—性别大战
“性别战”:一对恋人有两种选择,或去看足球 比赛,或去看芭蕾舞。男方偏好足球,女方偏好 芭蕾,但他们宁愿在一起,不愿分开。
12
在这个博弈中,如果双方同时决定,则有两个纳 什均衡,即都去看足球比赛或者都去看芭蕾演出。 但是到底最后他们去看足球比赛还是去看芭蕾演 出,并不能从中获得结论。
* i
的最好的策略。
纳什均衡的定义
定义2.1 设 G N,S1,,Sn , u1,, un 为一具有完全信息的策略型博弈模型,称
策略组合s*
(s
* i
,
s
* i
),
s
* i
S i ,
s
*
i
S
\ Si
为G的一个纳什均衡。如果对
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第22卷哈尔滨师范大学自然科学学报Vol .22,No .42006第4期NAT URAL SC I E NCES JOURNAL OF HARB I N NOR MAL UN I V ERSI TY博弈论与纳什均衡郭 鹏(中国矿业大学)杨晓琴(鸡西大学)【摘要】 纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础.关键词:博弈论;纳什均衡;非合作博弈收稿日期:2006-02-150 引言博弈论又称对策论,是使用严谨的数学模型研究现实世界中冲突对抗条件下最优决策问题的理论.两千多年前,孙膑利用博弈论原理帮助田忌赛马取胜,就是早期博弈论的萌芽.作为一门正式学科,博弈论是在20世纪40年代形成并发展起来的,合作型博弈在20世纪50年代达到了巅峰期.然而,它过于抽象,实用性不强,其局限性日益暴露出来.50年代以来,纳什(Nash )、泽尔腾(Selten )、海萨尼(Harsanyi )等人使博弈论成熟并最终进入实用.最近三四十年,经济学经历了一场“博弈论革命”,引入博弈论的概念和方法改造经济学的思维,推进经济学的研究.1994年诺贝尔经济学奖授予3位博弈论专家纳什、泽尔腾和海萨尼,可以看作是一个标志,这也激发了人们了解博弈论的热情.博弈论作为现代经济学的前沿领域,已成为占据主流地位的基本分析工具.简单地说,博弈论研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡.博弈论由3个基本要素组成:一是决策主体(Player ),又可以译为参与人或局中人;二是给定的信息结构,可以理解为参与人可选择的策略和行动空间,又叫策略集;三是效用(U tility ),是可以定义或量化的参与人的利益,也是所有参与人真正关心的东西,又称偏好或支付函数.参与人、策略集和效用构成了一个基本的博弈.1 博弈论的主要思想一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织:第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失.博弈论模型可以用五个方面来描述:G ={P,A,S,I,U )P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标.A:为各局中人的所有可能的策略或行动的集合.根据该集合是有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策、重复博弈和微分对策等.S:博弈的进程,也是博弈进行的次序.局中人同时行动的一次性决策的博弈,称为静态博弈;局中人行动有先后次序,称为动态博弈.I:博弈信息,能够影响最后博弈结局的所有局中人的情报.信息在博弈中占重要的地位,博弈的赢得很大程度上依赖于信息的准确度与多寡.得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈.反之为不完全信息博弈.在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动.如果完全了解则称之为“具有完美信息”的博弈.反之称为“不完美信息的动态博弈”.由于信息不完美,博弈的结果只能是概率期望,而不能像完美信息博弈那样有确定的结果.U:为局中人获得利益,也是博弈各方追求的最终目标.根据各方得益的不同情况,分为零和博弈与变和博弈.零和博弈中各方利益之间是完全对立的.变和博弈有可能存在合作关系,争取双赢的局面.博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论.前者主要强调的是团体理性;而后者主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,即策略选择问题,强调的是个人理性.两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议.倘若不能,则称非合作博弈,非合作博弈是现代博弈论的研究重点.博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识(信息)是否了解两个角度进行.把两个角度结合就得到了4种博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈.严格地讲,博弈论并不是经济学的一个分支,它只是一种方法,这也是为什么许多人将其看成数学的一个分支的缘故.博弈论已经在政治、经济、外交和社会学领域有了广泛的应用,它为解决不同实体的冲突和合作提供了一个宝贵的方法.目前谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益最大化,最后达到力量均衡.在这一点上,博弈论和经济学家的研究模式是完全一样的.经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和相互作用,人与人之间利益和中突、竞争与合作,而这正是博弈论的研究对象.2 博弈论的代表人物博弈论主要是由冯・诺依曼(1903~1957)所创立的.他是一位出生于匈牙利的天才的数学家.他不仅创立了经济博弈论,而且发明了计算机.早在20世纪初,塞梅鲁(Zer mel o)、鲍罗(Borel)和冯・诺伊曼(Von Neumann)已经开始研究博弈的准确的数学表达,直到1939年,冯・诺依曼遇到经济学家奥斯卡・摩根斯坦思(O skar Morgenstern)并与其合作才使博弈论进入经济学的广阔领域.1944年他与奥斯卡・摩根斯坦恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的初步形成.书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础.合作型博弈在20世纪50年代达到了巅峰期.然而,诺依曼博弈论的局限性也日益暴露出来,它过于抽象,应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,影响力很有限.正是在这个时候,非合作博弈———“纳什均衡”应运而生了,它标志着博弈论的新时代的开始.纳什是一位天才式的人物,上大学时就开始从事纯数学的博弈论研究,特别是在经济博弈论领域,他做出了划时代的贡献,是继冯・诺依曼之后最伟大的博弈论大师之一.他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用.后续的研究者对博弈论的贡献,都是建立在这一概念之上的.由于纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础.纳什博士1950年11月刊登在美国全国科学院每月公报上的两篇论文将冯・诺依曼的“最小最大原理”推广到非合作博弈领域,找到了普遍化的方法和均衡点,比冯・诺伊曼的合作博弈理论更能反映现实的情况.20世纪50年代以后,泽尔腾、海萨尼等人对博弈论作了进一步的完善,使之更为实用.近20年来,博弈论作为分析和解决冲突和合作的工具,在管理科学、国际政治、生态学等领域得到广泛的应用.3 纳什均衡与博弈论的应用“囚徒困境”(Pris oner’s D ile mma)至今仍然是博弈研究的重要课题.两个嫌疑犯作案后被警察62哈尔滨师范大学自然科学学报 2006年逮捕,分别关在不同的屋子里审讯,警察告诉他们,如果两个人都坦白,那么每人判刑8年;如果两个人都抵赖,每人各判刑1年;如果其中一人坦白,另一人抵赖的话,坦白的人释放,抵赖的人判刑10年.这里每个囚徒都有两种战略:坦白或抵赖;在这个博弈中,纳什均衡是(坦白,坦白),尽管从总体上看,(抵赖、抵赖)是对两个人都有益的结果,但由于不构成纳什均衡,所以不是该博弈的解,给定B坦白的情况下,A的最优战略是坦白;同样,A坦白的前提下,B的最优战略是坦白, AU最优战略的组合却不是总体最优的选择,有没有可能其中一个选:择抵赖呢?按照人是理性的假设,没有人会积极地这么做,因为如果对方坦白的话,自己就可能判刑10年,理性的人是不会冒这种险的。

囚徒困境反映了一个深刻的哲学问题:个人理性和集体理性的矛盾。

个体为了自己的利益最大,而不愿意改变决策(改变决策的结果是不划算,招了之后惩罚严重),导致整体利益最小。

这样的情景就是个体与环境博弈的结果,这种状态就是博弈论中所讲的“纳什均衡”,又叫做“全局博弈均衡”。

纳什均衡是局中人理智选择的结果。

在现代经济生活中,纳什均衡的思想经常被应用,如投资、消费和雇用关系分析,生产、库存和维修关系分析,标价、拍卖和谈判策略制订,自然资源和污染关系分析,委托与代理关系分析等都涉及到纳什均衡的概念.囚徒困境在生活中最常见的表现就是挤公共汽车.从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,纳什均衡就是大家都挤,结果上车就更慢了,每个人采取的都是最优的战略,但是结果却是最劣,原因在于个人理性和集体理性的冲突.囚徒困境在企业间最典型的例子就是“竟相杀价”,在某种产品市场容量一定的前提下,A、B 企业本可以订一个协议价格来维护共同的长期利润,但A会为自己的近期利益而采取“低价倾销”策略,B也会效仿降价,不遵守事先达成的价格协定,结果使市场过早枯竭,A、B都没有出路了.但是如果A事先获知B的产量和价格这类竞争情报,就可以采取保护措施(如动用反倾销法案,甚至可以“威胁”用更低的价格“报复”),这样就能避免“两败俱伤”,形成新的协定.在“囚徒困境”中我们得到一个重要的结论:一种制度(体制)安排,要发生效力,必须是一种纳什均衡,否则这种制度安排便不能成立.两家企业A、B合作建设一条VCD的生产线,协议由A方提供生产VCD的技术,B方则提供厂房和设备.在对技术和设备进行资产评估时就形成非合作博弈,因为每一方都试图最大化己方的评估值,这时B方如果能够获得A方关于技术的真实估价或参考报价这类竞争情报,则可以使自己在评估中获得优势;同理, A方也是一样.至于自己的资产评估是否会影响合作企业的总体运行效率这样的“集体利益”,则不会非常重视.这就是非合作博弈,参与人在选择自己的行动时,优先考虑的是如何维护自己的利益.合作博弈强调的是集体主义,团体理性(Collectivc Ratli onality),是效率、公平、公正;而非合作博弈则强调个人理性,个人最优决策,其结果是有时有效率,有时则不然.现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者.厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚.因为博弈双方的利润正好是零.竞争的结果是稳定的,即是一个“纳什均衡”.这个结果可能对消费者是有利的,但对厂商而言是灾难性的.所以,价格战对厂商而言意味着自杀.从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局.二是如果不采取价格战,作为一种敌对博弈其结果会如何呢?每一个企业,都会考虑是采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润.如果垄断可以形成,则博弈双方的共同利润最大.这种情况就是垄断经营所做的,通常会抬高价格.另一个极端的情况是厂商用正常的价格,双方都可以获得利润.从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”.事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”.在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策.在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本.在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态.如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏.这就是为什么W T O和各国政府要加强反垄断的意义所在.72第4期 博弈论与纳什均衡除了“囚徒困境”以外,博弈论学者还总结出许多博弈的模型.如智猪博弈(Boxed Pigs)来解释多劳者不多得;性别战(Battle of Sexes)来解释互动博弈;斗鸡博弈(Chicken Ga me)来解释一方的妥协等等.博弈论在现实中的应用很多.首先,它是一种数学理论,可以用于经济学等领域;再者,它作为一种理论,并非产生直接具体的影响,而是理论指导学科,进而影响某些方面.博弈论对人类的贡献是加强了国际间的交流合作机会和人类社会文明的发展.此外,博弈论的哲学思维方式推动了人类思维模式向前发展,这一点是博弈论对人类的最大贡献.参 考 文 献1 张维迎.博弈论和信息经济学.上海:三联书社,1996.2 赵景柱,叶天祥.对策论理论和应用.北京:科学出版社,1995. 3 谢识予.经济博弈论.复旦大学出版社,2001.4 王则柯.新编博弈论平话.中信出版社,2003.ON THE GA M E THE OR Y AN D THE NASH EQUI L I BRI U MGuo Peng(China University of M ining and Technol ogy) Yang Xiaoqin(J ixi University)ABSTRACTW ith the Nash equilibrium being put f or ward and i m p r oved constantly and it is taken as the theoretical foundati on of the Ga me theory,it is possible that the Ga me theory can be widely used in Econom ics, Manage ment,Politics,Sci ol ogy Srategics,etc.Keywords:The Ga me theory;Nash equilibriu m;Non-cooperative Ga me(责任编辑:李双臻) 82哈尔滨师范大学自然科学学报 2006年。

相关文档
最新文档