博弈论66个经典例子(9)不会令人后悔的纳什均衡

合集下载

纳什均衡点

纳什均衡点纳什均衡点纳什均衡点（港译：纳殊均衡点），又称为非合作博弈均衡点，是博弈论的一个重要概念，以约翰·纳什命名。

如果某情况下无一参与者可以独自行动而增加收益，则此策略组合被称为纳什均衡点[1]。

[编辑本段]例子经典的例子就是囚徒困境，囚徒困境是一个非零和博弈。

大意是：一个案子的两个嫌疑犯被分开审讯，警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被判刑一年，而对方将被判刑十年；如果两人均招供，将均被判刑五年。

于是，两人同时陷入招供还是不招供的两难处境。

如果两人均不招供，将最有利，只被判刑三年。

但两人无法沟通，于是从各自的利益角度出发，都依据各自的理性而选择了招供，这种情况就称为纳氏均衡点。

这时，个体的理性利益选择是与整体的理性利益选择不一致的。

囚犯甲的博弈矩阵囚犯甲招供不招供囚犯乙招供判刑五年甲判刑十年；乙判刑一年不招供甲判刑一年；乙判刑十年甲判刑三年基于经济学中Rational agent的前提假设，两个囚犯符合自己利益的选择是坦白招供，原本对双方都有利的策略不招供从而均被判刑三年就不会出现。

事实上，这样两人都选择坦白的策略以及因此被判五年的结局被是“纳什均衡”（也叫非合作均衡），换言之，在此情况下，无一参与者可以“独自行动”（即单方面改变决定）而增加收获。

[编辑本段]学术争议和批评第一，纳什（Nash）的关于非合作（non-cooperative）博弈论的平衡不动点解（equilibrium/fixpoint）学术证明是非构造性的（non-constructive），就是说纳什用角谷静夫不动点定理（Kakutani fixed point theorem）证明了平衡不动点解是存在的，但却不能指出以什么构造算法如何去达到这个平衡不动点解。

这种非构造性的发现对现实生活里的博弈的作用是有限的，即使知道平衡不动点解存在，在很多情况下达不到并不能解决问题。

[来源请求]在数学意义上，纳什并没有超越角谷静夫不动点定理。

博弈论66个经典例子

博弈论66个经典例子博弈论66个经典例子XXX：《博弈论三大经典案例》经典的囚徒困境是博弈论中最为著名的例子之一。

它由XXX和XXX在1950年提出，后来由顾问XXX以囚徒方式阐述，并命名为“囚徒困境”。

在这个困境中，警方逮捕了甲、乙两名嫌疑犯，但是没有足够的证据来指控他们。

警方将他们分开囚禁，并向他们提供以下相同的选择：如果一个人认罪并检举对方，而对方保持沉默，那么这个人将被立即释放，而对方将被判监10年。

如果两个人都保持沉默，那么他们都将被判监半年。

如果两个人都检举对方，那么他们都将被判监2年。

在这个博弈中，每个参与者都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。

参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。

另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。

那么，囚徒应该选择哪种策略才能将自己的刑期缩短到最短呢？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。

就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。

因此，两个理性的囚徒都会选择背叛，这是两种策略中的支配性策略。

因此，这场博弈中唯一可能达到的纳什均衡，就是双方都背叛对方，结果二人同样服刑2年。

在博弈论中，智猪博弈是一个著名的例子。

猪圈里有一头大猪和一头小猪，猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮。

按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本。

若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是7∶3；小猪先到槽边，收益比是6∶4.在两头猪都有智慧的前提下，最终结果是小猪选择等待。

实际上，小猪选择等待，让大猪去按控制按钮，而自己选择“坐船”或搭便车的原因很简单：在大猪选择行动的前提下，小猪也行动的话，小猪可得到1个单位的纯收益，而小猪等待的话，则可以获得4个单位的纯收益，等待优于行动；在大猪选择等待的前提下，小猪如果行动的话，小猪的收入将不抵成本，纯收益为-1单位，如果小猪也选择等待的话，那么小猪的收益为零，成本也为零，总之，等待还是要优于行动。

博弈论纳什均衡

博弈论纳什均衡什么是纳什均衡？1、纳什均衡（Nash equilibrium )，又称非合作博弈均衡，是博弈论概念，指的是：一种博弈稳定结果，谁单方改变策略，谁就会损失。

两个囚徒互相揭发，就是一种纳什均衡。

对于每个囚徒来说，如果打破纳什均衡，在对方实施揭发策略时，改变揭发策略，保持沉默，自己就会由判刑2年，变成判刑5年。

也就是说，两个囚徒互相揭发是稳定博弈结果，谁单方改变策略，就会受到损失。

这也就是均衡涵义所在，两个囚徒从利己角度，都不会单方改变策略。

博弈策略稳定，博弈结果也稳定。

之所以命名为纳什均衡，是因为提出者是经济学家、博弈论创始人约翰．纳什。

之所以称为非合作博弈均衡，原因就是：两个囚徒如果合作，互相保持沉默，各自只要坐牢1年；但最终博弈结果，也就是纳什均衡显著特征，是不合作。

2、纳什均衡意义重大。

纳什均衡提出，震动整个经济学界。

诺贝尔经济学奖得主萨缪尔森曾说：“你只要教会鹦鹉说‘需求和供给’，它也是经济学家。

”博弈论专家坎多瑞则说：“这只鹦鹉现在必须多学一个词了，那就是‘纳什均衡’。

”诺贝尔经济学奖得主迈尔森也说：“发现纳什均衡意义，可以和生命科学中发现DNA 双螺旋结构相媲美。

”纳什也因为提出纳什均衡，创立博弈论，而获得1994年诺贝尔经济学家奖。

纳值均衡意义重大，简单来说，就是它对于经济学具有重大意义。

读友们如果了解经济学看不见的手原理，就知道，古典经济学认为，通过市场这只‘看不见的手’调节，个体追求私利行为，会促进集体利益最大化。

但纳什均衡却违反上述原理：两个囚徒分别追求私利行为，并没有促进集体（囚徒整体）利益最大化，反而是损人不利己。

这正是市场失灵软肋之处，通过博弈论视角可以得到合乎逻辑解释，更有条件找到合适解决方案。

从上述这点，读友们可以“一斑窥全豹”，感受到博弈论重要性。

更重要的是，纳什均衡非常普遍，小至个人沟通，中到公司竞争，大到国家往来，都可以观察到。

Q2：怎样运用纳什均衡？1、分析囚徒困境。

博弈论中的纳什均衡

博弈论中的纳什均衡纳什均衡，Nash equilibrium ,又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。

约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。

其研究成果见于题为《非合作博弈》（1950）的博士论文。

该博士论文导致了《n人博弈中的均衡点》（1950）和题为《非合作博弈》（1951）两篇论文的发表。

纳什在上述论文中，介绍了合作博弈与非合作博弈的区别。

他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念，也就是不限于两人零和博弈。

该解概念后来被称为纳什均衡。

定义：纳什均衡(Nash Equilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。

也就是说，此时如果他改变策略他的支付将会降低。

在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。

纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。

所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a，那么局中人A的支付不会超过他采取原来的策略a*的支付。

这一结果对局中人B亦是如此。

纳什均衡的经典范例就是囚徒博弈，但是研究博弈论常常会使人陷入一种只追求个人利益的误区，事实上我们应该明白所谓的博弈只是建立在参与者假定为古典经济学中的理性经纪人的条件下这只是一个假设，并不总能说明事实。

只是假定他们只是选择对自己最有利的策略，而不考虑社会福利或任何其他对手的利益。

也就是说，这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。

没有人会主动改变自己的策略以便使自己获得更大利益。

“囚徒的两难选择”有着广泛而深刻的意义。

个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。

纳什均衡简单例子

媳妇刚娶进门的时候，婆媳两人间的关系确立，婆媳两人由于在婆媳关系确立之前都是独立的个体，双方也没有进行沟通和了解，由于生活习惯和家庭文化背景的差异，婆媳的生活观念和处理问题的方式方法都截然不同，婆媳之间就会开始出现博弈，在忍让和斗争中逐渐找到平衡。
扑克对色游戏
猜谜游戏等博弈
两人博弈，每人从自己的扑克牌（已抽出大鬼、小鬼）中抽一张出来，一起翻开。如果颜色一样，甲输给乙一根火柴；如果颜色不一样，甲赢得乙一根火柴。博弈矩阵如下：
若婆婆选择斗争，根据博弈矩阵，媳妇此时的相对优势策略也会是斗争，因为婆婆选择斗争之后，媳妇对应的斗争支付是-3，忍让支付是-4；若婆婆选择的是忍让，根据相对优势策略媳妇的同样会选择忍让。
同理，若媳妇选择的是斗争，由于婆婆此时的斗争支付是-3，忍让支付-4，婆婆的相对优势策略为斗争；若媳妇选择忍让，博弈中婆婆的斗争支付为-2，忍让支付为-1，此时婆婆的相对优势策略也是选择忍让。
Thank You !
CLICK HERE TO ADD A TITLE
单击此处添加文本具体内容
演讲人姓名
什么是纳什均衡？
首先纳什均衡是假设有n个局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。
生活中的纳什均衡
情侣博弈荣荣和纤纤是一对情侣，他们准备在周末进行体育活动，有两个选择，分别是打羽毛球、跳芭蕾。其博弈矩阵如下：
STEP3
STEP2

纳什均衡原理

纳什均衡原理
纳什均衡，英文是 Nash Equilibrium，也有人叫它“非合作均衡”、“非合作博弈均衡”，它是一个比较抽象的概念，需要运用数学的知识才能理解。

纳什均衡是指在一个博弈中，每一个人在做选择时都不能确定其他人是否会做同样的选择。

这个时候，如果一方做出了某种选择，那么另一方就会做出相应的反应。

这个反应的结果，就是双方都选择了一种对自己最有利的行为。

比如在博弈论中有这样一个例子：两个人在玩猫捉老鼠游戏，一个人是猫，另一个人是老鼠。

这个时候如果两个人都不敢抓老鼠，因为如果抓了老鼠的话，那他们俩都会被关进笼子里；如果两个人都抓老鼠的话，那他们俩都会被关进笼子里；但是如果两个人都不抓老鼠的话，那么他们俩都会被关进笼子里。

那么结果是怎样呢？这就是纳什均衡的结果。

在这个游戏中，如果只有一个人选择了不抓老鼠的话，那就只有他自己被关进笼子里；如果两个人都选择了不抓老鼠的话，那就是他们两个都被关进笼子里。

—— 1 —1 —。

生活中的博弈论例子

生活中的博弈论有那些例子那讲工作上的事假如你做的策划被上司偷了那你是要向更高级的领导告状还是忍受这也算一个博弈论问题你要是告状，也许能够伸冤，但也会若到上司他可能会给你下绊子但不上诉他也许会再偷，你的工作就白废了还有物价方面假如几个店铺联合起来自然能够把东西卖的比较贵但只要其中一个降价其他店的客人就会全跑到那家去那另外几家也会被迫降价店铺联合本来是最好的赚钱方法但店铺间一般是敌对关系为防备有人订低价，引走客人所有的店铺都会尽可能低价其实我们学校门口的网吧刚上演了一出这个好戏真是有感触啊！！！！！弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样，都是从复杂的现象中抽象出基本的元素，对这些元素构成的数学模型进行分析，而后逐步引入对其形势产影响的其他因素，从而分析其结果。

基于不同抽象水平，形成三种博弈表述方式，标准型、扩展型和特征函数型利用这三种表述形式,可以研究形形色色的问题。

因此,它被称为“社会科学的数学”从理论上讲，博弈论是研究理性的行动者相互作用的形式理论，而实际上正深入到经济学、政治学、社会学等等，被各门社会科学所应用。

1.博弈论是指某个个人或是组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，从各自选择的行为或是策略进行选择并加以实施，并从各自取得相应结果或收益的过程，在经济学上博奕论是个非常重要的理论概念。

什么是博弈论？古语有云，世事如棋。

生活中每个人如同棋手，其每一个行为如同在一张看不见的棋盘上布一个子，精明慎重的棋手们相互揣摩、相互牵制，人人争赢，下出诸多精彩纷呈、变化多端的棋局。

博弈论是研究棋手们“出棋” 着数中理性化、逻辑化的部分，并将其系统化为一门科学。

换句话说，就是研究个体如何在错综复杂的相互影响中得出最合理的策略。

事实上，博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。

数学家们将具体的问题抽象化，通过建立自完备的逻辑框架、体系研究其规律及变化。

生活中纳什均衡例子

生活中纳什均衡例子
纳什均衡是博弈论中的一个概念，指在双方或多方进行博弈时，
当每个参与者都选择了最优策略后，游戏的结果已经达到了一个稳定
状态。

生活中，我们可以看到很多纳什均衡的例子。

1.超市降价促销：当超市降价促销时，消费者可以选择是抢购或
等待。

如果大多数人都抢购，那么超市就会获得更多的销售额；如果
消费者等待，那么超市可以考虑再次降价吸引消费者购买。

2.交通拥堵：在道路狭窄且车流量大的情况下，司机们可以选择
是慢行还是超车。

如果每个司机都选择了超车，那么道路的拥堵就会
更加严重；如果司机们都选择慢行，那么车流量就会更加平缓。

3.竞拍：在竞拍中，每个竞拍者都会选择自己认为是最高的出价。

如果竞拍者们都认为这个物品的价值很高，那么竞拍的价格就会越来
越高。

如果有人放弃竞拍，价格就会下降，直到达到平衡。

4.恋爱：在恋爱中，每个人都希望自己的感情得到回报。

如果两
个人都对对方很有感情，那么他们就会在一起；如果只有一个人喜欢
对方，那么他们就不会在一起。

这是一个常见的纳什均衡例子。

总之，纳什均衡是在人与人之间相互影响，相互制约下的一种结果。

只有当每个人都选择自己认为最优的策略，才能形成稳定的状态。

博弈论的纳什均衡

博弈论的纳什均衡
纳什均衡
在多人参加的博弈中，每个人根据他人的策略制定自己的最优策略。

所有人的这些策略组成了一个策略组合，在这个策略组合中，没有人会主动改变自己的策略，那样会降低他的收益。

只要没有人做出策略调整，任何一个理性的参与者都不会主动改变自己的策略。

这个时候，所有参与者的策略便达成了一种平衡，这种平衡便是“纳什均衡”。

古时候，楚国和魏国交界处有一个小县城，城中的居民都以种瓜为生。

有一年，天气大旱。

魏国一边的村民比较勤劳，白天挑水浇瓜，瓜苗长势喜人；而楚国一边的村民比较懒，所以瓜苗长得又枯又黄。

楚国村民看着魏国一边的瓜苗绿油油一片，而自己这边又枯又黄，于是心生嫉妒，夜里组织人到魏国一边去搞破坏，将瓜苗拔出来扔到一边。

魏国的村民知道后，非常气愤，决定以牙还牙，报复楚国的村民。

但是，村长却反对这样做。

他认为报复的结局是两败俱伤，最终两个村到了秋后谁也收获不了瓜。

最后村长提出了一个想法，那就是以德报怨，晚上组织村民偷偷到楚国一边的村庄田地里，替他们给瓜苗浇水。

村民们按照村长说的去做，最后楚国的村民看到自己田里的瓜苗变绿了，并且知道是魏国的村民晚上来偷偷浇水，都感到非常羞愧。

为了表示歉意，楚国村民晚上偷偷到魏国村庄的田地里去替他们重新种上了瓜苗。

最终，双方平安无事，从此和谐相处。

纳什均衡案例

纳什均衡案例纳什均衡是博弈论中的一个重要概念，由约翰·纳什提出，用于描述博弈参与者之间的一种策略选择状态。

在这种状态下，每个参与者都知道其他参与者的策略选择，并且没有动机单方面改变自己的策略。

纳什均衡是一种稳定状态，当所有参与者都采取最优策略时，任何一方都没有动机改变自己的策略。

下面我们通过一个案例来具体了解纳什均衡的概念。

假设有两家冰淇淋店A和B，它们位于同一条街上，销售的冰淇淋口味和质量都是一样的。

每天下午4点，顾客会同时到两家店购买冰淇淋。

店家可以选择提高或降低价格，而顾客会选择到价格更便宜的店购买冰淇淋。

在这种情况下，我们来分析一下店家的最优策略选择。

首先，我们假设店家A提高了价格，而店家B保持不变，那么顾客肯定会选择到店家B购买冰淇淋，因为价格更便宜。

同理，如果店家B提高了价格，而店家A保持不变，顾客也会选择到店家A购买冰淇淋。

这说明在任何一家店提高价格的情况下，另一家店都会获得更多的顾客。

接着，我们假设店家A降低了价格，而店家B保持不变，那么顾客肯定会选择到店家A购买冰淇淋。

同理，如果店家B降低了价格，而店家A保持不变，顾客也会选择到店家B购买冰淇淋。

这说明在任何一家店降低价格的情况下，另一家店都会失去更多的顾客。

因此，我们可以得出结论，在这种情况下，店家A和店家B都会选择保持自己的价格不变，因为任何一家店单方面改变价格都无法获得更多的顾客，反而会失去顾客。

这种状态就是纳什均衡，即当每个参与者都知道其他参与者的策略选择，并且没有动机单方面改变自己的策略。

通过这个案例，我们可以更好地理解纳什均衡的概念。

在博弈论中，纳什均衡是一种重要的策略选择状态，它描述了参与者之间的稳定状态，当所有参与者都采取最优策略时，任何一方都没有动机改变自己的策略。

纳什均衡的概念不仅在经济学领域有着重要的应用，也在其他领域有着广泛的影响，如政治、生物学等领域都可以看到纳什均衡的身影。

总之，纳什均衡是博弈论中的一个重要概念，通过案例分析可以更好地理解其内涵和应用。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

不会令人后悔的均衡
在纳什均衡中，你不一定满意其他的策略，但你的策略是回馈对手招数的最佳策略。

从囚徒困境中我们会发现，作为博弈各方的行动就是针对对方行动而确定的最佳对策，而一旦知道对方在做什么，就没人愿意改变自己的做法。

博弈论学把这么一个结果称为均衡。

这个概念是有普林斯顿大学数学家约翰·纳什提出的，因此被称为纳什均衡。

诺贝尔经济学奖获得者萨缪尔森有句名言，你可以将一只鹦鹉训练成经济学家，因为它所需要学习的只有两个词，供给与需求。

博弈论专家坎多瑞引申说：“要成为现代经济学家，这只鹦鹉必须再多学一个词，这个词就是纳什均衡”。

1950年，还是一名研究生的纳什写了一篇论文，题为《n人博弈的均衡问题》，该文只有短短一页纸，可就这短短一页纸成了博弈论的经典文献。

纳什的贡献是，他证明了在这一类的竞争中，在很广泛的条件下是有稳定解存在的，只要是别人的行为确定下来，竞争者就可以有最佳的策略。

那么，什么纳什均衡呢？简单说，就是一策略组合中，所有的参与者面临这样的一种情况：给定你的策略，我的策略是我最好的策略。

给定我的策略，你的策略也是你最好的策略，即双方在对方给定的策略下不愿意调整自己的策略。

纳什均衡从此成为经济学家用来分析商业竞争到贸易谈判现象的有力工具，所以纳什均衡是对冯诺依曼和摩根斯坦的合作博弈论的重大发展，甚至说是一场革命。

纳什均衡首先对亚当斯密“看不见的手”的原理提出挑战，按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果，
从纳什均衡引出一个悖论：从利己的目的触发，结果损人不利己。

“囚徒困境”就是如此，从这个意义说，纳什均衡提出的悖论实际上动摇了西方经济学的基石。

纳什的想法成为我们指导“同时行动博弈”的最后一个法则的基础。

这个法则如下：走完寻找优势策略和剔除劣势策略的捷径之后，下一步就是寻找这个博弈的均衡。

所谓博弈均衡，它是一稳定的博弈结果。

均衡是博弈的一结果，但不是说博弈的结果都能成为均衡。

博弈的均衡是稳定的，因而是可以预测的。

在囚徒困境中存在唯一的纳什均衡点，即两个囚犯均选择“招认”，这是唯一稳定的结果。

有些博弈的纳什均衡点不止一个，如下述夫妻博弈中有两个纳什均衡点。

丈夫和妻子商量晚上的活动，丈夫喜欢看拳击，而妻子喜欢欣赏歌剧，但两个人都希望在一起度过夜晚。

在这个夫妻博弈中有两个纳什均衡点：要么一同去看歌剧，要么一同去看拳击。

在有两个或两个以上纳什均衡点的博弈中，其最后的结果难以预测。

在夫妻博弈中，我们无法知道，最后结果是一同欣赏歌剧还是一同看拳击。

是不是所有的博弈均存在纳什均衡点呢？不一定存在纯策略纳什均衡点，但至少存在一个混合策略均衡点。

这里所谓纯策略是指参与者在他的策略空间中选取唯一确定的策略，所谓混合策略是指参与者采取的不是唯一的策略，而是其策略空间上的概率分布。

我们下面将在警察与小偷的博弈中给出混合策略的说明。

在西部片里，我们常能看到这样的故事：某个小镇上只有一名警察，他要负责整个镇的治安，现在我们假定，小镇的一头有一家酒馆，另一头有一家银行，再假定该地有一个小偷，要实施偷盗。

因为分身乏术，警察一次只能在一个地方
巡逻，而小偷也能去一个地方。

假定银行需要保护的财产价格为2万元，酒馆的财产价格为1万元。

若警察在某地进行巡逻，而小偷也选择了去该地，就会被警察抓抓；若警察没有巡逻的地方而小偷去了，则小偷偷盗成功，警察怎么巡逻才能使效果最好？
一个明显的做法是，警察对银行进行巡逻，这样，警察可以保住2万元的财产不被偷窃。

可是如此，假如小偷去了酒馆，偷窃一定成功。

这种做法是警察的最好做法吗？有没有对这种策略改进的措施？
这个博弈没有纯策略纳什均衡点，而有混合策略均衡点，这个混合策略均衡点下的策略选择是每个参与者的最优（混合策略）策略选择。

对于这个例子，对于警察的一个最好的做法是，警察抽签决定去银行还是酒馆，因为银行的价值是酒馆的两倍，所以用两个签代办银行，比如抽到1.2号签去银行，抽到3号签去酒馆，这样警察有2/3的机会去银行进行巡逻，1/3的机会去酒馆。

而小偷的最优选择是：以同样抽签的办法决定去银行还是去酒馆偷盗，只是抽到1.2号签去酒馆，抽到3号签去银行，那么，小偷有1/3的机会去银行，2/3的机会去酒馆。

警察与小偷之间的博弈，如同小孩子之间玩石头剪刀布的游戏。

在这样一个游戏中，不存在策略均衡，对每个小孩来说，自己采取出剪刀，布，还是石头的策略应当是随机的，不能让对方知道自己的策略，哪怕是倾向性的策略。

如果对方知道你选择其中一个策略的可能性大，那么你在游戏中输的可能性就大，因此，每个小孩的最优混合策略是采取每个策略的可能是1/3，在这样的博弈中，每个小孩各取三个策略的1/3是纳什均衡。

由此可见：纯策略是参与者一次性选取的，并且坚持他选择的策略，而混合策略是参与者在各种备选策略中采取随机方式选取的。

在博弈中，参与者可以改变他的策略，而使得他的策略选择满足一定的概率，当博弈是零和博弈时，即一方所得是另外一方的所失时，此时只有混合策略均衡，对于任何一方来说，此时不可能有纯策略的占优策略。

从纳什均衡中我们还可以悟出一条真理：合作是有利的利己策略，但它必须按照你愿意别人对你的方式来对别人，只有他们也按同样的方式行事才行，也就是中国人所说的已所不欲，勿施于人。

但前提是人所不欲，勿施于我。

其次，纳什均衡是一种非合作博弈均衡，在现实中非合作的情况要比合作情况更普遍。

当你身处类似“囚徒困境”这样同时行动的博弈中时，你的最佳策略是什么？决定胜负的因素又是什么？双方的策略选择往往是有迹可循的，并形成某种定数——即纳什均衡，纳什均衡的威力来自于它的稳定，不管其他人怎么做，每个人都是都很满意自己的做法，所以没有人想要改变自己的策略。

纳什均衡是指一个不会令人后悔的结果，不管其他人怎么做，各方对于自己的策略都很满意，在纳什均衡中，你不一定满意其他人的策略，但你的策略是回馈对手招数的最佳策略，纳什均衡中的各方绝对不会合作，而且总是认定自己改变不了对手的做法。