博弈论之囚徒困境

合集下载

(完整)博弈论经典模型全解析(入门级)

博弈论经典模型全解析(入门级)1。

囚徒困境这是博弈论中最最经典的案例了-—囚徒困境,非常耐人寻味。

“囚徒困境"说的是两个囚犯的故事。

这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。

在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作）.这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放，因为只要他们拒不承认，警方无法给他们定罪.但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金.而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。

当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。

那么,这两个囚犯该怎么办呢？是选择互相合作还是互相背叛?从表面上看,他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。

但他们不得不仔细考虑对方可能采取什么选择。

A犯不是个傻子,他马上意识到，他根本无法相信他的同伙不会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。

这种想法的诱惑力实在太大了.但他也意识到,他的同伙也不是傻子，也会这样来设想他。

所以A犯的结论是，唯一理性的选择就是背叛同伙,把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。

而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。

所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。

企业在信息化过程中需要与咨询企业、软件供应商打交道的。

在与这些企业打交道的过程中，我们不可避免地也会遇到类似的两难境地，这个时候需要相互之间有足够的了解与信任，没有起码的信任做基础,切不可贸然合作.在对对方有了足够的信任之后,诚意也是必不可少的，如果没有诚意或者太过贪婪，就可能闹到双方都没有好处的糟糕情况，造成企业之间的双输。

囚徒困境经济学原理

囚徒困境经济学原理引言：囚徒困境是博弈论中一个经典的问题，也是经济学中的重要原理之一。

囚徒困境的情境是两个囚徒被捕后被分开审讯，检方没有足够的证据定罪，但却希望能定罪并判刑。

如果两个囚徒都保持沉默，则检方只能以轻罪定罪。

然而，如果其中一个囚徒选择合作并供出另一个囚徒，那么供出者将获得免罪的机会，而被供出者将面临重刑。

如果两个囚徒都选择供出对方，则两人都将面临有限的刑期。

囚徒困境问题展示了个人理性行为在博弈过程中可能导致的不利结果，对经济学有着重要的启示意义。

1.囚徒困境的基本情景囚徒困境的基本情景是两个囚徒在被捕后被审讯，他们面临着个人决策的困难。

在这个情境中，囚徒可以选择合作或背叛对方。

合作意味着保持沉默，而背叛意味着供出对方。

囚徒的决策将决定他们的命运，而他们并不知道对方的选择。

在这种情况下，囚徒需要权衡自己的利益和对方的选择来做出决策。

2.囚徒困境的策略和收益在囚徒困境中，每个囚徒都有两种策略可选择：合作或背叛。

合作的收益是较低的刑期，而背叛的收益是免罪。

然而，如果两个囚徒都选择背叛，那么他们都将面临较长的刑期。

因此，囚徒困境的最佳策略是背叛，因为无论对方选择什么，背叛都能获得更好的结果。

3.囚徒困境的启示意义囚徒困境问题揭示了个人理性行为可能导致不利结果的情况。

尽管合作对于整体利益是最好的选择，但个人追求自身利益往往会导致困境的产生。

囚徒困境的启示意义在于，个体之间的合作需要建立在互信和合作机制的基础上，才能避免困境的发生。

4.囚徒困境与经济学的关系囚徒困境经济学原理在经济学领域有着广泛的应用。

例如，在市场竞争中，企业可能面临类似的囚徒困境。

如果所有企业都选择合作并遵守竞争规则，市场将保持公平竞争的状态。

然而，如果有企业选择背叛并采取不正当手段获取竞争优势，其他企业也会被迫采取同样的策略，从而导致整个市场的恶性竞争。

囚徒困境经济学原理提醒我们，建立公平竞争的机制和规则对于市场的稳定和发展至关重要。

博弈论的囚徒困境模型

博弈论的囚徒困境模型引言博弈论是研究决策制定者在多方面利益冲突下进行选择的一门学科。

而囚徒困境模型是博弈论中最经典的模型之一，用于描述两个合作者之间存在利益冲突时可能出现的情况。

本文将详细介绍囚徒困境模型的基本概念、策略和解决方法，并探讨其在现实生活中的应用。

1. 囚徒困境模型的基本概念囚徒困境模型最早由美国数学家Melvin Dresher和Merrill Flood于1950年提出。

它是一个非零和博弈模型，意味着合作者之间的利益不完全一致，他们可以选择合作或背叛对方，从而获得不同的收益。

在囚徒困境模型中，通常有两名犯人被关押在不同的牢房里，无法相互沟通。

检察官给每个犯人提供了一个选择：如果两个人都保持沉默（即合作），那么他们将分别被判处较轻的刑期；如果其中一个人背叛（即不合作），而另一个人保持沉默，那么背叛者将被释放，而保持沉默者将被判处重刑；如果两个人都背叛，那么他们将各自被判处较重的刑期。

2. 囚徒困境模型的策略在囚徒困境模型中，每个犯人都有两种基本策略：合作和背叛。

根据对方的选择和自己的选择，可以得出四种不同的结果：互相合作、互相背叛、自己合作对方背叛、自己背叛对方合作。

这些结果对应着不同的收益。

为了量化这些收益，通常使用一个称为支付矩阵的工具。

支付矩阵是一个2x2的矩阵，其中每个元素表示在不同情况下每个合作者获得的收益。

在标准囚徒困境模型中，支付矩阵可以表示为：合作背叛合作R,R S,T背叛T,S P,P其中R表示互相合作时的收益，T表示自己背叛对方合作时的收益，S表示自己合作对方背叛时的收益，P表示互相背叛时的收益。

通常，R > T > P > S。

3. 囚徒困境模型的解决方法在囚徒困境模型中，每个犯人都希望获得最大的个人利益。

然而，如果两个犯人都追求个人利益，那么最终的结果将是两败俱伤。

如何选择合适的策略成为了一个关键问题。

在博弈论中，有许多不同的解决方法可以用于囚徒困境模型。

囚徒困境

信息共享：双方共享信息，提高决策的准确性
合作协议：达成合作协议，明确双方的责任和义务
惩罚机制：设立惩罚机制，对背叛行为进行惩罚
01
纳什均衡：在博弈论中，纳什均衡是指一种稳定的策略组合，使得每个参与者都不会因为改变策略而获得更好的结果。
02
合作与竞争：博弈论研究如何在合作与竞争中实现最优策略，以达到最佳结果。
03
应用领域：博弈论在政治、经济、军事、管理等领域都有广泛的应用，可以帮助人们更好地理解和解决实际问题。
04
经济学
博弈论：囚徒困境是博弈论的经典案例，研究参与者在决策过程中如何达到最优解
04
囚徒困境在市场营销中的应用：分析企业在市场竞争中的策略选择和合作竞争关系
囚徒困境在博弈论中的应用：分析博弈双方在决策过程中的策略选择
囚徒困境的破解
合作策略
建立信任：通过沟通和交流，建立双方之间的信任关系
01
信息共享：共享信息，使双方都能了解对方的意图和策略
02
制定规则：制定合作规则，确保双方都能遵守并执行
演讲人
囚徒困境
囚徒困境概述
囚徒困境的破解
囚徒困境的应用
囚徒困境概述
概念解释
囚徒困境：一种博弈论模型，描述两个囚犯在无法沟通的情况下，如何进行决策以获得最佳结果。
01
囚徒困境的决策结果：如果两个囚犯都选择合作，则两人都获得较低的刑罚；如果两个囚犯都选择背叛，则两人都获得较高的刑罚；如果一个囚犯选择合作，另一个选择背叛，则选择合作的囚犯将受到最严重的惩罚，选择背叛的囚犯将获得最轻的惩罚。
市场机制：囚徒困境可以解释市场机制中的合作与竞争关系
企业战略：囚徒困境可以指导企业在市场竞争中制定战略
公共政策：囚徒困境可以应用于公共政策制定，如环境保护、税收政策等

囚徒困境

一、囚徒困境（prisoner's dilemma ）1、囚徒困境简介囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。

虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。

囚徒困境最早是由美国普林斯顿大学数学家阿尔伯特·塔克（Albert tucker）1950年提出来的。

他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论，这个故事后来成为博弈论中最著名的案例。

故事内容是：两个嫌疑犯(A和B)作案后被警察抓住，隔离审讯；警方的政策是“坦白从宽，抗拒从严”，如果两人都坦白则各判8 年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判10年；如果都不坦白则因证据不足各判1年。

单次发生的囚徒困境，和多次重复的囚徒困境结果不会一样。

在重复的囚徒困境中，博弈被反复地进行。

因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。

这时，合作可能会作为均衡的结果出现。

欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。

作为反复接近无限的数量，纳什均衡趋向于帕累托最优。

囚徒困境的主旨为，囚徒们虽然彼此合作，坚不吐实，可为全体带来最佳利益（无罪开释），但在资讯不明的情况下，因为出卖同伙可为自己带来利益（缩短刑期），也因为同伙把自己招出来可为他带来利益，因此彼此出卖虽违反最佳共同利益，反而是自己最大利益所在。

但实际上，执法机构不可能设立如此情境来诱使所有囚徒招供，因为囚徒们必须考虑刑期以外之因素（出卖同伙会受到报复等），而无法完全以执法者所设立之利益（刑期）作考量。

2、经典的囚徒困境1950年，由就职于兰德公司的梅里尔·弗拉德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问阿尔伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。

囚徒困境

囚徒困境(Prisoner's dilemma)囚徒困境是博弈论中具有代表性的例子，反映个人最佳选择并非团体最佳选择。

虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。

囚徒困境最早是由美国普林斯顿大学数学家阿尔伯特·塔克（Albert tucker）1950年提出来的。

他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论，这个故事后来成为博弈论中最著名的案例。

2.经典的囚徒困境1950年，由就职于兰德公司的梅里尔·弗拉德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问阿尔伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。

经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。

于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：∙若一人认罪并作证检举对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。

∙若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。

博弈论故事及解析

博弈论故事及解析博弈论，又称为博奕论或博奕学，是研究冲突与合作的数学模型和分析方法。

它的研究对象是决策者在冲突和合作的环境中作出的决策，以及这些决策对其他决策者的影响。

博弈论被广泛应用于经济学、政治学、社会学、生物学等多个领域，它帮助我们理解和解决决策过程中的各种问题。

在博弈论中，存在许多经典的故事，这些故事通过描述具体的决策情境，展示了博弈论的原理和应用。

下面我们来看几个博弈论故事，并对其进行解析。

故事一：囚徒困境故事中有两个犯罪嫌疑人，警察将他们分开审问。

如果两人都坦白，将会分别判刑5年，如果两人都保持沉默，将会分别判刑1年，如果其中一个坦白，另一个保持沉默，坦白的人将会被赦免，而保持沉默的人将会被判10年。

在这个情境中，两个犯人面临一个重要的决策，是坦白还是保持沉默。

博弈论解析：在囚徒困境中，两个犯人面临一个合作与背叛的冲突。

博弈论中的解答是，无论对方采取什么策略，自己都应该选择坦白。

这是因为无论对方选择什么，坦白对自己的利益都是最大化的策略。

故事二：雁行队列一群大雁在迁徙时会形成一个V字形的队列。

这个队列的形状可以让大雁在飞行时节省能量，减少空气阻力。

队列中的每只大雁都可以感知到自己前方的大雁，它们会根据前方大雁的动作做出相应的调整。

如果前方的大雁飞得太累，它会离开队列，由后面的大雁取代。

博弈论解析：在这个故事中，每只大雁都是一个决策者，它们的决策会影响到整个队列的形状和飞行效率。

博弈论告诉我们，每只大雁都应该在队列中保持适当的距离，并根据前方大雁的行为做出相应的调整，以达到整个队列最佳的飞行效果。

故事三：拍卖在拍卖中，卖方希望能够以最高的价格卖出物品，而买方则希望能以最低的价格购买物品。

拍卖的形式有很多种，例如一口价拍卖、竞价拍卖等。

不同的拍卖形式会导致不同的结果。

博弈论解析：在拍卖中，卖方和买方都是决策者，他们的决策会直接影响到拍卖的结果。

博弈论提供了一些拍卖的理论模型，帮助卖方和买方制定最佳的决策策略。

博弈论基础—囚徒困境

15
经典范例表述
两个合伙犯罪的嫌疑犯作案后被警察抓住，由于缺乏
足够的证据指证他们的罪行，所以希望这两个人中至少有一个人供认犯罪，就能确认罪名成立。为此警察将这两个罪犯分别关押以防止他们串供，并告诉他们警方的政策是“坦白从宽，抗拒从严”：如果两人中只有一人坦白认罪，则坦白者立即释放，而另一人则被重判10年如果两个人同时坦白认罪，则他们将各判8年如果两个人都拒不认罪，则警方只能以较轻的罪名判他们各1年。
27
三、重复囚徒困境
28
由于在现实中，双方的博弈可能进行不止一次，如在
囚徒困境中，即使两个囚犯都坦白了，判刑也不是很严重，那么两个囚犯在刑满释放之后再作案，作案之后再判刑，释放之后再作案，如此周而复始的进行。
两个囚犯会在每次被审问时做何选择？是一直相互背
叛，还是寻找合作的机会？
29
重复博弈
博弈论的概念还包括行动、信息、结果和均衡
5
博弈的基本类型
6
合作博弈与非合作博弈 cooperative game and non-cooperative game
合作博弈
当事人之间达成有约束力的协议，强调团体理性，强调效率、公正、公平，例如两个寡头企业之间达成一个协议，联合获得最大化垄断利润，并且各自按照这个协议生产，这就是合作博弈。非合作博弈强调个人理性、个人最优决策，其结果可能是有效率的，也可能是无效率的。
12
纳什均衡的定义

13
二、囚徒困境
14
1950年，由就职于兰德公司的
梅里尔· 弗勒德（Merrill Flood）和梅尔文· 德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问艾伯特· 塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。

博弈论的经典案例五篇

博弈论的经典案例五篇囚徒困境学习管理学或经济学的人一定都了解一些博弈论方面的知识。

在博弈论中有一个经典案例——囚徒困境，非常耐人回味。

——"囚徒困境"说的是两个囚犯的故事。

这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。

在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。

这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。

但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。

而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。

当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。

——那么，这两个囚犯该怎么办呢是选择互相合作还是互相背叛从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。

但他们不得不仔细考虑对方可能采取什么选择。

A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。

这种想法的诱惑力实在太大了。

但他也意识到，他的同伙也不是傻子，也会这样来设想他。

所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。

而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。

所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。

——当然，在现实世界里，信任与合作很少达到如此两难的境地。

谈判、人际关系、强制性的合同和其他许多因素左右了当事人的决定。

囚徒困境文档

囚徒困境1. 引言囚徒困境是博弈论中的一个重要概念，描述了在特定情境下，个体做出自私决策的结果不利于整体利益最大化的现象。

本文将介绍囚徒困境的定义、模型、解决方法以及实际应用。

2. 定义囚徒困境由美国数学家墨菲在20世纪50年代提出，用来研究多人博弈理论中的合作问题。

在囚徒困境中，两名囚徒分别被关押在不同的房间中，不得相互沟通。

检察官没有足够的证据定罪，但却希望能够定罪并获得最重的刑罚。

因此，检察官给每名囚徒提供了选择合作或背叛的机会。

•如果两名囚徒都选择合作，则检察官无法定罪，每名囚徒被判一年徒刑。

•如果一名囚徒选择合作，而另一名囚徒选择背叛，则背叛者将不受惩罚，合作者将受到极重的刑罚（10年徒刑）。

•如果两名囚徒都选择背叛，则每名囚徒将被判刑5年。

3. 囚徒困境的模型囚徒困境可以用一个2x2的矩阵来表示。

矩阵中的元素表示每名囚徒选择合作或背叛所对应的结果。

囚徒B选择合作囚徒B选择背叛囚徒A选择合作(1, 1)(0, 10)囚徒A选择背叛(10, 0)(5, 5)在这个矩阵中，左上角的元素表示当两名囚徒都选择合作时的结果，右下角的元素表示当两名囚徒都选择背叛时的结果。

4. 解决囚徒困境的方法4.1. 唯一纳什均衡纳什均衡是指在多人博弈中，当所有参与者都选择了策略后，没有人再通过选择其他策略来使自己得到更好的结果。

在囚徒困境中，存在唯一的纳什均衡：双方都选择背叛。

虽然这个结果不利于个体和整体的利益最大化，但由于囚徒无法沟通和合作，双方都不愿冒险选择合作而遭受重刑。

4.2. 重复博弈策略在实际生活中，人们往往会面临多次的博弈，而不只是一次。

在重复博弈中，囚徒困境的结果可以发生改变。

4.2.1. 提前合作策略如果囚徒之间可以提前达成合作协议，并约定在每次博弈中都选择合作，那么纳什均衡将发生改变。

这是因为双方意识到合作是最有利的策略，不再担心背叛对方。

4.2.2. 无限重复策略在无限重复的囚徒困境中，囚徒有机会观察对方的行为，并根据对方的策略做出决策。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈论之囚徒困境
阿普顿是普林斯大学的高材生，毕业后被安排在爱迪生身边工作，他对依靠自学而没有文凭的爱迪生很不以为然。

一次，爱迪生要阿普顿算出梨形玻璃泡的容积，阿普顿点点头，心想：这么简单的事一会几就行了。

只见他拿来梨形玻璃泡，用尺上下量了几遍，再按照武样在纸上画好革田，列出了一道算式，算来算去，算得满头大汗仍没算出来。

一连换了几十个公式，还是没结果，阿普顿惠得满脸通红，狼狈不堪。

爱迪生在实验室等了很久，觉得奇怪，便走到阿普顿的工作问，看到几张白纸上密密麻麻的算式．便笑荚说：“您这样计算太浪费时间了。

”只见爱迪生将一杯水倒连玻璃泡内，交给阿普顿说：“再找个量筒来就知道答案了。

”阿普顿茅塞顿开，终于对爱迪生敬服．最后成为爱迪生事业上的好助手。

有时候。

科学并不一定意味着烦琐的计算与剥量，而是一种有浓厚艺术气息的思维方式。

前者固然可以得出正确的结论，但是后者同样可以用一种出入意表的方式曲径通幽。

这种方式，与我们在生活中运用博弈科学有异曲同工之妙。

大量的教学模型吓不倒我们，因为我们可以对它们置之不理。

有一个脑筋息转弯问题是这样的：在什么情况下零大干二，二大干五，五又大干零’答案是：在玩“石头．剪刀．布”游戏的时候。

博弈．就是用这种游戏思维来突破看似无法改变的局面，解决现实的严肃问题的策略。

在博弈中，每个参与者都在特定条件下争取其最大利益，强差一者来必胜券在握，弱者也未必永无出头之日。

因为在博弈中，特别是多十参与者的博弈中，结果不仅取决干参与者的实
力与策略，而且还取决于其他参与者的制约和策略。

事实上，博弈过程本来就不过是一种日常现象。

我们在日常生活中经常薷要先分析他人的意田从而做出合理的行为选择，而所谓博弈就是行为者在一定环境条件和规则下，选择一定的行为或策略加以实施并取得相应结果的过程。

博弈论首先是我们思索现实世界的一套逻辑，其次才是把这套逻辑严密化的数学形式。

博弈论的目的在于巧妙的策略，而不是解法。

我们学习博弈论的目的．不是为了享受博弈分析的过程，而在于赢得更好的结局。

说到底，博弈论毕竟只是一个分析问题的工具，用这个工具来简化问题，使问题的分析清晰明了也就够了。

博弈的思想既然来自现实生活，它就既可以高度抽象化地用教学工具来表述，也可以用日常事例来说明，并运用到生活中去。

在斯大林时代的苏联，有一位乐队指挥坐火车前往下一个演出地点。

正当他在车看当晚就要指挥演奏的作品乐谱时。

两名克格勃(KGB，苏联国家安全警察。

实际是政治特务将他作为间谍逮捕了。

他们以为那乐谱是某种密码，这位乐队指挥争辩说那只是柴可夫斯基的小提琴协奏曲，却无济于事。

在乐队指挥被投入牢房的第二天，审问者自鸣得意地走进来说：“我看你最好还是老实招了吧，我们已经抓住你的朋友柴可夫斯基了．他这会儿正向我们交代呢。

你如果再不招就枪毙了你。

如果交代了，只判你10年。

”笑过之后，每个人都会思考其中所蕴涵的东西。

但是如果认为这个笑话仅仅讽刺了克格勃特务的无知与无耻，那是不够的。

事实上，克格勃们的花招，是想运
用博弈论中囚徒困境理论，达到自己的目的。

虽然他们未必知道博弈论，但是他们明显企图运用其中的布局，使乐队指挥被迫选择招供。

i950年，担任斯坦福大学客座教授的数学家图克(Tucker)，给一些心理学家解释他正在研究的完全信息静态博弈问题，为r更形象地说明博弈过程．他用两个犯罪嫌疑人的故事构造了一个博弈模型．即囚徒嗣境模型。

这一模型的过程具体是这样的：两个共同偷窃的犯罪嫌疑人甲和乙被带进警察局警方对两名犯罪嫌疑人实行隔离关押．隔离审讯，每个犯罪嫌疑人都无法观察到司伴的选择警方怀疑他们作案，但手中并没有掌握确凿证据，于是明确地分别告知两名犯罪嫌疑人：对他们犯罪事实的认定及相应的量刑完全取决于他们自己的供认如果其中一方与警方合作，供认偷窃之事．而对方抵赖．供认打将不受惩罚，无罪释放．另一方则会被判重刑10年；如果双方都与警方合作共同供认，各被判刑5年；而如果双方均不认罪．因为警察找不到其他证据．则无罪释放。

每个犯罪嫌疑人都有两种可供选择的策略：供认或不供认而且，每个犯罪嫌疑人选择的最优策略不依赖于其同伙的策略选择。

如果甲选择抵赖．那么就可能会出现两种情况：如果乙选择供认．那么甲将被加重惩罚．判刑10年．而乙则无罪释放：如果乙也同样选择抵赖，那么他们两个都将因证据不足而被释放。

很显然．这第二种结果对于两个人都是最有利的但是．因为警方没有把两名嫌疑人放在一间囚室里．因而这种合作难以顺利进行．使得结果预测的不确定性加大．或者说增加了抵赖合作的风险性因此．基于人是理性的这一前提．由于犯罪嫌疑人不知道对方的想法．最理性的博弈。