博弈论与战略互动

合集下载

博弈论无名氏定理

博弈论无名氏定理引言：博弈论是研究决策制定和行为选择的数学模型，并在许多领域发挥重要作用。

在博弈论中，无名氏定理是一项非常重要的结论，它对于理解玩家之间的互动和找到最佳策略提供了指导。

本文将就博弈论无名氏定理展开详细阐述。

一、博弈论基本概念博弈论研究决策者在决策制定中的相互影响，主要分为以下几个基本概念：1.玩家：参与博弈的个体或群体，每位玩家需根据自身利益作出决策。

2.策略：玩家在博弈中可采取的行动方案。

每位玩家需从多个策略中选择一个。

3.收益：玩家基于自己的策略和其他玩家的策略，所获得的结果。

4.纳什均衡：指在博弈中各个玩家选择了最佳策略，无法通过单方面改变策略来获得更好结果。

二、无名氏定理的内容无名氏定理由约翰·纳什于1950年提出，它在博弈论中具有重要意义。

该定理的内容可以概括为：在任意有限次博弈中，至少存在一个纳什均衡。

也就是说，在博弈中，无论玩家有多少，无论策略有多复杂，至少会有一个纳什均衡点。

这意味着无论其他玩家选择什么策略，玩家都无法通过单方面改变自己的策略来获得更好的结果。

三、无名氏定理的证明无名氏定理的证明过程比较复杂，需要运用到博弈论中的一些数学理论和方法。

在证明过程中，通常会利用到反证法、最优响应函数、偏微分方程等工具。

具体证明过程如下：1.反证法：首先假设不存在纳什均衡点，即每个玩家都能通过改变自己的策略来获得更好结果。

2.最优响应函数：然后，分别对每个玩家的每种策略进行最优响应函数的计算，即找到玩家最好的策略选项。

3.偏微分方程：最后，通过偏微分方程等工具推导，得出存在纳什均衡的结论，从而证明无名氏定理。

四、无名氏定理的应用无名氏定理在经济学、政治学、生物学等多个领域有广泛的应用。

它可以帮助人们理解玩家之间的互动关系，揭示各种冲突与合作的策略选择。

无名氏定理的应用举例：1.在市场竞争中，企业可以利用无名氏定理来确定最佳的定价策略，以获取最大利润。

2.在国际关系中，国家之间的冲突和合作可以通过博弈论无名氏定理来研究和解析。

博弈论与管理决策中的竞争策略

博弈论与管理决策中的竞争策略博弈论是一种研究决策主体的数学理论，它研究的是在竞争环境中如何做出最优决策，以及不同决策主体之间的策略互动和结果。

在管理决策中，博弈论的应用越来越广泛，因为它可以帮助管理者更好地理解竞争环境，制定出更有效的竞争策略。

本文将探讨博弈论在管理决策中的重要性，以及如何运用博弈论制定竞争策略。

一、博弈论在管理决策中的重要性1.理解竞争环境：博弈论可以帮助管理者更好地理解竞争环境，包括竞争对手的行为、市场需求、资源分配等因素。

通过分析这些因素，管理者可以制定出更有效的竞争策略。

2.制定最优策略：博弈论提供了一种分析竞争策略的方法，可以帮助管理者制定出最优的竞争策略。

通过分析对手可能的反应和自己的收益，管理者可以找到一个能够最大化自己收益的策略。

3.建立合作关系：在某些情况下，博弈论也可以帮助管理者建立合作关系。

通过合作，双方可以共享资源、信息和技术，实现共同利益。

二、竞争策略的制定1.了解竞争对手：了解竞争对手是制定竞争策略的基础。

管理者需要了解竞争对手的优势和劣势，以及它们的目标和战略。

通过分析竞争对手的行为和反应，管理者可以制定出更有针对性的竞争策略。

2.确定目标市场：在制定竞争策略时，管理者需要确定目标市场，并了解目标市场的需求和趋势。

通过分析市场需求和趋势，管理者可以找到一个能够最大化自己收益的市场位置。

3.制定差异化策略：差异化是竞争中的一种重要策略，它可以帮助企业建立自己的竞争优势。

通过提供独特的产品或服务、独特的品牌形象、独特的营销策略等方式，企业可以吸引更多的消费者并保持竞争优势。

4.建立合作关系：在某些情况下，建立合作关系可以帮助企业实现共同利益。

通过与合作伙伴共同开发新产品、共享资源和技术等方式，企业可以实现更高效的资源利用和更低的成本。

5.风险管理：在制定竞争策略时，管理者需要考虑到可能的风险和不确定性。

例如，市场变化、竞争对手的反应、政策法规的变化等因素都可能影响企业的竞争地位。

博奕论与策略思维

囚徒困境的支付矩阵（赢得矩阵）：
乙
坦白
抗拒
┏━━━━━┳━━━━━┓
坦白┃ -8， -8 ┃ 0， -10 ┃
甲
┣━━━━━╋━━━━━┫
抗拒┃ -10， 0 ┃ -1， -1 ┃
┗━━━━━┻━━━━━┛
从理论上讲，四种情况每种发生的概率都是25%。
《博弈论与策略思维》
北张京延大学教经授济学院著
1、囚徒困境与纳什均衡
有一天，一个警察抓住了两个小偷。*
每个人面临两种选择 —— 坦白还是抗拒。
（1）在甲选择 —— 坦白的情况下， A、如果乙也选择 —— 坦白，结果是甲被判8年，乙也被判8年。 B、如果乙选择 —— 抗拒，结果是甲被无罪释放，判0年，乙被重判10年。
（2）在甲选择 —— 抗拒的情况下， A、如果乙选择 —— 坦白，结果是甲被重判10年，乙被无罪释放，判0年。 B、如果乙选择 —— 抗拒，结果是甲被轻判1年，乙也被轻判1 年。
威胁吗？这样对我不好。纳什均衡是两国都大量增加军费预算，两国
的社会福利都变得更糟。
3、最经典博弈论模型 —— 囚徒困境的特征：
《博弈论与策略思维》
北张京延大学教经授济学院著
4、囚徒困境的启示
（1）日常生活中的囚徒困境在日常生活中也存在囚徒困境，一旦陷入，理论上应采取什么策略是最优的呢？
案例：北大的丢车现象为什么会存在对黑车的强劲的需求？每个人都有两个选择：买黑
行优势。
博弈论作业：共5题。
一、优利公司和埃克森公司是生产一种非常精密的摄象机的仅有的两家公司。他们在商业杂志上投入或高或低的广告费。他们的赢得矩阵如下所示埃：克（森单位：万美元）
（3）制度变迁中的“斗鸡博弈”

博弈论完整版PPT课件

ac 3
纳什均衡利润为：
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识：每个人都是理性的，但不知道其他人是否是理性的；
1-阶理性共识：每个人都是理性的，并且知道其他人也是理性的，但不知道其他人是否知道自己是理性的；
2-阶理性共识：每个人都是理性的，并且知道其
他人也是理性的，同时知道其他人也知道自己是
理性的；但不知道其他人是否知道自己知道他们
国外经济学教科书改写，加入大量博弈论内容
博弈论进入主流经济学，反映了：
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学)，而
博弈论是一种新的数学。以前只有陆军，现在有了空军，其差异
不完全信息
静态
纳什均衡
（纳什）
贝叶斯纳什均衡
（海萨尼）
.
动态
子博弈精练纳什均衡
（泽尔腾）
精练叶贝斯纳什均衡
（泽尔腾等）
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈多人博弈
静态博弈动态博弈
合作博弈非合作博弈
零和博弈常和博弈变和博弈
根据参与人对其他参与人的
4-阶理性：C相信R相信C相信R相信C是理性的，C会将R1从R的战略空间中剔除, C不会选择C3；
5-阶理性：R相信C相信R相信C相信R相信C是理性的，R会将C3从C的战

博弈论心得体会

博弈论心得体会博弈论，这个看似高深莫测的学科，却在我们的日常生活中无处不在。

当我们在商场中讨价还价、在比赛中竞争、甚至在与家人朋友的相处中做出决策时，都或多或少地运用到了博弈论的思维。

通过对博弈论的学习，我有了许多深刻的体会。

首先，博弈论让我认识到决策并非孤立的行为。

在一个博弈的情境中，每个参与者的决策都会相互影响，最终的结果取决于所有人的选择。

这就要求我们在做决策时，不能仅仅考虑自身的利益和情况，还要充分考虑到他人可能的反应和策略。

比如在商业谈判中，如果一方只顾自己的利益，提出过分的要求，很可能会导致谈判破裂，双方都无法达成满意的结果。

而如果能够换位思考，预测对方的底线和可能的回应，就有可能找到一个双方都能接受的平衡点，实现共赢。

其次，信息的重要性在博弈论中凸显无疑。

拥有更多、更准确的信息往往能够让我们在博弈中占据优势。

然而，在现实生活中，信息往往是不对称的，一方可能比另一方了解更多的情况。

这就导致了在某些博弈中，处于信息劣势的一方可能会做出错误的决策。

比如在二手车市场上，卖家通常比买家更了解车辆的真实情况，如果买家无法获取足够的信息，就很容易买到质量不佳的车辆。

因此，我们在参与博弈时，要尽可能地收集和分析信息，同时也要警惕对方可能故意释放的虚假信息，以免被误导。

博弈论中的策略选择也是非常关键的一点。

不同的博弈情境需要不同的策略。

有些博弈是一次性的，比如拍卖；而有些博弈则是重复进行的，比如商业竞争。

对于一次性的博弈，我们可能需要采取冒险或者激进的策略，争取一次性获得最大的利益。

而对于重复进行的博弈，我们则需要考虑长期的利益，建立良好的声誉和合作关系，因为在长期的互动中，对方的记忆和反应会对未来的结果产生重要影响。

此外，博弈论还让我明白了合作的价值。

在某些博弈中，参与者通过合作可以实现共同利益的最大化。

但合作并非总是容易达成的，因为存在着背叛的风险和利益分配的问题。

比如在国际环保合作中，各个国家都知道共同采取措施应对气候变化对全球都有益，但由于各国的利益诉求不同，合作往往面临诸多困难。

博弈论和企业策略行为

科威特
什均衡
增产保持
沙特增产保持 (5, 5) (7, 4) (4, 7) (6, 6)
同步行动和纳什均衡
纳什均衡旳关键：无人乐意打破僵局给定一种状态，是否有人单独乐意去变化？
沙特
纳什均衡点
科
增产保持
威增产 (5, 5) (7, 4) 特
保持 (4, 7) (6, 6)
大小猪博弈
企业1
扩大不变
－500，－500 0，1000
1000，0 0，0
2．价格竞争：伯川德模型和动态
价格博弈模型
假定两个企业生产旳产品相同，边际成本都是10元。两个企业都只存在1期（静态旳含义），两个企业同步行动来决定各自旳产品价格。因为两个企业旳产品完全相同，能够完全替代，所以消费者就会购置价格低旳产品。这意味着，两家企业谁旳价格低就会赢得整个市场。在这种情况下，两家企业将把价格都定为10元这一边际成本水平。这使得企业最多只能取得零水平旳利润，假如前期有沉淀投入旳话，那么还将造成损失。
第二个原则：不让代理承人担过多其本身难以控制旳风险。
第三个原则：尽量使委托人和代理人旳目旳相一致。也就是说，应该使代理人旳自利行为同步也是委托人希望代理人采用旳行为。所以，这一原则又被称为是鼓励相容原则。
三、企业治理构造
一般来说，企业不是由出资人个人，而是由一种企业治理构造（corporate governance）来经营和管理旳。所谓企业治理构造，是指由全部者、董事会和高级经理人员三者形成旳一种组织构造。在这一构造中，上述三者之间形成一定旳制衡关系。
北京新兴医院旳例子
三、既有企业和新进入者之间旳博弈——进入和退出
1. 构造性旳进入障碍关键资源旳控制规模经济既有企业旳指企业经过收取低于进入发生时旳价格来防范进入。

新博弈论及经典案例简介

博弈论及经典案例简介当双方的条件相等时，适当的对策就能打败对方。

当双方的情况相距甚远时，适当的对策也可以将损失减少到最低限度。

如果你和一个朋友打电话，信号会突然中断。

这时，你会立即拨打电话，还是等你的朋友打电话？显然，你是否应该拨电话取决于你的朋友是否会拨。

如果你们中的一个想拨号，另一个最好等着。

如果一方等待，另一方最好拨号。

因为如果双方都拨号，那么线路将会很忙。

如果双方都在等待，那么时间就会在等待中流逝。

这是一个游戏！在游戏中，你必须考虑对方的选择来决定你自己的最佳选择，而对方也必须考虑你的选择来决定他的最佳选择。

*你从游戏中得到的不仅取决于你自己的行为，还取决于另一方的行为。

如果你知道你的爱人不会给你打电话(例如，她之前在等电话，当她断开连接时，如果很难用完你手机的每月限额，并且她的回答是免费的)，那么你最好的办法就是拨打它。

*游戏最本质的特征是双方的行为相互影响和依赖，游戏无处不在，石头、剪刀、布，0，0，1，-1，-1，1，-1，1，-1，0，0，1，-1，-1，1，1，0，0，0，石头头，剪刀，布，玩家2，石头头，剪刀，布，玩家1，赛艇比赛，老虎，鸡，虫，粗棒，老虎，鸡，虫，粗棒，0，0，1，-1，1，1，1，1，0，0，1，1，-1，0，0，0，0，0，-1，1，0，1，-1这里的符号更麻烦，因为它们不同于代数中纯粹抽象和无意义的符号。

在你的脑海中，你应该永远记住它们的实际意义，但你应该熟悉这种简单、抽象的思维模式，并记住这些符号的代表意义。

因此，更有效的学习方法是重复。

博弈论简介，又称博弈论，博弈论英语中的博弈论，是研究相互依赖、并相互影响的决策者的理性决策行为以及这些决策的均衡结果的理论。

博弈论试图研究人们在既有冲突又有合作时的决策行为(如寡头垄断)。

游戏是两个或更多的参与者追求他们自己的利益，没有人能控制结果的一种情况。

游戏过程是一个战略互动过程。

这使得任何一方的行为都必须考虑到另一方的可能反应。

动态完全信息三阶段博弈模型

动态完全信息三阶段博弈模型1. 介绍在博弈论领域，动态完全信息三阶段博弈模型是分析多参与者之间战略互动的有力工具。

在玩家完全了解游戏结构并能够观察到其他玩家行动的情况下，这个模型抓住了决策的本质。

本文旨在通过探索其关键特征、战略考虑和潜在应用，全面理解这一博弈模型。

2. 主体2.1动态完全信息三阶段博弈模型的主要特征动态完全信息三阶段博弈模型包括初始阶段、中间阶段和最终阶段三个不同的阶段。

每个阶段都代表一个特定的时间点，玩家在此做出决策并进行战略互动。

这种模式提供了几个区别于其他游戏模式的关键特征:2.1.1顺序决策:与玩家同时做出决策的同步游戏不同，三阶段游戏模型允许顺序决策。

在每个阶段中，玩家将基于之前玩家的行动而轮流做出选择，从而创造出一个动态且不断发展的游戏环境。

2.1.2完全信息:该模型假设参与者拥有关于博弈结构的完整信息，包括所有参与者的偏好、策略和收益。

这种完美的信息使玩家能够基于他们对整个游戏的了解做出理性的决定。

2.1.3多重均衡:三阶段博弈模型通常呈现多重均衡，即在其他玩家选择的策略下，每个玩家的策略都是最优的。

这些平衡在效率和公平性方面可能有所不同，从而导致玩家之间的战略考虑和潜在冲突。

2.2动态完全信息三阶段博弈模型中的策略考虑2.2.1前向归纳法:该博弈模型中一个重要的策略考虑是前向归纳法，即从最后阶段向后推理，以确定最优策略。

玩家预测未来玩家的行动，战略性地调整他们的选择，以最大化他们的长期收益。

这种战略思维对于玩家利用潜在机会和避免次优结果至关重要。

2.2.2时机与承诺:三阶段博弈模型强调了时机与承诺在决策中的重要性。

玩家必须仔细考虑何时采取行动，因为时机会对结果产生重大影响。

此外，承诺在塑造玩家的策略中发挥作用，因为在早期阶段做出的承诺可以影响未来玩家的行动。

2.2.3声誉和可信度:在这个博弈模型中，声誉和可信度是至关重要的考虑因素。

玩家过去的行动和行为可以建立影响其他玩家选择和期望的声誉。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈论与战略互动 www.newslist.com.cm 2009-05-29 来源：未知

作者：陈宏文章来源：《外交评论——外交学院学报》2007年第2期摘要: 谢林对博弈论与战略互动的分析以国际政治的“非零和游戏”特征为基本假定, 他超越了理性主义的研究范畴, 关注非理性因素在战略互动中的作用, 并试图对非理性行为加以分析。战略行动的本质是通过自己的行动去影响他人对自己将如何行动的期望从而影响他人的选择, 并最终形成有利于自己的结果。

关键词: 博弈论; 战略互动; 理性主义托马斯·谢林( Thomas C. Shelling) 是美国著名学者、经济学家, 同时也是研究外交事务、国家安全、核战略与军备控制的专家。他和罗伯特·奥曼(Robert J.Aumann) 一起分享了2005年诺贝尔经济学奖。谢林曾受到过严格的经济学的训练, 最初也曾致力于传统经济学的研究, 以后研究兴趣逐渐转移到核战略与军备控制等国际政治领域中来。1960年, 谢林发表了其经典著作《冲突的战略》, 对讨价还价理论和冲突管理理论作了细致的分析。因此,谢林认为国际政治本质上是一种“非零和游戏”,因为大部分的所谓国际冲突都存在某些共同利益,都可以看成是一种讨价还价的情形, 冲突各方需要合作以协调彼此的战略。谢林所有的国际战略理论都建立在这一假定基础上。

一、博弈论与社会科学 ( 一) 理性主义与超越理性主义: 谢林博弈论的理论基础谢林首先是一个提倡理性合作论的学者, 他创造性地扩展了博弈论的应用范围并在各个领域提出了原创性的理论洞见, 尤其是在国际关系领域,他的学术兴趣紧扣现实主题, 尤其是针对冷战期间美苏两个超级大国之间的核竞争。作为一名国际关系研究学者而言, 我们很难把他称为是一名现实主义者或是一名自由主义者, 因为他强调国际政治的参与者既存在共同的利益又存在相互冲突的利益。谢林强调国际战略的丰富议题正是来源于“国际事务既有相互依存又有相互对立的事实。”[1](P4)纯粹的冲突只有在以完全消灭对手为目的战争这种极端的情形下才存在。即使在战争中也存在某些共同利益如避免相互毁灭的行为, 这就需要合作和相互协调。因此, 谢林认为国际政治本质上是一种“非零和游戏”, 谢林所有的国际战略理论都建立在这一假定基础上。从谢林强调讨价还价的理性实质来看,他是一个典型的理性主义者; 从谢林强调合作以协调彼此战略这点来看, 把他看成是一名自由主义者也是有道理的。所以, 总体上说, 他是一个理性合作论者。谢林的理论大部分方法属于理性主义的研究方法。他认为理性假定有利于构建理论体系。但他始终关注非理性因素在战略互动中的作用, 并试图对非理性行为加以分析。从这一点上说, 他又超越了理性主义的研究范畴。主流国际关系理论, 无论是新现实主义还是新自由制度主义, 其理论基底都是理性主义[2](P12)。理性主义把国家定义为追求国家利益最大化的行为体。而这种理性又与新古典经济学的理性概念有许多相似之处。理性选择理论( Rational Choice Theory, 简称RCT) 是新古典经济学的理论基石。这种理性主要体现在新古典经济学关于理性人的假设上, 即假定个人在任何情景下都追求效用最大化。效用是偏好的函数, 偏好只要满足完备性和传递性就可以体现为理性。这种关于理性的过于简化的假定限制了理论的适用范围。首先, 垄断是经济的常态, 完全竞争的市场只是理想类型, 从来没有存在过。垄断条件下个人的决策必然受到他人决策的影响。而各种制度的存在如保护私有产权和自由交换的法律制度也是社会中互动的个人经过实践活动长期创造和演化的结果。围绕新古典经济学核心理念发展起来的一般均衡分析和比较静态分析对垄断和制度演化问题的解释力很弱; 其次, 新古典经济学的理性假设使经济学变成了一门“去伦理化”的学科,由于抽掉了人的因素, 比如人类的同情心、正义感、道德意识等伦理因素, 人类变成了在这个冷冰冰的地球上精于算计、冷酷无情的动物。

博弈论既继承了理性主义合理的成分, 又恰恰能够弥补理性主义的这些欠缺。首先, 它研究的是其行动将相互影响的决策者们的行为。可以说, 只要行为结果依赖于两个或两个以上的决策者的共同影响, 博弈论就有用武之地。国际关系理论研究的是国与国之间的冲突与合作, 其中很重要的一部分是国与国尤其是大国之间的战略互动, 研究相互依存的决策者的行为, 而博弈论正是研究类似问题的一种强有力的分析工具; 其次, 博弈论为研究伦理问题提供了一个方便的研究方法, 使我们在研究人类互动时, 不必再僵硬地坚持新古典经济学中理性人的假设。其实, 古典经济学从来没有忽视道德情感因素在社会生活中的作用, 亚当·斯密的《道德情操论》比《国富论》早17年出版。斯密认为人类与生俱来的同情心要求人类推己及人, 在我们的利益与他人的利益发生冲突时能够尽量公正[3](P163)。从这个意义上讲, 新古典经济学背离了斯密的传统。

主流国际关系理论也深受新古典经济学理性主义的影响。我们以现实主义和自由主义理论发展的历史线索为例来说明这个问题。古典现实主义的学者卡尔( E. H. Carr) 和摩根索( Hans J. Morgenthau)尽管都强调权力在国际政治中的核心作用, 但两人都强调国际道德和意识形态在维护权力的合法性方面的重要作用。卡尔在批判乌托邦主义的同时,也强调国际关系需要在权力与道德之间寻求妥协和平衡。指出“若要在国际关系中建立有序的和平变革程序, 也必须寻找某种方法, 使这种变革不仅基于权力, 而且也基于权力与道德之间艰难的妥协, 因为这种妥协是一切政治生活的基础。”[4](P197)摩根索则把道德看成是一种能够在某种程度上限制权力的因素, 并认为当今世界民族主义的泛滥弱化了国际道德对权力政治的这种限制作用[5](P265- 295)。

自由主义的早期形态——理想主义甚至把道德置于权力之上。到了沃尔兹( Kenneth N. Waltz) 的结构现实主义和基欧汉( Robert O. Keohane) 的新自由制度主义, 国家就成了单一的理性行为体, 在既定的结构和制度环境下寻求自我利益的最大化, 道德因素被弱化到最小的程度, 自然也就忽视人类情感因素在促进人类合作中的重大作用[6] [7]。在新现实主义那里, 理性假设必然导致冲突是国际关系的常态的论断; 在新自由制度主义那里, 制度可以促进合作, 但制度始终笼罩在权力的阴影之下, 国际制度的创立尤其依赖于权力, 人类合作的总体前景暗淡。这是理性排斥情感与道德的必然结果。理性主义在国际关系研究领域的主导地位是科学行为主义影响的必然结果。道德与情感等社会因素被视为非科学因素而被排斥于研究领域之外。所幸的是, 博弈论为我们研究人类情感和道德因素提供了工具。如今博弈论不仅用来分析核威慑、军备竞赛等现实主义议题, 也用来分析制度的设计与演化如何能促进国际合作这一自由主义核心命题。而演化博弈论和实验博弈论则用来研究包括道德因素在内的文化传播与变迁, 与建构主义的研究范式有着很大的结合空间。可见, 博弈论超越了理性主义的分析方法, 具有更广泛的应用领域和适用范围。 ( 二) 相互依存的决策理论: 博弈论的基本概念和方法

我们在这里用囚徒困境的例子说明博弈论的基本概念和方法。囚徒困境是20世纪博弈论最有影响的实例, 它预设了以下几种情景: 两个被抓获的囚犯面临这样的处境, 如果其中一人坦白他们的罪行则他将免于刑事处分, 而另一个拒不交代将被判10年徒刑; 如果两人都不坦白, 则由于司法当局缺乏足够证据只能判两人1年徒刑; 如果两人都交代了自己的罪行, 则两人都将被判处3年徒刑。显然, 对两个人来说, 最好的选择应该是互相合作拒不交代, 这是一个“帕累托最优”。问题在于, 这个选择组合是不稳定的, 因为每个人都害怕对方交待, 使自己成为牺牲品, 因此便会选择交代而谋求自己更大的利益。理性计算的结果是两人均选择不合作。

按照纳什均衡的定义, 如果存在一个所有参与者选定战略的一个组合, 在这个组合中, 每个人的战略都是针对其他人战略的最优反应, 这个组合就是纳什均衡。在囚徒困境中, 双方不合作是唯一的一个纳什均衡。这一结果可用如下矩阵表示:

图1中“囚徒1”、“囚徒2”代表两个博弈人, 他们都有“不坦白”和“坦白”两中可选择的策略, 矩阵中的数字表示双方不同组合策略下的收益组合,第一个数字为“囚徒1”的收益, 第二个数字为“囚徒2”的收益。该博弈的纳什均衡为双方都坦白这一策略组合, 亦即两个囚徒相互不合作。

依自我利益为目标的理性行为, 却导致对每个人都较差的结果, 这一惊人的结论给现代社会科学带来了深远的影响。它揭示个体理性深刻的内在矛盾——从个体利益出发的理性选择行为最终不但不能保证个体的最大利益, 而且损害了集体利益。它还颠覆了自斯密以来的那种教条, 即个体利益和社会利益总是相和谐的。它提出了这样一个深刻的问题: 如果每个人都依据或仅仅依据理性原则来行事, 那么人类的合作何以成为可能呢?

囚徒困境揭示了人类社会中存在的许多相似的情形, 从军备竞赛到环境污染到资源的过度开采。囚徒困境是对现实的高度简化和抽象, 省略了许多关键问题。后来的许多学者在此基础上添加了不同的条件, 得出许多有益的结论。1.囚徒困境是两人博弈, 而现实中更常见的是多人博弈。多人博弈有可能形成联盟, 这对研究国际关系中的联盟行为尤其具有重大意义; 2.囚徒困境中两人不允许交流, 如果允许彼此之间相互交流以协调彼此的战略, 则结果将极为不同;3.囚徒困境是一次性博弈, 实际的国际关系中往往是多次博弈, 而重复博弈则将产生不同的结果。

那么, 如何避免类似于囚徒困境的结果呢? 第一, 如果博弈各方彼此之间能够建立起信任关系,那么他们就会采取合作战略以争取双赢。建构主义主张人类能够通过长期实践与社会互动建立一种基于信任与合作的康德文化, 从而从根本上克服囚徒困境问题; 第二, 如果博弈各方能够彼此签订有约束力的合约, 彼此承诺采取合作以谋求共赢。或者有一个强有力的机构强制各方执行合作战略, 则也可以避免囚徒困境。而国际体系既缺乏有效的司法体系以惩