综合I类与II类理性人的博弈策略分析

合集下载

博弈论的几个经典模型ppt课件

博弈论的几个经典模型ppt课件

博弈论的几个经典模型
22
模型二、囚徒困境/非合作博弈
该博弈刻划了两大难题: • 冲突情形下,参与人的目标是什么?是采用(作 为个人 ) 他自己的最好策略,还是采用 ( 作为集 体的一员)他们共同的最好策略?前者导致均衡 策略 ( 坦白,坦白 ) ,支付为 (-8 , -8) ;后者的最 好策略是 ( 抵赖,抵赖 ) ,支付为 (-1 , -1) 。这里 反映了个体理性行为与集体理性行为之间的矛 盾、冲突。 • 此博弈只进行一次还是重复进行?如果博弈只 进行一次,参与人似乎只有坦白才是最好的策 略,因为没有理由相信对手会对你有信心,他 总认为你自己会坦白;因此,双方都采取坦白 策略。然而,若博弈进行多次,则结论将会发 生变化。
第四章 博弈论的几个经典模型
1
引言
博弈论又被称为对策论(Game Theory), 按照2005年因对博弈论的贡献而获得诺贝尔经 济学奖的Robert Aumann教授的说法,博弈论 就是研究互动决策的理论。所谓互动决策, 即各行动方(即局中人[player])的决策是相互 影响的,每个人在决策的时候必须将他人的 决策纳入自己的决策考虑之中,当然也需要 把别人对于自己的考虑也要纳入考虑之 中……在如此迭代考虑情形进行决策,选择 最有利于自己的战略(strategy)。
此外此外还与会计学还与会计学统计学统计学数学基础数学基础社会心理学社会心理学以及诸如认识论与伦理学等哲学分支有重要联以及诸如认识论与伦理学等哲学分支有重要联博弈论的几个经典模型按照按照aumannaumann所撰写的所撰写的新帕尔格雷夫经新帕尔格雷夫经济学大辞典济学大辞典博弈论博弈论辞条的看法辞条的看法标准的标准的博弈论分析出发点是理性的博弈论分析出发点是理性的而不是心理的而不是心理的或社会的角度或社会的角度

博弈论以及经典案例分析

博弈论以及经典案例分析
• 常和博弈。在这种博弈中,各种结果下的各博弈方得益之和总是 等于一个非零常数。与零和博弈一样,常和博弈各方的利益关系 也是对立的,一方多占有一点利益,另一方必然会少占有一点。
• 变和博弈。即意味着在不同策略组合下各博弈方的得益之和是不 同的。倘若博弈各方之间相互配合,则可能争取到总得益和个人 得益均较大的理想结局;反之则社会总得益和个人得益均较小。
1.碟子、猫和古董商 有位古董商发现有个人用珍贵的碟子做猫食碗,于是假装对这 只猫相当喜爱,要从主人手中买下。猫主人不卖,为此古董商出高 价。
成交之后,古董商装作漫不经心地说:“这个碟子它用惯了, 就一块给我吧。”猫主人不干了:“你知道我用这个碟子已经买出 多少只猫了?”下面分析该故事。在这里
知识是“碟子是古董”
• 在这种情况下,无论是对开发商A还是开发商B,都不 存在一种策略优于另一种策略,也不存在严格劣策略: 如果A选择开发,则B的最优策略是不开发;如果A选 择不开发,则B的最优策略是开发;类似地,如果B选 择开发,则A的最优策略是不开发;如果B选择不开发, 则A的最优策略是开发。
第二节 生活中的博弈论
完全信息指的是每一个参与人对所有其他参与人的特征, 如策略集合及得益函数都有准确完备的知识;否则就是 不完全信息。
☞将上述角度的划分结合起来,我们就得到四种不同类型 的博弈,这就是:完全信息静态博弈、完全信息动态博 弈、不完全信息静态博弈、不完全信息动态博弈
表5-1 博弈的分类和均衡表
行动次序 信息
三、博弈论的基本概念
(一)博弈论的定义
博弈论(gametheory),又译为对策论,就是研究决策主体的行为 发生直接相互作用时的决策以及这种决策的均衡问题。实际上, 博弈是一种日常现象。
在经济学中,博弈论是研究当某一经济主体的决策受到其他经济主 体决策的影响,同时,该经济主体的相应决策又反过来影响其他 经济主体选择时的决策问题和均衡问题。

博弈论模型解析决策者理性选择与策略

博弈论模型解析决策者理性选择与策略

博弈论模型解析决策者理性选择与策略博弈论是一种研究决策者在相互依赖环境下进行决策的数学模型。

决策者在博弈过程中会根据自己的利益和对其他决策者行为的预测来选择最优策略。

本文将介绍博弈论的基本概念,并解析决策者的理性选择和策略。

首先,我们来了解博弈论中的一些重要概念。

博弈论主要研究的是决策者的互动关系,其中包括决策者、策略和支付。

决策者是参与博弈的个体,可以是个人、组织或国家等。

策略是决策者进行决策的行动或方案。

支付是决策者从策略中获得的效益或成本。

决策者在博弈过程中会根据自己的利益和对其他决策者行为的预测来选择最优策略。

决策者在选择策略时通常会考虑以下几个因素:自己的利益、对手的选择、对手的动机以及对手有关信息的了解程度。

理性决策者会选择能够最大化自己效益的策略。

决策者的理性选择基于博弈论中的均衡概念。

博弈论中的均衡是指决策者在相互依赖环境下做出的稳定决策。

常见的均衡概念包括纳什均衡、次序均衡和完全均衡等。

纳什均衡是指在博弈中,每个决策者都已经做出了最优选择,并且其他决策者无法通过改变自己的策略来获得更大的效益。

次序均衡是指在博弈中,决策者的行动顺序是合理的,每个决策者的策略是对先前决策者行动的响应。

完全均衡是指在博弈中,每个决策者都已经做出了最优选择,并且其他决策者对这些最优选择的预期与实际情况相符。

博弈论的最经典模型是囚徒困境。

囚徒困境是指两个犯罪嫌疑人之间的博弈,他们可以选择合作或背叛。

如果两人都选择合作,则会得到较轻的刑期;如果两人都选择背叛,则会得到较重的刑期;如果其中一人选择合作而另一人选择背叛,则背叛者会得到零刑期,而合作者会得到较重的刑期。

在囚徒困境中,每个囚徒都会选择背叛,因为他们认为对方也会选择背叛,这样才能避免得到较重的刑期。

然而,如果两人能够相互合作,他们将会得到较轻的刑期。

除了囚徒困境,博弈论还可以应用于许多其他领域。

例如,企业之间的价格竞争、国家之间的军备竞赛以及拍卖等都可以通过博弈论模型进行分析。

博弈论——精选推荐

博弈论——精选推荐

博弈论博弈论第⼀章完全信息⾮合作静态博弈例⼀囚徒困境本例⼦对奠定⾮合作博弈理论基础起着重⼤作⽤。

假定有两个嫌疑犯A 和B 作案后被抓住,关在不同审讯室审讯,他们部知道,如果两⼈都坦⽩各判刑8年,若两⼈都抵赖各判1年,若⼀⼈坦⽩另⼀⼈抵赖坦⽩者释放抵赖者判⼗年,下图给出本例的完整数学描述:囚徒B坦⽩抵赖坦⽩囚徒A抵赖(囚徒A ,囚徒B )基本假定:1) 两囚徒都是理性的;2) 两囚徒都了解对⽅是理性的;3) 两囚徒都了解在各种情况下审判后果的信息;4) 两囚徒都了解对⽅了解在各种情况下审判后果的信息。

研究问题:预测最终结果。

结论:从上表看出A 与B 同样是:不管对⽅采取什么⾏动,坦⽩都是最优的,因⽽两囚徒若满⾜上述条件他们所采取的⾏动都是坦⽩。

(坦⽩,坦⽩)称为本博弈的均衡解。

从上述模型中看出,如果两⼈都选择抵赖,对两⼈都是最好的,但结果-8,-8 0,-10-10,0-1,-1他们只能选择较差的结果,都坦⽩,不论他们事先如何订⽴攻守同盟都⽆效,原因出在上述四点假设上。

囚徒困境表现为个⼈理性压倒集体理性。

例⼆智猪博弈猪圈有两头理性的智猪,⼀头⼤猪,⼀头⼩猪。

猪圈⼀头放着⾷,另⼀头有⼀按钮,供智猪⾷供应。

按⼀下按钮会有10单位猪⾷进糟,但谁按谁就要付出2单位代价。

若⼤猪先到、⼤猪吃到9单位,⼩猪吃到1单位,若同时到⼤猪吃到7单位,⼩猪吃到3单位,若⼩猪先到,⼤猪吃到6单位,⼩猪吃到4单位。

本问题可⽤下形式表⽰:⼩猪按等待按⼤猪等待(⼤猪,⼩猪)基本假设:与囚徒困境相同,即理性⼈假设和完全对称信息假设。

问题分析:很显然⼩猪的最优策略是等待,⼤猪很清楚⼩猪最优策略是等待,⽽且必然采取等待⾏动,那么⼤猪的策略是按,于是其结果必然是⼤猪按⼩猪等待。

(⼤猪按,⼩猪等待)为本博弈均衡解。

5,1 4,4 9,-1 0,0智猪问题本质:在合作共事中谁享受成果多谁多出⼒。

三、基本概念包括:参与⼈、⾏动、信息、战略、⽀付(效⽤)、结果、均衡。

决策与博弈理论分析

决策与博弈理论分析

3
公共资源分配
在公共资源分配问题中,博弈论可以帮助分析各 方利益诉求和冲突,寻求合理的资源分配方案。
04 基于博弈论决策方法论述
完全信息静态博弈下决策方法
最小最大定理
在完全信息静态博弈中,参与人可以通过选择策略使得自己的最小收益最大化, 即采用最小最大定理进行决策。
纳什均衡
纳什均衡是完全信息静态博弈中的一种稳定状态,参与人在该状态下无法通过单 方面改变策略来增加收益。因此,在决策时应考虑纳什均衡的存在。
通过本课程的学习,我掌握了决 策与博弈论的基本理论和方法, 能够运用所学知识分析和解决实 际问题。
不足之处
在学习过程中,我发现自己在理 论深度和广度方面还有待加强, 需要更加深入地学习和理解相关 知识。
未来计划
我计划在未来的学习中,继续深 入探究决策与博弈论的理论体系, 并尝试将所学知识应用于实际研 究和项目中。
决策与博弈理论分析
目录
• 决策理论基本概念 • 博弈论基础知识 • 决策与博弈关系探讨 • 基于博弈论决策方法论述 • 决策与博弈在现实生活应用举例 • 总结与展望
01 决策理论基本概念
决策定义及分类
决策定义
决策是指在不确定条件下,为实 现特定目标,从多个可行方案中 选择一个最优方案的过程。
决策分类
决策过程与影响因素
决策过程
包括问题识别、信息收集、方案制定、方案评估和选择等步骤。
影响因素
决策者的个人特征(如价值观、经验、能力等)、组织环境(如组织结构、文 化、资源等)以及外部环境(如市场状况、政策法规等)都会对决策过程产生 影响。
02 博弈论基础知识
博弈论定义及发展历程
博弈论定义
博弈论是研究决策过程中理性人之间相互作用及决策均衡的 理论。它分析在竞争或合作环境中,参与者如何根据各自掌 握的信息和对未来结果的预期,选择最优策略以最大化自身 利益。

综合I类_II类理性人的博弈策略 (doc 30)

综合I类_II类理性人的博弈策略 (doc 30)

综合I类/II类理性人的博弈策略[摘要]两人零和博弈作为较归整的形式,在博弈论的早期研究中已经得到的深入讨论。

本文引入了I类理性与II类理性的概念,认为现实博弈中的参与人往往既可能从I类理性的角度采取战略,也可能是从II类理性人的角度出发,因此,构造了一个综合了I类和II类理性特征的支付矩阵,通过对一些常见的非零和博弈实例进行讨论,认为这一模型可以解决战略选择的不确定性问题。

但本文没有对此进行严格的数学证明。

[关键词]I类理性,II类理性,混合战略,战略选择,不确定性在经济学的博弈理论中,一般假设参与人(PLAYERS)具有理性人的特征, 即总是寻求自身的最大化利益,选择能使个人利益最大化的策略。

在计算收益的时候,使用的是个人所得。

这是一个“绝对量”,而现实中,也存在着另外一种情况,也就是参与者之间除了考虑自己的所得之外,也很关心对方的所得,并比较相互间的差异,采取使“相对”所得最大化的策略。

我们不妨把以追求相对所得最大化的行为人称为II类理性人,并从博弈论的角度对他们的行为模式进行研究。

具有II类理性特征的现象在很多方面都有存在。

比如,我们在人际交往中确实会碰到一些“损人利己”的人,也会见到“损人不利己”的人,从我们观点看来,他们是非理性的,但是进行换位思考就会发现,其实他们的行事原则是相对来说,总要让自己占便宜或者自己吃得亏比对方少,至于别人是否会吃亏,不是他们考虑的因素,这也是一种“理性”行为,也有出于心理层面的考虑,认为自己所得相对较少或者自己损失较大是一种不公平,并从自己的角度出发进行策略选择。

在激烈的市场角逐中,竞争双方在短期内有时会不计代价地采取大出血的策略而欲先致对手于死地,希望对手先被淘汰而自己会坚持到最后。

如果做不到这点,也要最大程度地削弱对手力量,使其一蹶不振而不会对自己再构成威胁。

这种商场竞争,并期望自己能笑到最后的思维,也是“理性”的。

有研究表明,国际关系中这样的II类理性的例子更不少见。

博弈论(整理过名词解释和简答)

博弈论(整理过名词解释和简答)

1、名词解释:1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。

2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。

3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。

4、常和博弈:是指博弈双方的得益总和为非零的常数变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。

在经济学中,博弈论是研究经济主体的决策相互影响6、战略:参与人在给定信息集的情况下的行为规则的完备描述。

7、均衡:所有参与人的最优战略组合。

8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。

9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。

10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。

11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。

12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。

13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件:(1)决策结x是单结信息集;(2)在一个信息集的决策结必须是同一个决策结的后续结。

综合类类理性人的博弈策略

综合类类理性人的博弈策略

综合类理性人的博弈策略在博弈论中,理性人的博弈策略是指在一定的博弈环境下,参与者为理性人,根据自身的利益最大化来选择合适的行为策略。

综合类理性人指的是在博弈环境中具有多种不同利益考量的参与者,他们会综合考虑各种因素来做出最佳的决策。

本文将从博弈论的角度出发,探讨综合类理性人在博弈中的策略选择。

博弈论基础概念在博弈论中,博弈是指两个或多个决策者在特定情况下做出决策的过程。

博弈过程中每个决策者都会考虑其他决策者的行为对自己可能产生的影响,然后选择最有利于自己的策略。

博弈论主要研究参与者之间的互动关系和最优策略的选择。

综合类理性人的特点综合类理性人在博弈中的特点是具有多种不同的利益考量,他们不单独追求某一方面的利益最大化,而是需要综合考虑多种因素来做出决策。

这种综合性的考量往往使得他们的决策更加复杂,需要综合考虑各种因素的权衡。

策略选择的依据综合类理性人在博弈中选择策略的依据主要包括以下几个方面:1.利益最大化:在博弈中,参与者的最终目的是追求自身的利益最大化,所以在选择策略时需要考虑如何能够最大化自己的利益。

2.对手的策略:综合类理性人需要考虑其他参与者可能采取的策略,以便更好地应对对手的举动。

3.博弈环境:博弈的环境包括参与者的数量、信息的透明度、博弈的次数等,这些都会对策略选择产生影响。

4.风险偏好:不同的人在面对风险时的偏好程度不同,综合类理性人需要考虑自己的风险偏好程度来选择最合适的策略。

综合类理性人的博弈策略在博弈中,综合类理性人可以采取多种策略来最大化自己的利益。

下面将介绍几种常见的博弈策略:1.合作与背叛:合作是指参与者之间相互合作,共同达成最优解;背叛是指参与者之间不合作,各自追求自身最大利益。

综合类理性人需要在合作与背叛之间做出权衡取舍,根据博弈的环境和对手的策略来选择合适的策略。

2.微笑与冷漠:微笑是指友好和善意的态度,冷漠是指不置可否的态度。

综合类理性人可以通过微笑和冷漠来传递信息,影响对手的行为。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

综合I类与II类理性人的博弈策略两人零和博弈作为较归整的形式,在博弈论的早期研究中已经得到的深入讨论。

本文引入了I类理性与II类理性的概念,认为现实博弈中的参与人往往既可能从I类理性的角度采取战略,也可能是从II类理性人的角度出发,因此,构造了一个综合了I类和II类理性特征的支付矩阵,通过对一些常见的非零和博弈实例进行讨论,认为这一模型可以解决战略选择的不确定性问题。

但本文没有对此进行严格的数学证明。

在经济学的博弈理论中,一般假设参与人(PLAYERS)具有理性人的特征, 即总是寻求自身的最大化利益,选择能使个人利益最大化的策略。

在计算收益的时候,使用的是个人所得。

这是一个“绝对量”,而现实中,也存在着另外一种情况,也就是参与者之间除了考虑自己的所得之外,也很关心对方的所得,并比较相互间的差异,采取使“相对”所得最大化的策略。

我们不妨把以追求相对所得最大化的行为人称为II类理性人,并从博弈论的角度对他们的行为模式进行研究。

具有II类理性特征的现象在很多方面都有存在。

比如,我们在人际交往中确实会碰到一些“损人利己”的人,也会见到“损人不利己”的人,从我们观点看来,他们是非理性的,但是进行换位思考就会发现,其实他们的行事原则是相对来说,总要让自己占便宜或者自己吃得亏比对方少,至于别人是否会吃亏,不是他们考虑的因素,这也是一种“理性”行为,也有出于心理层面的考虑,认为自己所得相对较少或者自己损失较大是一种不公平,并从自己的角度出发进行策略选择。

在激烈的市场角逐中,竞争双方在短期内有时会不计代价地采取大出血的策略而欲先致对手于死地,希望对手先被淘汰而自己会坚持到最后。

如果做不到这点,也要最大程度地削弱对手力量,使其一蹶不振而不会对自己再构成威胁。

这种商场竞争,并期望自己能笑到最后的思维,也是“理性”的。

有研究表明,国际关系中这样的II类理性的例子更不少见。

这些虽然是比较极端的例子,现实生活中,更多的可能是,每个人或组织都会考虑自己的所得,并期望自己的所得比别人的大。

关键是对两种所得在考虑时的权数是随情况不同而变化的。

如果否定在策略选择中的II类理性因素,可能会对一些现象无法解释。

尽管从道德角度讲不值得提倡,而且从价值评判上总是受到谴责, 但作为一种存在的现象,仍然有必要加以研究。

但本文从II类理性个体的博弈战略开始,并过渡到一个综合了I类和II类理性行为的博弈模型,对例中设计的参与人的战略选择,只进行经济学分析而不做道义上的衡量。

当博弈参与者是II类理性人时, 此时收益矩阵的取值有一定的规律。

假设两个参与人甲和乙都是II类理性人时,对比在I类理性的得益矩阵(图1)乙S1 S2甲S1 (m1,n1) (m2,n2)S2 (m3,n3) (m4,n4)图1.I类理性参与人收益矩阵II类理性参与人的得益矩阵如下图所示:乙S1 S2甲S1 (m1-n1,n1-m1) (m2-n2,n2-m2)S2 (m3-n3,n3-m3) (m4-n4,n4-m4)图2.II类理性参与人收益矩阵很明显,在II类理性参与人进行的博弈里,在每一个战略组合下,双方的得益之和必为零,此时的博弈具有零和的性质。

这就是早期博弈论中重点研究的二人零和博弈的情形,在1910年~1930年间, 作为绝对竞争的形式,零和博弈被认为是博弈理论中的主要形态得到了深入的研究。

而且对零和博弈的研究成果成为了现代博弈理论中很多新理论的基础概念。

作为一个练习,我们把常见博弈模型改为零和博弈情形,来看相应的结果会是怎样的。

一般认为,零和博弈是一种常和博弈,而最普遍意义下的博弈情形是非常和的。

例1.囚犯困境甲,乙涉嫌同谋犯罪,分别在两个房间被提审。

提审官预先向两人交代政策:如果他们都承认犯罪事实,各判刑10年;如果两人都否认,双方都无罪释放;如果一方认罪一方抵赖,认罪方获500元奖励,抵赖方被判15年。

在非零和博弈情形下的支付矩阵如下:乙承认抵赖甲承认(-10,-10) (5,-15)抵赖(-15,5) (0,0)图3纳什均衡策略是(承认,承认),如果甲乙两人是II类理性人,他们的相应支付矩阵就变成了:乙承认抵赖甲承认(0,0) (20,-20)抵赖(-20,20) (0,0)图4可以看出,纳什均衡策略还是(承认,承认)。

例2.春节前夕,某小镇上两个商铺甲和乙同时看到一个赚钱机会:去城里贩一批鞭炮回来卖,购货款加上运输费共5000元,如果没有竞争对手,这批货在小镇上能卖6000元;但如果另一家商铺也同时在小镇上卖鞭炮,价格下跌使得这批鞭炮只能卖4000元。

对于甲乙都是I类理性人而言,有支付矩阵:乙进货不进货甲进货(-1000,-1000) (1000,0)不进货(0,1000) (0,0)图5(不进货,进货)和(进货,不进货)为纳什均衡策略。

但是问题在于,甲乙双方同时行动,而互相不知道对方采取的行动。

如果甲乙都是II类理性人,那么情况会变成:乙进货不进货甲进货(0,0) (1000,-1000)不进货(-1000,1000) (0,0)图6此时的纳什均衡策略就是(进货,进货)。

例3.利己与利他甲乙作为I类理性人,其支付矩阵为乙利己利他甲利己(1,1) (4,0)利他(0,4) (3,3)图7纳什均衡是(利己,利己);甲乙作为II类理性人,其支付矩阵转化为:乙利己利他甲利己(0,0) (4,-4)利他(-4,4) (0,0)图8纳什均衡仍然是(利己,利己)。

例4.智猪博弈一头大猪和一头小猪被关在同一个猪圈里。

猪圈的一头安装着一个特制的按键,另一头安装着一个食槽。

但一头猪按下按键时,会有10单位的食物进入槽中,但按键的猪会付出2单位的成本;如果大猪先到食槽,则小猪只能吃到1单位的残羹剩饭;但若小猪先到的话,则它能吃到4单位的食物。

若两猪同时到,则小猪可吃到3单位的食物。

如果按照I类理性,有支付矩阵:小猪按键等待大猪按键(5,1) (4,4)等待(9,-1) (0,0)图9纳什均衡策略是(按键,等待)。

在II类理性下,重写支付矩阵为:小猪按键等待大猪按键(4,-4) (0,0)等待(10,-10) (0,0)图10纳什均衡是(按键,等待)和(等待,等待)。

有趣的是,此时小猪一定会选择等待(占优战略),而大猪无论怎么做,都是一无所获!最终结果是两头猪都会饿死。

在这种情况下,两头猪的结局似乎和“布里丹的饥饿的驴”有共同点,后者因为面对同样两堆干草不能做出选择而饿死。

在智猪博弈里,小猪认为自己的结果只能是损失或者既无损失又无所得,这时它会选择后者,而将责任推给大猪。

现实中,不大可能出现两猪都饿死的结果,因为大猪最终会明白,与其被饿死还不如去按键,此时自己会得到4单位的食物;而小猪也会因为大猪作出这样的选择,而同样得到4单位的食物。

例5.性别战两个恋人,男方想看拳击,女方想看芭蕾。

如果需要的话,他们会牺牲自己的爱好而迁就对方。

有下面的支付矩阵:女拳击芭蕾男拳击(2,1) (0,0)芭蕾(0,0) (1,2)图11纳什均衡是(拳击,拳击)和(芭蕾,芭蕾)。

将支付矩阵做个变换:女拳击芭蕾男拳击(1,-1) (0,0)芭蕾(0,0) (-1,1)图12那么,(拳击,芭蕾)就是纳什均衡策略。

例6.斗鸡博弈两个人举着火棍从独木桥两端向中间前进,每个人都有两种战略:前进或退下阵来。

若两人都继续前进,则两败俱伤;如果一方前进,另一方退下来,前进者取得胜利,退后者丢了面子;若两人都退了下来,则都丢了面子。

支付矩阵如下:A进退B 进(-3,-3) (2,0)退(0,2) (0,0)图13纳什均衡策略是(进,退)和(退,进);按II类理性对支付矩阵进行变换后得:A进退B 进(0,0) (2,-2)退(-2,2) (0,0)图14纳什均衡策略是(进,进)。

在上面的讨论中,可以看到,在例2中,对于I类理性参与人,(不进货,进货)和(进货,不进货)都是纳什均衡策略,采取哪个战略要取决于对方的行动,在一次静态博弈中是很难在行动之初就了解到对方的战略的,因此存在选择上的不确定性。

在智猪博弈中,对于II类理性参与人而言,不能根据支付矩阵决定出大猪的战略,如何才能避免在选择时出现这样的不确定状态呢?有必要考虑某种混合战略。

一般来讲,博弈的每个参与者在某些时间会按I类理性人行为模式行事,而有时又会采用II类理性人模式行事。

不妨将这种组合看成是决定于概率p和q。

这时候,假设甲遵循I 类理性的概率是p,那么他是II类理性人的概率就是1-p,乙遵循I类理性的概率是q,相应他是II类理性人的概率是1-q。

这时我们也可以构造出一种混合战略,得到支付矩阵:乙S1 S2甲S1 m1-(1-p)n1,n1-(1-q)m1 m2-(1-p)n2,n2-(1-q)m2 S2 m3-(1-p)n3,n3-(1-q)m3 m4-(1-p)n4,n4-(1-q)m4图15对于I类理性可以看作p=1,q=1时的上述混合战略的一个特例;而II类理性对应p=0,q=0的情况。

在现实中,还可能出现另一种情况,也就是甲乙两个参与者中,一方是I类理性的,而另一方是II类理性的,为方便起见,我们假设甲是I类理性人,乙为II类理性人,那么支付矩阵具有下面一般形式:乙S1 S2甲S1 (m1,n1-m1) (m2,n2-m2)S2 (m3,n3-m3) (m4,n4-m4)图16这其实是在p=1,q=0时,混合战略的一个特殊情况。

对于上述常见博弈案例,在这种情况下进行演绎,相应也会得到一些有趣的结果。

例1.囚犯困境乙承认抵赖甲承认(-10,0) (5,-20)抵赖(-15,20) (0,0)图17纳什均衡策略仍是(承认,承认);例2.进货与不进货乙进货不进货甲进货(-1000,0) (1000,-1000) 不进货(0,1000) (0,0)图18纳什均衡策略是(不进货,进货)。

例3.利己与利他乙利己利他甲利己(1,0) (4,-4)利他(0,4) (3,0)图19纳什均衡策略仍是(利己,利己)。

例4.智猪博弈小猪按键等待大猪按键(5,-4) (4,0)等待(9,-10) (0,0)图20纳什均衡策略是(按键,等待)。

例5.性别战女拳击芭蕾男拳击(2,-1) (0,0)芭蕾(0,0) (1,1)图21纳什均衡策略是(芭蕾,芭蕾)。

例6.斗鸡博弈A进退B 进(-3,0) (2,-2)退(0,2) (0,0)图22纳什均衡策略是(退,进)可以发现,在多数情况下,II类理性人的结果都好于I类理性人。

现在使用如图15的混合战略,看看在例2,性别战,斗鸡博弈和智猪博弈中,战略的选择情况:在例2中,为方便起见,将原支付矩阵先转换成:乙进货不进货甲进货(-1,-1) (1,0)不进货(0,1) (0,0)图23再设甲乙为I类理性的概率为p,q:乙进货不进货甲进货(-p,-q) (1,q-1)不进货(p-1,1) (0,0)图24可以看到(进货,不进货)是一个可能的均衡策略,但若要使其成为唯一的纳什均衡,还应该要求q-1>-q,即q>1/2。

相关文档
最新文档