综合I类与II类理性人的博弈策略doc17(3)

合集下载

微观经济学第17讲-重复博弈

两阶段重复博弈
• 不过也说明子博弈完美对于可信性的要求并不严格。 • 人们可以在第二阶段经过重新谈判都选择帕累托占优的(R1 , R2)，此时(M1 , M2)就不是最优的 • 为了解决重新谈判这个问题，可以考虑下面的博弈
两阶段重复博弈
L1 M1 R1 P1 Q1
L2 1,1 0,5 0,0 0,0 0,0 M2 5,0 4,4 0,0 0,0 0,0 R2 P2 Q2 0,0 0,0 0,0 0,0 0,0 0,0 3,3 0,0 0,0 0,0 4,1/2 0,0 0,0 0,0 ½,4
两阶段重复博弈
L1
L2 2,2 M2 6,1 7,7 1,1 R2 1,1 1,1 4,4
M1 1,6 R1 1,1
两阶段重复博弈
• 这里有三个均衡(L1 , L2)， (M1 , M2)， (R1 , R 2) • 如果G={A1 ,…,An ;u1,…,un }是一个有多个纳什均衡的完全信息静态博弈，那么重复博弈G(T)可以存在子博弈精炼解，其中对每一t<T，t阶段的结果都不是G的纳什均衡 • 这个结论说明，对将来行动所做的可信威胁可以影响到当前行动。
两阶段重复博弈
• 纯策略均衡(L1 , L2)，(R1 , R2)，(P1 , P2)和 (Q1 , Q2) • 后面三个纳什均衡处于一个帕累托边界上 • 如果博弈进行两个阶段 • 策略：如果第一阶段(M1 , M2)，那么(R1 , R2);如果(M1 ,Z)，那么(P1 , P2);如果(x , M2), 那么(Q1 , Q2);如果(y , h)，那么(R1 , R2)
两阶段重复博弈
• 此博弈第二阶段均衡为(L1 , L2) • 假如第一阶段，那么博弈变为参与人2 L2 R2 L1 2,2 6,1 参与人1 R1 1,6 5,5

博弈论——理性与非理性精品PPT课件

“旅行者困境”: 从100到0
巴罗教授提出这个案例旨在警世：一方面，它有启示人们在为私利考虑的时候不要太“精明”，告诫人们精明不等于高明，太精明往往会坏事；另一方面，它于理性行为假设的适用性提出了警告。
“旅行者困境”: 从100到0
理性行为假设是讨论消费者和企业这些经济主体人的行为的基本假设。所以经济学在理性行为假设之下得到的结论是否符合实际，还要进行另外的分析。在这个意义上，“旅行者困境”是所有博弈论学者甚至所有经济学者必然面对的困境。
换言之,人不但知道自己的利益何在，而且知道该如何去追求。他可以“损人利己”，也可能“利人利己”，但并不会去“损己利人”、“损人损己”和“损人不利己”。
人是否聪明到了知道自己利益所在，并知道追求利益的正确途径？
理性的困境
分钱博弈
两人分一笔总数固定的钱，比如100元。方法是：一人提出方案，另外一人表决，如果表决的人同意，那么就按提出的方案来分，如果不同意的话，两人将一无所得。
假如由一次博弈变成重复博弈呢，比如，大家讲清楚下次再得100枚金币时，先由2号强盗来分，然后是3号……“轮流坐庄”，这倒颇有点像西方国家的两党政治，当然，你也可以说，其实是民主制度下的分赃制。
可能还会有比这闹得更凶的。比如，四人会想：l号居然要独得97枚金币，这简直是赤裸裸的剥削嘛！于是，他们立即起来“造反”，组成一个反l号的大联盟并制定出新规则：四人平分金币，独将l号扔进大海……
3号知道这个策略，就会提(100，0，0)的分配方案，对4号、5号一毛不拔而将全部金币归为己有，因为他知道4号一无所获但还是会投赞成票，再加上自己一票他的方案即可通过。
不过，2号推知到3号的方案，就会提出(98，0，l，1)的方案，即放弃3号，而给予4号和5号各1枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利，他们将支持他而不希望他出局而由3号来分配。这样，2号将拿走98枚金币。不过， 2号的方案会被l号所洞悉，l号并将提出(97，0，1，2，0)或(97，0，1，0，2)的方案，即放弃2号，而给3号1枚金币，同时给4号或5号2枚金币。由于l号的这一方案对于3号和4号(或5号)来说，相比2号分配时更优，他们将投l号的赞成票，再加上1号自己的票，1号的方案可获通过，97枚金币可轻松落入腰包。

博弈论模型解析决策者理性选择与策略

博弈论模型解析决策者理性选择与策略博弈论是一种研究决策者在相互依赖环境下进行决策的数学模型。

决策者在博弈过程中会根据自己的利益和对其他决策者行为的预测来选择最优策略。

本文将介绍博弈论的基本概念，并解析决策者的理性选择和策略。

首先，我们来了解博弈论中的一些重要概念。

博弈论主要研究的是决策者的互动关系，其中包括决策者、策略和支付。

决策者是参与博弈的个体，可以是个人、组织或国家等。

策略是决策者进行决策的行动或方案。

支付是决策者从策略中获得的效益或成本。

决策者在博弈过程中会根据自己的利益和对其他决策者行为的预测来选择最优策略。

决策者在选择策略时通常会考虑以下几个因素：自己的利益、对手的选择、对手的动机以及对手有关信息的了解程度。

理性决策者会选择能够最大化自己效益的策略。

决策者的理性选择基于博弈论中的均衡概念。

博弈论中的均衡是指决策者在相互依赖环境下做出的稳定决策。

常见的均衡概念包括纳什均衡、次序均衡和完全均衡等。

纳什均衡是指在博弈中，每个决策者都已经做出了最优选择，并且其他决策者无法通过改变自己的策略来获得更大的效益。

次序均衡是指在博弈中，决策者的行动顺序是合理的，每个决策者的策略是对先前决策者行动的响应。

完全均衡是指在博弈中，每个决策者都已经做出了最优选择，并且其他决策者对这些最优选择的预期与实际情况相符。

博弈论的最经典模型是囚徒困境。

囚徒困境是指两个犯罪嫌疑人之间的博弈，他们可以选择合作或背叛。

如果两人都选择合作，则会得到较轻的刑期；如果两人都选择背叛，则会得到较重的刑期；如果其中一人选择合作而另一人选择背叛，则背叛者会得到零刑期，而合作者会得到较重的刑期。

在囚徒困境中，每个囚徒都会选择背叛，因为他们认为对方也会选择背叛，这样才能避免得到较重的刑期。

然而，如果两人能够相互合作，他们将会得到较轻的刑期。

除了囚徒困境，博弈论还可以应用于许多其他领域。

例如，企业之间的价格竞争、国家之间的军备竞赛以及拍卖等都可以通过博弈论模型进行分析。

第1章策略式博弈

高等经济学讲义蒲勇健重庆大学教材：2013年陪同2012年诺贝尔奖得主A.Roth访问中国第一章博弈模型的策略式表述第一节策略式表述的博弈策略式的博弈也称为静态博弈。

抽象的表达就是：定义1.1：一个策略式博弈,(),()i iG N A u =由下列要素构成： ·博弈参与人集合：{1,...,}N n =；·每个参与人i 有一个包含其所有可选择行动的行动集A i ，i ∈N ；·每个参与人i 有一个支付函数:i u A R →，其中j N j A A ∈=⨯。

参与人（players ）：每个博弈都有参与者人。

记i 为博弈的一个参与人（1,2,,i n =），则N ={1,...,n }为所有参与人构成的集合。

象棋比赛有两人参与，因此{1,2}N =；麻将有四个人参与，因此{1,2,3,4}N =。

参与人可以是作为自然人的个人，也可以是企业、组织甚至国家等等。

博弈论假定参与人是追求效用最大化的理性人，即他们会根据自己的信念，选择他们觉得最好的行动。

行动空间（action space ）：每个参与人i N ∈都有行动集A i 。

该行动集包含可供其选择的所有行动，因此被称为行动空间。

记i A 中的一个元素为i i A a ∈；又记1(,...,,...,)i n a a a a =为一个行动组合。

行动组合告诉我们每个参与人的行动。

又记j j NA A ∈=⨯为行动组合空间。

有时我们也称行动为“策略”（在引入“扩展式博弈之前”是如此的），行动空间为“策略空间”，行动组合为“策略组合”，行动组合空间为“策略组合空间”。

支付函数（payoff function ）：指参与人从博弈中获得的效用水平（或利润水平等其他的目标）。

根据前面给出的说明，无论什么样的支付函数，一般都是以效用函数作为基础的。

如果所有参与人的行动构成行动组合a ，则i 的支付为(),i i u u a i N =∈。

第二单元理性的博弈

论语》是一部什么书？
是记录孔子及其弟子言行的书。共20篇。是儒家最重要的经典。

21
上页
返回
下页
《论语》：
• 中国两千年来最重要的课本。 • 其中语句大量化为成语（全文11750字，
出成语300多条）。
22
上页
返回
下页
《论语》作者是谁？
• 孔子的弟子及再传弟子。 • 注意：作者不是孔子。
第二单元理性的博弈——典籍

典籍，是文化的载体，承载着一个国家或民族最悠久、最优秀的思想。阅读典籍，就是在汲取民族文化，从古老文献中获得新生的智慧……
文化聚焦

公元前800年到公元前200年，人类精神文明史的第二次重大突破，被称之为“轴心时代” 中国先秦诸子，百家争鸣，成就中华文化最初的华彩乐章：《易经》、孔子、墨子、老子、庄子、《孙子兵法》印度的释迦摩尼创立了佛教，在亚洲广泛流传犹太教与基督教先后完成《圣经》的新约和旧约部分，成为现代欧美文化的基石古希腊出现苏格拉底、柏拉图和亚里士多德三位伟大的哲学家他们提出的思想原则塑造了不同的文化传统，一直在影响人类的生活，直到今天还在发挥着巨大的作用

【原文】子曰：“君子和而不同，小人同而不和。”《子路》【翻译】孔子说：“君子讲求和谐而不同流合污，小人只求完全一致，而不讲求协调。”
探究与思考

请找出《论语》中其他有关“仁”的两个句子，并结合自己的理解分析。

翻译颜渊请教什么是“仁”（仁，人生正途），孔子说：“能够自己做主去实践的规范就是人生的正途，你只要有一段时间能够自己做主去实践礼的规范，天下人都会肯定你走在人生的正路上，走在人生的正路上是要靠自己的，难道要靠别人吗？”颜渊说：“希望指点一些具体做法。”孔子说：“不合乎礼的不去看，不合乎礼的不去听，不合乎礼的不去说，不合乎礼的不去做。”颜渊说：“我虽然不够聪明，也要努力做到这些。”

综合类类理性人的博弈策略

综合类理性人的博弈策略在博弈论中，理性人的博弈策略是指在一定的博弈环境下，参与者为理性人，根据自身的利益最大化来选择合适的行为策略。

综合类理性人指的是在博弈环境中具有多种不同利益考量的参与者，他们会综合考虑各种因素来做出最佳的决策。

本文将从博弈论的角度出发，探讨综合类理性人在博弈中的策略选择。

博弈论基础概念在博弈论中，博弈是指两个或多个决策者在特定情况下做出决策的过程。

博弈过程中每个决策者都会考虑其他决策者的行为对自己可能产生的影响，然后选择最有利于自己的策略。

博弈论主要研究参与者之间的互动关系和最优策略的选择。

综合类理性人的特点综合类理性人在博弈中的特点是具有多种不同的利益考量，他们不单独追求某一方面的利益最大化，而是需要综合考虑多种因素来做出决策。

这种综合性的考量往往使得他们的决策更加复杂，需要综合考虑各种因素的权衡。

策略选择的依据综合类理性人在博弈中选择策略的依据主要包括以下几个方面：1.利益最大化：在博弈中，参与者的最终目的是追求自身的利益最大化，所以在选择策略时需要考虑如何能够最大化自己的利益。

2.对手的策略：综合类理性人需要考虑其他参与者可能采取的策略，以便更好地应对对手的举动。

3.博弈环境：博弈的环境包括参与者的数量、信息的透明度、博弈的次数等，这些都会对策略选择产生影响。

4.风险偏好：不同的人在面对风险时的偏好程度不同，综合类理性人需要考虑自己的风险偏好程度来选择最合适的策略。

综合类理性人的博弈策略在博弈中，综合类理性人可以采取多种策略来最大化自己的利益。

下面将介绍几种常见的博弈策略：1.合作与背叛：合作是指参与者之间相互合作，共同达成最优解；背叛是指参与者之间不合作，各自追求自身最大利益。

综合类理性人需要在合作与背叛之间做出权衡取舍，根据博弈的环境和对手的策略来选择合适的策略。

2.微笑与冷漠：微笑是指友好和善意的态度，冷漠是指不置可否的态度。

综合类理性人可以通过微笑和冷漠来传递信息，影响对手的行为。

综合I类II类理性人的博弈策略

VS
详细描述
在智猪博弈中，大猪和小猪的策略取决于它们的相对大小。当小猪选择等待时，大猪会主动行动并获得更多收益；而当大猪选择等待时，小猪会主动行动并获得更多收益。这种策略通常用于描述自然界中的大小关系以及人类在社会、经济等领域的竞争与合作行为。
05
综合i类ii类理性人的博弈策略
混合策略
博弈论广泛应用于经济、政治、生物、社交等多个领域。
它旨在分析不同决策主体在给定情境下的策略选择及后果。
博弈论的基本要素
参与者
博弈中的决策主体，通常称为玩家或局中人。
支付函数
每个玩家在特定策略组合下的收益或损失。
策略
玩家在博弈中可选择的行动方案。
均衡
一种策略组合，其中每个玩家都认为在当前情境下没有更好的选择。
总结词
囚徒困境是一种博弈模型，其中两个参与者被隔离并面临相互矛盾的利益。
详细描述
在囚徒困境中，每个参与者都希望对方选择合作，但出于自身利益的考虑，又不得不选择背叛。这种策略通常用于描述人类在社会、经济等领域的竞争与合作行为。
智猪博弈策略
总结词
智猪博弈是一种具有非零和性质的博弈模型，其中大猪和小猪之间的利益存在矛盾。
生物学中的应用
生态系统
在生态系统中，博弈论被用来研究生物种群之间的竞争、合作研究动物的行为生态学，特别是动物之间的互动和适应性问题。
进化生物学
博弈论在进化生物学中也扮演着重要角色，用来解释生物的进化过程和适应性问题。
THANKS
感谢观看
定义
混合策略是一种博弈策略，其中每个参与者以某种概率选择不同的策略。它允许参与者随机选择行动，以避免被对方预测并采取相应的对策。

CH02混合策略(博弈论,张醒洲)

– 白色 %
2021/5/27
张醒洲，大连
16
猜猜哪个硬币被标记了
• 这里有三枚硬币,每一面被贴上红色或白色纸片(如下图).为了方便从左向右编号1、2、 3号硬币
1
2
3
• 现在从中任取一枚放在桌面，结果你看到白色。请猜一下，这是几号硬币?
1/3 1/3
N
1/3
1/2
C1
1/2
1/2
C2
1/2
•
15、一年之计，莫如树谷；十年之计，莫如树木；终身之计，莫如树人。2021年5月上午8时49分21.5.2708:49May 27, 2021
•
16、提出一个问题往往比解决一个更重要。因为解决问题也许仅是一个数学上或实验上的技能而已，而提出新的问题，却需要有创造性的想像力，而且标志着科学的真正进步。2021年5月27日星期四8时49分5秒 08:49:0527 May 2021
13、He who seize the right moment, is the right man.谁把握机遇，谁就心想事成。21.5.2721.5.2708:49:0508:49:05M ay 27, 2021
•
14、谁要是自己还没有发展培养和教育好，他就不能发展培养和教育别人。2021年5月 27日星期四上午8时49分5秒 08:49:0521.5.27
• 模型
– 两个参与人 {1,2} – 每个参与人的策略
空间为{H,T} – 收益
• 零和
• 试着找到纳什均衡
正面参与人 1
背面
参与人2
正面
背面
-1, 1 1, -1

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

综合I类与II类理性人的博弈策略两人零和博弈作为较归整的形式，在博弈论的早期研究中已经得到的深入讨论。

本文引入了I类理性与IＩ类理性的概念，认为现实博弈中的参与人往往既可能从Ｉ类理性的角度采取战略,也可能是从ＩI类理性人的角度出发，因此,构造了一个综合了I类和ＩI类理性特征的支付矩阵，通过对一些常见的非零和博弈实例进行讨论,认为这一模型可以解决战略选择的不确定性问题。

但本文没有对此进行严格的数学证明。

ﻫﻫ
在经济学的博弈理论中,一般假设参与人(PＬAＹＥRＳ)具有理性人的特征，即总是寻求自身的最大化利益，选择能使个人利益最大化的策略。

在计算收益的时候，使用的是个人所得。

这是一个“绝对量”，而现实中，也存在着另外一种情况,也就是参与者之间除了考虑自己的所得之外,也很关心对方的所得,并比较相互间的差异，采取使“相对”所得最大化的策略。

我们不妨把以追求相对所得最大化的行为人称为II 类理性人，并从博弈论的角度对他们的行为模式进行研究。

ﻫﻫ具有II类理性特征的现象在很多方面都有存在。

比如,我们在人际交往中确实会碰到一些“损人利己”的人，也会见到“损人不利己”的人,从我们观点看来,他们是非理性的,但是进行换位思考就会发现,其实他们的行事原则是相对来说，总要让自己占便宜或者自己吃得亏比对方少，至于别人是否会
吃亏，不是他们考虑的因素,这也是一种“理性”行为,也有出于心理层面的考虑,认为自己所得相对较少或者自己损失较大是一种不公平,并从自己的角度出发进行策略选择。

在激烈的市场角逐中,竞争双方在短期内有时会不计代价地采取大出血的策略而欲先致对手于死地,希望对手先被淘汰而自己会坚持到最后。

如果做不到这点,也要最大程度地削弱对手力量，使其一蹶不振而不会对自己再构成威胁。

这种商场竞争,并期望自己能笑到最后的思维,也是“理性”的。

有研究表明，国际关系中这样的II类理性的例子更不少见。

这些虽然是比较极端的例子，现实生活中，更多的可能是,每个人或组织都会考虑自己的所得，并期望自己的所得比别人的大。

关键是对两种所得在考虑时的权数是随情况不同而变化的。

如果否定在策略选择中的II类理性因素，可能会对一些现象无法解释。

尽管从道德角度讲不值得提倡,而且从价值评判上总是受到谴责, 但作为一种存在的现象，仍然有必要加以研究。

但本文从ＩI类理性个体的博弈战略开始，并过渡到一个综合了I类和II类理性行为的博弈模型，对例中设计的参与人的战略选择，只进行经济学分析而不做道义上的衡量。

ﻫ
当博弈参与者是II类理性人时, 此时收益矩阵的取值有一定的规律。

假设两个参与人甲和乙都是ＩI类理性人时，对比在I类理性的得益矩阵(图１)ﻫﻫ
乙。