最新博弈论公开课1~5节笔记
博弈论的读书笔记

博弈论的读书笔记博弈论,这一高深又充满智慧的学问,仿佛是一场思维的盛宴,让我在探索的过程中不断领略到人类决策与互动的奇妙之处。
在接触博弈论之前,我对人与人之间、组织与组织之间的竞争与合作的理解相对简单和直观。
然而,当我真正踏入博弈论的世界,才发现其中蕴含着极其复杂而又富有逻辑的规律。
博弈论的核心概念在于参与者的策略选择以及这些选择所导致的结果。
它并不是单纯地研究竞争,而是深入探讨在各种情境下,参与者如何通过理性的思考和策略的制定来实现自身的最优目标。
比如经典的“囚徒困境”,两个嫌疑人被分别审讯,如果两人都保持沉默,可能都会受到较轻的处罚;但如果一人背叛另一人保持沉默,背叛者将获得从轻处理,而沉默者将受到重罚。
在这种情况下,从个体角度出发,背叛似乎是最优选择,但最终结果往往是双方都选择背叛,导致整体的结果并非最优。
这个简单的例子深刻地揭示了个体理性与集体理性之间的矛盾。
再来看“斗鸡博弈”,两个实力相当的对手相向而行,如果双方都不让步,就会两败俱伤;但如果一方让步,另一方胜利,让步的一方虽然有所损失,但避免了更严重的后果。
这就需要参与者在权衡利弊后,根据对对方的判断来决定自己的策略。
这种博弈让我明白,在某些情况下,适度的妥协和退让并非懦弱,而是一种明智的选择。
博弈论中的“零和博弈”和“非零和博弈”也给我带来了深刻的启示。
零和博弈指的是一方的收益必然导致另一方的损失,总和为零。
例如赌博,一方赢的钱就是另一方输的钱。
然而,在现实生活中,更多的是“非零和博弈”,即双方的合作可能会带来共同的收益,或者通过合理的分配,实现双方都能获利的局面。
这让我意识到,在很多情况下,合作比竞争更能带来良好的结果。
在商业领域,博弈论的应用无处不在。
企业之间的竞争、价格战、市场份额的争夺,都可以用博弈论的思维来分析。
企业需要预测竞争对手的行动,制定自己的策略,以在激烈的市场竞争中获得优势。
例如,当一家企业决定推出新产品时,它需要考虑竞争对手可能的反应,是跟风推出类似产品,还是采取差异化策略。
「算法笔记」博弈论入门

「算法笔记」博弈论⼊门⼀、公平组合游戏 ICG1. 公平组合游戏的定义若⼀个游戏满⾜:1. 游戏有两个⼈参与,⼆者轮流做出决策。
2. 在游戏进程的任意时刻,可以执⾏的合法⾏动与轮到哪名玩家⽆关。
3. 不能⾏动的玩家判负。
则称该游戏为⼀个公平组合游戏。
2. ⼀些说明我们把游戏过程中⾯临的状态称为局⾯,整局游戏第⼀个⾏动的为先⼿,第⼆个⾏动的为后⼿。
我们讨论的博弈问题⼀般只考虑理想情况,即两⼈均⽆失误,都采取最优策略⾏动时游戏的结果。
定义必胜态为先⼿必胜的状态,必败态为先⼿必败的状态。
注意,在⼀般确定操作状态的组合游戏中,只会存在这两种状态,如果先⼿和后⼿都⾜够聪明,不会出现介于必胜态和必败态之间的状态。
⼀个重要的性质:⼀个状态是必败态当且仅当它的所有后继都是必胜态。
⼀个状态是必胜态当且仅当它⾄少有⼀个后继是必败态。
特别地,没有后继状态的状态是必败态(因为⽆法操作则负)。
⼆、Nim 博弈\(\text{Nim}\) 游戏是⼀个公平组合游戏。
⼤概是这样的:现在有 \(n\) 堆⽯⼦,第 \(i\) 堆有 \(a_i\) 个。
两⼈轮流操作,每⼈每次可以从任选⼀堆中取⾛任意多个⽯⼦,但是不能不取。
取⾛最后⼀个⽯⼦的⼈获胜(即⽆法再取的⼈就输了)。
结论:\(\text{Nim}\) 博弈先⼿必胜,当且仅当 \(a_1\oplus a_2\oplus \cdots \oplus a_n\neq 0\)。
证明:为了证明这个结论,我们需要证明:1. 所有⽯⼦都被取⾛是⼀个必败局⾯。
2. 对于任意⼀个局⾯,若 \(a_1\oplus a_2\oplus \cdots \oplus a_n\neq 0\),⼀定能得到⼀个 \(a_1\oplus a_2\oplus \cdots \oplusa_n=0\) 的局⾯。
3. 对于任意⼀个局⾯,若 \(a_1\oplus a_2\oplus \cdots \oplus a_n=0\),⼀定不能得到⼀个 \(a_1\oplus a_2\oplus \cdots \oplusa_n=0\) 的局⾯。
博弈论笔记

活学活用博弈论威胁,承诺与序惯博弈1 要使威胁与承诺可信的方法:切断退路交出控制权切断联系建立起一致的诚实信用按顺序各个击破的威胁非理性的疯狂和精神失常。
2 重复博弈的长期性与多阶段对于背叛很有帮助。
3 可置信的问题总是使截止期限很难确定。
4 人们一旦受到伤害就很难恢复,不过如果继续与违背交往对于自己有所补偿的话,那么最好的做法就是宽恕。
但是那些被宽恕的人很可能在将来对你或者别人造成更大的伤害,所以法律对于那些伤害别人的人进行强制性制裁反而会降低对人们的伤害。
5 公司并购的毒丸:当并购者对标的公司的控股达到一定比例时,标的公司让原有股东(不包括并购者)拥有额外购股权或者发放红利给员工,以增加并购者的成本,确保自己的经营权。
6 阻止竞争对手进入的价格门槛:高于自己的成本同时低于对手的成本,让对手进入后没有利润而自己有微薄的利润。
7 连锁店悖论:第十个连锁店如果不会降价,那么第九个就不会降价,第九个不会降价,那么第八个也不会降价,如此类推:第一个连锁店也不会降价。
所以进入者不会对连锁店的降价威胁置信。
8 对于一个理性的竞争对手来说,他不会通过对你的印象来判断你所说的话,而是从你的威胁和承诺是否对于你的将来有利来判断你是否可信。
9 只关心自己的收益是否最大化,不要因为对手比自己赚的多而心生烦恼。
10 除非你选择退出游戏,否则不要考虑自己的沉没成本。
在有沉没成本的时候做的决策时考虑的成本有且只有自己的边际成本。
11 靠降价来阻止对手进入并非上策,因为价格易变。
价格竞争的危险1 要使报复有效,那么就要迅速做出反应并且采取切实的行动。
当对手相信你会全力以赴时他就会因为担心你的报复而不采取行动了。
2 采用复杂的定价策略可以有效的避免价格竞争。
3 如果采用价格竞争那么就会对服务打折,如果采用服务竞争那么就会避免价格竞争。
4 对于商家来说服务,品质,商品颜色,商标品牌都可以竞争,尽可能避免价格竞争。
但是即使没有价格竞争也会有竞争者进入从而引起价格竞争,此时对于商家来说把价格定得比较复杂可以避免价格竞争。
《博弈论》知识点总结归纳

《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要:博弈论是研究决策者之间相互影响和决策制定的数学分析工具。
本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳,以帮助读者更好地理解和应用博弈论的相关知识。
关键词:博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具,源自于经济学和数学两大学科的交叉。
博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。
本文将对博弈论的相关知识进行详细的总结和归纳。
一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。
博弈的基本要素包括:参与者、策略、收益和信息。
1.2 参与者参与者是指博弈中的决策者,可以是个人、团体、企业、国家等。
参与者的目标是实现自身利益的最大化。
1.3 策略策略是指参与者在博弈中所能采取的行动或选择。
通常分为纯策略和混合策略。
1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。
收益可以用来衡量参与者的利益大小。
1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。
信息可以分为对称信息和非对称信息。
二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后,没有动力再改变策略,从而达到一种稳定状态。
常见的均衡概念有纳什均衡、帕累托最优和博弈解。
2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择,使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对,没有动机再改变策略。
2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择,使得至少有一个参与者的收益达到最大,而其他参与者的收益至少不会减小。
帕累托最优是一种资源分配的有效方式。
2.4 博弈解博弈解是指在博弈中的一组策略选择,使得没参与者都没有动力再改变策略。
博弈解往往是均衡的特殊情况。
三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式,即参与者的利益总和为零。
耶鲁大学开放课程博弈论笔记

耶鲁大学开放课程博弈论笔记博弈论,是一门研究决策者之间互动行为的学科,它在经济学、政治学、社会学等多个领域发挥着重要作用。
耶鲁大学开放课程中的博弈论课程为我们提供了深入理解和掌握博弈论的机会。
在本篇文章中,我将分享我在学习耶鲁大学开放课程博弈论时所做的笔记和心得体会。
一、博弈论的基本概念和原理1.1 构成博弈论的基本要素博弈论研究的基本要素包括玩家、策略和支付。
玩家是博弈中的决策者,策略是玩家可选择的行动方案,支付是博弈的结果对玩家所产生的效用。
1.2 纳什均衡纳什均衡是博弈论中最重要的概念之一。
在一个博弈中,若每个参与者选择了一个策略,并且没有一个参与者愿意改变自己的策略,那么这种策略组合就被称为纳什均衡。
纳什均衡是一个非合作博弈中的稳定状态。
1.3 合作博弈与非合作博弈博弈论可分为合作博弈和非合作博弈两大类。
合作博弈强调玩家之间的合作与协调,而非合作博弈中玩家之间是相互独立的,没有直接的合作关系。
二、博弈论的应用领域2.1 经济学中的博弈论应用在经济学中,博弈论被广泛应用于市场竞争、拍卖、企业策略等方面。
通过博弈论的模型和方法,我们能够更好地理解各种经济行为和市场现象,并提供决策方案。
2.2 政治学中的博弈论应用政治学中,博弈论主要应用于研究选举、政策制定等政治行为。
博弈论揭示了政治参与者之间的互动关系和利益博弈,为我们分析政治决策提供了一种新的视角。
2.3 社会学中的博弈论应用博弈论在社会学中的应用主要涉及合作与互助、社会规范等方面。
通过博弈论的分析,我们能够更好地理解人类社会中的合作关系、道德行为和社会规范的形成。
三、耶鲁大学开放课程博弈论学习心得在学习耶鲁大学开放课程博弈论的过程中,我深刻体会到博弈论的重要性和应用广泛性。
通过学习博弈论,我不仅了解了博弈论的基本概念和原理,还学会了运用博弈论的方法分析和解决实际问题。
耶鲁大学开放课程博弈论课程的教学内容十分丰富,通过生动的案例分析和实践操作,课程帮助我更好地理解了博弈论的核心思想和应用方法。
博弈论读书笔记

1、 人面对自然物时如何行为?寻找人类如何最大化的使用自然物的途径,主要借鉴自然科学所积累的知识及其提升的工具理性。
2、 人面对着他人或社会时如何行为?探究如何充分运用人的理性以及实现社会需求的最大化,需啊哟分析具体环境下人的行为方式和偏好。
3、 博弈思维的联合理性就具有双重特性:一是相互依存,即博弈中的任何博弈方都受到其他博弈方行为的影响;二是理性行为,即博弈方的决策必定建立在预测其他博弈方的行动之上。
4、 非合作的纳什均衡存在以下问题:纳什均衡的非唯一性;不考虑博弈方的策略选择如何影响对手的策略;允许不可信威胁的存在。
5、 完美信息是指一个博弈方对其他博弈方的行动都有准确的了解,即么个信息集只包含一个值。
完全信息则是指自然不首先行动和自然地初始行动被所有博弈方准确观察到,即没有事前的不确定性。
不完全信息意味着不完美信息,但不完美信息并不意味着不完全信息。
6、 在不完全信息博弈中,首先行动的是“自然”,“自然”决定了博弈方以多大的可能性采取某种行动,由“自然”决定的每个博弈方以多大的可能性采取某种行动的情况只有每个博弈方个人知道,其他博弈方都不知道。
确定博弈是指不存在由“自然”作出行动的博弈,否则就是不确定博弈。
7、 严格占优均衡是指无论对手选择何种策略,均衡状态时的策略都是博弈方的最好选择;纳什均衡则是指在对手不改变当前策略的条件下,均衡状态时的策略是博弈方的最好选择。
8、 在对策G 中,如果策略组合1(,,)n s s **是一个纳什均衡,那么它的严格占优策略在重复剔除过程中就不会被剔除掉。
如果策略组合是剔除的严格占优策略均衡,那么他一定是一个纳什均衡。
9、 一般地,要使得任何有限博弈都存在纳什均衡这一命题,就必须有个前提条件:允许博弈方选择混合策略,即博弈方以一定的概率选择某种策略。
设想在多次反复博弈中,博弈方的最终收益状况可以从平均得益上表现出来。
一般地,如果一个策略规定博弈方在每个给定的信息情况下只选择一种特定的行动,就称该策略为纯策略;相反,如果一个策略规定博弈方在每一个给定的信息情况下以某种概率分布随机地选择不同的行动,就称为混合策略。
《博弈论基础》读书笔记(一)博弈标准式与纳什均衡

《博弈论基础》读书笔记(⼀)博弈标准式与纳什均衡在之前⼀个⽼师的安利下,还是开了这个博弈论的坑。
书是:这本书本⾝写的⾮常棒,⽽且很易懂,强烈安利。
顺便⾃⼰记录下读书的笔记和⼀些想法,同时也把书中⽐较难理解的地⽅⽤⾃⼰的理解说⼀下,希望能帮到⼤家。
第⼀章 1完全信息静态博弈在本章,我们来讨论如下简单形式的博弈(包含如下特点):1. 静态博弈:所有游戏的参与者同时选择⾏动,然后根据⾏动每个参与者得到各⾃的结果2. 完全信息博弈:即每⼀个参与者的收益函数在所有参与者之间是共同知识,即不存在信息的不对称性,也就是说每个参与者对游戏规则以及游戏演化机理完全明⽩。
关于本章的结构:在1.1节中我们先会介绍两个问题:1. 如何描述⼀个博弈问题2. 如何求得博弈问题的解在1问题中我们定义了博弈的标准式表述和严格劣战略的概念,在2问题中我们根据前⾯的介绍引出了纳什均衡的概念。
在1.2节中我们会运⽤前⾯的⼯具来分析古诺(Cournot,1838)的不完全竞争模型,使⽤纳什均衡的⽅式对之进⾏求解,之后我们将重回理论知识,我们将会定义混合战略,它可以理解为⼀个参与者并不能确定其他参与者会如何⾏动时应该选的战略,之后会引出纳什定理。
1.1节博弈的标准式和纳什均衡1.1.A 博弈的标准式表述⾸先举⼀个⼤家都⽐较熟悉的、很经典的例⼦:囚徒困境警⽅逮捕甲、⼄两名嫌疑犯,但没有⾜够证据指控⼆⼈⼊罪。
于是警⽅分开囚禁嫌疑犯,分别和⼆⼈见⾯,并向双⽅提供以下相同的选择:若⼀⼈认罪并作证检控对⽅(相关术语称“背叛”对⽅),⽽对⽅保持沉默,此⼈将即时获释,沉默者将判监10年。
若⼆⼈都保持沉默(相关术语称互相“合作”),则⼆⼈同样判监1年。
若⼆⼈都互相检举(相关术语称互相“背叛”),则⼆⼈同样判监8年。
对于这个博弈我们可以来使⽤如下矩阵来进⾏描述对于这个矩阵,其横纵轴分别为囚徒1、2所对应的选择。
⽅框⾥的值第⼀项代表在此选择下,囚徒1 的收益情况,第⼆项代表囚徒2的收益情况。
博弈论读书笔记(五)重复博弈

博弈论读书笔记(五)重复博弈2.3重复博弈从这⾥开始,就进⼊博弈论⽐较难以理解的地⽅了。
我也不跟着书上的章节⾛,根据⾃⼰的理解和书上的例⼦来写,如果理解有什么不对的地⽅,欢迎各位⼤佬的指正。
⾸先我们来明晰博弈论到底在讨论些什么:对于这个问题,前⾯⼏章的内容可能对⼤家会造成⼀定的误导。
因为根据前⾯⼏章的例⼦,我们可以很容易地认为,博弈论就是在讨论在某个规则下,参与者最优的策略和参与者之间达到的平衡。
这句话本⾝没有错误,但是我们很容易理解为:这个平衡是像最开始那两个囚徒⼀样,选择“保证对⽅不会背叛并且⾃⼰在此情况下能获得最⼤利益”的战略所达到的平衡(这句话有点难以理解,不过我相信你能明⽩我的意思)。
例如第⼀章第⼀节中囚徒困境双⽅都选择招认(因为选择合作即不招认,结果可能是被背叛)。
但是⼀旦进⼊了重复博弈那么我们就不能只考虑眼前的利益(即保守地只去选择单次博弈的纳什均衡),⽽要考虑多次重复博弈的总收益。
这个时候就需要参与双⽅共同商定⼀个“协议”(例如双⽅说好都选择不招认),这个协议必须是对于双⽅都有利的(⾄少由于选择单次博弈的纳什均衡,例如双⽅不招认总⽐双⽅都招认要好),并且协议中会对不遵守规则的进⾏惩罚,以便于对每个⼈来说选择合作是最好的结果。
从这⾥我们就可以理解“博弈论教你如何制定规则的”这句话了。
好了,这⼀章最核⼼的思想在这⾥已经讲完了,虽然我可能说的不是那么清晰,不过还是希望你能认真理解上⾯所说的,这会对下⾯的概念理解有很⼤帮助。
2.3.A两阶段重复博弈先给出⼏个先⾏的定义和定理:定义:对个定的阶段博弈G,令G(T)表⽰G重复T次的有限重复博弈,并且在下⼀次博弈开始前,所有以前的博弈都可以被观测到。
G(T)的收益为T次阶段博弈收益的简单相加。
这个定义最重要的是引出⼀个重复博弈中收益的概念,即T次博弈的收益简单相加,后⾯我们会提到贴现的概念,不过到这⾥先理解到简单相加就⾏。
定理:如果阶段博弈G有唯⼀的纳什均衡,则对任意有限的T,重复博弈G(T)有唯⼀的⼦博弈精炼解:即G的纳什均衡结果在每⼀阶段重复进⾏。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
题目一
情景一: 在不被你对手看到的情况下,选择 α 或者 β,我们会按以下方式给出你们的成绩:
如果你选择 α 而你对手选 β,那么你得分+3 而你的对手得分-1 如果你们都选 α,那么你门的得分都+0 如果你选择 β 而你对手选 α,那么你得分-1 而你的对手得分+3 如果你们都选 β,那么你们的得分都+1
表达:s’i 严格劣于 si,Ui(si,s-i)>Ui(s’i,s-i) for all “s-i”.
文字表述:如果 si 总是更好的选择,即总能给参与人 i 带来更高的收益,而无论其他参与人 怎么选。
例:防线布置问题
入侵者打算入侵一个国家,有两条路,必须通过其一才能进入,你是这个国家的防御者, 要决定在哪个路口布置防线,只能防守二者之一。一条路崎岖(途中会损失一个营的兵力), 另一条路平坦,如果入侵者遇到了你布置的防线,不管哪条路都要再损失一个营的兵力。
Yale students are evil.
第二节:学会换位思考 博弈的要素有哪些?
要素 参与人 players
表述法(Notation) i,j
The Number game You all
策略 strategies
si(参与人 i 的某个策略)
13
Si(表示策略集合 Strategy alternatives) 1,2,3……100
S(表示某一次博弈)——一个策略组合(a strategy profile profile)
每个参与者对应一个策略组合(或是电 子表格的一个样本)
s-i(表示除了 i 外其他参与人的策略)
收益 payoffs
Ui(1,2……N)——所有参与人的策略决定 简写:Ui(s)
Payoffs=5dollars-mistakens 0dollars (otherwise)
αβ
α 0,0 +3,-1
β -1,3 +1,+1
这种情况下不管我的对手选择什么,我选 α 得到的结果总是最优的。
情景二: 在不被你对手看到的情况下,选择 α 或者 β,我们会按以下方式给出你们的成绩:
如果你选择 α 而你对手选 β,那么你得分-1 而你的对手得分-3 如果你们都选 α,那么你门的得分都+0 如果你选择 β 而你对手选 α,那么你得分-3 而你的对手得分-1 如果你们都选 β,那么你门的得分都+1
第四节:足球比赛与商业合作之最佳对策 伐点球问题:
Goalerlr源自ShooterL4,-4
9,-9
M
6,-6
6,-6
R
9,-9
4,-4
U1(L,l)=4——射进的概率为 40% 结论:无论如何千万不要从中路射门。
不要选择任何信念下都非最佳对策的策略。 我们忽略了什么?
…… Definition3(最佳对策): (1)Player i’s strategy si is a best response(BR) to the strategy s-i of the players
例:
II
I
L
T
5,-1
C
R
11,3
0,0
B
6,4
0,2
2,0
Players:I and ii Strategy alternatives: S1={T,B} S2={L,C,R} Payoffs: Ui(T,C)=11 Uii(T,C)=3 博弈分析: 不管 i 怎么选,中间总是优于右边(center strictly dominates right),得出结论,参与者 ii 不应 该选右。
αβ α 0,0 -1,-3 β -3,-1 +1,+1
这种情况下,当对手选 α,我选 α 较优;当对手选 β,我选 β 较优。-- 协和谬误(Coordination problem)
Test does 2 dominate 1? vs 1: U1(1,1)=50% < U1(2,1)=90% vs 2: U1(1,2)=10% < U1(2,2)=50% vs 3: U1(1,3)=15% < U1(2,3)=20% vs 4: U1(1,4)=20% < U1(2,4)=25% …… 结论:立场 2 严格优于立场 1
结论:入侵者不会采取“弱劣势策略”崎岖之路是弱劣势策略,应在平坦之路设防。
Definition2(弱劣势策略):Player I’s strategy “s’i” is weakly dominated by her strategy “si” if player i’s payoff from choosing “si” against “s-i” is always as big as or equal to payoff from choosing “s’i” against “s-i” for all things that anyone else could do.(参与者的策略 s’i 弱劣于其 他策略 si 当且仅当在对手选 s-i 的情况下,参与人 i 选择 si 的收益等于对手选 s-i 下她选 s’i 的收益。而且在任何情况下此条件均成立)
入侵者
e
h
防守者
E
1,1
1,1
H
0,2
2,0
入侵者收益为攻入国家时还剩多少兵力,防守者的收益为入侵者损失多少兵力。
分析:如果入侵者走 eazy pass,你应防守 eazy pass(优于 hard pass);
如果入侵者走 hard pass,你应防守 hard pass(优于 eazy pass)
Definition1:Player I’s strategy “s’i” ,is strictly dominated by player i’s strategy “si” ,if “Ui” from choosing “s-i”, is strictly bigger than UI(si) when other people choose “s’i”,forall”s-i”.(参与者 i 的策略 s’i,严格劣于参与者 i 的另一个策略 si,在其他参与者选择 s-i 时,此情况下选 s’i 的收 益 UI(s’i),对所有的 s-i 均成立。)
2.并非人人都在投票,有人不投票也是一种策略 3.实际上有多位候选人,不只有两个 4.候选人未必能坚定他的立场,也就是说选民未必相信你的立场 5.其他(党内初选,多维度问题) 『最佳对策』:Best response
2
l
r
1
u
5,1
0,2
m
1,3
4,1
d
4,2
2,3
选上是对手选左时的最佳对策 选中是对手选右时的最佳对策 上中下三个策略中对手选左或选右的可能性都为 1/2 Choosing upper:expacted payoff of U is (1/2,1/2)=1/2*5+1/2*0=2.5 Choosing middle: expacted payoff of M is (1/2,1/2)=1/2*1+1/2*4=2.5 Choosing down:expacted payoff of D is (1/2,1/2)=1/2*4+1/2*2=3 模型解法: 画坐标图,假设选左概率为 X,选右概率为(1-X),解出各自区域的概率面积,联立方程, X=1/3.
表达:s’i 弱劣于其他策略 si,Ui(si,s-i) >=Ui(s’i,s-i)
第三节:迭代剔除和中位选民定理 『迭代剔除』: 例:政治模型案例 假设有两个候选人,他们为了选举必须确定自己的政治立场,他们要从一系列政治主张中选 择一个政治立场。一共有 10 个立场, 1,2,3,4,5,6,7,8,9,10 最靠近左边的(1)代表左翼分子的立场,最靠近右边的(10)代表右翼分子的立场,现假 设每一个立场都会得到 10%的选票,选民们会投票给离他们最近的候选人,出现平局时选 票会分摊,收益为:候选者希望尽可能最大化获得的选票。 分析:1 为严格劣势策略,因为 2 优于 1,意味着选择立场 2 会比立场 1 获得更多选票,无 论另一个候选人如何选择。
Ui(si,s-i)>=Ui(si’,s-i) for all si’ vssi 参与人 i 的策略 si,是一个最佳对策 BR,是对手的策略 s-i 的最佳对策,如果参与人 i 在对 手的策略 s-i 下,选 si 的收益弱优于其他策略 si’,这对于参与人 i 的所有 si’都适用。 OR Si’ slove max Ui(si,s-i) (2) Player i’s strategy si is a best response(BR) to the strategy s-i of the players Eui(si,p)>=Eui(si’,s-i) for all si’ vssi 例:Eui(L,p)=p(l)*Ui(L,l)+p(r)*Ui(L,r) 合伙人博弈: 有两个实体共同完成一个协作项目,这两家公司平分利润,即各自持有 50%股份,每个股 东都要选择为公司投入多少精力,S=[0,4](连续的),假设这个企业的利润是已知的,计算 方式为:4*[s1+s2+b*s1*s2],0<=b<=1/4, 参与人 1 的收益 U1(s1,s2)=1/2*4*[s1+s2+b*s1*s2]-s1^2, 参与人 2 的收益 U2(s1,s2)=1/2*4*[s1+s2+b*s1*s2]-s2^2, 求参与人 1 的最佳策略。 分析:Max(s1) 2(s1+s2+b*s1*s2)-s1^2 一阶求导:2*(1+b*s2)-2*s1=0 二阶求导:s1=1+b*s2 =BR1(s2) S1 是参与人 1 的最佳对策 同理,s2=1+b*s1=BR2(s1) S2 是参与人 2 的最佳对策 由 S1=S2 得 S1=S2=1/(1-B)