博弈论 2×2博弈编程自动解 10×10以内博弈自动解纯策略均衡

合集下载

博弈论介绍

•
为什么博弈论在经济学领域会产生如此大的影响呢？这是因为博弈论改变了传统微观经济学的某些基本假设，从一个独特的视角帮助我们更加深刻地理解和把握经济现象，并指导更加有效的经济政策制订。博弈论作为现代经济学的前沿领域，已成为占据主流的基本分析工具。
一、博弈论的基本概念
博弈论，英文为Game theory，是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。 • 这些相互依赖、相互影响的决策行为及其结果的组合称为博弈(Game)。
行动次序
信息
静态纳什均衡纳什贝叶斯均衡海萨尼
动态子博弈精练纳什均衡泽尔腾精炼贝叶斯均衡泽尔腾等
完全信息
不完全信息
二、博弈的种类
• 一、完全信息静态博弈 • (一)完全信息静态博弈定义 • 所谓完全信息静态博弈指的是各博弈方同时决策，或者决策行动虽有先后，但后行动者不知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈。 • 在博弈论中,一个博弈可以用两种不同的方式来表达： • 一种是策略式表达:另一种是扩展式表达.策略式表达更适合于静态博弈，而扩展式表达更适合于讨论动态博弈。
•性别战(battle of sexes) 女足球男足球芭蕾 2，1 0，0 芭蕾 0，0 1，2
• 斗鸡博弈(chicken game)(胆小鬼博弈)
B 进退
A
进退
-3，-3
0，2
2，0
0，0
• 进入阻挠(entry deterrance) 在位者默许斗争
进入者
进入不进入
40，50
0，300
-10，0
0，300

博弈论导论 2

图 2－5 军备竞赛
思考：现实生活中还有哪些情况属于囚徒困境？练习：将团队生产问题模型化成囚徒困境；如何理解囚徒困境与“看不见的手”之间的矛盾？
2.1.5 走出囚徒困境
从社会福利的角度讲，囚徒困境不是帕累托最优的，但这与理性人的假设并不矛盾。
① ②
这实际上是 Betrand 价格竞争模型。这是 Hardin（1968）发表在 Science 上但是被经济学引用最多的例子。但是，最近有学者提出了“反公地悲剧”理论。董志强（2007）启发我使用这个简单的收益矩阵而非复杂的数学模型。白鲨在线 2
2.3.2 性别战
如图 2－12。两个博弈相同的地方在于：（1）存在多重均衡，而且双方各自偏向一个均衡；（2）任何一个均衡结果都是帕累托最优的。信念扮演了重要的作用。在这个博弈中，假设男方是一个有名的拳击手，而女方也知道这点，那么（拳击，拳击）应该是一个均衡结果，而（芭蕾，拳击）不应该出现。
白鲨在线 5
2.3.4 协调博弈
如图 2－14，史密斯公司和琼斯公司独立地决定选择何种智能手机操作系统。若两家公司选择同样的操作系统，销售会更好。特征：存在多重均衡，但是一些均衡帕累托优于另一些均衡，这与性别战和斗鸡博弈都不同。提示：一定要注意不同博弈模型的结构性特征，而不是过于关注具体数字。思考：现实生活中有哪些博弈是性别战、斗鸡博弈和协调博弈？
图 2－1 双边优势
图 2－2 单边优势
2.1.2 定义优势策略均衡
并且，我们有命题：如果一个博弈 N ,{Si }i 1 ,{vi ()}i 1 存在优势策略均衡 s ，那么 s 就是惟一的优势策略均衡，并且也是惟一的纳什均衡。证明过程略（可做思考题或作业）。
白鲨在线 1

博弈论板子

博弈知识汇总有一种很有意思的游戏，就是有物体若干堆，可以是火柴棍或是围棋子等等均可。

两个人轮流从堆中取物体若干，规定最后取光物体者取胜。

这是我国民间很古老的一个游戏，别看这游戏极其简单，却蕴含着深刻的数学原理。

下面我们来分析一下要如何才能够取胜。

（一）巴什博奕（Bash Game）：只有一堆n个物品，两个人轮流从这堆物品中取物，规定每次至少取一个，最多取m个。

最后取光者得胜。

显然，如果n=m+1，那么由于一次最多只能取m个，所以，无论先取者拿走多少个，后取者都能够一次拿走剩余的物品，后者取胜。

因此我们发现了如何取胜的法则：如果n=（m+1）r+s，（r为任意自然数，s≤m),那么先取者要拿走s个物品，如果后取者拿走k（≤m)个，那么先取者再拿走m+1-k个，结果剩下（m+1）（r-1）个，以后保持这样的取法，那么先取者肯定获胜。

总之，要保持给对手留下（m+1）的倍数，就能最后获胜。

这个游戏还可以有一种变相的玩法：两个人轮流报数，每次至少报一个，最多报十个，谁能报到100者胜。

（二）威佐夫博奕（Wythoff Game）：有两堆各若干个物品，两个人轮流从某一堆或同时从两堆中取同样多的物品，规定每次至少取一个，多者不限，最后取光者得胜。

这种情况下是颇为复杂的。

我们用（ak，bk）（ak ≤ bk ,k=0，1，2，…,n)表示两堆物品的数量并称其为局势，如果甲面对（0，0），那么甲已经输了，这种局势我们称为奇异局势。

前几个奇异局势是：（0，0）、（1，2）、（3，5）、（4，7）、（6，10）、（8，13）、（9，15）、（11，18）、（12，20）。

可以看出,a0=b0=0,ak是未在前面出现过的最小自然数,而 bk= ak + k，奇异局势有如下三条性质：1。

任何自然数都包含在一个且仅有一个奇异局势中。

由于ak 是未在前面出现过的最小自然数，所以有ak > ak-1 ，而 bk= ak + k > ak-1 + k-1 = bk-1 > ak-1 。

完整版)博弈论知识点总结

完整版)博弈论知识点总结博弈论是研究决策主体在相互作用中做出的决策以及均衡问题的学科。

该学科的研究假设包括：1）决策主体是理性的，会尽可能地最大化自己的收益；2）完全理性是共同知识；3）每个参与者都能对环境和其他参与者的行为形成正确的信念和预期。

博弈中涉及到的变量包括：参与人、行动、战略和信息。

完全信息指每个参与人都了解其他参与人的支付函数，而完美信息则指在博弈过程中，每个参与人都能观察和记忆之前的行动选择。

不完全信息则表示参与人没有完全掌握其他参与人的信息，存在不确定性因素。

博弈与传统决策的区别在于，博弈是决策主体之间的相互作用，需要考虑其他决策者的选择和效用函数。

博弈的表示形式包括战略式博弈和扩展式博弈，其中战略式博弈适用于描述不需要考虑博弈进程的完全信息静态博弈问题，而扩展式博弈则更适用于描述动态博弈问题。

与战略式博弈不同，扩展式博弈更注重参与者在博弈过程中面临的决策问题的序列结构分析，而不是仅关注博弈结果的描述。

扩展式博弈包括参与人集合、参与人的行动顺序、序列结构和参与人的支付函数等要素。

战略式博弈是一种静态模型，而扩展式博弈是一种动态模型。

博弈论可以分为合作博弈和非合作博弈，其中合作博强调团体理性、团体最优决策和效率，而非合作博弈强调个人理性和个人最优决策。

根据参与人行动先后顺序的不同，博弈可以分为静态博弈和动态博弈，后者包括先行动者获得先行动者行动信息的情况。

根据参与人对信息的掌握程度，博弈可以分为完全信息和不完全信息博弈。

根据决策主体对信息的掌握程度和行动的先后顺序，博弈可以分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。

不同类型的博弈有不同的均衡类型和求解方法，顺序的不同也会影响均衡结果。

Hotelling价格竞争模型是一种重要的扩展式博弈，用于描述两个企业在同一市场上的价格竞争。

相对应。

占有均衡是指在博弈中存在一组参与人的战略选择，使得每个参与人都无法通过改变自己的战略来提高自己的支付。

博弈论知识点总结完整版

博弈论（一）：基本知识1.1定义:博弈论，又称对策论，是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论，是研究竞争的逻辑和规律的数学分支。

即，博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用，以及不同决策主体之间的均衡。

1.2基本要素：参与人、各参与人的策略集、各参与人的收益函数，是博弈最重要的基本要素。

1.3博弈的分类：博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。

两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议（binding agreement）。

倘若不能，则称非合作博弈（Non-cooperative game）。

合作博弈强调的是集体主义，团体理性，是效率、公平、公正；而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大，强调个人理性、个人最优决策，其结果有时有效率，有时则不然。

目前经济学家谈到博弈论主要指的是非合作博弈，也就是各方在给定的约束条件下如何追求各自利益的最大化，最后达到力量均衡。

博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息，是否了解两个角度进行。

把两个角度结合就得到了4种博弈：a、完全信息静态博弈，纳什均衡，Nash(1950)b、完全信息动态博弈，子博弈精炼纳什均衡，泽尔腾（1965）c、不完全信息静态博弈，贝叶斯纳什均衡，海萨尼（1967-1968）d、不完全信息动态博弈，精炼贝叶斯纳什均衡，泽尔腾（1975）Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容：完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式：策略式表述(Strategic form), 扩展式表述（Extensive form）1.6占优均衡：a、占优策略：在博弈中如果不管其他参与人选择什么策略，一个参与人的某个策略给他带来的支付值始终高于其他策略，或至少不劣于其他策略，则称该策略为该参与人的严格占优策略或占优策略。

博弈论知识点的总结

博弈论知识总结博弈论概述：1、博弈论概念：博弈论：就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论研究的假设：1、决策主体是理性的，最大化自己的收益。

2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量：博弈参与人：博弈中选择行动以最大化自己受益的决策主体。

行动：参与人的决策选择战略：参与人的行动规则，即事件与决策主体行动之间的映射，也是参与人行动的规则。

信息：参与人在博弈中的知识，尤其是其他决策主体的战略、收益、类型（不完全信息）等的信息。

完全信息：每个参与人对其他参与人的支付函数有准确的了解；完美信息：在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动，否则为不完美信息。

不完全信息：参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息，即存在着有关其他参与人的不确定性因素。

支付：决策主体在博弈中的收益。

在博弈中支付是所有决策主题所选择的行动的函数。

从经济学的角度讲，博弈是决策主体之间的相互作用，因此和传统个人决策存在着区别：3、博弈论与传统决策的区别：1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下，最大化自己效用，研究工具是无差异曲线。

可表示为：maxU(P,I)，其中P为市场价格，I为消费者可支配收入。

2、其他消费者对个人的综合影响表示为一个参数——市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。

但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。

4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。

战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。

(完整版)博弈中纯策略纳什均衡点

能得到的收益。当然，每个局中人都希望自己的尽可能大。
《博弈论及其应用》（汪贤裕） 9
完全信息静态博弈三要素
完全信息静态博弈就是在上述三要素的基础上，分析各局中人为实现自身利益最大化的策略行为分析。
简记为： G [N ,{Si },{Pi }]
《博弈论及其应用》（汪贤裕） 10
§2.1.2 占优均衡
(s
||
s
(i h
)
)
（2.1.1）
i 则称，局中人的策略 sk(i) 严格占优策略 sh(i)，或称策略 sh(i)相
对于sk(i)是严格劣策略。
《囚徒困境》中、犯罪嫌疑人A和B策略（承认）就是一个严
格占优策略。
《博弈论及其应用》（汪贤裕） 12
定义2.1.2 占优均衡
在博弈G [N,{Si},{Pi}]中，若每一个局中人 i
定理2.2.1
在n 人非合作博弈 G [N ,{Si },{Pi }] 中：
若， s
都存在一个策略
s
' i
Si
, (i
N
)
，使得
si'占优于
Si \ {si' }
中任何策略，那么策略组合
s'
(
s1'
,
s
' 2
,
sn' )
称为 G 的占优策略均衡，简称占优均衡。对应的
{Pi (s') | i N} 称为占优均衡结果。
《博弈论及其应用》（汪贤裕） 13
定义2.1.2 占优均衡（续）
《博弈论及其应用》（汪贤裕） 17
§2.2.1 纯策略纳什均衡
定义2.2.1 纯策略纳什均衡点和均衡结果定理2.2.1 重复剔除占优均衡与纯策略纳什均衡 ※ 纳什均衡点与多目标规划求解比较

博弈论启发式算法和纳什均衡-概述说明以及解释

博弈论启发式算法和纳什均衡-概述说明以及解释1.引言1.1 概述博弈论是一门研究决策和策略的数学理论，它以个体或组织在面对冲突和竞争时的互动行为为研究对象。

在现实生活中，博弈论可以应用于各种领域，如经济学、政治学、社会科学等。

启发式算法是一种基于经验和规则的问题解决方法，它通过不断试错和搜索最优解的过程，逐步逼近问题的解。

启发式算法可应用于各种优化问题、组合问题以及决策问题等。

本文旨在探讨博弈论、启发式算法和纳什均衡之间的关系。

博弈论的基本概念将会被介绍，包括博弈的类型、参与者的策略选择、收益与支付等因素。

启发式算法的原理和应用将会被解释，以展示它们在解决博弈论问题中的潜力。

本文的结论将会重点探讨纳什均衡的概念和特点。

纳什均衡是指在博弈中，每个参与者根据其他参与者的策略选择下的最佳响应策略。

此外，还将探讨博弈论、启发式算法和纳什均衡之间的联系，以揭示它们在实际问题中的应用潜力和相互作用关系。

通过本文的阅读，读者将对博弈论、启发式算法和纳什均衡有更深入的理解，并能够将它们应用于实际问题的解决中。

本文的目的是为读者提供一种全面的视角，以便能够更好地理解和应用这些概念和方法。

1.2 文章结构文章结构：本文主要分为引言、正文和结论三个部分。

在引言部分，将对博弈论、启发式算法和纳什均衡进行简要概述，并介绍文章的目的。

正文部分将着重阐述博弈论的基本概念以及启发式算法的原理和应用。

最后，在结论部分将探讨纳什均衡的概念和特点，并深入讨论博弈论、启发式算法和纳什均衡之间的关系。

本文旨在通过对博弈论、启发式算法和纳什均衡的研究，探索博弈论在实际问题中的应用，并探讨启发式算法与纳什均衡的关联性，从而提供对博弈论和启发式算法的理解和应用以及对纳什均衡的深入认识。

1.3 目的本部分将重点介绍本文的目的。

通过阅读本文，读者将能够深入了解博弈论、启发式算法和纳什均衡之间的关系。

我们将首先简要介绍博弈论的基本概念，包括博弈的定义和元素，以及博弈论在经济学、政治学和计算机科学等领域的应用。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

略7 大大大大大大大大大大大大大大大
略8 大大大大大大大大大大大大大大大
略9 大大大大大大大大大大大大大大大
略10 大大大大大大大大大
策1 策2 策3 策4 策5 策6 策7 策8 策9 策10
பைடு நூலகம்
注：4×3以外的区域不用看
在矩阵内输入收益
甲
乙略1 略2 略3 略4 略5 略6 略7 略8 略9 略10 2 2 8 1 2 # 2 2 5 3 # 1 5 7 3 3 0 1
# 0 1 # # #
策1 策2 策3 策4 策5 策6 策7 策8 策9 策10
例：在上面输入4×3博弈的收益后，右边显示了纯策略均衡的情况。当同一区域内双方的收益都
这个矩阵内显示纯策略均衡的位置
甲
乙
略1 大大大大大大大大大
略2 大大大大大大大大大
略3 大大大大大大大
略4 大大大大大大大大大大大大大大大
略5 大大大大大大大大大大大大大大大
略6 大大大大大大大大大大大大大大大
。当同一区域内双方的收益都显示“大”时，则为纯策略均衡。此博弈的纯策略均衡为“策3”对“略1”
略10 大大大大大大
策3”对“略1”