博弈论四种类型

合集下载

博弈论名词解释

博弈论名词解释博弈论是一种研究冲突和合作决策的数学理论。

在博弈论中，玩家通过制定决策来实现自己的利益，同时也要考虑其他玩家的决策对自己利益的影响。

博弈论的研究对象是在有限的资源和信息条件下，决策制定者之间的相互作用。

以下是一些常见的博弈论名词解释：1. 纳什均衡（Nash equilibrium）：是指在博弈过程中，每个玩家依据其他玩家的行为选择自己的最佳策略，而没有动机单方面改变策略。

纳什均衡是一种稳定状态，即每个玩家的策略都是最优的。

2. 零和博弈（zero-sum game）：是指一个玩家的收益与另一个玩家的损失完全相等，总收益为零。

在零和博弈中，一个玩家的利益的增加必然导致另一个玩家的利益的减少，双方利益存在完全的对立关系。

3. 非零和博弈（non-zero-sum game）：是指一个玩家的利益的增加不一定导致另一个玩家的利益减少。

在非零和博弈中，玩家之间的利益可以相互协调、互利互惠。

4. 博弈树（game tree）：是博弈论中常用的一种图形表示方式，用于展示博弈过程中的决策步骤和可能的结果。

博弈树由顶点和边组成，顶点表示玩家的决策点，边表示不同的行动选择。

5. 最优策略（optimal strategy）：在博弈论中，最优策略是指玩家的最佳选择，使得在对手的任何策略下，自身获得最大利益。

最优策略可能根据玩家的目标和信息不同而变化。

6. 合作与背叛（cooperation and defection）：博弈论中常涉及到的两个关键概念。

合作指玩家之间通过协调行动来获得共同利益，背叛指玩家为了自身利益而选择对方不合作。

7. 博弈矩阵（game matrix）：是一种表示博弈参与者和策略选择关系的表格。

博弈矩阵以参与者为行，以策略选择为列，用数字表示参与者在不同策略下的收益情况。

8. 支配策略（dominant strategy）：在博弈论中，一种策略如果在所有可能的对手策略下都能带来最佳结果，则被称为支配策略。

博弈论四种类型

精炼贝叶斯纳什均衡
信号传递博弈
分离均衡
根据所得信息修正判断概率，根据收益最大化决策
信号传递博弈
不完全信息重复博弈与声誉
Milgrom-Roberts垄断限价模型
不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。
混同均衡
准分离均衡
在博弈开始之前参与人之间的信息不存在不确定性，但是参与人行动存在先后顺序。
在完全信息动态博弈中，为了表示参与人之间的信息掌握关系，引入了信息及的概念。
子博弈精炼纳什均衡
子博弈精炼纳什均衡
有限次重复博弈均衡
与纳什均衡的唯一性有关
连锁店悖论
1、均衡结果是原博弈的Nash均衡；
2、同时在每一个子博弈上构成Nash均衡
无限次重复博弈均衡（无名氏定理）
与贴现因子有关
囚徒困境（冷酷战略）
无限期轮流讨价还价模型
一般博弈
逆向归纳法求解
斯坦科尔伯格寡头竞争
雇主与公会之间的竞争
不完全信息静态博弈
在博弈开始之前参与人之间的信息存在不确定性，但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。
不确定是参与人的了性的不确定性
贝叶斯纳什均衡
贝叶斯纳什均衡
混合战略（不完全信息情况下纯战略均衡的极限）
对原混合战略加入少许不确定性因素，求极限。
性别战
1、均衡存在性
2、不确定性体现为类型的不确定性
一般贝叶斯均衡
Harsanyi转换
机制设计
ห้องสมุดไป่ตู้不完全信息动态博弈
在博弈开始前参与人之间的信息存在不确定性，同时参与人行动存在先后顺序。不完全信息动态博弈过程不仅是参与人选择行动的过程，而且是参与人不断修正信念的过程。

聊聊四种经典的博弈论模型

聊聊四种经典的博弈论模型展开全文1、囚徒困境：为什么两个犯人都选择坐牢官差破获了一宗盗窃案，抓住了两名犯罪嫌疑人。

但在审讯过程中，被关在一处的二人始终矢口否认盗窃罪名，说东西不是我们偷的。

为了避免两人达成默契，结成攻守同盟，官差决定对他们进行单独审讯。

官差表示，如果两人中有一人坦白认罪，则可立即释放，另一个不认罪的人判5年徒刑；如果两人都坦白罪刑，则他们将各判2年徒刑。

但还有一种情况，那就是两个人都拒绝坦白，由于缺乏证据，他们只会以扰乱公共场合为名判处3个月拘役。

这就是两名罪犯面临的困境中，他们会做出怎样的选择呢？首先，他们互相之间都不清楚对方是否会坦白，其次，二人都希望将自己的刑期缩至最短。

如此考虑，最终，两名犯人都会选择坦白交代。

上面的案例就是博弈论所说的“囚徒困境”。

犯人们如果彼此合作，可为集体带来最佳利益（刑期最短）；但当二人面对同样的情况且不知道对方如何选择时，在理性思考后，双方都会得出相同的结论（坦白交代），以便达到个人利益的最大化。

囚徒困境是博弈论的“非零和博弈”中具代表性的例子，反映的是个人的最佳选择并非是团体的最佳选择。

虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。

2、智猪博弈：赢的总是小猪猪圈里有大小两头猪，它们在同一个食槽里进食。

为了保持饲料的新鲜，在远离猪食槽的另一边有一个踏板，大猪或小猪跑过去，每按动一次踏板，投食口就会掉落10个单位的食物。

于是，在大猪和小猪每次进食前，就会形成这样一种局面:如果小猪跑去按踏板，大猪守在食槽边，则大猪小猪吃到的食物比是9:1；反之，如果大猪去按而小猪守在食槽边，则吃食比例是6:4。

如果二猪同时到食槽边，则吃食比是7:3。

这样一来，从纯收益的角度考虑，小猪就更愿意选择在食槽边等待食物落出，因为“等待优于行动”，而大猪只能被迫奔忙在踏板和食槽之间。

上述“智猪博弈”的案例是经济学家的假设论证模型，这个博弈的结果，用经济学视角看待，可以解释为：谁占有更多资源，谁就必须承担更多义务。

《产业经济学》第五章--(博弈1)讲解

在上述“囚徒困境”的例子中，每个囚徒都有两种可选择的策略：坦白或抵赖。显然不论同伙选择什么策略，每个囚徒的最优策略是 “坦白”。如果一个博弈中，某个参与人有占优策略，那么该参与人的其他可选择策略就被称为“劣策略”。
在一个博弈里，如果所有参与人都有占优策略存在，那么占优策略均衡是可以预测到的唯一的均衡，因为没有一个理性的参与人选择劣策略。所以在“囚徒困境”博弈里，“坦白、坦白”是占优策略均衡。
第五章博弈
第一节博弈论的基本概念与应用
一、博弈论的定义博弈论，英文为Game theory，是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。一些相互依赖、相互影响的决策行为及其结果的组合称为博弈。博弈论研究的是存在相互外部效应条件下的主体的决策问题。
在寡头垄断的市场上，只有少数几家厂商在相互竞争，寡头们面对的市场环境或者说竞争对手的行为将随着他们本身的决策行为而变动，即寡头们的决策是相互作用的，每个企业的得益和利润不仅取决于自身的决策，也取决于其他厂商的决策。寡头厂商之间可能有激烈的竞争，这些竞争涉及价格、产量、广告、投资等许多方面的决策，在分析寡头垄断市场中的企业决策行为时，就必须把各种决策者之间的策略相互作用纳入到经济模型中，这就是一种博弈分析。
1．从行动的先后次序来划分，博弈可以分为静态博弈和动态博弈。静态博弈指在博弈中，参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取了什么具体行动；动态博弈指的是参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动的博弈。
2．从参与人对其他参与人的各种特征信息的获得差异来划分，博弈可分为完全信息博弈和不完全信息博弈。完全信息博弈指的是每一个参与人对所有其他参与人的特征，如策略集合及得益函数都有准确完备的知识；否则就是不完全信息博弈。

博弈论四种博弈类型

华为在阿根廷电信设备市场上的竞争博弈华为技术有限公司是一家总部位于中国广东省深圳市的生产销售电信设备的员工持股的民营科技公司，经过数十年的发展，成为全球最大的电信网络解决方案提供商，全球第二大电信基站设备供应商，同时也是全球第六大手机厂商，其海外市场的利润占到其总利润的75%。

在华为进入阿根廷电信设备市场之前，阿根廷的电信设备市场由爱立信、阿尔卡特-朗讯以及阿根廷本土设备供应商三家共同分享市场份额，接下来，我们将分析其不同条件下的博弈结果：1、完全信息情况下的静态博弈A 、纳什均衡：我们将上述三家公司统称为原有垄断者，华为称为虎视眈眈的潜在进入者，原有垄断者想要保住自己现有的垄断地位，就会想要阻止潜在进入者进入，在这个博弈中，原有垄断者有两种选择：一是进行斗争，打价格战；二是不斗争，默许其进入从而共同竞争，具体的支付矩阵结果表示如下：原有垄断者潜在进入者进入不进入根据纳什均衡的定义：好的一组策略。

当潜在进入者选择进入时，原有垄断者的最优选择是不斗争，获得70单位的利润；同样的，原有垄断者选择不斗争的情况下，潜在进入者的最优选择是进入，获得20单位的利润，从而获得一个要求纳什均衡的均衡（进入，不斗争），同理可以得出另一个纳什均衡（不进入，斗争）。

B 、占优策略：现假设华为公司已经获得了阿根廷电信集团的经营许可证，在严格管制情况下二者都不能以低于成本的价格进行价格战，同时禁止出现单一寡头垄断的情形，（各自均有正的利润）在这两种情况下考虑两者是否进行价格战的情况，具体支付矩阵如下所示：原有垄断者潜在进入者低价高价对于潜在进入者而言，不论原有垄断者是否进行价格战，潜在进入者的占优策略都是进行价格战，因为在原有垄断者定低价时，潜在进入者定低价可以获得额外的20单位利润，在原有垄断者定高价时，潜在进入者定低价可以获得额外的10单位利润，从而确定华为必将进行价格战，在完全信息情况下，原有垄断者会将自己置于潜在进入者的位置进行决策，从而决定自己也要进行价格战，否则会失去更多的利润。

博弈论知识点总结

博弈论知识点总结博弈论是一门研究决策与策略的数学理论，主要涉及博弈参与者之间的冲突、竞争和合作，并通过数学模型和方法来分析博弈参与者的最佳决策和最优策略。

下面是博弈论的一些基本概念和重要知识点的总结。

1. 标准形博弈（Normal Form Game）：标准形博弈是博弈论中最常见的形式，参与者同时选择策略，并根据选择产生相应的收益或损失。

标准形博弈由参与者的策略集合、收益函数和参与者的收益组成。

2. 纳什均衡（Nash Equilibrium）：纳什均衡是指在一个博弈中，参与者选择的策略组合使得没有任何一个参与者单方面改变自己的策略能够获得更高的收益。

纳什均衡是博弈论的核心概念，用来描述博弈中的稳定状态。

3. 零和博弈（Zero-sum Game）：零和博弈是指当其中一个参与者获得了收益，另一个参与者就会产生相应的损失，总收益为零。

在零和博弈中，参与者之间的利益完全相反，他们的决策是对立的。

4. 混合策略（Mixed Strategy）：混合策略是指在博弈中，参与者以一定概率选择不同的纯策略。

混合策略在博弈论中用来描述参与者的随机决策，可以通过计算期望收益来确定最优混合策略。

5. 博弈树（Game Tree）：博弈树是用来表示博弈过程的树状结构，每个节点代表一个博弈的状态，边代表参与者的策略选择。

博弈树可以用来推导纳什均衡策略和分析博弈过程。

6. 合作博弈（Cooperative Game）：合作博弈是指参与者之间可以合作达到更好的结果的博弈形式。

在合作博弈中，参与者通过互相合作，在利益最大化和成本最小化之间进行协商和决策。

7. 非合作博弈（Non-cooperative Game）：非合作博弈是指参与者之间独立地做决策，不进行合作和协商的博弈形式。

在非合作博弈中，参与者根据自身利益进行策略选择，涉及策略选择和对手的预测。

8. 进化博弈（Evolutionary Game）：进化博弈是将生物进化的概念引入博弈论中的一种模型。

博弈论四种类型之完全信息静态博弈

博弈论四种类型之完全信息静态博弈决策需要信息，⼏乎所有需要决策的场合我们都掌握着有限信息，这使得现实中往往是有限信息博弈。

完全信息在这⾥指的是每个参与⼈对其他参与⼈的⽀付函数有着完全的了解。

⽽静态指的是同时⾏动的博弈，或者不同时但后⾏动者不知道之前⾏动者的决策。

在完全信息静态博弈中的均衡是纳什均衡。

最典型的例⼦是囚徒困境与智猪博弈。

下⾯就由这两个例⼦展开，并将在博弈论中的⼀些知识点做出介绍。

【囚徒困境】中基于收益矩阵的模型描述如下：【注】博弈中参与⼈只拥有有限个离散性的纯战略供其选择称为离散型策略。

⽽在另外⼀些博弈中，每个参与者的纯策略可以是来⾃连续范围的⼀个数，如⼚商定价，称为连续型策略。

离散型策略静态博弈可以⽤⽀付表来表⽰，如上图。

对于囚徒A与B来说，⽆论对⽅采取什么策略，⾃⼰的策略是“坦⽩”时总是⽐“抵赖”要好些，在两⼈⽆法通信的情况下，两⼈都会选择“坦⽩”。

【优势战略均衡】在这⾥，⽆论对⽅选择什么，“坦⽩”的收益是严格⼤于“抵赖”，所以“坦⽩”是⼀个严格优势策略，对应的“抵赖”则是⼀个劣势策略。

所有⼈都有⾃⼰的优势策略，由此产⽣的优势策略组合是⼀个优势战略均衡。

但是这⾥需要注意的是，双⽅各⾃的优势策略却导致了集体的利益最差，如果两⼈都选择“抵赖”收益将是各⾃-1，但是优势策略下的收益却是-8.囚徒困境反映了个⼈理性与集体理性的冲突。

个⼈的最优选择从社会⾓度看并不是最优的。

社会⽣活中有很多例⼦：公共品的给予，商家的价格战，团队⽣产中的偷懒（三个和尚没⽔喝），⼩学⽣减负越减越重，各国军备竞赛等。

【如何⾛出囚徒困境】如果有可信的承诺或者是惩罚（第三⽅实施），会使两⼈合作，促进集体利益最⾼。

【智猪博弈】智猪博弈的收益矩阵模型如下：在此处，⼩猪有优势与劣势策略，但⼤猪没有，只能根据⼩猪的策略做出最佳应对，⽽⼩猪不会选择劣势策略，因此剔除⼩猪“按”的策略，此时，⼤猪的策略只能为“等”。

【重复剔除劣势战略均衡】严格劣势策略为不管其他参与⼈怎样选择呢策略，参与⼈选择策略A时的收益严格⼩于策略B时的收益。

博弈论(名词解释和简答)

博弈论名词解释：1、博弈：一些个人、团体或其他组织，在一定的规则约束下，依据所掌握的信息，同时或者先后，一次或者多次从允许选择的行为或战略进行选择并加以实施，并从中各自取得相应结果或收益的过程。

2、囚徒困境：从博弈中的两个利益主体出发选择行为，结果是既没有实现两人总体的最大利益，也没有真正实现自身的个体最大利益，比如经济领域的寡头竞争、公共产品的供给。

3、非合作博弈与合作博弈：人们行为相互作用时，当事人能达成一个具有约束力的协议，也就是合作博弈，反之，就是非合作博弈。

4、常和博弈：是指博弈双方的得益总和为非零的常数变和博弈：是指在不同的策略组合或者结果下，所有博弈方的得益总和一般是不相同的零和博弈：是指在博弈中，一方的得益就是另一方的损失，所有博弈方的得益总和为零5、博弈论：研究决策主体的行为及其相互决策和均衡问题的学科。

在经济学中，博弈论是研究经济主体的决策相互影响6、战略：参与人在给定信息集的情况下的行为规则的完备描述。

7、均衡：所有参与人的最优战略组合。

8、均衡路径：如果一个博弈有几个子博弈，一个特定的纳什均衡决定了原博弈树上唯一的一条路径，或者说是一个纳什均衡结果在博弈树中所形成的路径。

9、占优均衡：无论其他参与人选择什么战略，参与人的某一种战略均是最优的。

10、重复剔除劣战略的占优均衡：首先找到某个参与人的劣战略（假定存在），把这个劣战略删除掉，重新构造一个不包含已删除的劣战略的新的博弈，然后再删除这个新的博弈中的某个参与人的劣战略，一直重复这个过程，直到只剩下唯一的战略组合为止。

11、纳什均衡：给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是最好的策略，即双方在给定的战略上不愿意改变自己的策略。

12、混合战略：如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为，我们称该战略为混合战略。

13、子博弈：从单结信息集开始至博弈结束的过程，由一个决策结x和所有的后续决策结T(x)构成，满足条件：(1)决策结x是单结信息集；(2)在一个信息集的决策结必须是同一个决策结的后续结。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

类型
信息和行动特点
均衡
均衡类型
特别均衡
求解方法
学过的例子
性质
完全信息静态博弈
每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解，博弈开始时不存在不确定性因素，参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。战略和行动相同。
纳什均衡
纯战略纳什均衡(PNE)
占优战略纳什均衡（DSE）
无限次重复困境（冷酷战略）
无限期轮流讨价还价模型
一般博弈
逆向归纳法求解
斯坦科尔伯格寡头竞争
雇主与公会之间的竞争
不完全信息静态博弈
在博弈开始之前参与人之间的信息存在不确定性，但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。
不确定是参与人的了性的不确定性
精炼贝叶斯纳什均衡
信号传递博弈
分离均衡
根据所得信息修正判断概率，根据收益最大化决策
信号传递博弈
不完全信息重复博弈与声誉
Milgrom-Roberts垄断限价模型
不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。
混同均衡
准分离均衡
贝叶斯纳什均衡
贝叶斯纳什均衡
混合战略（不完全信息情况下纯战略均衡的极限）
对原混合战略加入少许不确定性因素，求极限。
性别战
1、均衡存在性
2、不确定性体现为类型的不确定性
一般贝叶斯均衡
Harsanyi转换
机制设计
不完全信息动态博弈
在博弈开始前参与人之间的信息存在不确定性，同时参与人行动存在先后顺序。不完全信息动态博弈过程不仅是参与人选择行动的过程，而且是参与人不断修正信念的过程。
在博弈开始之前参与人之间的信息不存在不确定性，但是参与人行动存在先后顺序。
在完全信息动态博弈中，为了表示参与人之间的信息掌握关系，引入了信息及的概念。
子博弈精炼纳什均衡
子博弈精炼纳什均衡
有限次重复博弈均衡
与纳什均衡的唯一性有关
连锁店悖论
1、均衡结果是原博弈的Nash均衡；
2、同时在每一个子博弈上构成Nash均衡
箭头法
划线法
Hotelling价格竞争
库诺特价格竞争
多重性和存在性
重复剔除的占有均衡(IFDE)
不断剔除劣战略（弱劣战略的剔除顺序会影响均衡结果
一般一个博弈中存在参与者有多个行动时可以先考虑能否剔除弱战略简化博弈
混合战略纳什均衡(MNE)
聚点均衡
支付最大化法
支付等值法
社会福利博弈
小偷－守卫博弈
完全信息动态博弈