博弈论的要素

合集下载

博弈论

（一）、博弈论的定义
博弈论是一种建立在抽象推理基础之上“研究处于利益冲突的各方在竞争性活动中制定最优化胜利的策略”的理论。
作为科学行为主义学派的重要一支，博弈论不仅是研究国际冲突的策略理论，而且还是处理国际关系问题的实际手段。
（二）、博弈论的要素
1、弈者（想获得最优结果的参与者）；
双方让路
（最保险、最可靠选择） A让B不让
（B的最佳方案）
A不让B让
（A的最佳方案）相撞
（最差的结果）
双方零合博弈的典型事例是：冷战时期的美苏争夺格局。
②、多方零合博弈
多方零合博弈的典型事例是：国际关系中的领土或资产纠纷。
（3）、零合博弈强调冲突的可能性以及解决冲突的机制。
（结构现实主义理论强调国际结构中冲突的可能性，认为国际结构中的国家为了获取自己的相对收益，常常是以牺牲别国为代价的（零合博弈））。
双方变数博弈的典型即，长期以来美苏之间的军备竞赛政策的运用。
②、多方变数博弈
它是“有三方以上参与者的博弈，并且一方所得并非其他方所失，得失之和并不等于零”。
该博弈与两方变数博弈特点相似。但由于独立决策者的增多，策略的相互依存关系也就更为复杂，策略的数目按几何级数上升（2的n次方），因此目前学术界并没有关于多方非零和博弈的成熟理论。尽管如此，政治学家还是指出，该类博弈的“关键问题就是如何能够实现让所有博弈者都满意的合理的收益分配”。
（二）、支持
博弈论提出假设的有效方法，为对外政策决策者说面临的战略选择作出了解释。
博弈论是国际关系和外交决策研究的“思想发动机”，有助于一国实现最佳的策略选择，有助于认识国际冲突的性质、动力和结果，不失为一种具有实用价值的关于对策的研究方法。

博弈论-博弈分类

动态博弈
各博弈方的选择和行动有先后次序且后选择、后行动的博弈方在自己选择行动之前可以看到其他博弈方选择的行动
如弈棋、市场进入、领导——追随型市场结构等重复博弈
➢ 同一个博弈反复进行所构成的博弈，提供了实现更有效率博弈结果的新可能
➢ 长期客户、长期合同、信誉问题 ➢ 有限次重复博弈、无限次重复博弈
2023/1/4
覃燕红——重庆理工大学
20
4、博弈分类区分 III ：课程涉及的4种博弈类型
4种基本的博弈类型
完全信息
静态完全信息静态博弈
纳什均衡
动态完全信息动态博弈子博弈精炼纳什均衡
不完全信息
不完全信息静态博弈贝叶斯纳什均衡
不完全信息动态博弈精炼贝叶斯纳什均衡
➢ 完全信息：每个参与人都拥有所有其他参与人的特征、策略及支付函数等方面准确信息的博弈。
• 人们在决策时遵循最大化原则 • 选择最优方案，谋求最大效益 • 作为决策的主体，始终坚持理性化活动，不存在任何非理性成分。
✓ 不完全理性：
• 有限理性 • 有限理性决策的前提是现实生活过于复杂，人们只能遵循满意原则 • 受到情感、偏好（如公平、互惠、利他）的影响 • 中国人：不患寡，患不均；滴水之恩，涌泉相报；以牙还牙等
的掠夺式使用、森林砍伐、实际和网络上的牛皮广告等
坦白囚徒 A
抵赖
囚徒 B
坦白
抵赖
-8，-8 0，-10
-10，0 -1，-1
2023/1/4
覃燕红——重庆理工大学
6
2、博弈模型示例II
剪刀-石头-布
博石头
弈剪子
方
布
1
石头
0， 0 -1， 1 1， -1

博弈论的基本要素

图1-2 囚徒问题的支付矩阵
不坦白 (0, -10) (-1, -1)
坦白总是占优策略
占优均衡
囚
徒
坦白
1 不坦白
图1-2 囚徒问题的支付矩阵
囚徒2 坦白 (-8, -8) (-10, 0)
不坦白 (0, -10) (-1, -1)
占优均衡由于矩阵的对称性，对囚徒2来说亦可得出类似结论
囚
坦白
博弈论对参与人做两个基本假设
1 理性的（rational）?
1—如果一个决策者在追逐其目标时能前后一致地做决策，就称他为rational。Roger B·Myerson (P2)
2—广义而言指的是一种行为方式，他同在给定条件或约束下最有效地实现预期目标相关。具体地讲，理性含义如下：
博弈论对参与人做两个基本假设
博弈的策略式表述
常用G表示一个博弈博弈模型的两种表示形式
❖ 策略式表述 (Strategic form), ❖ 扩展式表述（Extensive form）本章主要介绍博弈的策略式表述
博弈的策略式表述
参与人集合 ❖ N人博弈的参与人集合，往往也记为N。参与人则记为i, i∈ N ❖ 参与人i的策略集，记为Si ,其中的一个特定策略，可记为si.有si ∈ Si.
完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈
课程主要内容
完全信息静态博弈概念
概念：各参与人对彼此的策略集、支付函数有准确了解博弈行为同时进行一些实例
❖ 石头、剪子、布游戏 ❖ 彼此了解的两个厂商的价 ❖ 虽然决策不是在绝对时间意义上的“同时”， ❖ 但决策的时间先后差别跟博弈结果没有关系，也可看成是“同时进行的博弈”。 ❖ 如不同竞标单位作出的工程投标决策

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要：博弈论是研究决策者之间相互影响和决策制定的数学分析工具。

本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳，以帮助读者更好地理解和应用博弈论的相关知识。

关键词：博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具，源自于经济学和数学两大学科的交叉。

博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。

本文将对博弈论的相关知识进行详细的总结和归纳。

一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。

博弈的基本要素包括：参与者、策略、收益和信息。

1.2 参与者参与者是指博弈中的决策者，可以是个人、团体、企业、国家等。

参与者的目标是实现自身利益的最大化。

1.3 策略策略是指参与者在博弈中所能采取的行动或选择。

通常分为纯策略和混合策略。

1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。

收益可以用来衡量参与者的利益大小。

1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。

信息可以分为对称信息和非对称信息。

二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后，没有动力再改变策略，从而达到一种稳定状态。

常见的均衡概念有纳什均衡、帕累托最优和博弈解。

2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择，使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对，没有动机再改变策略。

2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择，使得至少有一个参与者的收益达到最大，而其他参与者的收益至少不会减小。

帕累托最优是一种资源分配的有效方式。

2.4 博弈解博弈解是指在博弈中的一组策略选择，使得没参与者都没有动力再改变策略。

博弈解往往是均衡的特殊情况。

三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式，即参与者的利益总和为零。

博弈论策略组合

博弈论策略组合博弈论是一门研究决策问题的数学学科，它的应用范围涵盖了经济、政治、生物学等领域。

在博弈论中，最基本的要素是博弈者和策略。

博弈者可以是个人、组织或国家等，而策略则是博弈者在决策过程中所采取的行动方式。

在本文中，我们将会深入探讨博弈论中的策略组合问题。

一、博弈论中的基本概念1.博弈者博弈者是指参加博弈的个人、组织或国家等。

在博弈理论中，每个博弈者都是理性的决策者，他们会根据自己的利益来进行决策。

2.策略策略是博弈者在决策过程中所采取的行动方式。

每个博弈者都有多种策略可供选择，每种策略都有其对应的利益和风险。

3.收益矩阵收益矩阵是博弈论中的一种重要工具，它用于描述博弈者选择不同策略时所能够得到的收益。

在收益矩阵中，通常用数字来表示博弈者的收益，而这些数字的大小则取决于博弈者所采取的策略以及其他博弈者所采取的策略。

二、博弈论中的策略组合在博弈论中，不同的博弈者之间往往会采取不同的策略，而这些策略的组合则会影响整个博弈的结果。

为了让自己在博弈中获得最大的利益，博弈者需要仔细考虑不同策略的组合方式以及其所带来的收益。

以下是一些常见的博弈论策略组合：1.纳什均衡纳什均衡是博弈论中最常见的策略组合之一。

它指的是一种状态，在这种状态下，每个博弈者都采取了最优的策略，而且不存在任何一方可以通过改变自己的策略来获得更大的收益。

在纳什均衡状态下，博弈者的利益最大化，同时也最小化了风险。

2.优势策略组合优势策略组合是一种博弈者采取的策略组合，可以使博弈者在任何情况下都能够实现最大利润。

也就是说，无论其他博弈者采取什么样的策略，这种策略组合都能够保证博弈者在经济上最为稳定。

3.混合策略组合混合策略组合指的是博弈者在选择策略时，同时采取多种策略。

这种策略组合可以帮助博弈者避免对手的预测和防御，同时也能够增加博弈者获胜的机会。

4.反攻策略组合反攻策略组合是一种博弈者在面对挑战时采取的策略组合。

在这种情况下，博弈者不会采取防御性的措施，而是会采取积极的反攻策略。

博弈论模型简介

博弈论的基本概念
(二)博弈的组成要素
• • •
•
一个博弈一般由以下几个要素组成，包括：参与人、行动、信息、策略、得益、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体； 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策； 3、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排；
案例模型构建
要素
4）效用函数：参与人i的效用函数不但受其自身的行动影响, 还取决于对方的行动选择,U=（U1，U2，U3）为参与人的效用函数组合。参与人1，即地方政府的效用U1主要取决于集体建设用地交易过程中取得的收益.参与人2和3的效用U2和U3也主要取决于三方面因素：一是集体建设用地交易过程中取得的收益R；二是集体建设用地地下交易的风险成本CR，即违反法律受到惩罚的风险；三是交易成本CT。
案例-地方政府的战略选择
其二，建立集体建设用地公开流转市场，地方政府获得级差地租Ⅱ 和部分级差地租Ⅰ。（略）
博弈论在旅游学的应用
1.旅游企业之间博弈
张亚明、陈亮(2008) 以博弈论为视角分析网络经济下旅游企业间的“竞—合”模式,通过运用博弈论对旅游企业间的合作竞争策略进行了分析,进而确定对合作和竞争策略的选择以及实施次序的活动运作战略。
案例-地下市场交易下的三方博弈分析
集体建设用地地下市场交易的动力来源
1
2
由于现行征地制度不健全，造成农村集体组织的权益受到侵害，农民集体组织为了获取比征地补偿更高的收益或者说规避土地征收带收的“产权侵害”问题,就私下进行了集体建设用地的各种流转
由于现行的征地上市交易模式手续多、周期长、成本高，往往出现用地企业拿到土地时已经错失投资良机的情况，而通过地下市场交易获得土地的成本低，周期短，成为用地企业获取土地的一个捷径。

《产业经济学》第五章--(博弈1)讲解

在上述“囚徒困境”的例子中，每个囚徒都有两种可选择的策略：坦白或抵赖。显然不论同伙选择什么策略，每个囚徒的最优策略是 “坦白”。如果一个博弈中，某个参与人有占优策略，那么该参与人的其他可选择策略就被称为“劣策略”。
在一个博弈里，如果所有参与人都有占优策略存在，那么占优策略均衡是可以预测到的唯一的均衡，因为没有一个理性的参与人选择劣策略。所以在“囚徒困境”博弈里，“坦白、坦白”是占优策略均衡。
第五章博弈
第一节博弈论的基本概念与应用
一、博弈论的定义博弈论，英文为Game theory，是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。一些相互依赖、相互影响的决策行为及其结果的组合称为博弈。博弈论研究的是存在相互外部效应条件下的主体的决策问题。
在寡头垄断的市场上，只有少数几家厂商在相互竞争，寡头们面对的市场环境或者说竞争对手的行为将随着他们本身的决策行为而变动，即寡头们的决策是相互作用的，每个企业的得益和利润不仅取决于自身的决策，也取决于其他厂商的决策。寡头厂商之间可能有激烈的竞争，这些竞争涉及价格、产量、广告、投资等许多方面的决策，在分析寡头垄断市场中的企业决策行为时，就必须把各种决策者之间的策略相互作用纳入到经济模型中，这就是一种博弈分析。
1．从行动的先后次序来划分，博弈可以分为静态博弈和动态博弈。静态博弈指在博弈中，参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取了什么具体行动；动态博弈指的是参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动的博弈。
2．从参与人对其他参与人的各种特征信息的获得差异来划分，博弈可分为完全信息博弈和不完全信息博弈。完全信息博弈指的是每一个参与人对所有其他参与人的特征，如策略集合及得益函数都有准确完备的知识；否则就是不完全信息博弈。

博弈论

人质困境
一场憋屈的博弈。抢打出头鸟，人质联合固然可以制服歹徒，但是谁愿出头。这一点给了无数处于劫持者地位的一方以机会，类似于秦的远交近攻、各个击破的策略，将最终全盘赢下。人质可有反制的策略，当然有，不过艰难至极。人质可以选择沉默，这样他有一定时间苟延残喘；或者联合劫持者对付人质，结局还是取决于劫持者，万一他过河拆桥怎么办；同时反抗，集体将获得左右策略，但是这需要壮士断腕的勇气，部分人可能因此受伤。这里是实力与勇何在？因为，小猪踩踏板将一无所获，不踩踏板反而能吃上食物。对小猪而言，无论大猪是否踩动踏板，不踩踏板总是好的选择。反观大猪，已明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，所以只好亲力亲为了。 “小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是：每次落下的食物数量和踏板与投食口之间的距离。
囚徒困境（一）
在博弈论中，含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”（prisoners’ dilemma）博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别臵于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果两个犯罪嫌疑人都坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪，各被判刑8年；如果只有一个犯罪嫌疑人坦白，另一个人没有坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年 .
(4)策略(strategies)：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。 (5)得失(payoffs)：一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。所以，一局博弈结束时每个局中人的 “得失”是全体局中人所取定的一组策略的函数，通常称为支付函数。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈论的要素
参与人：在一场竞赛或博弈中，每一个有决策权的参与者成为一个局中人。

只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。

策略：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。

如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。

得失：一局博弈结局时的结果称为得失。

每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。

所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。

对于博弈参与者来说，存在着一博弈结果。

博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意
即相关量处于稳定值。

在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。

所谓纳什均衡，它是一稳定的博弈结果。

来源：招标师在线网（QQ学习群：244362119），欢迎分享本文!。