博弈论基本要素共66页

合集下载

博弈论完整版PPT课件

R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4；
2-阶理性： C相信R相信C是理性的，C会将R4从R的战略空间中剔除, 所以 C不会选择C1；
3-阶理性： R相信C相信R相信C是理性的， R会将C1从C的战略空间中剔除, R不会选择R1；
基本假设：完全竞争，完美信息
个人决策是在给定一个价格参数和收入的条件下最大化自己的效用，个人的效用与其他人无涉，所有其他人的行为都被总结在“价格”参数之中
一般均衡理论是整个经济学的理论基石和道义基础，市场机制是完美的，帕累托最优成立，平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立：
.
19
理性共识
0-阶理性共识：每个人都是理性的，但不知道其他人是否是理性的；
1-阶理性共识：每个人都是理性的，并且知道其他人也是理性的，但不知道其他人是否知道自己是理性的；
2-阶理性共识：每个人都是理性的，并且知道其
他人也是理性的，同时知道其他人也知道自己是
理性的；但不知道其他人是否知道自己知道他们
如果你预期我会选择X，我就真的会选择X。
如果参与人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定：
只有两个厂商面对相同的线形需求曲线，P(Q)=a－Q， Q=q1+q2 两厂商同时做决策；假定成本函数为C(qi)＝ciqi
劣策略：如果一个博弈中，某个参与人有占优策略，那么
该参与人的其他可选择策略就被称为“劣策略”。

博弈论的要素

博弈论的要素
参与人：在一场竞赛或博弈中，每一个有决策权的参与者成为一个局中人。

只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。

策略：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。

如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。

得失：一局博弈结局时的结果称为得失。

每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。

所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。

对于博弈参与者来说，存在着一博弈结果。

博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意
即相关量处于稳定值。

在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。

所谓纳什均衡，它是一稳定的博弈结果。

来源：招标师在线网（QQ学习群：244362119），欢迎分享本文!。

博弈论最全完整ppt-讲解

能提供万无一失的应对办法。
例1：无谓竞争（The GPA Rat Race）
你所注册的一门课程按照比例来给分：无论卷面分数是多少，只有40％的人能够得优秀， 40％的人能得良好。
所有学生达成一个协议，大家都不要太用功，如何？想法不错，但无法实施!稍加努力即可胜过他人，诱惑大矣。
问题是，大家都这么做。这样一来，所有人的成绩都不比大家遵守协议来得高。而且，大家还付出了更多的功夫。
约翰·纳什 1928年生于美国
莱因哈德·泽尔腾， 1930 年生于德国
约翰· 海萨尼 1920年生于美国
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由：前者在信息经济学理论领域做出了重大贡献，尤其是不对称信息条件下的经济激励理论的论述；后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献。
博弈论为众多学科提供了分析的概念和方法：经济学和商学,政治科学,生物学, 心理学和哲学。
如何在“博弈”中获胜？
日常生活中的博弈（“游戏”）往往指的是诸如赌博和运动这样的东西：赌抛硬币百米赛跑打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。策略是为了获胜所需要的一种智力的技巧。
没有某个这样的暗示，默契的合作就完全不可能。
例3：为什么教授如此苛刻？
许多教授强硬地规定，不进行补考，不允许迟交作业或论文。
教授们为何如此苛刻？如果允许某种迟交，而且教授又不能辨
别真伪，那么学生就总是会迟交。期限本身就毫无意义了。避免这一“滑梯”通常只有一种办法，

博弈论知识点总结推荐文档

博弈论知识总结博弈论概述：1、博弈论概念：博弈论：就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论研究的假设：1、决策主体是理性的，最大化自己的收益。

2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量：博弈参与人：博弈中选择行动以最大化自己受益的决策主体。

行动：参与人的决策选择战略：参与人的行动规则，即事件与决策主体行动之间的映射，也是参与人行动的规则。

信息：参与人在博弈中的知识，尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。

完全信息：每个参与人对其他参与人的支付函数有准确的了解；完美信息：在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动，否则为不完美信息。

不完全信息：参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息，即存在着有关其他参与人的不确定性因素。

支付：决策主体在博弈中的收益。

在博弈中支付是所有决策主题所选择的行动的函数。

从经济学的角度讲，博弈是决策主体之间的相互作用，因此和传统个人决策存在着区别：3、博弈论与传统决策的区别：1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下，最大化自己效用，研究工具是无差异曲线。

可表示为：maxU(Pi)，其中P为市场价格，I为消费者可支配收入。

2、其他消费者对个人的综合影响表示为一个参数——市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。

但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。

4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。

战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。

博弈论ppt课件

15
➢ 扩展术语：
信息：信息集；完全信息（complete）；完美信息（perfect）。
共同知识：双方可能获取的相同信息；彼此都能算清楚。
博弈结果：均衡策略组合；均衡行动组合。均衡：所有局中人最优策略的组合。
博弈论2009
精选ppt课件
16
3. 博弈描述
➢博弈的策略型（标准型、正则型）表述：
33
博弈论2009Leabharlann 精选ppt课件34
毕业后先后在兰德研究所、普林斯顿大学、MIT工作。
1957年他与MIT学生爱莉西娅结婚。
在而立之年患上了妄想型精神分裂症，九十年代逐渐恢复了正常。
1994年纳什博士获诺贝尔经济学奖。
2002年来北京参加 “国际数学家大会”
博弈论2009
精选ppt课件
35
博弈论2009
则，不开发。（？）
博弈论2009
精选ppt课件
22
关键问题：对自然状态的概率估计；不同时间决策（决策顺序）；对对方先验信息的估计（即估计对方对信
息的掌握程度）。
现实困难：对市场了解程度不同；对对方了解程度不同；如何向对方暗示自己的行动。
博弈论2009
精选ppt课件
23
4.博弈练习
➢游戏一：心灵感应两个人一组，独立写出1至10之间的任
乙甲
理性的人是自私自利的；理性选择不是全局最优。
博弈论2009
精选ppt课件
6
➢经济合作：
乙甲
诚信的价值；一报还一报策略；人类生存环境启示。
博弈论2009
精选ppt课件
7
➢长街上的超市（海滩占位模型）
＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊

博弈论入门PPT课件

基于对其他参与者信息的了解程度
完全信息博弈
不完全信息博弈
负和博弈
根据结果
零和博弈
正和博弈
特征合作中如何分配利益，使大家都满意。只考虑自己的利益，不考虑对方的利益。做出策略虽然有先后，但每一方都不知
道对方的策略。做出策略虽然有先后，但参与者对对方
做出的策略是知道。（例如下象棋）博弈中对其他参与者的各方面信息、可
最理想的结局：双赢
一、正和博弈各方本着相互合作，公平公正，互利互惠的原则分配利益，让每一个人参与者都满意的博弈。
案例：鳄鱼鸟与鳄鱼和谐相处，生存搭档的典型。凶恶的鳄鱼可以容忍鳄鱼鸟清理它牙缝里的残肉，因为这样可以避免滋生细菌，它的牙就不会生虫了。
二、博弈中发生冲突的时候，充公了解对方、取长补短，各取所需，往往会使双方走出负和博弈和零和博弈的误区，实现合作共赢。
一年轻人在酒吧喝酒，中途去厕所。一美女尾随他打劫，对他说：将钱和手机都交出来，否则我说你非礼我。年轻人转念一想，计上心来，用手指自己的嘴和耳朵。美女误以为他是聋哑人，想放弃。年轻人掏出一支笔和一张纸在上面写上：你说什么呀？
美女见状拿过笔来也在纸上写了：将钱和手机都交出来，否则我说你非礼我。这时年轻人一把抓住美女的手，大声喊道：我要送你去派出所。
最坏的结果：两败俱伤
战争是典型的负和博弈：二战共有61个国家卷入，涉及人口20亿以上。二战中军民伤亡1.9亿，其中死亡6000万，受伤 1.3亿。其中死亡的平民有2730万。盟军中苏联军队伤亡最为惨重，死亡890 万，中国军队死亡148万，英国与美国各死亡38万。法西斯德国军队伤亡人数 1170万，军队死亡600万，日本军队伤亡216万。

博弈论最全完整-讲解课件

(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为零，这个博弈就叫零和博弈；
• 相反，如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为零，这个博弈就叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后，但只要局中人在决策时都还不知道对手的决策或者行动是什么，也算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人的得益。
供万无一失的应对办法。
学习交流PPT
5
例1：无谓竞争（The GPA Rat Race）
• 你所注册的一门课程按照比例来给分：无论卷面分数是多少，只有40％的人能够得优秀，40 ％的人能得良好。
• 所有学生达成一个协议，大家都不要太用功，如何？想法不错，但无法实施!稍加努力即可胜过他人，诱惑大矣。
• 某些博弈中，由于偶然的外因可以对策略贴标签，或者参与者之间拥有某些共同的知识体验，导致了焦点的存在。
• 没有某个这样的暗示，默契的合作就完全不可能。
学习交流PPT
9
例3：为什么教授如此苛刻？
• 许多教授强硬地规定，不进行补考，不允许迟交作业或论文。
• 教授们为何如此苛刻？
• 如果允许某种迟交，而且教授又不能辨别真伪，那么学生就总是会迟交。
• 王则柯、李杰编著，《博弈论教程》，中国人民大学出版社，2004年版。

博弈论知识点总结完整版

博弈论一：基本知识1.1定义:博弈论;又称对策论;是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论;是研究竞争的逻辑和规律的数学分支..即;博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用;以及不同决策主体之间的均衡..1.2基本要素：参与人、各参与人的策略集、各参与人的收益函数;是博弈最重要的基本要素..1.3博弈的分类：博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论..两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议binding agreement..倘若不能;则称非合作博弈Non-cooperative game..合作博弈强调的是集体主义;团体理性;是效率、公平、公正；而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大;强调个人理性、个人最优决策;其结果有时有效率;有时则不然..目前经济学家谈到博弈论主要指的是非合作博弈;也就是各方在给定的约束条件下如何追求各自利益的最大化;最后达到力量均衡..博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息;是否了解两个角度进行..把两个角度结合就得到了4种博弈：a、完全信息静态博弈;纳什均衡;Nash1950b、完全信息动态博弈;子博弈精炼纳什均衡;泽尔腾1965c、不完全信息静态博弈;贝叶斯纳什均衡;海萨尼1967-1968d、不完全信息动态博弈;精炼贝叶斯纳什均衡;泽尔腾1975 Kreps; Wilson1982 Fudenberg; Tirole19911.4课程主要内容：完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式：策略式表述 Strategic form; 扩展式表述Extensive form1.6占优均衡：a、占优策略：在博弈中如果不管其他参与人选择什么策略;一个参与人的某个策略给他带来的支付值始终高于其他策略;或至少不劣于其他策略;则称该策略为该参与人的严格占优策略或占优策略..对于所有的s-i; si称为参与人i的严格占优战略;如果满足：uisi;s-i>uisi';s-is-i; si' sib、占优均衡：一个博弈的某个策略组合中;如果对应的所有策略都是各参与人的占优策略;则称该策略组合为该博弈的一个占优均衡..1.7重复剔除严劣策略均衡：a、“严劣”和“弱劣”的含义：设 s i’和s i’’是参与人i可选择的两个策略;若对其他参与人的任意策略组合s-i; 均成立u i s i’; s-i < u i s i’’; s-i; 则说策略s i’严劣于策略s i’’ ..上面式子中;若将“<”改为“≤”;则说策略s i’弱劣于策略s i’’ ..b、定义：重复剔除严格策略就是各参与人在其各自策略集中;不断剔除严劣策略…如果最终各参与人仅剩下一个策略;则该策略组合就被称为重复剔除严劣策略均衡..二：纳什均衡Nash Equilibrium2.1纳什均衡定义：对于一个策略式表述的博弈G= {N;S i; u i; i ∈N}; 称策略组合s=s1; …s i; …; s n是一个纳什均衡;如果对于每一个i ∈N; s i是给定其他参与人选择s-i={s1; … ;s i-1; s i+1; … ;s n} 情况下参与人i的最优策略经济理性策略;即：u i s i; s-i≥ u i s i; s-i; 对于任意的s i∈S i ;任意的i∈N均成立..通俗定义：纳什均衡是一种策略组合;给定对手的策略;每个参与人选择自己的最优策略..纳什均衡是一种稳定的策略组合：当所有参与人的选择公开以后;每个人都满意自己作出了正确的选择；没有人能得到更好的结果了..在博弈论中这种结果被称为纳什均衡NE..2.2定理：Nash在1950年证明：任何有限博弈;都至少存在一个NE——Existence of Nash Equilibrium..即在一个有n个参与人的策略式博弈G={S1;…;Sn; u1;…;un}中;如果n是有限的;且Si是有限集i=1;…;n;则该博弈至少存在一个纳什均衡在混合策略意义下Wilson1971证明;几乎所有有限博弈;都存在有限奇数个NE;包括纯策略NE和混合策略NE..——Oddness Theorem2.3纳什均衡、占优均衡、重复剔除严劣策略均衡的关系定理 a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡;但反过来不一定成立；定理 b 纳什均衡一定不能通过重复剔除严劣策略方法剔除..2.4划线法先找出自己针对其他博弈方每种策略或策略组合对多人博弈的最佳对策;即自己的可选策略中与其他博弈方的策略或策略组合配合;给自己带来最大得益的策略这种相对最佳策略总是存在的;不过不一定唯一;然后在此基础上;通过对其他博弈方策略选择的判断;包括对其他博弈方对自己策略判断的判断等;预测博弈的可能结果和确定自己的最优策略..这就是划线法..2.5箭头法箭头法对于理解博弈关系很有好处;是寻找相对稳定性策略组合的分析方法..对博弈中的每个策略组合进行分析;考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益..如能;则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组..最后综合对每个策略组合的分析情况;形成对博弈结果的判断..划线法和箭头法的结果是一致的;可以相互替代..三：混合策略Mixed Strategies 纳什均衡3.1定义：混合策略的定义：在博弈G={N; Si; ui; i∈N}中;假设参与人i的纯策略构成的策略集合为Si={si1;…; sik};若参与人i 以概率分布pi=pi1;…; pik 在其k 个可选策略中随机选择“策略”;称这样的选择方式为混合策略..这里;0≤pij ≤ 1;对于j=1 ;…; k 都成立;且有; pi1+…+ pik=1..纯策略可看成特殊的混合策略..上述定义是在有限博弈前提下进行的..3.2混合策略意义下策略组合的表述{x1∈X1; …; xn∈Xn};其中Xi ; i =1; …; n表示参与人i所有纯策略生成的概率空间;xi为参与人i的一个具体混合策略猜硬币博弈的一个混合策略就可记为{1/2; 1/2;1/2; 1/2}3.3VNM效用函数Von Neumann and Morgenstern冯·诺依曼和摩根斯坦如果某个随机变量X以概率Pi 取值xi;i=1;2;…;n;而某人在确定地得到xi时的效用为uxi;那么;该随机变量给他的效用便是： UX =P1ux1 + P2ux2 + ... + Pnuxn表示关于随机变量X的期望效用..因此UX称为期望效用函数;又叫做冯·诺依曼——摩根斯坦效用函数VNM函数..3.4基于混合策略意义下的博弈策略式表述定义：基于v-N-M效用的策略式博弈由 a、参与人集合 b、每个参与人有一个纯策略集合 c、对于每一个参与人来说;由所有参与人纯策略组合构成的风险结果空间;存在一个v-N-M效用3.5混合策略意义下的纳什均衡定义：对于博弈G= {N; Si; ui; i∈N};基于v-N-M效用的混合策略组合α是一个纳什均衡;若对于每一个i; 以及i的任意一个混合策略αi;α对应的期望支付至少和αi;α-i 的期望支付一样大换句话说;称混合策略组合α是一个纳什均衡;如果没有一个参与人通过偏离策略αi 实现支付的增加3.6一个定理对于N-人静态博弈问题;设混合策略纳什均衡对应的策略组合为Xi ; X –i ..对于任意的i ;若最优混合策略为Xi= {x1;…;xl;0…0}不失一般性;假设前l个分量严格大于0;记分量xk k=1;…; l 对应的纯策略sk;则对于参与人i而言;sk与其他参与人的最优混合策略组合X –i 形成的局势的收益值;等于纳什均衡混合策略组合 Xi; X –i 的收益值..即ui sk; X –i = ui Xi; X –i 成立 ; k=1;…; l3.7方法：a、求解混合策略均衡可以用期望收益等值法b、2×2双矩阵博弈的图解法:反应函数的三个交点即是纳什均衡四：多重纳什均衡解及其分析4.1 帕雷托占优均衡帕雷托占优均衡的含义是：在多个纳什均衡中;若存在一个纳什均衡;其支付结果针对每个参与人而言都严格优于其它纳什均衡;则该纳什均衡是帕雷托占优纳什均衡..4.2风险占优均衡risk-dominant equilibrium参与人对风险占优均衡的选择倾向;有一种强化的机制..当部分或所有参与人选择风险占优均衡的可能性增强的时候;任一参与人选择帕雷托占优均衡策略的期望支付会进一步减小;而这又使得帕雷托占优均衡策略的支付更小;从而形成一种选择风险占优均衡策略的正反馈机制;并使其出现的概率越来越大..当参与人数目增加时;选择合作的风险将会更大;可借助该点考虑招标机制如何减少投标方勾结问题..上述问题是我们知道建立诚信机制社会的重要意义..上述问题引出一个博弈相关分支为协调博弈coordination game4.3聚点均衡由实际问题抽象出来的博弈模型中;更多的一类问题是：多个纳什均衡间不存在帕雷托占优关系或明显的风险占优关系;如夫妻爱好问题的两个纯策略均衡..这时如何预测哪一个纳什均衡会出现是一个很有意义的问题以夫妻爱好博弈为例;在实际中往往二人很默契地知道如何进行博弈;双方往往知道怎么进行选择策略;且能够相互了解这里面排除了互相协商后达成的一致实际博弈中参与人往往会利用博弈模型以外的信息;实现对特定博弈均衡一致关注的“聚点”这些信息如：参与人共同的文化背景或规范;共同的知识;具有特定意义事物的特征;某些特殊的数量、位置关系等聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性;但因为涉及因素太多;对于一般博弈模型很难总结普遍规律;只能具体问题具体分析聚点：人们通常会协调彼此的行为..你弱他就强；先例产生的影响远大于逻辑或者法律效力；人们总是乐于安守现状或接受自然形成的界线三八线4.4相关均衡correlated equilibrium实际上;在现实中遇到选择困难时;特别是在长期中反复遇到相似选择难题时;常会通过收集更多信息;形成特定的机制和规则;为某种形式的制度安排等主动寻找思路..相关均衡就是这样的一种均衡选择机制..对于实际中比较复杂的博弈问题;参与人是否有能力设计这种机制;并且有足够能力理解、信任这种机制;是有一定疑问的..相关均衡作为社会经济制度创新的一种解释也许更有意义..4.5防共谋均衡coalition-proof equilibrium 定义：如果一个博弈的某个策略组合满足a、没有任何单个参与人的“串通”会改变博弈的结果;即单独改变策略无利可图该策略组合是纳什均衡..b、给定选择偏离的参与人有再次偏离的自由时;没有任何两个参与人通过“串通”改变博弈的结果..c、依此类推;直到所有参与人都参加的串通也不会改变博弈的结果..满足上述要求的均衡策略组合称为“防共谋均衡”在有多个参与人的博弈中;若部分参与人通过某种形式的默契或串通形成小团体;可能得到比不串通个大的支付..这就是多人博弈的共谋问题..防共谋均衡是指这样的一个纳什均衡;在该均衡局势下;少数参与人集合不能通过均衡策略的偏离;实现更好的局部利益..防共谋均衡是两个以上参与人参加的博弈中;参与人在帕雷托占优均衡中进行合作思想的扩展..五：动态博弈5.1特点一类博弈行为通常需要参与人多步决策才能完成;具有明显的阶段性..博弈的结局、各参与人的收益由多阶段决策结果确定..各参与人的决策有一定的顺序..由于动态博弈各参与人进行决策具有明显的阶段性、行动次序性;通常用扩展式extensive form表述法描述这些信息..5.2博弈的扩展式表示参与人集合：i=1; … ;N..用N表示虚拟参与人“自然”；自然的含义是某些外生的客观概率分布事件参与人的行动顺序the orderof moves:描述各参与人在什么时候行动；参与人的行动空间actionset：在每次行动时;参与人可选择的行动集合；参与人的信息集information set：每次行动时参与人知道什么；参与人的收益函数：在行动结束之后;每个参与人得到些什么..自然选择的概率分布假定自然状态是共同知识..对于有限博弈;博弈树是常用的表述方式..5.3博弈树a若动态博弈是有限博弈;则可用博弈树表示该博弈..这里有限的含义是：各阶段各参与人的行动数目有限；博弈的阶段数有限..b博弈树的基本结构为结点nodes..包括决策结及终点结..决策结是参与人采取行动的时点；终点结是博弈行动路径的终点..枝branches..从一个决策结到它的直接后续结的连线;每一个枝代表参与人的一个行动选择..信息集..是决策结集合的一个子集..将博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结称为一个信息集..注：每个决策结都是同一个参与人的决策结..该参与人知道博弈进入该集合的某个决策结;但不知道自己究竟出于哪一个决策结若该信息集有两个或两个以上元素..5.4对于有限动态博弈;若参与人对彼此在各决策结点的行动集合;彼此的效用函数;历史的行动有着完全的了解;则称这样的博弈为完全信息动态博弈..如果博弈树的所有信息集都是单元素集;称该博弈为完美信息博弈game of perfectinformation..上述两个定义的差别在于对自然行动信息的描述..5.5动态博弈的策略式表述a相机选择contingent play动态博弈中参与人的策略是各自预先设定的;在博弈的各阶段;针对各种情况做出相应决策..即“等待”博弈到达自己的信息集包含一个或多个决策结后再决定如何行动..在策略式表述博弈中;参与人似乎是博弈开始之前就制定出了一个完全的相机选择;即“如果……发生;我将选择……”..b从扩展式表述构造战略式表述若把B的信息集从左到右排列;上述四个纯策略可以简单记为{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}..上面四个纯策略含义：当A选择开发时;B选择大括号中前面的策略；当A选择不开发时;B选择大括号中后面的策略..B的纯策略为：{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}A的纯策略为：SA=开发;不开发于是可以写成策略式表述形式;为开发;开发开发;不开发不开发;开发不开发;不开发开发-3;-3-3;-31;01;0不开发0;10;00;10;0在扩展式表述博弈中;所有n个参与人的一个纯战略组合s=s1;…;sn决定了博弈树上的一个路径..比如开发;{不开发;开发}决定了博弈的路径为A 开发 B 不开发1;05.6完全信息动态博弈纳什均衡存在性定理如果有限博弈是完美信息博弈;他还有一个纯战略纳什均衡Zermelo;1913..5.7逆向归纳法：a逆向归纳法求解策略：从动态博弈的最后一个阶段出发;对该参与人采用经济理性原则进行分析;逐步到推回前一个阶段相应参与人的行动选择;一直到第一阶段的分析方法..b逆向归纳法是求解完美信息动态博弈的经典方法..逆推归纳法是完美信息动态博弈分析中使用最普遍的方法..c与策略式分析比较：如果A选择U;那么B的信息集不能达到;我们说B的信息集不在均衡路径上out-of-equilibrium path.. 此种情况下;B的选择对A没有什么影响..因此;纳什均衡对一个参与人在非均衡信息集上的选择没有限制..但是;一个参与人在非均衡信息集上的战略可以影响其他参与人在均衡信息集上的选择..d逆向归纳法实质上是重复剔除劣战略法在扩展式博弈中的应用..逆向归纳法适不用于无限博弈和不完美信息博弈..逆向归纳法剔除了“非理性”的均衡策略5.8子博弈完美均衡子博弈精炼纳什均衡①子博弈概念：一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结Tx组成;它满足下列条件：x是一个单结信息集;即hx={x};对于所有的Tx中的x’;如果x’’与x’同属于一个信息集;则x’’也在Tx中..需要说明的是;G本身是自己的一个子博弈..②子博弈完美纳什均衡子博弈精炼纳什均衡扩展式博弈的一个战略组合s=s1;…;s i;…;s n是一个子博弈完美纳什均衡;如果它是原博弈的纳什均衡..它在每一个子博弈上都是纳什均衡③纳什均衡与子博弈精炼纳什均衡的关系前面分析说明;一个特定的纳什均衡决定了原博弈树上唯一的一条路径;这条路径称为“均衡路径”equilibrium path..相对该纳什均衡;其他路径称为非均衡路径out-of-equilibrium path..在每一个子博弈上给出纳什均衡意味着;构成子博弈纳什均衡的战略不仅在均衡路径的决策结上是最优的;同时在非均衡路径的决策结上也是最优的..对于有限完美信息博弈;前面介绍的逆推归纳法得出的纳什均衡即是子博弈精炼纳什均衡..六多阶段静态博弈6.1该类模型中至少在某个阶段参与人同时选择其决策..这类模型实质上就是完美信息动态博弈;因此仍然可以采用逆推归纳法进行分析..因为存在同时选择;因此每个阶段不再是单人优化问题;而是一个静态博弈..6.2前向归纳法：前面已经说明;完美信息动态博弈的经典求解方法为逆序归纳法..还有一种分析方式;就是前向归纳法forward induction..前向归纳法由科尔博格和莫顿斯1986提出..这里不进行严格的数学描述;仅通过一个例题进行说明..6.3重复博弈重复博弈repeated game的定义指同样结构的博弈重复多次;其中的每次博弈称为“阶段博弈stage game”..如两个多次犯罪的“囚徒问题”..由于动态博弈是相机行动;反映到重复博弈中;就是可以使自己在某个阶段的博弈选择依赖于其他参与人过去的行动历史..影响重复博弈均衡结果的主要因素是博弈重复次数和信息的完备性completeness..重复次数对参与人可能会有的影响是：参与人为了获得长远利益而牺牲眼前利益的策略成为可能..关于完备性;简单地说;但一个参与人的支付函数不为其他参与人所知时;该参与人可能有积极性建立一个“好”的声誉reputation以换取长远利益..在社会行为中;经常可以看到本质不好的人在相当长的时期内干好事的原因..定理：令G是阶段博弈;GT是G重复T次的重复博弈T<∞..那么;如果G有唯一的纳什均衡;重复博弈GT的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次即每个阶段博弈出现的都是一次性博弈的均衡结果..上述定理说明;只要博弈的重复次数是有限的;重复本身并不改变囚徒困境的均衡结果..上述定理中“唯一性”是一个重要条件..如果纳什均衡不是唯一的;上述结论就不一定成立..当博弈有多个纳什均衡时;参与人可以使用不同的纳什均衡惩罚前面阶段的不合作行为或奖励第一阶段的合作行为..（七）不完全信息静态博弈不完全信息静态贝叶斯博弈贝叶斯纳什均衡海萨尼转换拍卖理论八合作博弈可传递效用 transferableutility合作博弈的特征函数合作的分配可行分配核心的定义 Shapley 值。

五讲博弈论基础共72页

第一节博弈论导论
博弈的四要素： 1.博奕的参加者，即博奕方或参与人。
2.各博奕方可选择的全部策略或行为的集合。
3.进行博奕的次序。
4.博奕方的得益。例：囚徒困境
囚徒A
坦白抵赖
囚徒B
坦白
-8,-8 -10,0
抵赖
0,-10 -1,-1
均衡结果为：A、B都选择坦白，各判8年刑
第一节博弈论导论
比如说：夜间唱歌
科斯定理图示
农场主的边际净损失
牧羊的边际利润
S
P
O
社会最优量
牧养人放牧的数量
说明
如果产权归农场主，农场主可以禁止放牧（点0），小于社会最优量S；但此时，增加放牧给牧羊人带来的边际利润大于给农场主造成的损失，牧羊人将有积极性贿赂农场主，直到放牧量达到S为止；
如果产权归牧羊人，牧羊人的利润最大点是P，大于社会最优量S；但此时，减少放牧量对牧羊人的边际利润损失小于给农场主节约的边际成本，所以，农场主将有积极性贿赂牧羊人，直到S；
博奕论前提假设：博弈的参与者都是理性人所谓理性人是指有一个很好定义的偏好，在面临给定的约束下最大化自己的偏好。理性人可能是利己主义者，也可能是利它主义者。
第一节博弈论导论
例：囚徒困境
囚徒A
坦白抵赖
囚徒B
坦白
-8,-8 -10,0
抵赖
0,-10 -1,-1
均衡结果为：A、B都选择坦白，各判8年刑
革命通常不是一个帕累托改进。
外部性与科斯定理
个人收益与社会收益：一项活动的社会收益等于决策者个人得到的收益加社会其他成员得到的收益，如养花；
个人成本与社会成本：社会成本等于决策者的个人承担的成本加社会其他成员承担的成本，如环境污染，交通堵塞；

《博弈论的基本概念》课件

智猪博弈
• 总结词：描述大猪和小猪在食槽附近争夺食物的策略博弈。
• 详细描述：在智猪博弈中，一个大猪和一个小猪共同生活在一个猪圈里，食槽位于猪圈的一端。每次食物被放入食槽时，大猪和小猪都有两种选择：冲向食槽或继续等待。如果大猪选择冲向食槽，小猪的最佳策略是等待，因为大猪吃掉大部分食物后，小猪可以享用剩余的食物。相反，如果小猪选择冲向食槽，大猪的最佳策略也是等待，因为小猪可能无法抢到任何食物。因此，无论大猪如何选择，小猪的最佳策略都是等待；同样地，无论小猪如何选择，大猪的最佳策略也是等待。
合作博弈
特征
强调合作、协议和联盟，目标是实现共同利益。
应用领域
国际关系、商业合作、团队协作等。
非合作博弈
特征
强调竞争、自利和策略互动，目标是实现个人利益。
应用领域
市场竞争、个人决策、政治选举等。
动态博弈
特征
强调行动的顺序和信息传递，策略和行动需考虑时间因素。
应用领域
商业竞争、投资决策、谈判策略等。
《博弈论的基本概念》ppt课件
目录
• 博弈论简介 • 博弈论的基本类型 • 博弈论的基本概念 • 博弈论的经典案例 • 博弈论的未来发展
01
博弈论简介
博弈论的定义
01
博弈论：研究决策主体在相互影响、相互作用的环境中如何进行决策，以及这种决策的均衡结果的学科。
02
博弈论强调参与者之间的互动关系，通过数学模型和理论分析来研究策略选择和均衡结果。
应用领域：拍卖机制设计、保险市场分析、医疗资源分配等。

03
博弈论的基本概念
参与者
01
02
03
参与者
在博弈中，参与者是决策的主体，可以是个人或组织。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。