博弈论(课一)

合集下载

博弈论PPT课件

有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i，对于所有的 σi∈Mi，都有ui﹙σ*﹚≥ui﹙σi，σ-i*﹚，则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中解：设猜方猜正方的概率为p，猜反方的概率则为1－
无名氏（大众）定理
无名氏定理：在无穷次重复的由n个游戏者参与的博弈里，如果在每一次重复中博弈的行动集是有限的，则在满足下列三个条件时，在任何有限次重复中所观察到的任何行动组合都是某个子博弈完美均衡的惟一结果：
条件1：贴现因子接近于1；条件2：在每一次重复中，博弈结束的概率或等于0，或为非常小的一个正值；条件3：严格占优于一次性博弈中的最小最大收益组合的那个收益组合集是n维的。
博弈方
博弈方：独立决策、独立承担博弈结果的个人或组织
博弈规则面前博弈方之间平等，不因博弈方之间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈，单人博弈是退化的博弈
策略
策略：博弈中各博弈方的选择内容策略有定性定量、简单复杂之分不同博弈方之间不仅可选策略不同，而且可
游戏和经济等决策竞争较量的共同特征：规则、结果、策略选择，策略和利益相互依存，策略的关键作用
游戏——下棋、猜大小经济——寡头产量决策、市场阻入、投标拍卖政治、军事——美国和伊朗、以色列和巴勒斯坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) （或称支付，或得益）

中央财经大学研究生博弈论课件

占优策略
参与者的最优选择不依赖于其他参与者的策略选择（一般情况下，应该依赖于其他参与者的策略选择），即不论其他参与者选择什么策略，其最优策略是唯一的。这样的最优策略被称为占优策略占优策略。占优策略
一般地，一般地，如果对应所有的 s− i ， i* 是i 的严 s 格最优选择，格最优选择，即
第一章完全信息静态博弈
本章主要内容：本章主要内容：
占优策略均衡重复剔除的占优均衡纳什均衡三种均衡之间的关系
纳什均衡应用举例混合策略纳什均衡纳什均衡的多重性纳什均衡的存在性
一、占优策略均衡占优策略均衡
例子：囚徒困境
囚徒B
坦白抵赖
1，15 2，2
囚徒 A
坦白抵赖
10，10 15，1
* i ' i
' i * i
占优策略均衡
由所有参与者的占优策略构成的策略组合就是占优策略均衡占优策略均衡。占优策略均衡 * 如果对于所有的i， si 被称为参与者i的占优策略，策略组合 * * * s = ( s1 ,L , sn ) 被称为占优策略均衡占优策略均衡。占优策略均衡
二、重复剔除的占优均衡重复剔除的占优均衡
），，
ui ( s , s− i ) > ui ( s , s− i ) ∀s−i ,∀s ≠ s 则 s * 被称为参与者i的（严格）占优策被称为参与者的严格） i ' 对应地，略。对应地，所有的 si （ si' ≠ si* ）被称为劣策略。为劣策略。其中 s−i = ( s1 ,L , si −1 , si +1 ,L , sn )是 i之外所有参与者策略的组合。之外所有参与者策略的组合。之外所有参与者策略的组合

博弈论完整版PPT课件

R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4；
2-阶理性： C相信R相信C是理性的，C会将R4从R的战略空间中剔除, 所以 C不会选择C1；
3-阶理性： R相信C相信R相信C是理性的， R会将C1从C的战略空间中剔除, R不会选择R1；
基本假设：完全竞争，完美信息
个人决策是在给定一个价格参数和收入的条件下最大化自己的效用，个人的效用与其他人无涉，所有其他人的行为都被总结在“价格”参数之中
一般均衡理论是整个经济学的理论基石和道义基础，市场机制是完美的，帕累托最优成立，平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立：
.
19
理性共识
0-阶理性共识：每个人都是理性的，但不知道其他人是否是理性的；
1-阶理性共识：每个人都是理性的，并且知道其他人也是理性的，但不知道其他人是否知道自己是理性的；
2-阶理性共识：每个人都是理性的，并且知道其
他人也是理性的，同时知道其他人也知道自己是
理性的；但不知道其他人是否知道自己知道他们
如果你预期我会选择X，我就真的会选择X。
如果参与人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定：
只有两个厂商面对相同的线形需求曲线，P(Q)=a－Q， Q=q1+q2 两厂商同时做决策；假定成本函数为C(qi)＝ciqi
劣策略：如果一个博弈中，某个参与人有占优策略，那么
该参与人的其他可选择策略就被称为“劣策略”。

《博弈论》课程ppt课件

10
图1 进攻与防守的基本式 G={N, S, u}，其中N=（1,2)， Si={(0,2),(1,1),(2,0)}，ui (s1, s2) = ri，i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败，成功
成功，失败
成功，失败
失败，成功
成功，失败
成功，失败
《博弈论》课程
（一）什么是博弈论
我们首先看几个例子。例1 石头、剪刀、布
猪八戒
石头石头孙悟空剪刀布未定，未定找水，休息休息，找水剪刀休息，找水未定，未定找水，休息布找水，休息休息，找水未定，未定
2
例2 诺曼底登陆
德军
加来设防加来登陆盟军
诺曼底登陆成功，失败
诺曼பைடு நூலகம்设防成功，失败
9
例4 进攻与防守双方争夺一个据点，有两条进攻路线X和Y，攻方有两个军，而防守方也有两个军，只有当守方的兵力不少于攻方时，才能击退进攻，否则据点将会失守。首先可知守方的防守方案（即策略）为(0,2)，(1,1)，(2,0)，即在X 线路和Y线路驻扎军队数，同样可以到的攻方的进攻方案(0,2)，(1,1)和(2,0)。容易看出，行动并非策略，策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心，因而博弈论对于各门社会科学而言，就具有了方法论意义，成为各门学科的有力分析工具。
6
（二）博弈表达的科学式
（1）博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然是很重要的。如果用参与者、策略和收益函数来科学地描述一个博弈，就称为博弈表达的策略式（或基本式、标准式）。

博弈论课后习题

Document serial number [UU89WT-UU98YT-UU8CB-UUUT-UUT108]第一章导论1、什么是博弈博弈论的主要研究内容是什么2、设定一个博弈模型必须确定哪儿个方面3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。

4、"囚徒的困境”的内在根源是什么举出现实中囚徒的困境的具体例子。

5、博弈有哪些分类方法，有哪些主要的类型6、你正在考虑是否投资100万元开设一家饭店。

假设情况是这样的：你决定开，则的概率你讲收益300万元（包括投资），而的概率你将全部亏损；如果你不开，则你能保住本钱但也不会有利润，请你（a）用得益矩阵和扩展形式表示该博弈；（b）如果你是风险中性的，你会怎样选择（c）如果你是风险规避的，且期望得益的折扣系数为，你的策略选择是什么（d）如果你是风险偏好的，期望得益折算系数为，你的选择又是什么7、一逃犯从关押他的监狱中逃走，一看守奉命追捕。

如果逃犯逃跑有两条可选择的路线，看守只要追捕方向正确就一定能抓住逃犯。

逃犯逃脱可以少坐10年牢，但一旦被抓住则要加刑10年；看守抓住逃犯能得到1000元奖金。

请分别用得益矩阵和扩展形式表示该博弈，并作简单分析。

第二章完全信息静态博弈1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么2、为什么说纳什均衡是博弈分析中最重要的概念3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。

4、多重纳什均衡是否会影响纳什均衡的一致预测性质，对博弈分析有什么不利影响5、下面的得益矩阵表示两博弈方之间的一个静态博弈。

该博弈有没有纯策略纳什均衡t専弈的结果是什么6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。

7、博弈方1和2就如何分10 000元进行讨价还价。

假设确定了以下规则:双方同时提出自己要求的数额S1和S2, 0< sl,s2< 10 000,如果sl+s2W10 000,则两博弈方的要求都得到满足，即分别得到si和s2, 但如果是sl+s2>10 000,则该笔钱就被没收。

(完整版)耶鲁公开课--博弈论笔记

耶鲁公开课一博弈论笔记第一节、名词解释优势策略（Dominant strategy ）:不论其他局中人采取什么策略，优势策略对一个局中人而言都是最好的策略。

即某些时候它胜于其他策略，且任何时候都不会比其他策略差。

注：1、"优势策略”的优势是指你的这个策略对你的其他策略占有优势，而不是无论对手采用什么策略，都占有优势的策略。

2、采用优势策略得到的最坏的结果不一定比采用另外一个策略得到的最佳的结果略胜一筹。

严格劣势策略（strictly dominated strategy）:被全面的严格优势策略压住的那个策略，也就是说不是严格优势策略以外的策略。

弱劣势策略：原来不是严格劣势策略，但是经过剔除严格劣势策略后，这个策略就成了严格劣势策略。

例：囚徒困境甲沉默｛合作）甲认罪（背叛乙沉默（合作）二人同服刑半年甲即时获释！乙眼刑F评乙认罪（背扳）甲腮刑10年；乙即时获释二炯服刑2年囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。

就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。

试设想困境中两名理性囚徒会如何作出选择：若对方沉默、背叛会让我获释，所以会选择背叛。

若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。

二人面对的情况一样，所以二人的理性思考都会得出相同的结论一一选择背叛。

背叛是两种策略之中的支配性策略。

因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。

例：协和谬误20 世纪60 年代，英法两国政府联合投资开发大型超音速客机，即协和飞机。

该种飞机机身大、装饰豪华并且速度快，其开发可以说是一场豪赌，单是设计一个新引擎的成本就可能高达数亿元。

难怪政府也会被牵涉进去，竭力要为本国企业提供更大的支持。

项目开展不久，英法两国政府发现：继续投资开发这样的机型，花费会急剧增加，但这样的设计定位能否适应市场还不知道；但是停止研制也是可怕的，因为以前的投资将付诸东流。

精品课程《博弈论》PPT课件(全)

人博弈两人博弈有多种可能性，博弈方的利益方向可
能一致，也可以不一致
三、多人博弈
三个博弈方之间的博弈可能存在“破坏者”：其策略选择对自身的利
益并没有影响，但却会对其他博弈方的利益产生很大的，有时甚至是决定性的影响。申办奥运会是典型例子。多人博弈的表示有时与两人博弈不同，需要多个得益矩阵，或者只能用描述法
动态博弈、重复博弈。
静态博弈：所有博弈方同时或可看作同时选择策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈：各博弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场结构
重复博弈：同一个博弈反复进行所构成的博弈，提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时，有一夛，父亭乘了冩丢梨回宛，
陶谦吏亸叹孜癿时俳，又问亸：“亵绉泶孜癿觇
店看，佝觏为叴小梨刁算叾？”孔融回答该： “我丌
过觑了一次梨，哏哏単因此爱抋了我一辈子，社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨看俺
昤道徇成本，简直就昤一本万利唲！
阿克洛夫：买卖
主对于要交易的“旧车”存在信息不对称，买主通常不愿意出高价，这样持有好车的买主只好退出市场，市场上都剩下“坏车”，买主则越来越不愿意光顾，旧车市场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16

北京大学博弈论课件第1章博弈论概述

博弈参与者可能是单个的个人，也可能是组织或集体
企业、社会团体、国家
博弈参与者可能多于两方，三方或多方博弈参与者
二、博弈策略（Strategy）
博弈策略指博弈参与者可以采取的行动在“锤头、剪刀、布”博弈中，博弈参与者所能采取的博弈策略
均为“锤头”、“剪刀”或“布” 两名同学去相约去博物馆博弈中，博弈参与者所能采取的博弈策
博弈参与者：两个人博弈过程：
两人在校门口集合，一起逛博物馆
博弈策略和结果
两人都去南门，成功碰面两人都去北门，成功碰面同学甲去南门，同学乙去北门，两人错过同学甲去北门，同学乙去南门，两人错过
博弈双方策略相互依赖，不独立。
其他博弈实例
棋类比赛：象棋、围棋等。古人“对弈”。寡头市场：
遇、不能够相遇两种可能的结果。在“囚徒困境”博弈中，博弈参与者得到的收益是
如果甲、乙都坦白，则甲、乙均得到 5 年徒刑如果甲、乙都不坦白，则甲、乙均得到 2 年徒刑如果甲坦白、乙不坦白，则甲得到 1 年、乙得到 10 年有期徒刑如果甲不坦白、乙坦白，则甲得到 10 年、乙得到 1年有期徒刑
略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中，博弈参与者所能采取的博弈策略均为
“坦白”或“不坦白”
三、博弈的收益（Payoff）
博弈收益指不同博弈策略给博弈参与者带来的利益在“锤头、剪刀、布”博弈中，博弈参与者得到的收益是：赢、平局、
输三种可能的结果。两名同学去相约去博物馆博弈中，博弈参与者得到的收益是：能够相
2．非合作博弈（Non-cooperative games），纳什就读于普林斯顿大学数学系的博士毕业论文，1950年。

博弈论课件

扩展一：不完全信息博弈
不完全信息博弈的定义
01
在博弈中，参与人对于其他参与人的类型、偏好、战略空间等
信息不完全了解。
不完全信息博弈的分类
02
根据信息不完全的程度，可以分为完全信息不完全博弈和完全
非完美信息博弈。
不完全信息博弈的求解方法
03
包括贝叶斯纳什均衡、精炼贝叶斯纳什均衡、完美贝叶斯纳什
均衡等。
选举策略
博弈论可以用来分析选举中的投票行为和策略，研究候选人如何制定竞选策略以最大化胜选机会。
政策制定
博弈论可以用来研究政策制定过程中的利益冲突和协调，分析政策制定者如何平衡不同利益群体的需求。
国际关系
博弈论可以用来研究国际关系中的冲突和合作，分析国家如何通过外交政策和军事手段来维护自身利益。
纯策略纳什均衡和混合策略纳什均衡。
特点
纳什均衡是一种稳定的状态，任何参与者单方面改变自己的策略都不会获得更好的收益。
优势策略与劣势策略
优势策略
无论其他参与者如何选择策略，该策略都能为参与者带来更高的
收益。
劣势策略
无论其他参与者如何选择策略，该策略都能为参与者带来更低的收益。
特点
在优势策略下，参与者没有理由改变自己的策略；在劣势策略下，参与者应该尽快改变自己的策略。
价格战的负面影响
价格战不仅会导致企业利润下降，还可能引发市场恶性竞争，破坏市场秩序。此外，价格战还可能导致产品质量下降，损害消费者利益。
案例二：国际政治中的博弈策略
国际政治中的博弈策略
在国际政治中，各国之间往往存在着复杂的博弈关系。为了维护自身利益，各国会采取不同的博弈策略，如通过外交手段、经济制裁、军事威胁等方式来达到自己的目的。

博弈论全套课件

三. 经典的博弈模型
1、“囚徒的困境”
关于博弈论，流传最广的是一个叫做“囚徒困境 ” 的故事。这个博弈是 1950 年图克（Tucker）提出的，这个博弈模型提出后曾引发了大量的相关研究，也有许多关于“囚徒困境”的版本。“囚徒困境”对博弈论的发展起到了巨大的推动作用。可以说凡是讲博弈论，都会说到这个经典的博弈模型。
在过去二三十年中，博弈论已成为社会科学研究的一个重要方法。有人说，如果未来社会科学还有纯理论的话，那就是博弈论。无论是合作博弈还是非合作博弈都给我们提供了一种系统的分析方法，使人们在其命运取决于他人的行为时制定出相应的战略。特别是当许多相互依赖的因素共存，没有任何决策能独立于其它许多决策之外时，博弈论更是价值巨大。
最近十几年来，博弈论在经济学尤其是微观经济学中得到了广泛的运用, 博弈论在许多方面改写了微观经济学的基础,经济学家们已经把研究策略相互作用的博弈论当作最合适的分析工具来分析各类经济问题，诸如公共经济、国际贸易、自然资源、企业管理等。在现代经济学里，博弈论已经成为十分标准的分析工具。除经济学以外, 博弈论目前在生物学、管理学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。现在已经有愈来愈多的人开始关注、了解并学习博弈理论。
博弈论(Game Theory)是一种关于游戏的理论, 又叫做对策论, 是一门以数学为基础的、研究对抗冲突中最优解问题的学科。事实上，博弈论也正是衍生于古老的游戏，如象棋、围棋、扑克等。
博弈论作为一门学科，是在20世纪50～60 年代发展起来的，当非零和博弈理论、特别是不完全信息博弈理论获得充分发展时，才成为现实。到20世纪70年代，博弈论正式成为主流经济学研究的主要方法之一。1994年诺贝尔经济学奖同时授予了纳什、泽尔腾、海萨尼三位博弈论专家。2005年诺贝尔经济学奖又授予了美国经济学家托马斯．谢林（Thomas Schelling）和以色列经济学家罗伯特．奥曼（Robert Aumann），以表彰他们在合作博弈方面的巨大贡献。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈学
-----博览全局对弈棋局课一
博弈在中国的理解--略观围棋，法于用兵，怯者无功，贪者先亡。

西方国家的理解--Game fair play。

（中国人在博弈中关注的是获胜，西方人在博弈中关注的是怎么玩的开心。

）
博弈可以在工作领域，可以在社交往来，可以在家庭相处，无处不在，博大精深。

知人者智，自知者明;
胜人者力，自胜者强;
小胜者术，大胜者德。

推荐书刊
1、蒋文华：《用博弈的思维看世界》，浙江大学出版社，2014年。

2、张维迎：《博弈论与信息经济学》，上海三联书店，上海人民出版社，1996年。

3、詹姆斯·米勒：《活学活用博弈论－如何利用博弈论在竞争中取胜》，中国财政经济出版社，2006年。

4、阿维纳什·K·迪克西特、巴里·J·奈尔伯夫：《策略思维》，中国人民大学出版社，2002年。

5、阿维纳什·K·迪克西特、巴里·J·奈尔伯夫：《妙趣横生博弈论》，机械工业出版社，2009年。

博弈
指在一定的游戏规则约束下，基于直接相互作用的环境条件，各参与人依据所掌握的信息，选择各自的策略（行动），以实现利益最大化的过程。

故事1，两人同行打猎，忽遇一猛狮。

一人卸下身上物品狂奔，同伴不解，问道：“汝能胜狮？”答曰：“非需胜狮，只需胜汝！”（博弈既可以是竞争，也可以是合作！）
游戏1，每位同学写1个介于1与100之间的自然数（整数，包括1与100在内），然后求出所有数字的平均数，如果你所写的数字最接近该平均数的二分之一，那么你将在游戏中胜出。

（博弈，必须学会换位思考！）
博弈
只需领先一步，高人一筹！大智若愚如果因为对方眼中的你的傻，而让对方更愿意和你合作，何乐而不为呢？
游戏2，每位同学写5个大于0的自然数，如果你所写的5个数字中有一个是所有同学中所写的数字中最小的（在没有重合的情况下），那么你将在该游戏中胜出。

（选对市场（对手）比选对策略更重要！）
故事2“刚整理东西的时候发现了这张旧名片，隐约记得是N年前，有一次在杭州的一个路边店吃烧烤，认识了一位其貌不扬的朋友，聊得甚欢，他非常欣赏我，不嫌我年纪轻轻，说让我别读书了，读出来也是给别人做苦力，去他公司跟他一起打天下，看他吊样和山寨般的公司名我断然拒绝了，现在我只想一个人
安静一会儿。

”（在博弈之前，博弈就已经开始了！）
夫未战而庙算胜者，得算多也；未战而庙算不胜者，得算少也。

多算胜，少算不胜，而况於无算呼！吾以此观之，胜负见矣。

掌握博弈学，这门学问让
一、当局者清
更有利的选择，更快速的反应
二、旁观者更清
理解历史与现实，预测未来的发展
三、提出完善游戏规则（制度）的建议。