博弈论(课一)
博弈论PPT课件

这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
中央财经大学 研究生 博弈论课件

占优策略
参与者的最优选择不依赖于其他 参与者的策略选择(一般情况下, 应该依赖于其他参与者的策略选 择),即不论其他参与者选择什 么策略,其最优策略是唯一的。 这样的最优策略被称为占优策略 占优策略。 占优策略
一般地, 一般地,如果对应所有的 s− i , i* 是i 的严 s 格最优选择, 格最优选择,即
第一章 完全信息静态博弈
本章主要内容: 本章主要内容:
占优策略均衡 重复剔除的占优均衡 纳什均衡 三种均衡之间的关系
纳什均衡应用举例 混合策略纳什均衡 纳什均衡的多重性 纳什均衡的存在性
一、占优策略均衡 占优策略均衡
例子:囚徒困境
囚徒B
坦白 抵赖
1,15 2,2
囚徒 A
坦白 抵赖
10,10 15,1
* i ' i
' i * i
占优策略均衡
由所有参与者的占优策略构成的 策略组合就是占优策略均衡 占优策略均衡。 占优策略均衡 * 如果对于所有的i, si 被称为参 与者i的占优策略,策略组合 * * * s = ( s1 ,L , sn ) 被称为占优策略均衡 占优策略均衡。 占优策略均衡
二、重复剔除的占优均衡 重复剔除的占优均衡
) ,,
ui ( s , s− i ) > ui ( s , s− i ) ∀s−i ,∀s ≠ s 则 s * 被称为参与者i的(严格)占优策 被称为参与者 的 严格) i ' 对应地, 略。对应地,所有的 si ( si' ≠ si* )被称 为劣策略。 为劣策略。其中 s−i = ( s1 ,L , si −1 , si +1 ,L , sn )是 i之外所有参与者策略的组合。 之外所有参与者策略的组合。 之外所有参与者策略的组合
博弈论完整版PPT课件

2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
《博弈论》课程ppt课件

10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼பைடு நூலகம்设防 成功,失败
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。
博弈论课后习题

Document serial number [UU89WT-UU98YT-UU8CB-UUUT-UUT108]第一章导论1、什么是博弈博弈论的主要研究内容是什么2、设定一个博弈模型必须确定哪儿个方面3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。
4、"囚徒的困境”的内在根源是什么举出现实中囚徒的困境的具体例子。
5、博弈有哪些分类方法,有哪些主要的类型6、你正在考虑是否投资100万元开设一家饭店。
假设情况是这样的:你决定开,则的概率你讲收益300万元(包括投资),而的概率你将全部亏损;如果你不开,则你能保住本钱但也不会有利润,请你(a)用得益矩阵和扩展形式表示该博弈;(b)如果你是风险中性的,你会怎样选择(c)如果你是风险规避的,且期望得益的折扣系数为,你的策略选择是什么(d)如果你是风险偏好的,期望得益折算系数为,你的选择又是什么7、一逃犯从关押他的监狱中逃走,一看守奉命追捕。
如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。
逃犯逃脱可以少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得到1000元奖金。
请分别用得益矩阵和扩展形式表示该博弈,并作简单分析。
第二章完全信息静态博弈1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么2、为什么说纳什均衡是博弈分析中最重要的概念3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。
4、多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不利影响5、下面的得益矩阵表示两博弈方之间的一个静态博弈。
该博弈有没有纯策略纳什均衡t専弈的结果是什么6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。
7、博弈方1和2就如何分10 000元进行讨价还价。
假设确定了以下规则:双方同时提出自己要求的数额S1和S2, 0< sl,s2< 10 000,如果sl+s2W10 000,则两博弈方的要求都得到满足,即分别得到si和s2, 但如果是sl+s2>10 000,则该笔钱就被没收。
(完整版)耶鲁公开课--博弈论笔记

耶鲁公开课一博弈论笔记第一节、名词解释优势策略(Dominant strategy ):不论其他局中人采取什么策略,优势策略对一个局中人而言都是最好的策略。
即某些时候它胜于其他策略,且任何时候都不会比其他策略差。
注:1、"优势策略”的优势是指你的这个策略对你的其他策略占有优势,而不是无论对手采用什么策略,都占有优势的策略。
2、采用优势策略得到的最坏的结果不一定比采用另外一个策略得到的最佳的结果略胜一筹。
严格劣势策略(strictly dominated strategy):被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
弱劣势策略:原来不是严格劣势策略,但是经过剔除严格劣势策略后,这个策略就成了严格劣势策略。
例:囚徒困境甲沉默{合作)甲认罪(背叛乙沉默(合作)二人同服刑半年甲即时获释!乙眼刑F评乙认罪(背扳)甲腮刑10年;乙即时获释二炯服刑2年囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。
就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。
试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论一一选择背叛。
背叛是两种策略之中的支配性策略。
因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
例:协和谬误20 世纪60 年代,英法两国政府联合投资开发大型超音速客机,即协和飞机。
该种飞机机身大、装饰豪华并且速度快,其开发可以说是一场豪赌,单是设计一个新引擎的成本就可能高达数亿元。
难怪政府也会被牵涉进去,竭力要为本国企业提供更大的支持。
项目开展不久,英法两国政府发现:继续投资开发这样的机型,花费会急剧增加,但这样的设计定位能否适应市场还不知道;但是停止研制也是可怕的,因为以前的投资将付诸东流。
精品课程《博弈论》PPT课件(全)

能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
北京大学博弈论课件第1章博弈论概述

企业、社会团体、国家
博弈参与者可能多于两方,三方或多方博弈参与者
二、博弈策略(Strategy)
博弈策略指博弈参与者可以采取的行动 在“锤头、剪刀、布”博弈中,博弈参与者所能采取的博弈策略
均为“锤头”、“剪刀”或“布” 两名同学去相约去博物馆博弈中,博弈参与者所能采取的博弈策
博弈参与者:两个人 博弈过程:
两人在校门口集合,一起逛博物馆
博弈策略和结果
两人都去南门,成功碰面 两人都去北门,成功碰面 同学甲去南门,同学乙去北门,两人错过 同学甲去北门,同学乙去南门,两人错过
博弈双方策略相互依赖,不独立。
其他博弈实例
棋类比赛:象棋、围棋等。古人“对弈”。 寡头市场:
遇、不能够相遇两种可能的结果。 在“囚徒困境”博弈中,博弈参与者得到的收益是
如果甲、乙都坦白,则甲、乙均得到 5 年徒刑 如果甲、乙都不坦白,则甲、乙均得到 2 年徒刑 如果甲坦白、乙不坦白,则甲得到 1 年、乙得到 10 年有期徒刑 如果甲不坦白、乙坦白,则甲得到 10 年、乙得到 1年有期徒刑
略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中,博弈参与者所能采取的博弈策略均为
“坦白”或“不坦白”
三、博弈的收益(Payoff)
博弈收益指不同博弈策略给博弈参与者带来的利益 在“锤头、剪刀、布”博弈中,博弈参与者得到的收益是:赢、平局、
输三种可能的结果。 两名同学去相约去博物馆博弈中,博弈参与者得到的收益是:能够相
2.非合作博弈(Non-cooperative games),纳什就读于普林斯 顿大学数学系的博士毕业论文,1950年。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈学
-----博览全局对弈棋局课一
博弈在中国的理解--略观围棋,法于用兵,怯者无功,贪者先亡。
西方国家的理解--Game fair play。
(中国人在博弈中关注的是获胜,西方人在博弈中关注的是怎么玩的开心。
)
博弈可以在工作领域,可以在社交往来,可以在家庭相处,无处不在,博大精深。
知人者智,自知者明;
胜人者力,自胜者强;
小胜者术,大胜者德。
推荐书刊
1、蒋文华:《用博弈的思维看世界》,浙江大学出版社,2014年。
2、张维迎:《博弈论与信息经济学》,上海三联书店,上海人民出版社,1996年。
3、詹姆斯·米勒:《活学活用博弈论-如何利用博弈论在竞争中取胜》,中国财政经济出版社,2006年。
4、阿维纳什·K·迪克西特、巴里·J·奈尔伯夫:《策略思维》,中国人民大学出版社,2002年。
5、阿维纳什·K·迪克西特、巴里·J·奈尔伯夫:《妙趣横生博弈论》,机械工业出版社,2009年。
博弈
指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。
故事1,两人同行打猎,忽遇一猛狮。
一人卸下身上物品狂奔,同伴不解,问道:“汝能胜狮?”答曰:“非需胜狮,只需胜汝!”(博弈既可以是竞争,也可以是合作!)
游戏1,每位同学写1个介于1与100之间的自然数(整数,包括1与100在内),然后求出所有数字的平均数,如果你所写的数字最接近该平均数的二分之一,那么你将在游戏中胜出。
(博弈,必须学会换位思考!)
博弈
只需领先一步,高人一筹!大智若愚如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢?
游戏2,每位同学写5个大于0的自然数,如果你所写的5个数字中有一个是所有同学中所写的数字中最小的(在没有重合的情况下),那么你将在该游戏中胜出。
(选对市场(对手)比选对策略更重要!)
故事2“刚整理东西的时候发现了这张旧名片,隐约记得是N年前,有一次在杭州的一个路边店吃烧烤,认识了一位其貌不扬的朋友,聊得甚欢,他非常欣赏我,不嫌我年纪轻轻,说让我别读书了,读出来也是给别人做苦力,去他公司跟他一起打天下,看他吊样和山寨般的公司名我断然拒绝了,现在我只想一个人
安静一会儿。
”(在博弈之前,博弈就已经开始了!)
夫未战而庙算胜者,得算多也;未战而庙算不胜者,得算少也。
多算胜,少算不胜,而况於无算呼!吾以此观之,胜负见矣。
掌握博弈学,这门学问让
一、当局者清
更有利的选择,更快速的反应
二、旁观者更清
理解历史与现实,预测未来的发展
三、提出完善游戏规则(制度)的建议。