博弈论入门PPT课件

合集下载

第六讲博弈论课件

第六讲博弈论课件
❖ 对于矩阵博弈,其主要的任务就是求出矩阵 博弈的Nash均衡解-----双方尽可能满意的结 果。
例12.1 智猪博弈模型
❖ 每次踩出6个单位的食物,按者支付2个单位 成本,小踩,(1,5)大踩(4,2)同时 (2,4)
大猪
小猪

踩 2,4 等待 4,2
等待
1,5 0,0
小猪的收入矩阵
A
2, 4,
❖ 20世纪50年代以来,纳什、泽尔腾、海萨尼 等人使博弈论最终成熟并进入实用。
三位大师主要的贡献
❖ 1950年和1951年纳什的两篇关于非合作博弈 论的重要论文,彻底改变了人们对竞争和市 场的看法。他证明了非合作博弈及其均衡解, 并证明了均衡解的存在性,即著名的纳什均 衡。从而揭示了博弈均衡与经济均衡的内在 联系。因为在现实世界中,非合作博弈要比 合作博弈普遍得多。
囚徒困境的意义
❖ “囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。
❖ 他们两人都是在坦白与抵赖策略上首先想到 自己,这样他们必然要服长的刑期。只有当 他们都首先替对方着想时,或者相互合谋(串 供)时,才可以得到最短时间的监禁的结果。
顺序和信息
❖ 博弈论非常强调时间和信息的重要性,认为 时间和信息是影响博弈均衡的主要因素。
❖ 在博弈过程中,参与者之间的信息传递决定 了其行动空间和最优战略的选择;
❖ 同时,博弈过程中始终存在一个先后问题 Sequence order,参与人的行动次序对博弈 最后的均衡有直接的影响。
分类
❖ 博弈的划分可以从参与人行动的次序和参与 人对其它参与人的特征、战略空间和支付的 知识、信息,是否了解两个角度进行。

博弈论完整版PPT课件

博弈论完整版PPT课件
R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。

《博弈论》课程ppt课件

《博弈论》课程ppt课件

10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼பைடு நூலகம்设防 成功,失败
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。

博弈论PPT课件

博弈论PPT课件

第1个数字表示企业1 的收入, 第2个数字表示企业2的收入。
13
7.2.2合作博弈:建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈:怎样对付欺骗者 • 重复性博弈:反复进行多次博弈 • 重复性博弈的最优策略——针锋相对:模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单,不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为,但要给欺骗行为以处罚 ☞针锋相对是宽大的,允许对方恢复合作
可以采取降价策略,使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策:投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损 失
29
7.3.4先发制人:使市场饱和
• 在各地布点,使新的进入者无法利用高运 输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策 略。
的违约问题 • 先合作,第N次违约的收入:
30+30+30+30+······+40
• 现实:不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工? • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有 利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入:30+30+30+30+······
• 不合作收入:40+20+20+20 +······

博弈论入门(课堂PPT)

博弈论入门(课堂PPT)

共同价值和赢者的诅咒
• 两家代理:1个积极估价,1个消极估价
prob(v/s)11//22
vs2 vs2
• v均匀分布
• 出价b=?(一家和两家出价时有不同吗)
• 考察b=s-1这样一个对称策略
• 德士古公司的例子
15
几种常见的拍卖形式
• 英式公开叫价拍卖 • 荷式公开叫价拍卖 • 一价密封拍卖 • 二价密封拍卖
• 通过改革,陪审团制度在美国得到了比英国更 好的发展。
22
投票程序
23
• 每个陪审员在陪审之前已经有一个大体 的判断
• 他们的类型 • 非专业性——从众行为
– 如果评判有罪的人数多于无罪,则投有罪 – 如果评判无罪的人数多于有罪,则投无罪 – 如果双方人数相等,则依照自己的评判结果
投票
24
• 陪1:假设投有罪 • 陪2:若评判有罪,则投有罪;若评判无
• 在被问及对最终的价格是否感到意外时 ,Frija抛下一个“不”字,随即离开了
11
简化的暗标拍卖
密封递交标书 统一时间公正开标 标价最高者以所报标价中标 中标博弈方的得益不仅取决于标价,还取决于他对拍
卖标的物的带有很大主观性的估计 每个博弈方的估价通常是自己的私人信息
12
0.6
0.4
• 考虑这样一个对称策略:给定其他两个 委员采取相同策略,以及对于其他成员 拥有哪个政策更好的知识的信念,不论 这个参与者什么类型,采取这个策略都 使他收益最大。
19
• 自然决定四项:哪个政策更好,以及三 个委员的类型。
• 当一个委员了解新政策时:投票给自己 认为更好的策略是一个弱占优策略。
– 当另外两位投票相同时 – 当另外两位投票分歧时

第十章博弈论初步-PPT精品

第十章博弈论初步-PPT精品

▪ 1、纳什均衡的定义:
▪ 设 s(s1, .., .sn)是n人博弈G={ ; S1, .., . Sn u1,.., . un } 的一个策略组合。如果对于每个局中人 i , ui(s1 , ., .s .i 1 , si , si 1 , ., .s .n )≥ ui(s1 , ., .s .i 1 , si, si 1 , ., .s .n )
第十章 博弈论初步 Game Theory
博弈论概述 纳什均衡 序贯博弈与重复博弈 进入威慑
第一节 博弈论概述
▪ 什么是博弈? ▪ 拍卖金钱 ▪ 海盗博弈 ▪ 田忌赛马 ▪ 围棋和象棋
齐王
田忌



上 赢,输 赢,输 赢,输
中 输,赢 赢,输 赢,输
下 输,赢 输,赢 赢,输
一、博弈的基本要素
ui(si,si) ≥ ui(si,si) 对于所有si Si 都成立,则我们称策略组合
s(s1, .., .sn)
是该博弈的一个纳什均衡。
▪ 纳什简介: ▪ 约翰·纳什生于1928年6月13日。父亲是电子工程师
与教师,第一次世界大战的老兵。纳什小时孤独内 向。纳什的数学天分大约在14岁开始展现。他在普 林斯顿大学读博士时刚刚二十出头,但他的一篇关 于非合作博弈的博士论文和其他相关文章,确立了 他博弈论大师的地位。在20世纪50年代末,他已是 闻名世界的科学家了。 ▪ 然而,30岁的时候,纳什和他惟一儿子都罹患精神 分裂症。半个世纪之后,在他妻子(艾利西亚—— —麻省理工学院物理系毕业生)的精心照料下,和 她的儿子一样,纳什教授渐渐康复,并在1994年获 得诺贝尔经济学奖。 ▪ 影片《美丽心灵》是一部以纳什的生平经历为基础 而创作的人物传记片。该片荣获2019年奥斯卡金像 奖。

第十章 博弈论初步PPT课件

第十章 博弈论初步PPT课件

2020年3月2日星期一
12
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
2.条件策略下划线方法的五步法 第一,把整个的支付矩阵分解为甲厂商的支付矩阵和 乙厂商的支付矩阵
2020年3月2日星期一
13
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
2020年3月2日星期一
11
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
1.基本方法 先用下划线法分别表示甲厂商和乙厂商的条件策
略,最后确定博弈的均衡(就是找到在两个数字之下 都划线的单元格即可,与这些单元格相对应的策略组 合就是所要求的均衡策略组合)。
1
第十章 博弈论初步 第一节 博弈论和策略行为
2.博弈的三个基本要素 三个基本要素,即参与人、参与人的策略和参与
人的支付。 所谓参与人(或称局中人),就是在博弈中进行
决策的个体;所谓参与人的策略,指的是一项规则, 根据该规则,参与人在博弈的每一时点上选择如何行 动;所谓参与人的支付则是指,在所有参与人都选择 了各自的策略且博弈已经完成之后,参与人获得的效 用(或期望效用)。
2020年3月2日星期一
2
第十章 博弈论初步 第一节 博弈论和策略行为
3.博弈的简单分类 根据参与人的数量,可以分为二人博弈和多人博
弈;根据参与人的支付情况,可分为零和博弈和非零 和博弈;根据参与人拥有的策略的数量多少,可分为 有限博弈和无限博弈;根据参与人在实施策略上是否 有时间的先后,可分为同时博弈和序贯博弈。
二、支付矩阵
1.支付矩阵 使用支付矩阵来描述和分析只有两人参加且两人

博弈论基础知识.ppt

博弈论基础知识.ppt

The theory of rational choice

The action chosen by a decision-maker is at least as good, according to her preferences, as every other available action.
第一讲( 第一讲(续) 博弈论基础知识
The theory of rational choice
Actions Preferences and payoff functions
epresents a decision-maker’s preferences if, for any actions a in A and b in A, u(a)>u(b) if and only if the decision-maker prefers a to b. – A decision-maker’s preferences convey only ordinal information.
Conditional probability and Bayes’s rule
– –
Conditional probability and Bayes’s rule
条件概率: P ( B | A) = P ( AB ) P ( A)
全概率公式:设试验 E的样本空间为 S, A为 E的事件, B1, B2, Bn为 S的一个划分, P ( Bi ) > ( i = 1, 2,⋯ , n), 0 则: P ( A) = P ( A | B1 ) P ( B1 ) + P ( A | B2 ) P ( B2 ) + ⋯ + P ( A | Bn ) P ( Bn ) 贝叶斯公式: P ( Bi | A) = P ( A | Bi ) P ( Bi )
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于对其他参与 者信息的了 解程度
完全信息博 弈
不完全信息 博弈
负和博弈
根据结果
零和博弈
正和博弈
特征 合作中如何分配利益,使大家都满意。 只考虑自己的利益,不考虑对方的利益。 做出策略虽然有先后,但每一方都不知
道对方的策略。 做出策略虽然有先后,但参与者对对方
做出的策略是知道。(例如下象棋) 博弈中对其他参与者的各方面信息、可
最理想的结局:双赢
一、正和博弈各方本着相互合作,公平公 正,互利互惠的原则分配利益,让每一 个人参与者都满意的博弈。
案例:鳄鱼鸟与鳄鱼和谐相处,生存搭档 的典型。凶恶的鳄鱼可以容忍鳄鱼鸟清 理它牙缝里的残肉,因为这样可以避免 滋生细菌,它的牙就不会生虫了。
二、博弈中发生冲突的时候,充公了解对 方、取长补短,各取所需,往往会使双 方走出负和博弈和零和博弈的误区,实 现合作共赢。
一年轻人在酒吧喝酒,中途去厕所。一美女尾随 他打劫,对他说:将钱和手机都交出来,否则 我说你非礼我。年轻人转念一想,计上心来, 用手指自己的嘴和耳朵。美女误以为他是聋哑 人,想放弃。年轻人掏出一支笔和一张纸在上 面写上:你说什么呀?
美女见状拿过笔来也在纸上写了:将钱和手机都 交出来,否则我说你非礼我。这时年轻人一把 抓住美女的手,大声喊道:我要送你去派出所 。
最坏的结果:两败俱伤
战争是典型的负和博弈:二战共有61个国 家卷入,涉及人口20亿以上。二战中军 民伤亡1.9亿,其中死亡6000万,受伤 1.3亿。其中死亡的平民有2730万。盟 军中苏联军队伤亡最为惨重,死亡890 万,中国军队死亡148万,英国与美国 各死亡38万。法西斯德国军队伤亡人数 1170万,军队死亡600万,日本军队伤 亡216万。
警察将他们两个分开审讯:分别对他们说:尽管 你们不承认,但是我知道人就是你们两个杀的, 事情早晚会水落石出的。现在我给你一个坦白 的机会,如果你坦白了,亚当拒不承认,那你 就是主动自首,同时协助警方破案,你将被立 即释放,亚当则要坐10年牢;如果你们都坦白 了,每人坐8年牢;都不坦白的话,可能以入 室盗窃罪判你们每人1年,如何选择你自己想 一想吧。
基于对其他参与者的信息的掌握程度、博 弈可以分为完全信息博弈和不完全信息 博弈。
完全信息博弈是指博弈中对其他参与者的 特征、利益、可能选择的策略等信息有 一个准确的了解。反之就是不完全信息 博弈。
按照结果来分博弈可分为:
1、零和博弈:一方赢,另一方输,双方 的得失总和永远为零。比如:赌博、炒 股。
两个好朋友合伙做生意,一个有资金但不 善于交际,另一个没有资金但能说会道 。两个人凑到一起,互相赏识,很快就 决定开一家公司,有资金的出资金,没 有资金的负责联络客户。
公司的业务动作得很好,看到公司开始赢 利,能说会道的那个人就想独自霸占公 司,他便将出资人的钱全部还给他,表 示公司不再欠他了。出资人肯定不同意 呀,就去法院起诉,可是到了法院才知 道营业执照上只写了能说会道的那个人 的名字。他一气之下放了一把火将公司 烧了。
能做出的策略全部了解。
局部了解对方的信息。
两败俱伤 一胜一负 双赢或多赢
双赢的案例:
一个有想了解天堂和地狱的差别,就去问 传教士,传教士将他带到一间二层楼的 房子。进入第一层,有张大餐桌,桌上 摆着各种美食,但是桌上每个人都满面 愁容。原来他们的手臂受到诅咒不能弯 曲,所以就不能享受桌上的美食。
又来到二楼,情况一样的,可是大家都吃 得很高兴,原来他们的手臂不能弯曲, 可是他们相互合作,互相喂食,这样各 人都可以得到自己想要的东西。
2、合作博弈是研究合作中如何分配利益 的问题,目的是使得协议框架内所有参 与者都满意。
(OPEC欧佩克:石油输出国的简称,为 了维护石油国的利益,统一调度石油的 出口和价格。也有行业寡头之间进行合 作博弈,垄断行业资源的负面博弈。)
3、非合作博弈:只争取对自己最大化的 利益,不考虑其他参与者的利益,与其 他参与者之间没有共同遵守的协议。
博弈论
-----------
一、什么是博弈论
博弈论,又称对策论;是研究冲突对抗条 件下最优决策问题的理论。
博弈论:指双方或多方在竞争、合作、冲突 等情况下,充分了解各方信息,并依此 选择一种能为本方争取最大利益的最优 决策的理论。
*博弈原指赌博、或警察局接到报案:一位富翁被杀死在家里,家中 财物也被洗劫一空,警方最终将嫌疑人锁定在 杰克和亚当的身上,因为当晚有人看见他们俩 慌张地从被害人家里跑出来,于是将俩人拘留。
三、博弈的四要素
1、至少有两个参与者 2、存在参与者在乎的利益 3、有策略;为获得最大利益而制定的方
法,策略必须要有选择性。也就是说至 少有两套以上的策略供选择的。 4、信息;是制定策略的依据,甄别信息 真假就显得格外重要。 诸葛亮空城记 美国西部淘金记
四、博弈的分类
1、根据参与者之间是否具有约束力的协 议,博弈分为:合作博弈和非合作博弈。
你猜他们会选择什么呀?
杰克 坦白 不坦白
亚当 坦白 (8,8) (10,0)
不坦白 (0,10) (1,1)
二、博弈论的历史发展
1、1944年,冯·诺依曼与摩根斯坦合 著的《博弈论与经济行为》发行出 版,将先前冯·诺依曼的主要只研究 二个博弈拓展为多人博弈;同时还 应用于经济领域,奠定了这门学科 的基础和理论体系。
2、负和博弈:参与者最后得到的收获都 小于付出。两败俱伤。
3、正和博弈:又称为双赢博弈或者合作 博弈,是指参与者都能获益,或者一方 的收益增加不影响其他参与者的利益。
判断生活中的博弈属于哪种?
图示博弈的分类
分类标准
博弈双方是否有 约束力的协 议
分类 合作博弈 非合作博弈
参与者做出策略 的先后顺序
静态博弈 动态博弈
非合作博弈是博弈的常态。
4、按照参与者选择策略、做出决定的先 后顺序,博弈可以分为静态博弈与动态 博弈。
静态博弈:参与者的策略有先后、但后做 出策略的参与者并不知道其他参与者的 策略。例:石头、剪刀、布。
动态博弈:后的参与者知道其他参与者提前选择 的策略。例如:下象棋、打扑克。
案例:年轻人智斗美女非礼劫财
相关文档
最新文档