博弈论与囚徒困境-展示PPT

合集下载

第九章 博弈论 《微观经济学》PPT课件

第九章 博弈论 《微观经济学》PPT课件




1,-1
3,-3
A
图9-3 写字博弈的收益矩阵
9.2 占优策略
• 在一个有n个人参与的博弈G={S1,…,Sn;u1,…,un}中,令 si′和si″是第i个参与人可选择的两个策略,如果对其他所有参与 人任意的策略组合s-i,总有 Ui(si′, s-i)<ui(si″, s-i)s-i(9-4)
• 式中:t-i表示除参与人i以外的其他参与人的类型。
9.4* 贝叶斯纳什均衡
9.4.3 不完全信息古诺模型
• 现在我们假定市场反需求函数为P=a-q1-q2,ci为每个厂商不变的 单位成本,那么厂商的利润函数为:
πi=qi(a-q1-q2-ci)=qi(ti-q1-q2) (i=1, 2) • 式中:ti=a-ci。更进一步假定a=2,c1=1,=3/4,=5/4,μ=1/2,
ቤተ መጻሕፍቲ ባይዱ囚徒B
坦白
不坦白

坦白
-3,-3
0,-6

A
不坦白
-6,0
-1,-1
9.1 基本描述
9.1.2 基本概念 • 博弈是指任何一种由一人、两人或多人参与竞争的情形。 • 任何一个博弈都必须至少具备以下3个基本要素:参与人、策
略和支付。除此之外,行动、信息等也都是博弈的要素。
9.1 基本描述
• 参与人是指博弈中每个策略的决策者,他的目的是通过自己个 人的理性决策来最大化自己的支付水平。
9.3 纳什均衡
2.伯特兰模型 • 伯特兰模型是寡头厂商联合定价博弈。与古诺模型不同,伯特
兰模型中厂商同时选择的不是产量,而是产品价格。 • 因此,该伯特兰模型的纳什均衡为((a+c)/(2-b),

囚徒困境课件PPT课件

囚徒困境课件PPT课件
12
第12页/共25页
囚徒困境的启示
“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各 人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利 的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服 长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以 得到最短时间的监禁的结果。
21
第21页/共25页
经济如局 人生如棋 博弈之道 生活之常 运用之妙 存乎一心
22
第22页/共25页
结束语:学点博弈论 心灵更美丽
博弈——无处不在的策略游戏; 博弈——大千世界的生存法则; 博弈——竞争社会的现代意识。
23
第23页/共25页
24
第24页/共25页
感谢您的欣赏!
25
第25页/共25页
生活中,博弈无孔不入、无处不在。
1
第1页/共25页
博弈无处不在
2
第2页/共25页
3
第3页/共25页
选择
两条路在树林里分叉, 而我选择人迹罕至的那一条, 从此一切变了样。
4
第4页/共25页
坦白? 抵赖?
5
第5页/共25页
囚徒困境
检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。 如果你单独坦白偷盗的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被 同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们 都要被判5年刑。”
19
第19页/共25页
如何走出囚徒困境
长期关系和重复博弈
• 建立长期关系,使得囚徒困境可以多次重复,如果这个“多次”足够长,那 么人们就有可能为了长远的将来利益而牺牲眼前,合作也是可以达成的

关于博弈论的课件

关于博弈论的课件

混合策略
小偷与守卫的博弈
混合策略博弈的几个原则
小偷与守卫的博弈
守卫 睡 偷 小偷 不偷 0,2 , 0,0 , 6,- ,-2 ,- 不睡 -3,0 ,
混合策略博弈的几个原则
策略组合不可能是单一的策略或者纯策略, 而必须把不同的策略混合一起使用,这种博弈也 称之为“混合策略” 博弈,所达到的均衡也称之 为混合策略均衡。 第一,不能让对方事先知道自己可能采取的 策略。 第二,必须采取随机选择的原则。 第三,选择策略的概率一定要使对方无机可入 进入 厂商A 厂商 不进入 0,50 , 0,0 , ,-20 -20,- ,- 不进入 50,0 ,
市场进入博弈的扩展形式
进入(-20,-20) 厂商B 进入 厂商A
(1)
·
不进入(50,0) 进入 (0,50 )
·
不进入
(2)
厂商B
(3)
·
不进入 (0,0)
• 博弈理论认为,改变竞争规则是赢取博弈 博弈理论认为, 的根本出路。 的根本出路。
相同市场份额厂商的价格战
厂商B 厂商
降价 30,30 , 20,70 ,
不降价 70,20 , 50,50 ,
厂商A 厂商A
降价
不降价
纳什均衡
纳什均衡 协调博弈
• 我尊重你是因为你尊重我,你尊重我是因 我尊重你是因为你尊重我, 为我尊重你; 为我尊重你; • 我喜欢你是因为你喜欢我,你喜欢我是因 我喜欢你是因为你喜欢我, 为我喜欢你; 为我喜欢你; • 我爱你是因为你爱我,你爱我是因为我爱 我爱你是因为你爱我, 你。 • ……………………….. 佚名
不降价 65,25 , 60,40 ,
降价 厂商A 厂商A 不降价

清华大学博弈论讲义ppt课件

清华大学博弈论讲义ppt课件
完美信息perfect information:指一个参与 人对其他参与人的行动选择有准确的理 解,即每个信息集只包含一个值。
清华诚志
10
共同知识common knowledge
所有参与人知道每一步的信息集。
清华诚志
11
战略strategies
参与人在给定信息集的情况下的行动规 则,它规定参与人在什么时候选择什么 行动。
perative 合作博弈强调的是集体主义,团体理性
Ration
清华诚志
16
非合作博弈
而非合作博弈则主要研究人们在利益相 互影响的局势中如何选择策略使得自己 的收益最大,强调个人理性、个人最优 决策,其结果是有时有效率,有时则不 然。目前经济学家谈到博弈论主要指的 是非合作博弈,也就是各方在给定的约 束条件下如何追求各自利益最大化,最 后达到力量均衡。
清华诚志
1
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的 意义。个人理性与集体理性的冲突,各 人追求利己行为而导致的最终结局是一 个“纳什均衡”,也是对所有人都不利 的结局。他们两人都是在坦白与抵赖策 略上首先想到自己,这样他们必然要服 长的刑期。只有当他们都首先替对方着 想时,或者相互合谋(串供)时,才可以得 到最短时间的监禁的结果。
的均衡有直接的影响。
清华诚志
19
分类
博弈的划分可以从参与人行动的次序和 参与人对其它参与人的特征、战略空间 和支付的知识、信息,是否了解两个角 度进行。把两个角度结合就得到了4种 博弈:完全信息静态博弈,完全信息动 态博弈,不完全信息静态博弈,不完全 信息动态博弈
清华诚志
20
博弈的分类及对应的均衡
为了分析方便,自然nature被当作虚拟参 与人。

囚徒困境专题优秀PPT

囚徒困境专题优秀PPT
27
公共资源悲哀
思考1 思考2
为什么人们在消费各种公共资源时, 如果各取所需,留给下一代的越来越 少?而在社会优化分配中,消耗一半, 留下一半给后代。也就是说,当一种 资源成了公共资源的时候,还能够实 行各取所需吗?
全球转暖的温室效应是否属于公共资 源悲剧?
28
公共资源悲哀
思考3 在我国,利用电话线的网络快车 (ADSL),包月租或者包年租的时候, 每个人都想把网络打开挂在网络上 (在线游戏的激励),这样是不是公 共悲剧?你家里的网络快车是否真的 快?
39
但是,对手的战略锁定了“疯狂 艾迪”的行为,因为“疯狂艾迪”的这 一计划会有相反的效果。因为顾客会到 对手那里先以300美元买下录相机,然后 再获退款50美元。这样,对手自然将价 格降到更低的价格250美元一台,顾客反 而是从“疯狂艾迪”那里流向对手而不 是相反。
40
如果对手不想以250美元一台出售 录相机,他也可以将价格降到275美元一 台,只要它发现有顾客来要求退款,就 会发现对手的背叛行为,从而将价格降 到了250美元一台。既不以太低价出售, 又快速发现对手的背叛从而以降价予以 报复,使对手降价也不能增大顾客量, 从而蒙受损失。
20
修 甲
不修
修路博弈
乙 修
不修
1,1
-1,3
3,-1
0,0
21
我们看到,对甲和乙两家居民来说, “修路”都是劣战略,因而他们都不会 出资修路。
22
这就是我们看到的为什么大多数 路、桥等公共设施都是由政府出资修建 的原因。
同样的道理,国防、教育、社会 保障,环境卫生等都由政府承担资金投 入,私人一般没有积极性承担这方面服 务的积极性和能力。
31

囚徒困境PPTPPT课件

囚徒困境PPTPPT课件
第10页/共27页
警方怀疑他们作案,但并没有掌握他们作案的确凿证据,于是明 确地分别告诉2名嫌疑人:对他们犯罪事实的认定及相应的量刑, 完全取决于他们自己供认与否。如果一方与警方合作,坦白所做 违法之事,而另一方抵赖,招认方将无罪释放,另一方则会被判 重刑8年;如果双方都与警方合作共同招认,各被判刑5年;而如 果双方均不认罪,因为警察找不到其他证明他们违法的证据,则 判刑1年。
1.1.1 什么是“博弈”?
博弈 Game(游戏)
围棋等棋类比赛、桥牌拱猪等扑克游戏,以及田径、球 类等各种体育比赛
人们在一定规则下进行竞赛 在竞赛中,策略,或者说
计谋,有举足轻重的作用。
第1页/共27页
博弈起源于游戏中的策略对抗
博弈是策略起关 键作用的游戏
第2页/共27页
博弈,根据《辞海》的解释,就是在多决策主体之 间行为具有相互作用时,各主体根据所掌握信息及 对自身能力的认知,做出有利于自己的决策的一种 行为。
他们面临的选择和带来的后果组合,可以用下面的表格来表示。
A B
不坦白
坦白
不坦白
坦白
A:判刑1年 B:判刑1年
A:判刑8年 B:无罪释放
A:无罪释放 B:判刑8年
A:判刑5年 B:判刑5年
第11页/共27页
请问,他们会选择什么呢? 坦白or 不坦白
第12页/共27页
从上面的表中我们可以知道:每个嫌疑人都有两种可供 选择的策略: 坦白不坦白。
博弈就是决策行为
第3页/共27页
“石头-剪子-布” 游戏
第4页/共27页
第5页/共27页
游戏特点
有一定的规则,规定游戏的参加者,游戏者可以做什么,不 可以做什么。 都有结果,如一方赢、一方输、平局等

博弈论经典案例——囚徒困境ppt课件

博弈论经典案例——囚徒困境ppt课件
博弈论经典案例之
囚徒困境
1
博弈无处不在
2
至少有一人招供
缺乏足够的证据
3
坦白从宽,抗拒从严
4
坦白从宽,抗拒从严
认罪
重判10年 5
同时坦白,各判8年
6
同时抵赖,各判1年
7
思考
选择有几种、结局有几种? 如果你,如何选择? 为什么这么选择;如何考虑的?
8
坦白? 抵赖?
9
囚徒困境博弈表格
囚徒1 囚徒2
坦白
抵赖
坦白
—8,—8
0,—10
抵赖
—10,0
—1,—1
10
• 关于这个假设案例,显然最好的对策是双方都抵 赖,其结果是各被判1年,但隔离的审讯办法却杜 绝了犯罪嫌疑人事先有协商的机会。
• 从心理学的角度来分析,两人在受审时首先必会 怀疑对方会主动交代罪行以求自保,所以他们必 定会选择对自身最大利益的选项,那就是坦白认 罪。
11
反映了一个很深刻的问 题??
12
个人理性与集体理性的矛盾
13
囚徒困境可以用来解释为什么在一个群体 中没有人采取行动,来使该群体中每个人 的境况都得到改善。
——如公共产品的供给
14
小 区 路 灯 坏 了

我更换,得不偿失啊 你更换,我就会占便宜
更换,大家都不 摸黑
16
李四 更换
更换
1,1
张三
不更换 2,-1
不更换 -1,2 0,0
囚徒困境的收益矩阵
1717

博弈论中的经典分析及启示囚徒困境74页PPT

博弈论中的经典分析及启示囚徒困境74页PPT
快乐增加并使享受加强。 ——德 谟克利 特 67、今天应做的事没有做,明天再早也 是耽误 了。——裴斯 泰洛齐 68、决定一个人的一生,以及整个命运 的,只 是一瞬 之间。 ——歌 德 69、懒人无法享受休息之乐。——拉布 克 70、浪费时间是一桩大罪过。——卢梭
博弈论中的经典分析及启示 囚徒困境
26、机遇对于有准备的头脑有特别的 亲和力 。 27、自信是人格的核心。
28、目标的坚定是性格中最必要的力 量泉源 之一, 也是成 功的利 器之一 。没有 它,天 才也会 在矛盾 无定的 迷径中 ,徒劳 无功。- -查士 德斐尔 爵士。 29、困难就是机遇。--温斯顿.丘吉 尔。 30、我奋斗,所以我快乐。--格林斯 潘。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生活中,博弈无孔不入、无处不在:
“要想在现代社会做个有价值的人,你就必须对博弈 论有个大致的了解。” —— Paul Samuelson
1994年纳什(Nash)、海萨尼(Harsanyi)、塞尔腾 (Selten)三人,因为他们在非合作博弈论的研究方 面所出了突出贡献,而获得诺贝尔经济学奖。
John Nash
原因的研究》下卷,商务印书馆,1972年版,第25页)
❖ “……在这场合,像在其他许多场合一样,他受着一只看 不见的手的指导,去尽力达到一个并非他本意想要达到的 目的。也并不因为事非出于本意,就对社会有害。他追求 自己的利益,往往使他能比在真正出于本意的情况更有效 地促进社会的利益。” -----《国富论》(Adam Smith, 1776)(摘自:亚当.斯密:《国民财富的性质和原因的研究》上卷,商务
得益矩阵
囚徒B
坦白
不坦白
坦白
囚徒A
不坦白
-5,-5 -8,0
0,-8 -1,-1
此时,如果您是囚徒之一您会怎么办?
我坦白,那家伙肯定靠不住,肯定顶 不住无罪释放的诱惑,会出卖我,到 时候我就成了冤大头,八年的牢狱之 灾啊!况且如果他讲义气的话,我坦 白,我无罪释放,为什么不呢?大不 了两败俱伤,五年也比八年好啊!
❖ “囚徒困境”的例子 虽然简单到用一页 纸就可以写完,但 却对20世纪后半叶 的社会科学产生了 深远的影响。
它是博弈论最经典、
最著名的博弈模型之 一,虽然讲的是一个 法律刑侦或犯罪学方 面的问题,但可以扩 展到许多经济问题, 以及各种社会问题, 可以揭示市场经济的 根本缺陷。
基本模型( Prisoners’ Dilemma )
响力反对该项法律的实施呢??为什么??
香烟广告策略中的“囚徒困境” 博弈(Cigarette Advertising as a Prisoner’s Dilemma)
Marlbora
广告
不广告
广告
Camel
不广告
30,30 20,50
50,20 40,40
单位:亿美元/年
Байду номын сангаас
“囚徒困境”核心理念
❖博弈全输,合作双赢; ❖怀疑或不信任导致失败
John Harsany
Leihaden Selten
约翰·纳什(JOHN F.NASH)
约翰·纳什(JOHN F.NASH)美国人 (1928- ),由于他与Harsany、Selten 在非合作博弈的均衡分析理论方面做出 了开创性的贡献,对博弈论和经济学产 生了重大影响,而获得1994年诺贝尔经 济学奖。
“囚徒困境”的思考??
“囚徒困境”模型说明一个道理:从个人利 益出发选择的最优策略,从整体看却不一定 是个好的结果,个人利益和集体利益之间存 在冲突。
❖ “各个人都不断地努力为自己所能支配的资本寻找到最有 利的用途。固然,他所考虑的不是社会的利益,而是他自 身的利益,但他对自身的利益的研究自然会或者毋宁说必 然会引导他选定最有利于社会的用途。” -----《国富论》 (Adam Smith,1776)(摘自:亚当.斯密:《国民财富的性质和
《n人博弈的均衡点》(1950) 《非合作博弈》(1951)
《美丽心灵》本片荣获8项奥斯卡提名, 最终夺得第74届奥斯卡最佳影片、最佳 导演、最佳改编剧本和最佳女配角4项大 奖。
囚徒困境 The Prisoners’ Dilemma
模型的提出
1950年由就职于兰德公司的梅里尔·弗勒德(Merrill M. Flood)和梅尔文·德雷希尔(Melvin Dresher)提出, 后由阿尔伯特·塔克(Albert W. Tucker)以囚徒方式阐述, 并命名为“囚徒困境”。
印书馆,1972年版,第27页)
❖ 这种“自利即公益”的认识,在“囚徒困境”未被经济学界 认识之前,大家都认为这是对的,是真理,而“囚徒困境” 则说明了亚当斯密的思想需要补充,由此引出了相关的一系 列的讨论、发展。它动摇了传统经济学中个人效用最大化行 为必然导致社会福利最优的基本命题。正因为如此,以博弈 论为基石,重构现代经济学理论大厦,已成为一个引人注目 的重要研究领域。
这小子,为人我清楚,八 成顶不住,我不坦白就惨
了!
囚徒B
坦白
不坦白
坦白
囚徒A
不坦白
-5,-5 -8,0
0,-8 -1,-1
囚徒A的选择: 若B选坦白, 则A选坦白; 若B选不坦白, 则A选坦白;
囚徒B的选择: 若A选坦白, 则B选坦白; 若A选不坦白, 则B选坦白;
(坦白,坦白)是囚徒困 境模型的必然均衡结果。但 并不是最优的策略选择,最 优应为(不坦白,不坦白)。
❖ “囚徒困境” 博弈对亚当·斯密的完全自由竞争市场能够实现 社会利益最大化的理论,提出了挑战,政府宏观调控这只“看 得见的手”呼之欲出。
案例:美国的烟草广告
1971年美国政府禁止在广播、电视上作香烟 的广告,烟厂不得不停止在这两个媒体上的 广告竞争。

思考题:

烟草公司是否会利用他们在政治上的影
❖ 在一次严重纵火案发生后,警察抓到两名嫌疑人。事实 上正是他们为了报复而一起放火的,但警察没有掌握足 够的证据。于是,将他们隔离审问,两个人都明白警方 的政策:
如果两人都坦白,入狱5年;
如果两人都不坦白,由于证据不充分,他们只会被认定 为妨碍公务罪而入狱1年;
如果一人抵赖,而另一人坦白,则抵赖者入狱8年,坦白 者无罪释放。
相关文档
最新文档