囚徒困境专题优秀PPT

合集下载

囚徒困境课件PPT课件

囚徒困境课件PPT课件
12
第12页/共25页
囚徒困境的启示
“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各 人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利 的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服 长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以 得到最短时间的监禁的结果。
21
第21页/共25页
经济如局 人生如棋 博弈之道 生活之常 运用之妙 存乎一心
22
第22页/共25页
结束语:学点博弈论 心灵更美丽
博弈——无处不在的策略游戏; 博弈——大千世界的生存法则; 博弈——竞争社会的现代意识。
23
第23页/共25页
24
第24页/共25页
感谢您的欣赏!
25
第25页/共25页
生活中,博弈无孔不入、无处不在。
1
第1页/共25页
博弈无处不在
2
第2页/共25页
3
第3页/共25页
选择
两条路在树林里分叉, 而我选择人迹罕至的那一条, 从此一切变了样。
4
第4页/共25页
坦白? 抵赖?
5
第5页/共25页
囚徒困境
检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。 如果你单独坦白偷盗的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被 同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们 都要被判5年刑。”
19
第19页/共25页
如何走出囚徒困境
长期关系和重复博弈
• 建立长期关系,使得囚徒困境可以多次重复,如果这个“多次”足够长,那 么人们就有可能为了长远的将来利益而牺牲眼前,合作也是可以达成的

清华大学博弈论讲义ppt课件

清华大学博弈论讲义ppt课件
完美信息perfect information:指一个参与 人对其他参与人的行动选择有准确的理 解,即每个信息集只包含一个值。
清华诚志
10
共同知识common knowledge
所有参与人知道每一步的信息集。
清华诚志
11
战略strategies
参与人在给定信息集的情况下的行动规 则,它规定参与人在什么时候选择什么 行动。
perative 合作博弈强调的是集体主义,团体理性
Ration
清华诚志
16
非合作博弈
而非合作博弈则主要研究人们在利益相 互影响的局势中如何选择策略使得自己 的收益最大,强调个人理性、个人最优 决策,其结果是有时有效率,有时则不 然。目前经济学家谈到博弈论主要指的 是非合作博弈,也就是各方在给定的约 束条件下如何追求各自利益最大化,最 后达到力量均衡。
清华诚志
1
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的 意义。个人理性与集体理性的冲突,各 人追求利己行为而导致的最终结局是一 个“纳什均衡”,也是对所有人都不利 的结局。他们两人都是在坦白与抵赖策 略上首先想到自己,这样他们必然要服 长的刑期。只有当他们都首先替对方着 想时,或者相互合谋(串供)时,才可以得 到最短时间的监禁的结果。
的均衡有直接的影响。
清华诚志
19
分类
博弈的划分可以从参与人行动的次序和 参与人对其它参与人的特征、战略空间 和支付的知识、信息,是否了解两个角 度进行。把两个角度结合就得到了4种 博弈:完全信息静态博弈,完全信息动 态博弈,不完全信息静态博弈,不完全 信息动态博弈
清华诚志
20
博弈的分类及对应的均衡
为了分析方便,自然nature被当作虚拟参 与人。

博弈论的经典案例ppt课件

博弈论的经典案例ppt课件

ppt课件.
2
囚徒困境
参与人——小偷 参与人策略集——{坦白,抵赖} 参与人的支付——判刑年限
ppt课件.
3
囚徒困境
坦白 A
抵赖
B
坦白
抵赖
-8,-8 0,-10
-10, 0 -1,-1
ppt课件.
4
囚徒困境
解决问题的思路: 给定对方的选择,寻找自己的最优战略。
每位参与者要选择的战略必须是针对其 它参与者选择战略的最优反应。
博弈结果——(2,1)和(1,2)。
ppt课件.
19
4 斗鸡博弈
设想两个勇士举着火棍从独木桥两端冲向 中央进行火拼。
万丈深渊
ppt课件.
20
斗鸡博弈
每个人都有两种选择——前进或后 退。
两人都前进,则两败俱伤; 一人进另一人退,则进者胜,退则 丢面子; 两人都退,都丢面子。
ppt课件.
21
斗鸡博弈
B

退
进 -3,-3 2, 0
A 退
0, 2 0, 0
ppt课件.
22
斗鸡博弈
斗鸡博弈存在两个Nash均衡——(进, 退)和(退,进)。
博弈结果——(2,0)和(0,2)。
ppt课件.
23
斗鸡博弈
斗鸡博弈实例:
1.公共产品提供; 2.美苏争霸; 3.警察与游行队伍; 4.夫妻吵架; 5. 古巴导弹危机。
ppt课件.
27
猜硬币
正 A

B


-1,1
1,-1
1,-1 -1,1
ppt课件.
28
猜硬币
不存在前面所讨论的Nash均衡。

囚徒困境的根源与启示PPT教案

囚徒困境的根源与启示PPT教案

从这个意义上说,“纳什均衡” 提出的悖论实际上动摇了西方 经济学的基石。因此,从“纳 什均衡”中我们还可以悟出一 条真理:合作是有利的“利己 策略”。但它必须符合以下黄 金定律:按照你愿意别人对你 的方式来对别人,但只有他们 也按同样方式行 第7页/共27页 事才行。也就 是中国人说的“己所不欲勿施
…… 第21页/共27页
如何走出囚徒困境
报复与惩罚(株连制) “人质”方案
长期关系和重复博弈
第22页/共27页
判断分析题
➢ 1.单人博弈就是个人最优 化决策,
•正确。因为单人博弈只有一个博弈
方与,因典此型不的可能博存弈在问博弈题方有之本间行质为 和区利益别的。交互作用和制约,因此实际
上就是个人最优化决策,与存在博弈 方之间行为和利益交互作用和制约的 典型博弈问题有本质的区别。
➢ 所以,要破解囚徒困境,就 要跳出这个模型本身,从更
第10页/共27页
高的层面上给以制度性的约
囚徒困境的实际运用
举例来是说,我是供应商,你 是大超市,你可以选择拖欠货款, 我也可以选择延迟发货或较低的 质量,套用上面的模型:
超市
不合作 合

不合作 -5 -
5
2 -8第11页/共27页
供应商
囚徒困境的实际运用
第3页/共27页
囚徒困境的内在根源
➢ 在个体之间存在行为和利益 相互制约的博弈结构中,以 个体理性和个体选择为基础 的分散决策方式,无法有效 地协调各方面的利益,并实 现整体、个体利益共同的最 优。简单地说,“囚徒的困
第4页/共27页
境”问题都是个体理性和集
囚徒困境的启示
“囚徒的两难选择”有着广泛 而深刻的意义。个人理性与集 体理性的冲突,各人追求利己 行为而导致的最终结局是一个 “纳什均衡”,也是对所有人 都不利的结局。他们两人都是 在坦白与抵赖策略上首先想到 自己,这样他们必然要服长的 刑期。只有当他 第5页/共27页 们都首先替对 方着想时,或者相互合谋(串供)

S-囚徒困境与社会的基本问题PPT课件

S-囚徒困境与社会的基本问题PPT课件

2021/7/22
14
(二)奥尔森的“集体行动的逻辑”
✓ 由具有自利倾向的理性“经济人 ”组成的集体中,因“搭便车” 行为而难以实现合作:人人都想 分享集体行动的成果,但不愿分 担集体行动的成本。集体越大, 越难克服“搭便车”行为。
2021/7/22
15
(二)奥尔森的“集体行动的逻辑”
✓ “除非一个集团中人数很少, 或者除非存在强制或其他某些 特殊手段以使个人按照他们的 共同利益行事,有理性的,寻 求自我利益的个人不会采取行 动以实现他们共同的集团的利 益。”(Olson,1980)
• 1. 过程
D(背叛) T=5,S=0 P=1,P=1
✓ 14个策略程序+1个随机程序(随机选择“合作”或“背叛 ”);
✓ 225场比赛,每个比赛200回合;
✓ 最大收益:15场×200回合×5分=15000分((D,C) 或(C,D));
✓ 最小收益:15场×200回合×0分=0分((D,C)或(C ,D));
能实现团体的最大利益,同时也揭示了个体
理性本身的内在矛盾——从个体利益出发的
行为最终也不一定能真正实现个体的最大利
益,甚至会得到相当差的结果。
2021/7/22
7
二、社会的基本问题
2021/7/22
• 人类社会与其他动物群体的一个重要区别是, 人与人之间可以通过运用个人理性而达致某种 形式的合作。合作能产生“合作剩余”。
✓ “一报还一报”策略的平均分为504.5,即600基准分的
84%,其他8个好的策略中,得基准分的28.4%和83.4%
2021之/7/2间2 。
21
(二)第一届竞赛
• 3. 结论
策略j

囚徒困境PPTPPT课件

囚徒困境PPTPPT课件
创新与变革
面对囚徒困境,我们需要勇于创新和变革,打破固有的思维模式和制度限制,寻找更好的解决方案。这有助于推动社会的进步和发展。
对未来发展的影响
THANKS FOR
WATCHING
感谢您的观看
社会制度应该鼓励和促进合作,减少囚徒困境的发生。例如,可以通过制定合理的法律法规、加强监管等手段,来引导个体在面对类似情境时做出更有利于社会的选择。
公平与效率
制度设计与监管
对社会制度的思考
全球化与合作
随着全球化的发展,各国之间的相互依存度越来越高,囚徒困境的启示有助于推动国际间的合作与交流,共同应对全球性的挑战。
囚徒困境
囚徒困境简介 囚徒困境的基本模型 囚徒困境的解决方案 囚徒困境的实际案例 囚徒困境的启示与思考
contents
目 录
01
囚徒困境简介
囚徒困境是一种博弈论模型,描述了两个犯罪嫌疑人被捕后,在不能互相沟通的情况下,各自选择最优策略时所面临的困境。
定义
囚徒困境源于现实生活中的囚犯困境问题,即两个同谋的囚犯在接受审判时,如果他们都保持沉默,则可能获得较轻的判决;但如果他们互相背叛,则可能获得较重的判决。
合作
在囚徒困境中,参与者可以通过选择合作的方式,共同达成更好的结果。合作可以避免被对方背叛的风险,同时也有助于建立长期的关系和互信。
长期视角
参与者应该从长远的角度考虑问题,认识到合作带来的长期利益,而不仅仅关注眼前的短期利益。通过建立长期关系和互信,可以降低囚徒困境中的风险和不确定性。
合作策略
有效沟通
沟通与信任
引入第三方监管机制,可以对囚徒困境中的参与者进行监督和约束,防止他们采取不合作或背叛的行为。监管机制可以提供公正的裁决和惩罚,维护游戏的公平性和规则的执行。

囚徒困境1课件

囚徒困境1课件

囚徒困境
A B
不坦白
坦白
不坦白
坦白
A:判刑1年 B:判刑1年
A:判刑8年 B:无罪释放
A:无罪释放 B:判刑8年
A:判刑5年 B:判刑5年
请问,他们会选择什么呢? 坦白or 不坦白
从上面的表中我们可以知道:每个嫌疑人都有两种可供 选择的策略:
坦白不坦白。
如果A选择抵赖,那么就可能会出现两种情况,如 果B选择坦白,那么A将被加重惩罚,判刑8年,而B则 无罪释放;如果B也同样选择抵赖,那么他们将判刑1年。
2.1.3 划线法 ——求纳什均衡
1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
囚 徒
-5, -5
不动的情况下,没有人有兴趣动
这个故事最早是1950年,数学家塔克任斯坦福大 学客座教授给心理学家作讲演时提出的。时至今 日,这个故事广为流传,在哲学、伦理学、政治 学、经济学等学科中获得了极为广泛的应用。
rtgrQ
囚徒困境的应用
在荷兰召开了一次“合作及社会两难困境研讨会”,
与会者都是博弈论的专家。当大会结束后,有两个学者, 麦息克和路特提议大家玩一个游戏。
他们将一个大信封拿出来,请在场的43位学者专家拿 出金钱装到这个信封里。如果到最后这个信封里的钱超过 250元,麦息克和路特将自己掏腰包,退还每人10元。不 过,如果信封内的钱不足250元,就统统没收,大家拿不 到半毛钱。
请问,你会出多少钱呢?
每个人应该要放入的数目:250/43=5.81。
如果每人放进去7元钱,应该就可以超过目标250 元了。等到最后退还10元钱时其它组织,面对一定的环 境条件、在一定的规则下,同时或先后,一次或多次,从 各自允许选择的行为或策略中进行选择并加以实施,各自 取得相应结果的过程。

囚徒困境.完美版PPT

囚徒困境.完美版PPT

1.1.2 博弈的非技术性定义
博弈——就是一些个人、对组或其它组织,面对一定的环 境条件、在一定的规则下,同时或先后,一次或多次,从 各自允许选择的行为或策略中进行选择并加以实施,各自 取得相应结果的过程。
1.1.2 博弈的非技术性定义
博弈论就是系统研究可以用上述方法定义的各种博弈 问题,寻求在各博弈方具有充分或者有限理性能力的 条件下,合理的策略选择和合理策略选择时博弈的结 果,并分析这些结果的经济意义、效率意义的理论和 方法。
博弈就是决策行为
“石头-剪子-布” 游戏
游戏特点
有一定的规则,规定游戏的参加者,游戏者可以做什么,不 可以做什么。
都有结果,如一方赢、一方输、平局等
策略至关重要,每一个 游戏者所得结果的好坏, 不仅取决于自身的策略 选择,也取决于其他参 加者的策略选择。
游戏特点
在游戏中,也规定了游戏参加者出招的顺序,是同时做出选 择还是先后做出选择等。
每个人从自己收益 最大化出发来考虑 问题,最终往往落 得两败俱伤的结果。 个人的理性算计, 往往导致集体的非 理性结局。
(坦白,坦白)是囚徒困境的纳什均衡。 纳什均衡是什么呢?
假设有n人参与博弈,每个人选择自己的最 优战略,所有参与人选择的战略构成一个战 略组合。
纳什均衡是这样一个战略组合,这种战略 组合由所有参与人的最优战略组成,也就
他们面临的选择和带来的后果组合,可以用下面的表格来表示。
A B
不坦白
坦白
不坦白
坦白
A:判刑1年 B:判刑1年
A:判刑8年 B:无罪释放
A:无罪释放 B:判刑8年
A:判刑5年 B:判刑5年
请问,他们会选择什么呢? 坦白or 不坦白
从上面的表中我们可以知道:每个嫌疑人都有两种可供 选择的策略:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

过是一种“囚徒困境”,彩电价格不会
上涨。在高峰会议之后不到二周,国内
彩电价格不是上涨而是一路下跌。这是
因为厂商们都有这样一种心态:无论其
他厂商是否降价,我自己降价是
有利于自己的市场份额扩
大的。
19
例子2 为什么政府要负责修建公共设施,因 为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处 为3。如果两户居民共同出资联合修路,并平 均分摊修路成本,则每户居民获得净的好处 (支付)为3-4/2=1;当只有一户人家单独出 资 修 路 时 , 修 路 的 居 民 获 得 的 支 付 为 3-4=-1 (亏损), “搭便车”不出资但仍然可以使 用修好的路的另一户人家获得支付3-0=3。
当一些商家共谋将价格抬高,消费者 实际上不用着急,因为商家联合维持高 价的垄断行为一般不会持久,可以等待 垄断的自身崩溃,价格就会掉下来。
17
譬如,2000年我国几家生产彩电的
大厂商合谋将彩电价格维持高位,他们搞
了一个“彩电厂家价格自律联盟”,并在
深圳举行了由多家彩电厂商首脑参加的
“彩电厂商自律联盟高峰会议”。当时,
第三讲 囚徒困境专题
1
多种情景,一个思想
五一、商场
2
多种情景,一个思想
美国大选 民主党 共和党 中间策略
3
多种情景,一个思想
渔业 物种灭绝
4
囚徒困境
两个小偷甲和乙联手作案,私入民宅被警方逮住 但未获证据。警方将两人分别置于两间房间分开 审讯,政策是若一人招供但另一人未招,则招者 立即被释放,未招者判入狱10年;若二人都招则 两人各判刑8年;若两人都 不招则未获证据但因私入民宅 各拘留1年。
25
如果其他牧民约束放牧规模,我 单独一家人过度放牧不会破坏广褒的牧 场,但自己却获得了高额的收益。因此, 任何一位牧民的结论都会是:无论其他 牧民是否过度放牧,我选择“约束自己 的放牧规模”都是劣战略,从而被剔除。 大家最终都会选择过度放牧,结果导致 草地消失,生态破坏。
26
类似的例子还有:
囚徒困境的本质
个体理性与集体理性之间存在冲突 不合作劣于合作 合作不具有约束性
10
囚徒困境的破解
不合作
合作
许诺 奖励 惩罚
可信性
11
囚徒困境的破解
囚徒困境的一般表达式
合作
不合作
合作
T,T
S,R
不合作
R,S
P,P
满足:R>T>P>S; (S+R)<T+T
12
囚徒困境的破解
国家法律 梁启超:我国成文法之起源不可确指,
如果你选择生产A,则老师奖励你2元,选择B,则 老师奖励你2.15元。
选择A产品可以产生1元总收益,选择B产品不能 产生总收益,最后老师计算出所有选择A产品同学的人 数,将所得到的总收益平分给所有同学。
8
囚徒困境?
条件: 囚徒甲和乙都是完全清白的、绝对具有理性的良 好市民。
均衡: (坦白,坦白)
9
20
修 甲
不修
修路博弈
乙 修
不修
1,1
-1,3
3,-1
0,0
21
我们看到,对甲和乙两家居民来说, “修路”都是劣战略,因而他们都不会 出资修路。
22
这就是我们看到的为什么大多数 路、桥等公共设施都是由政府出资修建 的原因。
同样的道理,国防、教育、社会 保障,环境卫生等都由政府承担资金投 入,私人一般没有积极性承担这方面服 务的积极性和能力。
5
表1 囚徒困境博弈


不招
招 甲
不招
-8,-8 -10,0
0,-10 -1,-1
(问题1:甲、乙如何选择?)
6
囚徒困境?
条件: 允许囚徒甲和乙在审讯室单独呆上10分钟,然后 再决定是否坦白。
目的: 建立攻守同盟,克服自利心理。
均衡: (坦白,坦白)
ห้องสมุดไป่ตู้
恋爱、低碳、核
7
实验:信息沟通?
假设每一个学生都拥有一家企业,选择生产产品 A还是B,A代表高质量产品,B代表低质量产品。
渤海中的鱼愈来愈少了,工业化中的大 气及河流污染,森林植被的破坏等。解决公共 资源过度利用的出路是政府制订相应的规制政 策加强管理,如我国政府规定海洋捕鱼中,每 年有一段时间的“休渔期”,此时禁止捕鱼, 让小鱼苗安安静静地生长,大鱼好好地产卵, 并对鱼网的网眼大小作出规定,禁用过小网眼 的捕网打鱼,保护幼鱼的生存。又如在三峡库 区,为了保护库区水体环境,关闭了前些年泛 滥成灾的许多小造纸厂等。
然以数千年之思想往往视法律与命令为 一物 国家法律措施是无效率还是高效率?
13
用法律解决“囚徒困境”
合作
不合作
合作 不合作
T,T
S,R-X
R-X,S P,P
满足:X>R-T
14
公共产品(public goods)
提供
不提供
提供 不提供
4,4 5,-1
-1,5 0,0
无论对方如何选择,每个人的最优选择:不提供。 所以,我们可以预测,结果将是(不提供,不提供)
国家有关部门还未出台相关的反垄断法律,
对于这种在发达国家明显属于违法行为的
所谓“自律联盟”,国家在法律上暂时还
是无能为力的。寡头厂商在光天化日之下
进行价格合谋,并且还通过媒体大肆炒作,
这在发达国家是不可思议的。
18
但是,尽管政府当时无力制止这种
事情,公众也不必担心彩电价格会上涨。
这是因为,“彩电厂商自律联盟”只不
15
公共产品与税收制度
比较私人产品与公共产品的不同:使用 上排他性;
私人产品是志愿购买的,但公共产品可 能需要强制购买;
税收制度就是保证公共产品的生产,解 决公共产品生产上的“囚徒困境”
16
生活中的“囚徒困境”例子
例子1 商家价格战
出售同类产品的商家之间本来可以通 过共同将价格维持在高位而获利,但实 际上却是相互杀价,结果都赚不到钱。
24
由于草地的产权没有界定,政府 也没有对放牧作出规模限制,每家牧民 都会如此盘算:如果其他牧民不约束自 己的放牧规模,让自己的牛羊过多地到 草地上吃草,那么,我自己一家约束自 己的放牧规模规模对保护草场的贡献是 微乎其微的,不会使草场免于破坏;相 反,我也加入过度放牧的行列,至少在 草场消失之前还会获得一部分短期的收 益。
23
例子3 苏格兰的草地为什么消失了?公共资 源经常被过度利用的原因。
在18世纪以前,英国苏格兰地区 有大量的草地,其产权没有界定,属公 共资源,大家都可以自由地在那里放牧。 草地属于“可再生资源”,如果限制放 牧的数量,没有被牛羊吃掉的剩余草皮 还会重新长出大面积草场,但如果不限 制放牧规模,过多的牛羊将草吃得一光 二净,则今后不会再有新草生长出来, 草场就会消失。
相关文档
最新文档