北京大学博弈论课件第1章_博弈论概述
合集下载
博弈论PPT课件

有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
博弈论完整版PPT课件

R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
《博弈论》课程ppt课件

10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼பைடு நூலகம்设防 成功,失败
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。
博弈论最全完整ppt-讲解

能提供万无一失的应对办法。
例1:无谓竞争(The GPA Rat Race)
你所注册的一门课程按照比例来给分:无论 卷面分数是多少,只有40%的人能够得优秀, 40%的人能得良好。
所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
问题是,大家都这么做。这样一来,所有人 的成绩都不比大家遵守协议来得高。而且, 大家还付出了更多的功夫。
约翰·纳什 1928年生于美国
莱因哈 德·泽尔 腾, 1930 年生于 德国
约翰· 海萨尼 1920年 生于美 国
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由:前者在信息经济学理论领域做 出了重大贡献,尤其是不对称信息条件 下的经济激励理论的论述;后者在信息 经济学、激励理论、博弈论等方面都做 出了重大贡献。
博弈论为众多学科提供了分析的概念和方 法:经济学和商学,政治科学,生物学, 心 理学和哲学。
如何在“博弈”中获胜?
日常生活中的博弈(“游戏”)往往指的是 诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。 策略是为了获胜所需要的一种智力的技巧。
没有某个这样的暗示,默契的合作就完 全不可能。
例3:为什么教授如此苛刻?
许多教授强硬地规定,不进行补考,不 允许迟交作业或论文。
教授们为何如此苛刻? 如果允许某种迟交,而且教授又不能辨
别真伪,那么学生就总是会迟交。 期限本身就毫无意义了。 避免这一“滑梯”通常只有一种办法,
例1:无谓竞争(The GPA Rat Race)
你所注册的一门课程按照比例来给分:无论 卷面分数是多少,只有40%的人能够得优秀, 40%的人能得良好。
所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
问题是,大家都这么做。这样一来,所有人 的成绩都不比大家遵守协议来得高。而且, 大家还付出了更多的功夫。
约翰·纳什 1928年生于美国
莱因哈 德·泽尔 腾, 1930 年生于 德国
约翰· 海萨尼 1920年 生于美 国
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由:前者在信息经济学理论领域做 出了重大贡献,尤其是不对称信息条件 下的经济激励理论的论述;后者在信息 经济学、激励理论、博弈论等方面都做 出了重大贡献。
博弈论为众多学科提供了分析的概念和方 法:经济学和商学,政治科学,生物学, 心 理学和哲学。
如何在“博弈”中获胜?
日常生活中的博弈(“游戏”)往往指的是 诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。 策略是为了获胜所需要的一种智力的技巧。
没有某个这样的暗示,默契的合作就完 全不可能。
例3:为什么教授如此苛刻?
许多教授强硬地规定,不进行补考,不 允许迟交作业或论文。
教授们为何如此苛刻? 如果允许某种迟交,而且教授又不能辨
别真伪,那么学生就总是会迟交。 期限本身就毫无意义了。 避免这一“滑梯”通常只有一种办法,
博弈论ppt课件

15
➢ 扩展术语:
信息:信息集; 完全信息(complete); 完美信息(perfect)。
共同知识:双方可能获取的相同信息; 彼此都能算清楚。
博弈结果:均衡策略组合;均衡行动组合。 均衡:所有局中人最优策略的组合。
博弈论2009
精选ppt课件
16
3. 博弈描述
➢博弈的策略型(标准型、正则型)表述:
33
博弈论2009Leabharlann 精选ppt课件34
毕业后先后在兰德研究所、普林斯顿大 学、MIT工作。
1957年他与MIT学生爱莉西娅结婚。
在而立之年患上了妄想型精神分裂症,九 十年代逐渐恢复了正常。
1994年纳什博士获诺贝尔经济学奖。
2002年来北京参加 “国际数学家大会”
博弈论2009
精选ppt课件
35
博弈论2009
则,不开发。(?)
博弈论2009
精选ppt课件
22
关键问题: 对自然状态的概率估计; 不同时间决策(决策顺序); 对对方先验信息的估计(即估计对方对信
息的掌握程度)。
现实困难: 对市场了解程度不同; 对对方了解程度不同; 如何向对方暗示自己的行动。
博弈论2009
精选ppt课件
23
4.博弈练习
➢游戏一:心灵感应 两个人一组,独立写出1至10之间的任
乙 甲
理性的人是自私自利的; 理性选择不是全局最优。
博弈论2009
精选ppt课件
6
➢经济合作:
乙 甲
诚信的价值; 一报还一报策略; 人类生存环境启示。
博弈论2009
精选ppt课件
7
➢长街上的超市 (海滩占位模型)
*********************
博弈论课件

第一章
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
博弈ห้องสมุดไป่ตู้分类
4 Part
课堂互动
假设我脸干净
A脸干净
如果我脸也干净
A
则
C一定知道自己脸脏 但C不知道
B
所以我脸脏
所以B一定知道自己脸脏 但B不知道,说明我的假设不正确 故我脸脏
第一章
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
Static Game Perfect Information
教CO学NT要EN求TS:
NO.1 知 占识优目策标略均衡 NO.2 能 重力复目剔标除占优均衡 NO.3 情 纳感什目均标衡 NO.4 重混点合难策点略均衡
Static Game Perfect Information
通过经典案例分析,掌握重复剔除的占优策略、纳什均 衡与混合策略均衡理论。 培养分析问题、解决问题的能力。 体会博弈论的应用价值,开拓视野,激发学习兴趣。
自测题目
教学大纲
教学课件
相关视频 参考书目
教学课件
Teaching courseware
目录
• 第一章 博弈论概述
006
• 第二章 完全信息静态博弈
041
第一节 占优策略均衡
043
第二节 重复剔除的占优均衡
066
第三节 纳什均衡
088
第四节 混合策略均衡
106
第一章
教学要求
知识目标 掌握博弈论的概念、发展、分类与要素
42
第二章 完全信息静态博弈
1.1 博弈的策略式表述
在博弈论中,一个博弈可以用两种不同的方式来表达: 策略式表达 和 扩展式表达 。策略式表达更适合于静态 博弈,而扩展式表达更适合于讨论动态博弈。
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
博弈ห้องสมุดไป่ตู้分类
4 Part
课堂互动
假设我脸干净
A脸干净
如果我脸也干净
A
则
C一定知道自己脸脏 但C不知道
B
所以我脸脏
所以B一定知道自己脸脏 但B不知道,说明我的假设不正确 故我脸脏
第一章
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
Static Game Perfect Information
教CO学NT要EN求TS:
NO.1 知 占识优目策标略均衡 NO.2 能 重力复目剔标除占优均衡 NO.3 情 纳感什目均标衡 NO.4 重混点合难策点略均衡
Static Game Perfect Information
通过经典案例分析,掌握重复剔除的占优策略、纳什均 衡与混合策略均衡理论。 培养分析问题、解决问题的能力。 体会博弈论的应用价值,开拓视野,激发学习兴趣。
自测题目
教学大纲
教学课件
相关视频 参考书目
教学课件
Teaching courseware
目录
• 第一章 博弈论概述
006
• 第二章 完全信息静态博弈
041
第一节 占优策略均衡
043
第二节 重复剔除的占优均衡
066
第三节 纳什均衡
088
第四节 混合策略均衡
106
第一章
教学要求
知识目标 掌握博弈论的概念、发展、分类与要素
42
第二章 完全信息静态博弈
1.1 博弈的策略式表述
在博弈论中,一个博弈可以用两种不同的方式来表达: 策略式表达 和 扩展式表达 。策略式表达更适合于静态 博弈,而扩展式表达更适合于讨论动态博弈。
精品课程《博弈论》PPT课件(全)

人博弈 两人博弈有多种可能性,博弈方的利益方向可
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
博弈论讲义-概述1

第一章 概述-人生处处皆博弈
注意两点: 注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”
石匠的决策与拳击手的决策的区别
第一章 概述-人生处处皆博弈
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
参与人
ห้องสมุดไป่ตู้
第一章 概述-人生处处皆博弈-基本概念
博弈论的基本概念包括: 参与人:博弈论中选择行动以最大化自己效用的决策主体; 参与人:博弈论中选择行动以最大化自己效用的决策主体; 行动: 行动:参与人的决策变量 战略: 战略:参与人选择行动的规则 信息:参与人在博弈中的知识,特别是有关其他参与人的特征和 行动的知识 支付函数: 支付函数:参与人从博弈中获得的效用水平 结果:博弈分析真正感兴趣的要素的集合 均衡: 均衡:所有参与人的最优战略的组合 参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈 规则决定均衡。
完全信息静态博弈 纳什均衡
第一章 概述-人生处处皆博弈
纳什(1950,1951)
分析:上述博弈属于何种类型的博弈?
囚徒困境 坦白
囚徒 B 囚徒A
抵赖
坦白 抵赖 行动
-8,-8 -10,0
0,-10 -1,-1
支付函数
完全信息静态博弈 纳什均衡
纳什(1950,1951)
第一章 概述-人生处处皆博弈-智猪博弈
第一章 概述-人生处处皆博弈-囚徒困境 亚当斯密在1776年发表的经典之作《原富》中认为: 亚当斯密在1776年发表的经典之作《原富》中认为: 1776年发表的经典之作
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
纳什的代表作
1.多人博弈的均衡(Equilibrium points in n-person games) 国家科学院学报(Proceedings National Academy of Sciences),36: 48 – 49,1950年。 2.非合作博弈(Non-cooperative games),纳什就读于普林斯 顿大学数学系的博士毕业论文,1950年。 3.讨价还价问题(The bargaining problem)。计量经济学杂志 (Econometrica)18: 155 – 162,1950年。 4.非合作博弈(Non-cooperative games)数学年报(Annals of Mathematics),54: 286 – 295,1951年。
第一章
博弈论概述
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
2012-8-28
博弈参与者(Player) 博弈策略(Strategy) 博弈的收益(Payoff) 博弈的均衡(Equilibrium)
一、博弈参与者(Player)
博弈参与者指参与博弈的主体 在“锤头、剪刀、布”博弈中,博弈参与者是玩游戏的两个人 两名同学去相约去博物馆博弈中,博弈参与者是两名同学 在“囚徒困境”博弈中,博弈参与者是两名犯罪嫌疑人
产量博弈模式 价格博弈模式 领先者、跟随者博弈模式
大国之间关于汇率政策的博弈 经典博弈实例:囚徒困境(Prisoner's Dilemma)
囚徒困境
警方逮捕了甲、乙两名犯罪嫌疑人 警方分开审讯两人 根据“坦白从宽、抗拒从严”的原则:
如甲、乙均坦白,则两人将分别被判处 5 年有期徒刑 如甲坦白、乙不坦白,则甲被判 1 年、乙被判 10 年徒刑 如甲不坦白、乙坦白,则甲被判 10 年、乙被判 1 年徒刑 如甲、乙均不坦白,则两人将分别被判处 2 年有期徒刑
1950、1951 年,约翰 · 纳什(John Nash)利用不动点定
理证明了博弈均衡的存在性,为博弈论奠定了坚实的理论基础。 20 世纪 70 年代,约翰 · 海萨尼(John Harsanyi)和莱因
哈德 · 泽尔腾(Reinhard Selten)等将不完全信息理论融入
到博弈论的研究中。
在“囚徒困境”博弈中,博弈参与者得到的收益是
如果甲、乙都坦白,则甲、乙均得到 5 年徒刑 如果甲、乙都不坦白,则甲、乙均得到 2 年徒刑 如果甲坦白、乙不坦白,则甲得到 1 年、乙得到 10 年有期徒刑
如果甲不坦白、乙坦白,则甲得到 10 年、乙得到 1年有期徒刑
四、博弈的均衡(Equilibrium)
参与者 策略集
收益
均衡
本章习题
• 1.试举出两个现实生活中的博弈实例。 • 2.博弈的构成要素有哪些?
2012-8-28
金融
中国古人思想中的“博弈”智慧
《战国策》:田忌赛马 马分为上、中、下三等
我方上等马 vs. 对方中等马 我方中等马 vs. 对方下等马 我方下等马 vs. 对方上等马
三局两胜,田忌胜出 正确运用战略,也是取胜的重要因素之一
第二节:博弈的构成要素
完整的博弈通常包含四个构成要素
甲、乙二人独立决策
对甲而言,不管乙选择坦白还是不坦白,甲的最优策略都是坦白。 对乙而言,不管甲选择坦白还是不坦白,乙的最优策略都是坦白。
结果:甲、乙均选择坦白,分别被判处 5 年有期徒刑 甲、乙如均不坦白,则分别被判处 2 年有期徒刑 个体理性与集体理性的冲突
囚徒困境
分析中
博弈理论丰富了人们认识世界的角度和工具
第一节:博弈的定义和实例
博弈论(Game Theory)又名对策论 博弈理论原本是运筹学的一个重要分支。 目前博弈论已发展为一门备受关注的独立学科。 博弈的定义
“博弈”指当两个或多个决策主体之间存在相互作用,任何一方 的决策策略(Strategy)都不能完全独立于其他各方策略时, 各方的决策过程及均衡问题。
博弈参与者:两个人 博弈过程:
两人在校门口集合,一起逛博物馆
博弈策略和结果
两人都去南门,成功碰面
两人都去北门,成功碰面
同学甲去南门,同学乙去北门,两人错过 同学甲去北门,同学乙去南门,两人错过
博弈双方策略相互依赖,不独立。
其他博弈实例
棋类比赛:象棋、围棋等。古人“对弈”。 寡头市场:
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
完全信息静态博弈(Static Game with Complete
Information)
完全信息动态博弈( Dynamic Game with Complete Information)
不完全信息静态博弈(Static Game with Incomplete
Information)
不完全信息动态博弈( Dynamic Game with Incomplete Information)
博弈的均衡指所有参与者最优策略的组合 两名同学去相约去博物馆博弈中,博弈均衡有两个
两个同学都去学校南门
两个同学都去学校北门
在“囚徒困境”博弈中,博弈均衡有一个
嫌疑人甲和嫌疑人乙都坦白
第三节:博弈论的发展历史和分类
博弈的思想古已有之 《孙子兵法》、《三国演义》等中国古典名著都蕴含着丰 富的博弈智慧 当代博弈理论的研究源于西方 一、博弈理论的发展历史
纳什对非合作博弈均衡进行了独到精辟的阐述 对合作博弈的博弈过程及策略选择进行了系统的归纳和证明
纳什的思想对日后博弈理论的发展影响深远
以纳什的名字命名的“纳什均衡”
尽管不得不时常与医院、药物和孤独为伴,但纳什仍然一如
既往的进行着他所痴迷的研究工作。 1994 年,因为在博弈理论方面的突出贡献,纳什获得了 当年度的诺贝尔经济学奖
20 世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯 · 诺依 曼(Von Neumann)开始研究博弈的数学表达方式
一、博弈理论的发展历史(续)
1944 年,冯 · 诺依曼( Von Neumann)和经济学家奥斯
卡· 摩根斯坦(Oskar Morgenstern)合作发表了《博弈理 论与经济行为》一书,使博弈的理论和思想进入经济学领域。
5.两人合作博弈(Two-person cooperative games)。计量经
济学杂志(Econometrica),21: 128 – 140,1951年。
本章小结
本章给出了博弈的基本定义 通过现实实例分析了博弈的基本内涵和主要思想 “囚徒困境”是博弈理论中的经典案例 博弈的构成要素主要包括:
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
2012-8-28
POWERPOINT TEMPLATE 金融
引言
博弈的思想古已有之
博弈理论是当代经济学不可或缺的重要组成部分
博弈思想及理论已被广泛应用于对各类经济和社会现象的
博弈实例1:锤头、剪刀、布
博弈参与者:两名同学 博弈过程:
两人在“锤子、剪刀、布”三种策略中选择一种。 如果两人的策略一样,则平局。 出“锤子”一方胜过出“剪刀”一方。 出“剪刀”一方胜过出“布”一方 出“布”一方胜过出“锤子”一方
博弈双方策略相互依赖,不独立。
博弈实例2:聚会
博弈论大师——约翰 · 纳什简介
约翰 · 纳什(John Nash)1928 年 6 月出生于美国一 个中产阶级家庭 纳什自幼便显露出过人的数学天赋 1948 年,纳什在普林斯顿大学攻读博士学位 1950 年至 1953 年,纳什撰写了多篇在博弈论研究领域 颇具开创性和奠基性的论文。 纳什的论文对合作博弈和非合作博弈进行了明确定义和区分
20 世纪 90 年代之后,博弈论作为一种方法被普遍运用到经济
学、政治学、生物学、军事学、统计学等领域中。
博弈理论已成为当代经济学理论不可分割的重要组成部分。
二、博弈的分类
根据博弈参与者能否达成相互合作的和约束性协议
合作博弈(Cooperative Games) 非合作博弈(Non-Cooperative Games)
略均为“去学校南门集合”或“去学校北门集合”
在“囚徒困境”博弈中,博弈参与者所能采取的博弈策略均为 “坦白”或“不坦白”
三、博弈的收益(Payoff)
博弈收益指不同博弈策略给博弈参与者带来的利益
在“锤头、剪刀、布”博弈中,博弈参与者得到的收益是:赢、平局、
输三种可能的结果。
两名同学去相约去博物馆博弈中,博弈参与者得到的收益是:能够相 遇、不能够相遇两种可能的结果。