博弈论的几个经典模型PPT课件

合集下载

博弈论的几个经典模型ppt课件

博弈论的几个经典模型ppt课件

博弈论的几个经典模型
22
模型二、囚徒困境/非合作博弈
该博弈刻划了两大难题: • 冲突情形下,参与人的目标是什么?是采用(作 为个人 ) 他自己的最好策略,还是采用 ( 作为集 体的一员)他们共同的最好策略?前者导致均衡 策略 ( 坦白,坦白 ) ,支付为 (-8 , -8) ;后者的最 好策略是 ( 抵赖,抵赖 ) ,支付为 (-1 , -1) 。这里 反映了个体理性行为与集体理性行为之间的矛 盾、冲突。 • 此博弈只进行一次还是重复进行?如果博弈只 进行一次,参与人似乎只有坦白才是最好的策 略,因为没有理由相信对手会对你有信心,他 总认为你自己会坦白;因此,双方都采取坦白 策略。然而,若博弈进行多次,则结论将会发 生变化。
第四章 博弈论的几个经典模型
1
引言
博弈论又被称为对策论(Game Theory), 按照2005年因对博弈论的贡献而获得诺贝尔经 济学奖的Robert Aumann教授的说法,博弈论 就是研究互动决策的理论。所谓互动决策, 即各行动方(即局中人[player])的决策是相互 影响的,每个人在决策的时候必须将他人的 决策纳入自己的决策考虑之中,当然也需要 把别人对于自己的考虑也要纳入考虑之 中……在如此迭代考虑情形进行决策,选择 最有利于自己的战略(strategy)。
此外此外还与会计学还与会计学统计学统计学数学基础数学基础社会心理学社会心理学以及诸如认识论与伦理学等哲学分支有重要联以及诸如认识论与伦理学等哲学分支有重要联博弈论的几个经典模型按照按照aumannaumann所撰写的所撰写的新帕尔格雷夫经新帕尔格雷夫经济学大辞典济学大辞典博弈论博弈论辞条的看法辞条的看法标准的标准的博弈论分析出发点是理性的博弈论分析出发点是理性的而不是心理的而不是心理的或社会的角度或社会的角度

《博弈论》课程ppt课件

《博弈论》课程ppt课件

10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼பைடு நூலகம்设防 成功,失败
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。

《博弈论的经典案例》课件

《博弈论的经典案例》课件
• 原理:囚徒之间的合作或背叛关系直接影响他们的判罚。 • 应用:虚拟囚徒困境可以帮助解释社会合作的动机和策略。
报童问题
报童问题是博弈论中的一个常见案例,涉及一个报童需要决定采购报纸的数量。 • 原理:报童必须在满足需求和最小化成本之间做出权衡。 • 应用:报童问题可应用于库存管理、供应链优化和市场需求预测。
博弈论提供了计算机科学领域中优化、决策 和人工智能算法的基础。
政治学
博弈论研究了政治家、政党和国家之间的互 动关系,探讨了选择、协商和合作的策略。
生物学
博弈论用于研究动物行为、进化和生态系统 中的竞争和合作策略。
虚拟囚徒困境
虚拟囚徒困境是博弈论的一个经典案例之一。它描述了两一个有趣而重要的领域,它研究人与人之间的互动以及决策制定的 艺术。
《博弈论的经典案例》PPT课 件
博弈论是一个研究人们在决策过程中如何选择的分支学科。
什么是博弈论
博弈论是通过数学模型和分析来研究人们在决策过程中如何选择的学科。它从战略的角度提供了准确的 分析和预测。
博弈论的应用
经济学
博弈论在经济学中被广泛应用,帮助解释市 场行为、竞争策略和合作行为等现象。
计算机科学
拍卖
拍卖是博弈论的一个重要领域,涉及多个竞标者在有限资源上的竞争。 • 原理:拍卖涉及竞标策略、价格设定和资源配置等问题。 • 应用:拍卖可见于艺术品、土地和网络广告等领域。
集体行动难题
集体行动难题是博弈论中探讨社会合作和公共利益的案例。 • 原理:集体行动需要协调个体的利益,以达到共同的目标。 • 应用:集体行动问题可应用于环境保护、公共资源管理和社会合作。

博弈论最全完整ppt-讲解

博弈论最全完整ppt-讲解
能提供万无一失的应对办法。
例1:无谓竞争(The GPA Rat Race)
你所注册的一门课程按照比例来给分:无论 卷面分数是多少,只有40%的人能够得优秀, 40%的人能得良好。
所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
问题是,大家都这么做。这样一来,所有人 的成绩都不比大家遵守协议来得高。而且, 大家还付出了更多的功夫。
约翰·纳什 1928年生于美国
莱因哈 德·泽尔 腾, 1930 年生于 德国
约翰· 海萨尼 1920年 生于美 国
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由:前者在信息经济学理论领域做 出了重大贡献,尤其是不对称信息条件 下的经济激励理论的论述;后者在信息 经济学、激励理论、博弈论等方面都做 出了重大贡献。
博弈论为众多学科提供了分析的概念和方 法:经济学和商学,政治科学,生物学, 心 理学和哲学。
如何在“博弈”中获胜?
日常生活中的博弈(“游戏”)往往指的是 诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。 策略是为了获胜所需要的一种智力的技巧。
没有某个这样的暗示,默契的合作就完 全不可能。
例3:为什么教授如此苛刻?
许多教授强硬地规定,不进行补考,不 允许迟交作业或论文。
教授们为何如此苛刻? 如果允许某种迟交,而且教授又不能辨
别真伪,那么学生就总是会迟交。 期限本身就毫无意义了。 避免这一“滑梯”通常只有一种办法,

博弈论与数学模型(课堂PPT)

博弈论与数学模型(课堂PPT)

.
46
三方竞争
.
47
选举
候选人政纲和选民主张均可抽象为一实 数。选举时选民投票给政纲距本人主张 最接近的候选人。获得最多选民支持的 候选人当选。
实行两党制的国家在竞选时两党的政纲 区别不大,旨在争取中间选民。实行多 党制的国家政党分分合合,政府更迭频 繁。
.
48
竞争上岗
每位选民都可以自荐为候选人,其政纲即为本 人主张。
.
6
美苏冷战
参与者:美国,苏联 行动集
美国:强硬、妥协 苏联:强硬、妥协 局势 美国强硬、苏联强硬 美国强硬、苏联妥协 美国妥协、苏联强硬 美国妥协、苏联妥协
两败俱伤、同归于尽 美国得益、苏联受损 苏联得益、美国受损 互不侵犯、和平共处
.
7
美苏冷战
收益:由于实际情况的复杂性,参与者的收益 很
极大极小原则
.
16
鞍点
.
17
矩阵博弈
.
18
纯策略和混合策略
若参与者每次行动都选择某个确定的策 略,我们称之为纯策略(pure strategy)。
若参与者行动时可以以一定的概率分布 选择若干个不同的策略,这样的策略称 为混合策略(mixed strategy)。
• 在混合策略意义下,参与者的收益实质 上表现为期望。
1960年,Lemke和Howson给出了求解双矩 阵博弈解的算法,但该算法是指数时间的。
.
24
John Forbes Nash
.
25
Nash 均衡
完全信息静态博弈的某个局势称为Nash 均衡(Nash equilibrium),若每一个 理性的参与者都不会单独偏离它。即在 其他参与者的策略不变情况下,单独采 取其他策略,收益不会增加。

博弈论完整版PPT课件

博弈论完整版PPT课件

ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战

第四篇博弈论PPT课件

第四篇博弈论PPT课件
• 此情况下由于博弈没有可预测的明确的博弈结果,所以就不能 确定博弈方的策略。但是是否在这样的博弈中,各博弈方选择 任何策略都是一样的,因此可以随意选择吗?
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) (严格竞争博 弈)
(麻将、赌博、猜硬币)
• 常和博弈 (Constant-sum Games)
博弈)
(固定数量利润、财产分配的讨价还价
• 变和博弈 (Variable-sum Games) (囚徒 困境博弈、古诺模型)
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果: -5)
(坦白,坦白)——(-5,
• 集体理性决策的结果: -1)
(抵赖,抵赖)——(-1,
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型:价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈

硬 正面 币 反面 方
猜硬币方
正面
反面
-1,1
• 博弈论是系统研究各种博弈问题,寻求博弈方合理的策略选择 和合理选择策略时的博弈结果,并分析结果的经济、效率意义 的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型(Cournot) (1838)(两寡头通过 产量决策进行竞争的模型;
• 伯特兰德模型(Bertrand) (1883)(价格竞争) • 《博弈论与经济行为》(1944)
六、博弈的表示方法
• 标准型 (normal form ) 收益矩阵
对简单的博弈适用(二人有限博弈)
• 扩展型 (extensive form )
博弈树
适用于动态博弈
• 特征式

博弈论的几个经典模型

博弈论的几个经典模型

模型二、囚徒困境/非合作博 弈
囚徒困境可以用来说明许多现象。
寡头定价 拍卖出价 推销员的努力 政治上的讨价还价 军备竞赛等(冲突中出现两败俱伤的情况,
往往要考虑到囚徒困境)
*(纯策略)纳什均衡
问题与思考
• 什么是博弈论?试举两个你生活中的例子说明。
• 某年在荷兰召开了一次“合作及社会两难困境研讨 会”,与会者都是博弈论的专家。
基本术语
• 博弈涉及哪些内容呢?
博弈涉及至少两个独立的博弈参与者 (player)。
博弈涉及行动者存在着策略(strategy)选 择的可能,博弈论用策略空间来表示参与 者可以选择的策略。
参与者在不同策略组合下会得到一定的支 付(payoff)。
对于博弈参与者来说,存在着一博弈结果。
对于游戏设计者,这是一个最好的
模型二、囚徒困境/非合作博 弈
在博弈论中,含有占优战略均衡的 一个著名例子是由塔克给出的“囚徒困 境” (prisoners’dilemma)博弈模 型。该模型用一种特别的方式为我们讲 述了一个警察与小偷的故事。
模型二、囚徒困境/非合作博 假设:有两个小偷A弈和B联合犯事、私入
第四章 博弈论的几个经典模 型
讲授人 谭建国
引言
博 弈 论 又 被 称 为 对 策 论 ( Game Theory),按照2005年因对博弈论的贡献 而获得诺贝尔经济学奖的Robert Aumann 教授的说法,博弈论就是研究互动决策 的理论。所谓互动决策,即各行动方 (即局中人[player])的决策是相互影响 的,每个人在决策的时候必须将他人的 决策纳入自己的决策考虑之中,当然也 需要把别人对于自己的考虑也要纳入考 虑之中……在如此迭代考虑情形进行决
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
• 海萨尼转换的具体方法
一个虚拟的参与人“自然”,自然首先决定参
与人的类型,赋予各参与人的类型向量 t,其
中t (t1, t2 , , tn ) ; 自然告知参与者自己的类型,却不告诉其他参
与者的类型;
参与者同时选择行动,每一参与者i 从可行集 Ai中
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
• 什么是海萨尼转换? 海萨尼提出了一种处理不完全信息博弈的方 法,即引入一个虚拟的局中人——“自然”。 自然首先行动,它决定每个局中人的特征。 每个局中人知道自己的特征,但不知道别的 局中人特征。这种方法将不完全信息静态博 弈变成一个两阶段动态博弈,第一个阶段是 自然N的行动选择,第二阶段是除N外的局中 人的静态博弈。这种转换被称为“海萨尼转 换”,这个转换把“不完全信息”转变成为 完全但不完美信息,从而可以用分析完全信 息博弈的方法进行分析。
也就是说,在智猪博弈中,大猪没有占优策略, 而小猪有占优策略,它的最佳选择就是耐心 等待大猪去按钮,才能获得最佳结果。
“小猪躺着大猪跑”的现象是由于故事中的游 戏规则所导致的。规则的核心指标是:每次落 下的事物数量和踏板与投食口之间的距离。
博弈论的几个经典模型
模型一、智猪博弈/完全信息静态博弈
如果改变一下核心指标,猪圈里还会出现同样 的“小猪躺着大猪跑”的景象吗?试试看。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
通过海萨尼转换,博弈开始时,所有参 与人有关“自然”的行动有一致的信念,即 都知道所有参与人类型的概率分布函数,此 即“海萨尼公理”。
• 理性不一定道德。
博弈论的几个经典模型
模型一、智猪博弈/完全信息静态博弈
猪圈里有两只猪,一只比较大,一只比
较小。猪圈狭长,猪食槽在一头,猪食按钮
在另一头,按一下会有10个单位的猪食落进
槽里。由于按钮和食槽距离较远,按按钮的
体力耗费相当于2个单位的食物。若大猪先到
槽边,大小猪吃到食物的收益比是9:1;同
模型二、囚徒困境/非合作博弈
有两个小偷A和B联合犯事、私入民宅被 警察抓住。警方将两人分别置于不同的两个 房间内进行审讯,对每一个犯罪嫌疑人,警 方给出的政策是:如果一个犯罪嫌疑人坦白 了罪行,交出了赃物,于是证据确凿,两人 都被判有罪。如果另一个犯罪嫌疑人也作了 坦白,则两人各被判刑8年;如果另一个犯罪 嫌人没有坦白而是抵赖,则以妨碍公务罪(因 已有证据表明其有罪)再加刑2年,而坦白者 有功被减刑8年,立即释放。如果两人都抵赖, 则警方因证据不足不能判两人的偷窃罪,但 可以私入民宅的罪名将两人各判入狱1年。
博弈论的几个经典模型
引言
博弈:game,即是人们遵循一定规则下的活 动,参与人的目的是“赢”。进行game的人 是很认真的,不同于汉语中游戏的概念。 博弈论/对策论:game theory 奥林匹克运动会:Olympic Games。
博弈论的几个经典模型
基本术语
• 博弈论研究的对象:是理性人或参与者如何 选择策略或如何作出行动的决定。
博弈论的几个经典模型
模型二、囚徒困境/非合作博弈
乙 甲
坦白
抵赖
坦白
(-8,-8) (-10,0)
抵赖
(0,-10) (-1,-1)
不难看出,“坦白”是任一犯罪嫌疑人的占 优战略,而(坦白,坦白)是一个占优战略 均衡。
博弈论的几个经典模型
模型二、囚徒困境/非合作博弈
该博弈刻划了两大难题: • 冲突情形下,参与人的目标是什么?是采用(作
选择行动方案 ; 各方得到收益 Ai (a1, a2, , ai ,ti ) 。
借助于第一步和第二步中虚构的参与者“自 然”的行动,我们可以把一个不完全信息的 博弈表述为一个不完美信息的博弈。
博弈论的几个经典模型
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
• 海萨尼转换分析 海萨尼转换是处理不完全信息博弈的标准方 法。一般地,“自然”在博弈开始的时候选择 参与人的类型,参与人的某个类型包括表征 类型的各个特征如策略空间、信息集、得益 函数等,这些又称为该类型参与人所拥有的 个人信息。 不完全信息意味着博弈各方中至少有一个参 与人有多个类型。
改变方案一:减量方案。 改变方案二:增量方案。 改变方案三:减量加移位方案。
投食仅原来的一半分量,但同时将投食口移到 踏板附近。结果呢,小猪和大猪都在拼命地 抢着踩踏板。等待者不得食,而多劳者多得。 每次的收获刚好消费完。 对于游戏设计者,这是一个最好的方案。 成本不高,但收获最大。
博弈论的几个经典模型
时到槽边,收益比是7:3;小猪先到槽边,
收益比是6:4。
小猪

ቤተ መጻሕፍቲ ባይዱ
不按(等待)
大猪

(5,1)
(4,4)
不按(等待)
博弈论的几个经典模型
(9,-1)
(0,0)
模型一、智猪博弈/完全信息静态博弈
选择等待是小猪的占优策略。
大猪的最佳选择取决于小猪的行动,如果小猪 去按,大猪最好选择等待;如果小猪不去按, 则最佳选择是大猪亲自去按。
博弈论的几个经典模型
博弈论的几个经典模型
引言
博弈论又被称为对策论(Game Theory), 及研究互动决策的理论。 互 动 决 策 : 即 各 行 动 方 ( 即 局 内 人 [player] ) 的决策是相互影响的,每个人在决策的时候 必须将他人的决策纳入自己的决策考虑之中, 当然也需要把别人对于自己的考虑也要纳入 考虑之中……在如此迭代考虑情形进行决策, 选择最有利于自己的战略(strategy)。
为个人)他自己的最好策略,还是采用(作为集 体的一员)他们共同的最好策略?前者导致均衡 策略(坦白,坦白),支付为(-8,-8);后者的最 好策略是(抵赖,抵赖),支付为(-1,-1)。这里 反映了个体理性行为与集体理性行为之间的矛 盾、冲突。 • 此博弈只进行一次还是重复进行?如果博弈只 进行一次,参与人似乎只有坦白才是最好的策 略,因为没有理由相信对手会对你有信心,他 总认为你自己会坦白;因此,双方都采取坦白 策略。然而,若博弈进行多次,则结论将会发 生变化。
相关文档
最新文档