第七章 博奕论(Game Theory教材课程

合集下载

博弈论PPT课件

博弈论PPT课件
有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)

博弈论完整版PPT课件

博弈论完整版PPT课件
R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。

《西方经济学》第七章 博弈论

《西方经济学》第七章 博弈论

21
第五节
不完全信息动态博弈
对应于不完全信息动态博弈的均衡概念是精炼 精炼 贝叶斯均衡(perfect Bayesian equilibrium). 贝叶斯均衡 这个概念是完全信息动态博弈的子博弈精炼纳 什均衡与不完全信息静态均衡的贝叶斯纳什均 衡的结合.具体来说,精炼贝叶斯均衡是所有 参与人战略和信念的一种结合.它满足如下条 件:第一,在给定每个参与人有关其他参与人 类型的信念的条件下,该参与人的战略选择是 最优的.第二,每个参与人关于其他参与人所 属类型的信念,都是使用贝叶斯法则从所观察 到的行为中获得的.
22
贝叶斯法则 贝叶斯法则是概率统计中的应用所观察 到的现象对有关概率分布的主观判断 (即先验概率)进行修正的标准方法.
23


1. 什么是占优策略均衡?什么是重复剔除的占优策 略均衡?什么是纳什均衡? 2. 什么是子博弈精炼纳什均衡?重复博弈与一次性 博弈有何不同? 3. 假定两寡头生产同质产品,两寡头的边际成本为 0.两寡头所进行的是产量竞争.对于寡头产品 的市场需求曲线为P=30-Q,其中Q=Q1+ Q2.Q1是寡头1的产量,Q2是寡头2的产量. (1)假定两个寡头所进行的是一次性博弈. 如果两寡头同时进行产量决策,两个寡头各生产 多少产量?各获得多少利润?
25

第七章
第一节 第三节 第四节 第五节
博弈论
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
第一节 博弈问题概述
一,博弈的基本概念 二,博弈的分类
2
一,博弈的基本概念
博弈论 博弈论(game theory)是研究决策主体的 行为发生直接相互作用时候的决策以及这 种决策的均衡问题的. 博弈论的基本概念包括:参与人 行动 参与人,行动 参与人 行动, 战略,信息 支付函数,结果 均衡. 信息,支付函数 结果,均衡 战略 信息 支付函数 结果 均衡

博弈论 Game theory (全)

博弈论 Game theory (全)

博弈论 Game Theory博弈论亦名“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学,经济学,国际关系,计算机科学, 政治学,军事战略和其他很多学科都有广泛的应用。

在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。

主要研究公式化了的激励结构间的相互作用。

是研究具有斗争或竞争性质现象的数学理论和方法。

也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

表面上不同的相互作用可能表现出相似的激励结构(incentive structure),所以他们是同一个游戏的特例。

其中一个有名有趣的应用例子是囚徒困境(Prisoner's dilemma)。

具有竞争或对抗性质的行为称为博弈行为。

在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。

为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。

比如日常生活中的下棋,打牌等。

博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。

生物学家使用博弈理论来理解和预测演化(论)的某些结果。

例如,约翰·史密斯(John Maynard Smith)和乔治·普莱斯(George R. Price)在1973年发表于《自然》杂志上的论文中提出的“evolutionarily stable strategy”的这个概念就是使用了博弈理论。

其余可参见演化博弈理论(evolutionary game theory)和行为生态学(behavioral ecology)。

博弈论也应用于数学的其他分支,如概率,统计和线性规划等。

历史博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。

game theory lecture7博弈论

game theory lecture7博弈论
• a player mixes before playing the game but then remains loyal to the selected pure strategy.
behavioral strategy in Extensive-Form Games
a behavioral strategy is more in tune with the dynamic nature of the extensive-form game. When using such a strategy, a player mixes among his actions whenever he is called to play.
Normal-Form Representation of Extensive-Form Games
• Any extensive-form game can be transformed into a normal-form game by using the set of pure strategies of the extensive form (see definition 7.4) as the set of pure strategies in the normal form, and the set of payoff functions is derived from how combinations of pure strategies result in the selection of terminal nodes. • Therefore the normal-form representation of an extensive form will suffice to find all the Nash equilibria of the game.

game theory 教材

game theory 教材

Game Theory 教材一、介绍Game Theory是一种研究决策问题的数学理论,它关注的是理性行为体在面临复杂互动环境时的选择和行动。

Game Theory可以广泛应用于经济学、政治学、社会学等领域,帮助人们理解和解释现实世界的各种互动现象。

本教材旨在介绍Game Theory的基本概念、方法和应用,为读者提供一种理解和分析现实世界中复杂问题的工具。

二、内容第一章:Game Theory概述本章将介绍Game Theory的基本概念、发展历程和应用领域。

我们将探讨理性行为体的假设、互动决策的基本模式以及Game Theory 的主要研究问题。

第二章:策略博弈本章将介绍策略博弈的基本概念和方法,包括策略博弈的定义、纳什均衡、零和博弈和囚徒困境等。

我们将通过实例和分析来理解和应用这些概念和方法。

第三章:非策略博弈本章将介绍非策略博弈的基本概念和方法,包括非策略博弈的定义、优势策略和劣势策略、不完全信息博弈和拍卖理论等。

我们将通过实例和分析来理解和应用这些概念和方法。

第四章:演化博弈本章将介绍演化博弈的基本概念和方法,包括演化博弈的定义、演化稳定性和动态演化博弈等。

我们将通过实例和分析来理解和应用这些概念和方法。

第五章:应用案例本章将介绍Game Theory在经济学、政治学和社会学等领域的应用案例,包括市场交易、政治选举和社会规范等。

我们将通过案例分析和讨论来深入理解和应用Game Theory的概念和方法。

三、结论本教材旨在介绍Game Theory的基本概念、方法和应用,帮助读者理解和分析现实世界中各种复杂的互动现象。

通过阅读和实践,读者可以更好地理解和掌握Game Theory,并应用于解决现实问题中。

《博弈论》课程教学大纲

《博弈论》课程教学大纲

《博弈论》课程教学大纲一、课程名称(中英文)中文名称:博弈论英文名称:Game Theory二、课程代码及性质ECN5011 学科(大类)基础课必修三、学时与学分总学时:40(理论学时:40学时;实践学时:0学时)学分:2.5四、先修课程先修课程:《中级微观经济学》五、授课对象本课程面向经济学院经济各专业的二年级本科生六、课程教学目的(对学生知识、能力、素质培养的贡献和作用)《博弈论》课程的教学目的是在学生了解、认识和掌握博弈论基本理论和基本分析方法的基础上,培养和提高学生运用所学博弈论分析方法来分析经济领域相关问题的能力。

通过博弈论的学习,使学生掌握影响策略互动的主要因素、以及机制设计的基础知识。

牢固掌握的内容包括:纳什均衡,混合策略均衡,完全信息展开型博弈,贝叶斯均衡,动态博弈,可理性化,动态博弈等。

七、教学重点与难点:课程重点:均衡解的概念、求解、刻画与运用。

课程难点:运用合理的均衡解概念分析策略互动场景。

八、教学方法与手段:教学方法:课堂讲授为主。

辅以讨论、辩论环节。

教学手段:主要课程内容采用幻灯片演示的方法。

九、教学内容与学时安排(一)教学内容1(教师课堂教学4学时+ 学生课后学习4学时)教学内容:占优均衡课后文献阅读:无.课后作业和讨论:课后作业(二)教学内容2(教师课堂教学8学时+ 学生课后学习8学时)教学内容:纳什均衡(纯策略与混合策略)、以及在产业组织中的应用课后文献阅读:无课后作业和讨论:课后作业(三)教学内容3(教师课堂教学8学时+ 学生课后学习8学时)教学内容:不完全信息博弈与贝叶斯均衡课后文献阅读:无课后作业和讨论:课后作业四)教学内容4(教师课堂教学8学时+ 学生课后学习8学时)教学内容:序贯博弈与子博弈精炼均衡课后文献阅读:无课后作业和讨论:课后作业五)教学内容5(教师课堂教学4学时+ 学生课后学习4学时)教学内容:委托代理模型等课后文献阅读:无课后作业和讨论:课后作业六)教学内容6(教师课堂教学8学时+ 学生课后学习8学时)教学内容:信息经济学课后文献阅读:无课后作业和讨论:课后作业十、教学参考书及文献博弈论基础,罗伯特·吉本斯著,高峰译,中国社会科学出版社。

博弈论教案

博弈论教案


都是坦白。

这就是我们将在以后要学习的博弈论。
讲 简单了解什么是博弈论
在激发
过授
博弈论(Game Theory),也称对策论,是描述和 了学生学习
程 新 研究行为者之间策略相互依存和相互作用的一种决策 兴趣之后,
3
课 理论。它是现代数学的一个新分支,博弈论的应用领 给出“博弈
域十分广泛,在经济学、政治科学(国内的以及国际 论”的定
学 2. 让学生掌握占优策略均衡和纳什均衡的基本原理
目 3. 使学生明确区分占优策略均衡和纳什均衡

重 1. 在支付矩阵中找出处于均衡状态的最佳策略组合
点 2. 掌握两类均衡的相互关系
难 掌握占优策略均衡与纳什均衡的内在联系和区别

教 1.采用情景教学法和案例教学法,以教师的讲授为主 学 2.通过对比教学引导学生掌握占优策略均衡和纳什均衡的相互关系 方 3.结合生动有趣的案例分析和简单示意图帮助学生了解博弈分析过程
每个人各判刑 2 年。
该案例将贯
如图 1 的支付矩阵
穿于后面的

理论讲解
坦 白 不坦白
中,也为教
坦白
-5 -5 -1 -7
学节约了时

-7 -1
不坦白
-2 -2
导 入 新 课
图1 这两个囚犯之间的博弈过程如下:先考虑囚犯甲 的选择。甲要决定自己的选择,他必须要先考虑乙的 选择,即甲是在考虑了乙的选择的前提下来决定自己 的选择。那么,甲一定是这样思考的:
间。
简单向 学生介绍支 付矩阵图的 具体含义。
1. 如果乙选择坦白,则甲选择坦白,会判 5 年;选择
不坦白,会判 7 年。于是甲选择坦白。(因为
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

max

u1
即该博奕的纳什均衡解
max u 2
maxu1 maxu2
U1 Uq12
q2
6q2 6q1
2q1 2q2
0 0
的解,
求解上述方程组:
q 1 * q 2 * 2 , Q 4 u 1 1 , u 2 4 , u 1 u 2 8
标志着博奕论的初步形成。 50年代,合作博奕发展到鼎盛阶段,非合作博奕开始出现 纳什和夏普里的讨价还价模型, 塔克的“囚徒困境” 60年代以后,selten,Haysany,Krops,Wilseen
“信誉问题模型” (动态不完全信息博弈) 最近十多年,博弈论几乎贯穿了整个微观经济学,产业组
织理论和企业制度理论,并扩展到宏观经济学,环境、劳动、 福利经济学等领域。
新厂商的市场进入问题
B
打入
A
打击
(0,10)
和平共处
(-2,3)
(5,5)
6.博奕进程的信息
完美信息博奕:在动态博奕中,博弈方对博弈的进程, 即次此行为前各博奕方的行为完全了解
非完美信息博弈:
完全信息博弈:博奕各方完全了解所有博奕方各种策 略组合下得益情况 非完全信息博弈:
7.2.2博弈的主要分类
1 3、赢得(利益):参加博奕各方从博奕中所获得的 利
益 支付矩阵,博弈树
零和博奕:各博奕方赢得的代数和为零 非零和博奕:各博奕方赢得的代数和不为零
4.均衡:所有博奕方的最优策略的组合
博奕分析的目的是使用博奕规则决定均衡
5.得益的信息
完全信息博奕:博奕各方完全了解所有博奕方各种策略 组合下得益情况的博奕,如囚徒困境和田忌赛马。
7。3 完全信息静态博奕——纳什均衡
7.3.1 有限策略完全信息静态博奕(划线法,……)
囚徒困境
乙囚徒

囚 坦白

不坦白
坦白
不坦白
-8, -8
-10, 0
0, -10 -1, -1
有限策略划线法的原理:寻找针对其他博奕方每种
策略的最佳策略,即在其他博奕方的一定策略下本方 能实现自身最大得益的策略(极值问题),而纳什均 衡就是双方都能接受的策略组。
第七章 博奕论(Game
7.1 导言
Theory)
7.1.1 博奕与博奕论
博奕:一些个人、队组或其他组织,面对一定的环境条件, 在一定的规则下,同时或先后,一次或多次,从各自允许 选择的行为或策略中进行选择并加以实施,并从中各自取 得相应结果的过程。
(具有竞争或斗争性质的现象)
博奕论:研究博奕现象中的各方是否存在最合理的行动方案, 以及如何找到合理行动方案的数学理论和方法
不完全信息博变:博奕各方不完全了解其他博奕方得益 的博奕,如讨价还价,招、投标
6.博奕的次序
静态博奕: 博弈双方同时决定各自的策略,不存在博弈的 次序问题
动态博奕:博弈双方的博弈行为是交替进行的,前博弈 方的行动影响后博弈方的行动乃至整个策略,如:奕 棋,商业大战
重复博奕:数次静态博奕,工会与雇主的工资谈判合约 谈判
7.2 博奕的要素与分类
7.2.1 博弈的要素
1.博奕方(局中人):理性假定、独立决策、独立
承担博奕结果的个人或组织
囚徒困境
因忌赛马
警察 齐王:i= 1
孙膑 因忌: i= 2
两人博奕、多人博奕
注意:(1)博奕双方利益并不总对抗的;
(2)博奕双方中信息较多者并不总是得益
(3)个人理性与集体理性的矛盾
1、博奕论与新古典经济学
价格制度
非价格制度(参与人之间行为的相互作用)
新古典经济
博奕论
三个假定:
Байду номын сангаас
1 A.理性人:给定约束条件下,
个人效用的最大化
完全一致
B.市场参与者数量足够多从而 市场参与者是有限的
市场是完全竞争性的
市场是非完全竞争性的
个体理性与集体理性的一致性
个体与集体理性的矛盾
解决方法: 价格制度 , 市场
博奕论适用于一切通过策略进行对抗或合作的人类活动和行为, 它在军事、法律、政治、国际关系和外交、环保、体育竞技 等诸多领域都有广阔的应用。尤其是经济,如信誉模型、委 托代理机制,次品车问题,OPEC,寡头垄断等等。
7.1.2 博奕论与主流经济学
博奕论是现代经济研究的先进工具,也是经济学科的一个分支
1994年,Nobel经济学奖授予三位对博奕论和博奕论的经济 应用的发展作出了杰出贡献的学者,纳什、塞尔顿和海萨尼。
1996年,Nobel经济学奖授予詹姆斯·莫里斯、威廉·维克瑞表 彰其对非对称信息条件下经济激励的理论研究(信息经济学)
2001年,诺贝尔经济学奖被授予三位信息经济学家阿克洛夫 (次品车模型)、斯宾塞(信号传递模型)和斯蒂格利茨 (保险市场模型和信贷配给模型),以表彰他们在非对称信 息市场分析方面的杰出贡献。
从各自可能出现的最不利的情形中选择一个最有利的情 形作为决策依据(理性)。最后的结局就是双方均可 接受的,对双方来说都是最稳妥的结果。
又例:
妻 电影

足球
电影
2,1 0,0
丈夫
足球
0,0 1,3
二、无限策略完全信息静态博奕(古诺模型)
1.古诺模型 (1)两寡头古诺模型的描述和求解 1.2 两厂商 假设:1厂商产量 2厂商产量 总产量
q 1 q 2
Q q 1 q 2
价格是总产量的减函数, 无固定成本,可变成本
PP(Q)8Q
c1 c2 2
则:厂商1的利润:
同理,厂商2的利润:
U1 q1(p(Q)c1) q1(8(q1q2)2)
U 26q2q1q2q2 2
q1(6(q1q2))6q1q1q2 q12
两厂商最终的产量组合 (q1*,q2*)
2.策略:一次博奕中,博奕方可选择的一个行 动方案(或者一个行动序列)
博弈方1的一个策略a1=(上、中、下)
博弈方1的策略集合 S1 {(上、中、下),(上、下、中),(中、上、下),
(中、下、上),(下、中、上),(下、上、中)}
策略组


a1 =(上、中、下) 有限策略,无限策略
a2 =(下、中、上)
解决办法: 非价格制度 传:政府干预
现:制度安排
C.参与者之间不存信息不对称的问题
非对称信息
价格制度→非价格制度→弥补了经济模型脱离实际的缺 陷,所得出的结论更符合经济现实更有实际应用性和指导性。
7.1.3 博弈论的发展
18世纪初,零星的研究 1838年,关于寡头垄断的产量决定模型---古诺模型 1883年,关于寡头垄断的价格决定模型-----Bertrand模型 1944年,冯·诺依曼和摩根斯坦恩的《博奕论与经济行为》
相关文档
最新文档