第九章 运筹学博弈论
运筹学博弈论

i a 2 1 3 a c 1 3 a c c 1 3 a c 9 1 a c 2
产量博弈的古诺模型是一种囚徒困境,无法实现 博弈方总体和各个博弈方各自最大利益的结论,对 于市场经济组织、管理,对于产业组织和社会经济 制度的效率判断,都具有非常重要的意义。说明对 市场的管理,政府对市场的调控和监管都是必须的。
纳什均衡(Nash Equilibrium)
通俗地说,纳什均衡的含义 就是:
给定你的策略,我的策略是 最好的策略;给定我的策略, 你的策略也是你的最好的策 略。即双方在给定的策略下 不愿意调整自己的策略。
1. 纯战略Nash均衡
策略空间:每个博弈方的全部可选策略的集合 S1,Sn
博弈方 i的第 j个策略: si j Si 博弈方 i的得益:u i
每个参与人都想猜透对方的战略,而每个参与人又 不愿意让对方猜透自己的战略。
这种博弈的类型是什么?如何找到均衡?
请举一些这样的例子:
✓石头、剪子、布游戏 ✓老虎、杠子、鸡、虫子游戏 ✓扑克游戏 ✓橄榄球赛 ✓战争中
大猪先到:大猪吃到9个单位,小猪吃到1个单位; 小猪先到:小猪吃到4个单位,大猪吃到6个单位; 同时到达:大猪吃到7个单位,小猪吃到3个单位。
局中人:大猪和小猪 行动:按按钮吃东西
小猪
按
不按
大
猪
按 (5, 1) (4, 4)
不按 (9, -1) (0, 0)
24
大猪 按 等待
小猪的上策
寡头产量竞争——以两厂商产量竞争为例 Qq1 q2 PP(Q) aQ
u 1 q 1 P ( Q ) c 1 q 1 q 1 [ a ( q 1 q 2 ) c ]1q
u 2 q 2 P ( Q ) c 2 q 2 q 2 [ a ( q 1 q 2 ) c ]2q
博弈论9

• 2.市场机会 设两个厂商都发现了一个市场机 会,但市场容量不大。若只有一家进入,能赚 100,若同时进入,则各亏50. • 厂商2 • 进 不进 • 进 100, 0 -50 -50 -50,-50 • 厂商1 • 不进 0 , 0
0 ,100
• 本博弈也有两个纯策略纳什均衡(不进,进), (进,不进)但它们分别有利于两个厂商,因此 这两个均衡都不容易实现,都应采取混合策略。 • 请同学们自己计算混合策略纳什均衡及得益。
• • • • •
2 s 1 s w
1,3 d 2,2 0,0 r 0,0 3,1
w
• 这是一个第二阶段为静态博弈的动态博弈问题。如 这是一个第二阶段为静态博弈的动态博弈问题。 果第一阶段1选 则博弈结束 双方各得2;如果1 则博弈结束, 果第一阶段 选d,则博弈结束,双方各得 ;如果 则第二阶段有三个纳什均衡: 选r则第二阶段有三个纳什均衡:纯策略的(s,w) 则第二阶段有三个纳什均衡 纯策略的( 和混合策略的双方以1/4和 选 和 和混合策略的双方以 和3/4选s和w.
•
• • • •
3.三寡头垄断市场的需求函数是 三寡头垄断市场的需求函数是p=100-Q, 三寡头垄断市场的需求函数是 , 市场总产量Q=q1+q2+q3 ,p为市场价格 三个企 为市场价格,三个企 市场总产量 为市场价格 业的边际成本都为2,固定成本为 如果企业1 业的边际成本都为 固定成本为0.如果企业 固定成本为 如果企业 和企业2先同时决定产量 先同时决定产量q 企业3看到 、 看到q 和企业 先同时决定产量 1和q2,企业 看到 1、 q2后同时决策,问三个企业各自的产量和利润 后同时决策, 是多少? 是多少? 解:三个企业的利润函数是 L(q1,q2,q3)=qi(100-Q)-2qi i=1,2,3 根据逆推归纳法先看企业3 的选择:( :(企业 根据逆推归纳法先看企业 的选择:(企业 3的利润对其产量求导并令其为零) 的利润对其产量求导并令其为零) 的利润对其产量求导并令其为零 q3=(98-q1-q2)/2
博弈论概述

一般地,称 si*为局中人i的(严格)占优策略, 若对应所有的
si , s i*是i的严格最优策略 , 即:
ui (si*, si ) ui (si' , si ) si , si' si*
对应地,所有的 si' si* 被称为“劣策略”。注意:这
甲的策略
1
2
3
乙的策略
1
7
8
9
2
6
2
3
3
5
4
0
1.乙先行动。若乙选1,则甲选3;乙选2,则甲选1;乙选3, 则甲选1。乙在行动时会估计到甲的行动,它估计三种选择 中的最高代价为策略1(损失900万),其次为策略2(损失 600万),最低为策略3(损失为500万)。因此,乙必选代 价最低的策略3。——最大最小原理。结论:乙选择3,甲选 1作为回应,乙损失500万,甲获益500万。
在博弈论里,一个博弈可以有两种表述方式:一种是策 略式(strategic form representation)表述,另一种是 扩展式( extensive form representation )表述。前者 适合于讨论静态博弈,后者适合于讨论动态博弈。在策略式 表述中,所有参与人同时选择各自的策略,所有参与人选择 的策略一起决定每个参与人的支付。
2007 - Leonid Hurwicz, Eric S. Maskin, Roger B. Myerson 2005 - Robert J. Aumann, Thomas C. Schelling 2001 - George A. Akerlof, A. Michael Spence, Joseph E.
第九章-运筹学博弈论

乙 石头 布
甲
石头
0
-1
布
1
0
剪刀
-1
1
剪刀
1 -1 0
21
例2 写出齐王和田忌赛马中齐王的收益矩阵. 赢一场得一千金.
解:
S1 a1,a2,a3,a4,a5,a6,S2 b1,b2,b3,b4,b5,b6
a1 (上,中,下),a2 (上,下,中),a3 (中,上,下), a4 (中,下,上),a5 (下,中,上),a6 (下,上,中). S2中的各策 S1对 略应 与的策.略相同
史密斯(Vernon L. Smith)
获奖理由:在心理和实验经济学研究方面做出了开创性工
作。
2001年 三位美国学者乔治-阿克尔洛夫(George A.
Akerlof)、迈克尔-斯彭斯(Michael Spence)和约瑟夫-斯
蒂格利茨(Joseph E. Stiglitz)
获奖理由:在“对充满不对称信息市场进行分析”领域
11
1986年 美国人詹姆斯-布坎南(James M. Buchanan Jr.)
获奖理由:将政治决策的分析同经济理论结 合起来,使经济分析扩大和应用到社会,政治法 规的选择
1985年 意大利人弗兰科-莫迪利安尼 (Franco Modigliani)
获奖理由:第一个提出储蓄的生命周期假 设,这一假设在研究家庭和企业储蓄中得到了 广泛应用。
完全信息是指所有局中人对其他局中人各自策略 集以及不同局势下的收益函数都有完全的了解.
18
博弈的三个要素的矩阵表示(局中人A的收益)
局中人B
局中人A
策 a1 a2
略
am
b 1
c11 c 21
博弈论知识点总结完整版

博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。
即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。
1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。
1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。
两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。
倘若不能,则称非合作博弈(Non-cooperative game)。
合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。
目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。
博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。
把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。
博弈论完整版PPT课件

ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战
运筹学博弈论 PPT

6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
囚徒困境
坦白是B的 占优战略
坦白
囚徒 B
抵赖
坦白
坦白是A的 囚徒A 占优战略
抵赖
占优策略(上策)均衡
占优策略(上策)通俗来说是:
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策 略组合所构成的均衡。
囚徒困境( Prisoners’Dilemma )
运筹学博弈论
第一节 博弈论概述
一、博弈论的产生和发展
1. 博弈在中国 田忌赛马Байду номын сангаас弈
华容道博弈
从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战
2. 博弈论的开山之作
1943 年 , 冯 ·诺 依 曼 和 摩 根斯顿发表《博弈论和经 济行为》的一书,
标志着博弈论作为一门独立科学的开始, 也标志着新古典经济学进入了一个新的发 展阶段。
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战 略均衡”(iterated dominance equilibrium).
运筹学博弈论简介

合作博弈
非合作博弈
二)按局中人数分 类:
二人博弈 多人博弈
三)按策略数分 类:
•有限策略博弈 •无限策略博弈
二人非合作博 弈是我们讨论的重 点。
非合作博弈的进一步分类
非合作博弈
非零和的四种博弈
零和博弈
也可以有纯策略和混合
– 纯策略博弈 策略博弈之分。
策略—前进或后退
支付函数
斗鸡B
前进 后退
前进 -3/-3 2/0
斗鸡A
后退 0/2 0/0
五、博弈论的典型例子
市场进入阻挠—二人非合作非零和纯策略博弈
局中人—在位者和进入者 策略—在位着:容忍或斗争;进入者:进入或不进入 支付函数—垄断利润300,寡头利润各50;进入成本10
进入 进入者
不进入
在位者 容忍 斗争
– 混合策略博弈
非零和博弈
动态时行动和策略
– 完全信息博弈 不同,要素有五个;而
静态博弈
静态时行动与策略不加
动态博弈
区别,要素有三个。
– 不完全信息博弈
静态博弈
动态博弈
四、博弈论发展史的要件
1944年,von Neumann and Oskar Morgenstern 发表专著 The Theory of Games and Economic Behavior创立了博弈论
2000 -40万 -40万 -40万
五、博弈论的典型例子
齐王赛马—二人非合作零和博弈
局中人—齐王和田忌 策略—上中下三种等级的马的组合 ,比三
次,有六组策略:(上,中,下)、 (中,上, 下)、 (上,下,中)、 (中,下,上)、 (下, 上,中)、 (下,中,上)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
瑞典诺贝尔基金会官方网站透露了近20年 诺贝尔经济学奖得主名单及其主要贡献(即获 奖理由): 2004年 挪威经济学家芬恩-基德兰德(Finn E. Kydland)和美国经济学家爱德华-普雷斯科 特(Edward C. Prescott) 获奖理由:在动态宏观经济学方面做出了 巨大贡献。 2003年 美国经济学家罗伯特-恩格尔 (Robert F. Engle III)和英国经济学家克莱夫格兰杰(Clive W.J. Granger) 获奖理由:在经济时间数列中运用了统计 学的方法。
完全信息是指所有局中人对其他局中人各自策略 集以及不同局势下的收益函数都有完全的了解.
博弈的三个要素的矩阵表示(局中人A的收益)
策 略Leabharlann 局中人B 局中人Ab 1
a1 a2 am
c11 c21 cm1
b2
c12 c22 cm 2
bn
c1n c2 n cmn
策
略
局中人A的收益函数可用如下的矩阵表示:
§2.完全信息静态博弈(一) 一.二人零和博弈 设博弈中只有局中人A,B;局中人A的策略集为
. 局中人B的策略集为 S2 b1, b2 ,, bn cij 表示局中人A采取策略ai , 局中人B采取策略b j
S1 a1 , a2 ,, am ;
时A的收益(这时局中人B的收益为 cij ), cij为ai 和 b j的二元函数,即cij F (ai , b j ), (ai , b j )称为局势.
1986年 美国人詹姆斯-布坎南(James M. Buchanan Jr.) 获奖理由:将政治决策的分析同经济理论结 合起来,使经济分析扩大和应用到社会,政治 法规的选择 1985年 意大利人弗兰科-莫迪利安尼 (Franco Modigliani) 获奖理由:第一个提出储蓄的生命周期假设, 这一假设在研究家庭和企业储蓄中得到了广泛 应用。
什么是博弈论?
所谓博弈是指局中人按一定规则,在充分考虑其 他局中人可能采取的策略的基础上,从自己的策 略集中选取相应策略,并从中得到回报的过程. 博弈是一种特殊的决策,在决策论中,决策者的 对手是大自然,在博弈论中,代替大自然的是有 理性的人,因而任何一方做出决定时,都必须考 虑其他对手可能作出的反应.
在国外,1912年E.Zermelo用集合论研究过下棋 问题,四十年代由于生产和战争的需要,博弈理 论得到了发展,系统博弈理论的形成则以1944 年V.Neumann,O.Morgensten合著的《博弈论 和经济行为》一书为标志.1994年瑞士皇家科 学院决定将诺贝尔经济学奖授予纳什(Nash),哈 萨尼(Harsanyi)和泽尔腾(Selten)三人,表彰他们 在博弈理论和应用研究方面作出的杰出贡献. 目前,博弈论在定价,招投标,拍卖,委托代理以及 很多重要的经营决策中得到应用,它已成为现代 经济学的重要基础.
1995年 美国人罗伯特-卢卡斯(Robert E. Lucas Jr.) 获奖理由:倡导和发展了理性预期与宏观经济学研究的运用 理论,深化了人们对经济政策的理解,并对经济周期理论提出 了独到的见解。 1994年 美国人约翰-海萨尼(John C. Harsanyi) 和美国人约翰 -纳什(John F. Nash Jr.)以及德国人莱因哈德-泽尔腾(Reinhard Selten) 获奖理由:在非合作博弈的均衡分析理论方面做出了开创性 的贡献,对博弈论和经济学产生了重大影响 。 1993年 美国人罗伯特-福格尔(Robert W. Fogel)和道格拉斯诺斯(Douglass C. North) 获奖理由:前者用经济史的新理论及数理工具重新诠释了过 去的经济发展过程;后者建立了包括产权理论、国家理论和意 识形态理论在内的“制度变迁理论”。 1992年 美国人加里-贝克(Gary S. Becker) 获奖理由:揭示并澄清了经济制度结构和函数中交易费用和 产权的重要性。
§1. 引言
在社会活动,经济和经济管理,军事活动中,经常 会遇到具有竞争性或利益相对抗的现象,例如下 棋,打桥牌,体育竞赛,市场竞争,广告战,价格战, 军事斗争等.竞争的各方总是想用最好的策略击 败对方,取得尽可能好的结果,这就是博弈现象. 博弈现象是一种特殊的决策,在不确定决策分析 中,决策者的对手是”大自然”,它对决策者的 各种策略不产生反应,但在博弈现象中,代替” 大自然”的是”有理性的人”,因而任何一方做 出的决定都必须充分考虑其他对手可能作出的 反应.
1990年 美国人哈里-马科维茨(Harry M. Markowitz)、 默顿-米勒(Merton H. Miller)和威廉-夏普(William F. Sharpe) 获奖理由:在金融经济学方面做出了开创性工作。 1989年 挪威人特里夫-哈维默(Trygve Haavelmo) 获奖理由:建立了现代经济计量学的基础性指导原 则。 1988年 法国人莫里斯-阿莱斯(Maurice Allais) 获奖理由:在市场理论及资源有效利用方面做出了 开创性贡献,并对一般均衡理论重新做了系统阐述。 1987年 美国人罗伯特-索洛(Robert M. Solow) 获奖理由:对增长理论做出贡献。提出长期的经济 增长主要依靠技术进步,而不是依靠资本和劳动力的 投入。
构成博弈的三个要素: 1.局中人(Players):是指参与竞争的各方,它可以 是一个人,也可以是一个集团,但局中人必须是 有决策权的主体,而不是参谋或从属人员.在博 弈中局中人可以有两方,称为二人博弈;也可以 有多方,称为多人博弈,在多人博弈中又可分为 结盟和不结盟的情况. 2.策略(Strategies):指局中人所拥有的对付其 他局中人的手段,方案的集合.在静态博弈中,策 略必须是一个独立的完整的行动,而不能是若 干相关行动中的某一步.
c11 c21 A c m1 c12 c22 cm 2 c1n c2 n cmn
二人零和博弈也称为矩阵博弈. 博弈可表为 G S1 , S2 ; A .
例1 写出”石头,剪子,布”游戏的收益矩阵.石 头赢剪刀1分,布赢石头1分,剪刀赢布1分. 解:甲的策略集为{石头,布,剪刀} 乙的策略集为{石头,布,剪刀}
约翰· 纳什 1928年生于美国
约翰· 海萨尼 1920年生于美国 约翰· 海萨尼(JOHN C. HARSANYI)美国人,由 于他与另外两位数学家在 非合作博弈的均衡分析理 论方面做出了开创性的贡 献,对博弈论和经济学产 生了重大影响,由此获得 诺贝尔经学奖。
莱因哈德· 泽尔腾 1930年生于德国
博弈的三个要素,即局中人,策略集和收益函 数构成了博弈信息,根据不同信息可对博弈 做如下分类:
1.按局中人对信息掌握情况分为:完全信息博弈 和不完全信息博弈; 2.按局中人采取行动的次序分为:如果同时采取 行动或在互相保密情况下采取行动,称为静态博 弈;如果采取行动有先后,后采取行动的人可以 观察到前面人采取的行动,称为动态博弈. 我们只研究完全信息静态博弈.
博弈论的研究建立在下述假设前提下:即参与 博弈的各局中人都是理性的. 对”理性”的理解:”理性人是指有一个很好定 义的偏好,在面临给定的约束条件下最大化自己 的偏好.” “博弈中一个理性的决策必定建立在预测其他 局中人的反应之上.一个局中人将自己置身于 其他局中人的位置并为他着想从而预测其他局 中人将选择的行为,在这个基础上该局中人决 定自己最理想的行动.”
乙 石头 0 1 -1 布 -1 0 1 剪刀 1 -1 0
甲 石头 布 剪刀
例2 写出齐王和田忌赛马中齐王的收益矩阵. 赢一场得一千金. 解:
S1 a1 , a2 , a3 , a4 , a5 , a6 , S 2 b1 , b2 , b3 , b4 , b5 , b6 a1 (上,中, 下), a2 (上, 下,中), a3 (中, 上, 下), a4 (中, 下, 上), a5 (下,中, 上), a6 (下, 上,中). S 2中的各策略与 S1对应的策略相同 .
约翰· 纳什(JOHN F.NASH)美国人 (1928- ),由于他与 另外两位数学家在 非合作博弈的均衡 分析理论方面做出 了开创性的贡献, 对博弈论和经济学 产生了重大影响, 而获得1994年诺贝 尔经济奖。
三人在非合作博弈的均 衡分析理论方面做出了 开创性贡献对博弈论和 经济学产生了重大影响
2002年 美国学者丹尼尔-卡尼曼(Daniel Kahneman)和弗农史密斯(Vernon L. Smith) 获奖理由:在心理和实验经济学研究方面做出了开创性 工作。 2001年 三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯 蒂格利茨(Joseph E. Stiglitz) 获奖理由:在“对充满不对称信息市场进行分析”领域 做出了重要贡献。 2000年 美国芝加哥大学的詹姆斯-赫克曼(James J. Heckman)和加州大学伯克利分校的丹尼尔-麦克法登 (Daniel L. McFadden) 获奖理由:在微观计量经济学领域做出了重大贡献。 1999年 加拿大著名经济学家罗伯特-蒙代尔教授(Robert A. Mundell) 获奖理由:对不同汇率体制下的货币和财政政策以及最 优货币区域的分析做出了伟大贡献。
第九章 博弈论
引言 完全信息静态博弈(有鞍点的博弈,混合策 略,纳什均衡) 完全信息静态博弈(非零和的情况,纳什均 衡)
教学目的与要求:理解具有竞争性问题的博 弈思想,对纳什均衡概念有初步的认识,掌 握矩阵博弈的求解方法. 重点与难点:有鞍点的静态博弈和无鞍点的 静态博弈,难点是纳什均衡的概念. 教学方法:通过大量的实例讲解相关概念和 解法,并进行课堂讨论. 思考题,讨论题,作业:两个课堂讨论题,本章 习题. 参考资料:见前言. 学时分配:6学时.
例如在齐王和田忌赛马的博弈中,双方都有六 个策略:(上,中,下),(上,下,中),(中,上,下), (中,下,上),(下,中,上),(下,上,中),这六个策略 形成一个策略集合.在一局对策中,局中人的 策略只有有限个,称为有限策略,否则为无限 策略.相应每个局中人的策略选择形成的策略 组称为一个局势. 3.收益函数(Payoff function):指一局博弈后各 局中人的输赢得失,用正的数字表示局中人的 赢得,负的数字表示局中人的损失.显然,收益函 数的取值与局中人选定的策略有关,于是一局 博弈的”得失”是”局势”的函数.