博弈论第二章——博弈规则.
合集下载
博弈论PPT课件

有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
博弈论(第一、二章)

游戏2:摘柿子
甲 跑
摇 跑
乙
摇 跑
甲
摇
乙 跑
摇 跑
甲
不跑 (2,2)
(0,0)
(0,1) (2,0)
(0,3) (4,0)
游戏3:免费彩票博弈
每个人可以免费购买任意数量彩票,随机 抽取1张彩票中奖,奖金总额为1000万元/n,n 为彩票数量。
博弈论:研究理性人行为选择的理论
博弈论作用:帮助个人、组织等决策主 体深刻理解策略并明智的选择行动。
第二章 完全信息静态博弈
� 基本分析思路和方法 � 纳什均衡 � 混合策略 � 纳什均衡的选择
第一节 基本分析思路和方法
行动或策略(acቤተ መጻሕፍቲ ባይዱion or strategy)
si:局中人i的一个特定策略 Si:局中人i的策略集(strategy set)或策略空间 (strategy space),可以是离散的或连续的。
纳什的基本贡献是证明了非合作博弈均衡解 及其存在性,建立了作为博弈论基础的“纳 什均衡”概念;海萨尼则把不完全信息纳入 到博弈论方法体系中;泽尔腾的贡献在于将 博弈论由静态向动态的扩展,建立了“子博 弈精练纳什均衡”的概念。
1996莫里斯(James A.Mirrlees)和维克瑞(William Vickrey)
游戏1:军事游戏-进攻和防守
博弈结果表
守方
B 攻方 a -1 b -1 c +1 +1 +1 -1 +1 -1 -1
C -1 +1 +1
游戏1:军事游戏-进攻和防守
博弈结果表
守方
B 攻方 a -1 b -1 c +1 +1 +1 -1 +1 -1 -1
第2讲 博弈的类型与表述

第2讲
1. 博弈的基本要素
博弈的类型与表述
—— 参与人 参与人(Player)是博弈中的决策主体。一般表示为:
i I 1, 2,
, n
一局国际象棋的参与人是两位棋手;在囚徒困境的例子中,参与人是囚徒甲和囚徒乙。 —— 博弈规则 博弈的规则(Rule),规定了每位参与人何时行动,以及在轮到每位参与人行动时,他能够选 择哪些行动。 国际象棋有其详细的规则;在囚徒困境的例子中,规则就是两名囚徒分别决定是“坦白”还 是“抗拒” 。 —— 行动 在一个博弈中,在不同的阶段可能有不同的参与人需要“行动(action)” ,这些参与人在这博 弈的一阶段的行动,共同决定着博弈在这一阶段的结果。 在一个博弈中, 并非每名参与人在每一阶段都要有行动, 但是没有一名参与人在整个博弈的 任何阶段都不行动。 —— 策略 在一个博弈中,一名参与人的一个“策略(strategy,也叫‘战略’)”是该参与人的“一整套 行动计划” ,在该博弈每个轮到该参与人行动的位置,为该参与人规定一个行动。通常用 si Si 表示参与人 i 的策略,其中 Si 表示参与人 i 的“策略集” 。 策略是博弈中最重要的概念,我们在之后还会详细介绍这一概念。 —— 结果 在一个博弈中, 一个 “结果(Outcome)” 由每名参与人选择的一个策略(战略)共同组成, 因此, 博弈的一个结果就是博弈所有参与人的一个策略组合:
u u s u1 s , u2 s ,
, un s
要注意区分博弈的“结果”和“支付”—— 博弈的“结果”只是指“最终发生了什么” ,博 弈的“支付”是指“最终每个参与人获得了什么” 。但是,博弈的每个结果都必然对应着一个支 付向量,为每名参与人规定了一个支付。 例如,在囚徒困境的例子中, “甲选择‘坦白’ ,乙选择‘抗拒’ ”是一个结果,这一结果对 应的支付向量是(0,-8)。 在现实中,有时我们无法直接改变博弈的规则和各种可能出现的结果,但是,如果我们能够 通过各种办法改变博弈的各种结果对应的支付, 就能够改变博弈参与人面临的支付, 从而将博弈 导向不同的均衡结果。(举例) —— 博弈的 3 个基本要素 在上述所有有关博弈的概念之中,给定博弈的规则,构成一个 n 人博弈 n 由 3 个基本要素 是:参与人、结果和支付:
1. 博弈的基本要素
博弈的类型与表述
—— 参与人 参与人(Player)是博弈中的决策主体。一般表示为:
i I 1, 2,
, n
一局国际象棋的参与人是两位棋手;在囚徒困境的例子中,参与人是囚徒甲和囚徒乙。 —— 博弈规则 博弈的规则(Rule),规定了每位参与人何时行动,以及在轮到每位参与人行动时,他能够选 择哪些行动。 国际象棋有其详细的规则;在囚徒困境的例子中,规则就是两名囚徒分别决定是“坦白”还 是“抗拒” 。 —— 行动 在一个博弈中,在不同的阶段可能有不同的参与人需要“行动(action)” ,这些参与人在这博 弈的一阶段的行动,共同决定着博弈在这一阶段的结果。 在一个博弈中, 并非每名参与人在每一阶段都要有行动, 但是没有一名参与人在整个博弈的 任何阶段都不行动。 —— 策略 在一个博弈中,一名参与人的一个“策略(strategy,也叫‘战略’)”是该参与人的“一整套 行动计划” ,在该博弈每个轮到该参与人行动的位置,为该参与人规定一个行动。通常用 si Si 表示参与人 i 的策略,其中 Si 表示参与人 i 的“策略集” 。 策略是博弈中最重要的概念,我们在之后还会详细介绍这一概念。 —— 结果 在一个博弈中, 一个 “结果(Outcome)” 由每名参与人选择的一个策略(战略)共同组成, 因此, 博弈的一个结果就是博弈所有参与人的一个策略组合:
u u s u1 s , u2 s ,
, un s
要注意区分博弈的“结果”和“支付”—— 博弈的“结果”只是指“最终发生了什么” ,博 弈的“支付”是指“最终每个参与人获得了什么” 。但是,博弈的每个结果都必然对应着一个支 付向量,为每名参与人规定了一个支付。 例如,在囚徒困境的例子中, “甲选择‘坦白’ ,乙选择‘抗拒’ ”是一个结果,这一结果对 应的支付向量是(0,-8)。 在现实中,有时我们无法直接改变博弈的规则和各种可能出现的结果,但是,如果我们能够 通过各种办法改变博弈的各种结果对应的支付, 就能够改变博弈参与人面临的支付, 从而将博弈 导向不同的均衡结果。(举例) —— 博弈的 3 个基本要素 在上述所有有关博弈的概念之中,给定博弈的规则,构成一个 n 人博弈 n 由 3 个基本要素 是:参与人、结果和支付:
博弈论-入门

人接受了这五十万,其中的一个人说:“自己没有钱
,父母苦了一辈子了,临老了生病没钱医治,为了父
母,放弃了爱情吧。”
男人接着开出了第三个价格“500万!”
现场更静了,男人的第一个动作都是看身边的女
人,也许是在权衡什么。一半的男人沉默了,另一半
的男人怯生生的说:“我要爱情。”身边的女友也有
点呆住了,一个女孩子站起来说:“如果一个男人肯
去年七八月间,陈某儿子与赖某离婚;同年9月17日,陈某也 与王某办理了事实婚姻的离婚手续。仅仅四天后,陈某就与原 儿媳赖某登记结婚。结婚当天,他就向高新区公安分局户籍管 理部门申请办理儿媳、孙女的户籍迁移,欲将她们的户口迁到 上王村。工作人员将陈某的申请材料退了回来,口头告知他说 ,要迁户口,需先取得所在村委会的同意,并开具证明。
博弈 game—— “下棋”、“玩牌”,赌博和其他许 多智力游戏在内的对抗性游戏、对抗性体育竞 赛。博弈就是策略性的互动决策,通俗的说就 基于交叉效应的有意识的行为互动 交叉效应 参与人意识到交叉效应
博弈论,英文为Game theory,是研究相互依 赖、相互影响的决策主体的理性决策行为以及 这些决策的均衡结果的理论。
以利交者,利尽则散!以色交者,色衰则疏! 以貌交者,久之则腻!唯有以心交者,方能永恒!
理性
每个参与人均以获取最大支付为目标 理性内涵:对自己利益完全了解并能完美计算出何种
行动可最大化其利益 理性不意味着:
参与人自私 着眼于短期利益 与其他参与人有相同价值体系
男人无所谓忠诚,忠诚是因为背叛的砝码太低; 女人无所谓忠贞,忠贞是因为受到的引诱不够.
2
田忌策略:
结 果:
谋士孙膑 策略: 结 果:
精品课程《博弈论》PPT课件(全)

人博弈 两人博弈有多种可能性,博弈方的利益方向可
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
博弈论课件 第二章

2.3 无限策略博弈分析和反应函数
2.3.1 古诺的寡头模型 2.3.2 反应函数 2.3.3 伯特兰德寡头模型 2.3.4 公共资源问题 2.3.5 反应函数的问题和局限性
2.3.1 古诺的寡头模型
假设条件:
市场总产量Q q1 q2 市场出清价格 P P(Q) 8Q 边际成本c1 c2 2,无固定成本 两厂商同时决定各自产的量
2.2.1 纳什均衡的定义
博弈、博弈方的策略空间和得益的一般表示法 G 表示一个博弈; n个博弈方;
S1,S2, ,Sn表示每个博 策弈 略方 集的 合可 , 空 选 称 间为 ”“ ; sijSi表示博 i的 弈第 j个 方策略; 博弈i的 方得益 ui表 用示ui, 是各博弈方策 函略 数的 ;多元
★★★学习博弈论,大家一定要记忆一些基本的模型。因为很多
时候,我们总是基于已有的模型,对其做出修订来考察一些新的 问题。完全创新的模型是很少见的,当我们记忆的模型多了,就 很容易在分析问题时套用模型,并修订模型的条件来考察自己研 究的问题。
其实大家学习西方经济学理论的时候,会发现它与大家曾接触 的马克思主义经济学理论,以及国内一些逻辑思辩型的经济学研 究范式一个很大不同就在于,它采取的是一种模型化的思维。我 们学习西方经济学的时候,会发现始终在学习一些模型,因为模 型是帮助我们简单地理解现实世界的有用工具。经济学中的数学 模型,其实与生物课教学的塑料人体模型等在本质上并无不同。
左
中
右
博弈的解:(上,中)
博上 弈 方 一
下
1,0 0,4
1,3 0,2
0,1 2,0
2.1.3 划线法
囚徒困境
囚 坦白 徒 1 不坦白
囚徒 2 坦白
2 完全信息静态博弈

2 政府
救济 3,
3
-1,
1 0 0,
1 )( ( )) ( 01
不救济 -1,
求微分,得到政府最优化的一阶条件:
同样,可以根据流浪汉 的期望效用函数找到政 府的最优混合策略。??
即:流浪汉以0.2的概率选择寻 找工作,0.8的概率选择游荡
四. 混合策略纳什均衡
社会福利博弈
四. 混合策略纳什均衡
社会福利博弈
救济 政府
流浪汉
寻找工作 2 3, 1 不救济 -1, 0, -1, 0 流浪 3
设:政府救济的概率:1/2 ;不救济的概率:1/2。 流浪汉:寻找工作的概率:0. 2;流浪的概率:0.8 每个参与人的策略都是给定对方混合策略时的最优策略
四. 混合策略纳什均衡
四. 混合策略纳什均衡
策略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。
纯策略:如果一个策略规定参与人在每一个给定的信 息情况下只选择一种特定的行动,该策略为 纯策略。 混合策略:如果一个策略规定参与人在给定信息情况 下以某种概率分布随机地选择不同的行动, 则该策略为混合策略。
由于混合策略伴随的是支付的不确定性,因此参与 人关心的是其期望效用。
最优混合策略:是指使期望效用函数最大的混合策 略(给定对方的混合策略) 在两人博弈里,混合策略纳什均衡是两个参与人的 最优混合策略的组合。
支付最大 化法
四. 混合策略纳什均衡
流浪汉
寻找工作 流浪
假定政府的混合战略是 G , ); ( 1 流浪汉的混合战略是 L , )。 ( 1 政府的期望效用函数为: v( G, L) (3 1 ( )( )) 1 (5 1 ) vG 5 1 0 故 * 0.2
博弈论-博弈规则

4.1:回应规则之威胁
威胁的策略接近于管理学上的“热炉效应”,形象地阐述了惩罚的规则:
1.热炉火红,不用手去摸也知道炉子是热的,是会灼伤人的—警告性原则
2.每当你碰到热炉肯定会被灼伤—必然性原则
3.每当你碰到热炉,立刻就会被灼伤—即时性原则
4.不管谁碰到了热炉,都会被灼伤—公平性原则
威胁的最大优点在于你不需要率先行动,只要在对手行动之前公布你的行动策略就可以形成威胁。
4.2:回应规则之承诺
承诺是在别人与自己合作后给与的回报。
它给别人带来的是一种预期的效益。
如果是一次性博弈,违背承诺当然能给自己带来额外的收益,所以在一次性博弈中承诺的话往往不算数的。
但是在多次博弈中,如果承诺没有兑现,那么随后的博弈中承诺将变成毫无意义的空话。
4.3:不要忽视你身边的任何一个人
博弈无处不在正是因为我们的对手无处不在。
并不是所有的人都纯粹地依靠理性来行动,他们还受到情感的、道德的、法律的规则来约束。
因而并不是每个人都会成为我们博弈的对手。
只要你能善待不是你敌人的每一个人,你的潜在对手或许会变成你的朋友。
善待你身边的人,别让他变成你的敌人,永远也不要把自己投进博弈的海洋。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
E(equilibrium)
▪ 均衡(equilibrium):是所有参与人的最 优战略的组合。
▪ 所谓博弈均衡,它是一种稳定的博弈结 果。
▪ 纳什均衡(Nash Equilibrium):一策 略组合中,所有的参与者面临这样的一 种情况:当其他人不改变策略时,他此 时的策略是最好的。
▪ 谢识予:给定你的 策略,我的策略是最 好的的策略,给定我的 策略,你的策略 也是最好的的策略
是指博弈分析者 感兴趣的要素的
嫌 疑 人
B
集合。是均衡行
动的组合。
坦白t
不坦 白n
嫌疑人A 坦白t 不坦白n -8,-8 0,-10 -10, 0 -1,-1
U(t,t)=0.5*(-8)+ 0.5*(-8)=-8 U(t,n)=0.5*0+ 0.5*(-10)=-5 U(n,t)=0.5*(-10)+ 0.5*0=-5 U(n,n)=0.5*(-1)+ 0.5*(-1)=-1
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈
“博弈论”译自英文“Game
Theory”,直译就是“游戏理论”。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
博弈论(game theory): 又称对策论,是Go研ver究nin相g 互依 赖、相互影响的Dy决na策mic主s 体的 理性决策行为以及这些决策 的均衡结果的理论。
2.1.2 博弈论的基本概念
博弈论的基本假设
人 是 理 性 人 ( rational , 也 说自私人):行动者具有推理 能力,在具体策略选择时的 目的是使决策者自己的目标 效用最大化。
通俗地讲,博弈论是一种“游戏理 论”。其较对博弈为准确的理解是: 一些个人、团队或其他组织,面对 一定的环境条件,在一定的规则约 束下,依靠所掌握的信息,同时或 先后,一次或多次,从各自允许选 择的行为或策略进行选择并加以实 施,并从中各自取得相应结果或收 益的过程。
2.1.3博弈论的模型简介
博弈论模型可以用七个方面来描述
描述博弈的最少要素:参与人,战略,支付。 行动和信息是其积木
参与人、行动、结果统称为“博弈规则” 博弈分析的目的:是使用博弈规则预测均衡
第二节 博弈论的结构与分类
博弈论模型可以用七个方面来描述
G={P,A,S,I,U,O,E}
2.2.1 博弈方 2.2.2 博弈的行动过程 2.2.3 策略 2.2.4 支付(效用、得益) 2.2.5 博弈的信息结构 2.2.6 博弈方的能力和理性 2.2.7 博弈的分类和理论结构
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
G={P,A,S,I,U,O,E}
P(players)
▪ P(players): 为局中人,博弈的
参与者,也称为“博弈方”,局中
人以最终实现自身利益最大化为目
标。
个人
双方
虚拟参与人:
团体
多方
Nature
A(action)
▪ A(action) :为各局中人的所有可能的 策略或行动的集合。
▪ 行动的顺序(The order of play)
▪ 分类:根据博弈各方对各种局势下所 有局中人的信息掌握情况分:
完全信息博弈 不完全信息博弈
U( utility )
▪ U( utility ):也称为支付(pay off).为局中人获得利益,或者是 指参与人的期望效用水平。也是博 弈各方追求的最终目标。
▪ 分类:根据各方得益的不同情况
零和博弈
田忌赛马
游戏的共有特征 1. 一定的规则 2. 有一个结果(且可以折算
成数字) 3.策略的相互依存性 4.策略至关重要
ห้องสมุดไป่ตู้弈论-无处不在的游戏
“要想在现代社会做一 个有文化的人,你必须对 博弈论有一个大致了解”。
—保罗·萨缪尔森
年光似鸟翩翩过,世事 如棋局局新。
——(宋)僧志文
2.1.2 博弈论的基本概念
变和博弈
囚徒困境
▪ Ua(t,t)=-8 Ua(t,n)=0 Ua(n,n)=-1 Ua(n,t)=-10
▪ Ub(t,t)=-8 Ub(t,n)=-10 Ub(n,n)=-1 Ub(n,t)=0
b
嫌疑人a
坦白t
不坦白 n
嫌 疑
坦白t -8,-8
0,-10
人
不坦 白n
-10, 0
-1,-1
▪ 结果(outcome)
囚徒困境
嫌疑人A
一个纳什 均衡点!
嫌 疑 坦白 人 B 不坦白
坦白
不坦白
-8,-8 0,-10 -10,0 -1,-1
情侣博弈
王菲
两个纳什 均衡点!
足球
演唱会
李 亚
足球
2,1
鹏 演唱会 -1,-
1
0,0 1,2
2.1.3 博弈论的模型简介
博弈论模型可以用五个方面来描述
G={P,A,S,I,U,O,E}
先动优势 后动优势
▪ 根据该集合是有限还是无限进行分类:
S(strategies)
▪ S(strategies) :博弈的进程,也是 博弈进行的次序。它规定什么人在 什么时候选择什么行动。因此,战 略是参与人的 “相机行动方案” (contingent action plan)
▪ 分类:根据后行动的人是否能够看 到先行动人的具体行动
静态博弈 动态博弈
行动与策略的区别?
▪ 行动是指参与者可能有的具体行动 ▪ 战略是行动的规则而不是行动本身
毛泽东:
人不犯我我不犯人 人若犯我我必犯人
敌进我退 敌退我追 敌驻我扰 敌疲我打
I(information)
▪ I(information) :博弈信息。指的是 参与人在博弈中的知识,特别是有关 其他参与人(对手)的特征和行为的 知识