二零一零学年 春季学期 《博弈与社会》第1次习题课
2016博弈与社会第一次作业

(2()(1)B(erCtr结oaun果rdn来o竞挑t 竞战争这争,一,或政或价策。产格教量竞授竞思争争考)再)奶三奶,茶茶称M赞MM了M学和生和奶们奶的茶茶团G结GG精G神都想,同通给时过了所奶喜有茶欢人的上。供了有应价网量友格来评战论进的行方P式K。,即
不是他选们择同产时说量选,而择这个自是事己选例提择是供人奶们的茶通奶的过茶合价作数格成量。功Q打这1破和下“囚Q可徒2困,乐境以坏”的求了尝得顾试最。客大另,有的他一利些们润网总。友是请惊呼光问,顾这这次价些同竞格学争更对博于低弈的的那纳家什店。 当然均,衡如是果什彼两么此家?而言价这真格个是均一最靠衡样谱是,的否顾队可友客。以就由会重任复选剔一除家被店占购优买战。略请的问过,程在达这到?个价格战 的博弈中,纳什
均衡又是什么?给出均衡时两家的产量,市场的价格,以及利润状况。这个均衡是否可以由
URV 请问,为什么 S2i2` 6`ƺ?HB+? 教授的给分策略会让学生陷入“囚徒困境”? UkV 你认为,在这个事件中,学生为什么可以打成合作,成功突破“囚徒困境”? UjV 如果 S2i2` 6`ƺ?HB+? 教授坚持想要用以上策略给分,那么你能否给教授支个招,让学生 自愿参加考试,重回“囚徒困境”?
9
博弈与社会第一次作业
请于 kyRe 年 9 月 Rk 日提交本次作业!
R、 U战争与和平V 假设两个博弈参与人生活在“丛林法则”之下,每一个参与人都可以选择“战争” 与“和平”,并且其支付矩阵如下所示:
参与人 k 和平 战争 参与人 和平 j,j R,9 R 战争 9,R k,k URV 请问,这个博弈类似于教材中提到的哪类博弈? UkV 这个博弈有几个纳什均衡?它是帕累托最优的吗? UjV 出于对“战争”状况下人民福祉的忧虑,霍布斯建议采用“利维坦”来终结战争状态,即“把 大家所有的权利和力量托付给某一个人或一个能通过多数人的意见把大家的意志化为一个意 志的多人组成的集体。”由于“利维坦”拥有惩罚“战争”的力量,因此可以协调人们走出战争,迎 来和平。我们假设,如果在上述博弈中,参与人们通过契约建立了“利维坦”。如果某人发动战 争,“利维坦”会对其施加惩罚,且惩罚力度为 P UP > 0V。因此,博弈变成了如下形式:
博弈与社会第次习题课

0.64×8+0.36×8= 8
0.64×8.053+0.36 ×8.053=8.053
0.64×8+0.36×8= 8
×9.71+0.36× 4.93=7.99
在状态平面上刻画风险问题
横轴表示第一种状态下的收入,比 如不出事的时候,纵轴对应于第二 种状态,比如出事的时候。
45度线上表示确定性情况,因为
恰当的区分点取决于低能力工人的可行选择
工资水平
低水平工人能否可 以主动选择不参加考试 是问题的关键,也就是 决定了低水平工人的保 留效用
34
圆周率百位数
如果可以放弃:6-(1+θ)=2,θ=3 本题标准答案:6-(1+θ)=1,θ=4
任何为难低能力工人的举动都会同时损 害高能力工人的利益
思考1:强者的自负
0.81×6.485+0.19 ×6.485=6.485
0.81×6.4+0.19×6 .4=6.4
0.81×9.43+0.19× 2.43=8.1
0.81×9+0.19×9 =9
0.81×8.053+0.1 9×8.053=8.053
0.81×8+0.19×8 =8
0.81×9.71+0.19 ×4.93=8.8
无论发生什么状态收入都相等。 如何画出风险中性的消费者与风险
状 态
规避的消费者的无差异曲线? 下
U线=上pu的(w点2)效+用(1水-p)平u(都w相1),同无(差等异于曲 一个常数),取全微分:
的 收 入
p风u险’(w中2)性dw者2+的(1效-p用)u函’(w数1是)d线w1性=0的,
第1章 博弈与社会

以两人社会为例
B 的 收 入
X 。
X和Y都是帕累托最优状态, 但Z不是帕累托最优状态 。 Y
Z 。
A的收入
帕累托改进与帕累托标准
• 定义:一种变革没有使任何人的处境变坏,至 少有一个人的处境变好。 • 如果一种状态不是帕累托最优,意味着存在帕 累托改进的可能。 • 如果社会已经处在帕累托最优状态,就不可能 有帕累托改进的余地。 • 状态X帕累托优于状态Y,如果在状态X下,至 少有一个人的处境比状态Y下更好,而没有任 何人的处境比在状态Y下坏。
Homo economicus vs. Homo sociologicus
• Adam Smith vs. Emile Durkheim • Rational, outcome-oriented; social normoriented, not outcome-oriented:
• “the former is supposed to be guided by instrumental rationality, while the behavior of the latter is dictated by social norms. The former is „pulled‟ by the prospect of future rewards, whereas the latter is „pushed from behind by quasi-inertial forces.
靠右行
1, 1
-1, -1
A
靠 右 行
-1, -1
1, 1
协调与预测
• 协调问题的核心是预测(prediction):
– 预测其他人如何行为;
• 个人行为的基本规则是什么? • 信息:too little knowledge; too much knowledge; fail to use the knowledge; no knowledge can help.
《博弈与社会》第1次作业 (参考答案)

第2页
(3) 用延展式表示这一博弈。(2 分) 解:
2. 妈妈有 3 个孩子,A、B 和 C。一天妈妈发现客厅的台灯被打坏了,她知道只可能
是 3 个孩子在玩耍时,其中之一打坏的 —— 实际上的“罪魁祸首”是 A,但是妈妈不
知道这一点。
不过,比起惩罚打坏台灯的孩子,妈妈更关心事情的真相,她宣布所有 3 个孩子将
(f) 如果在参与人 1 做出选择之后游戏未立即结束,接下来轮到参与人 2 行动,随 后游戏结束;
(g) 如果参与人 1 选择“正面”并且游戏未立即结束,参与人 2 在这时可以选择“向 上 (U)”、“向下 (D)”或者“向一旁 (S)”三者之一:如果他选择“向上”,参与人 1 和 参与人 2 分别获得 9 单位和 6 单位支付;如果他选择“向下”,参与人 1 和参与人 2 分 别获得 3 单位和 1 单位支付;如果他选择“向一旁”,参与人 1 和参与人 2 分别获得 1 单位和 5 单位支付;
(北京航空航天大学校级通识课程 2018 年春季学期) (参考答案)
1. 考虑以下游戏: (a) 有两个参与人,分别记为“参与人 1”和“参与人 2”; (b) 参与人 1 首先行动,他选择“正面 (H)”、“背面 (T)”或者“中间 (M)”三者之
一; (c) 如果参与人 1 选择“正面”,其选择将被参与人 2 直接观察到;但是,参与人 2
(1) 将这一情境视为一个博弈,写出参与人 1 和参与人 2 的全部策略 (2 分)。 解:
参与人 1 只有 1 个信息集,即在游戏一开始时。在参与人 1 的该信息集上,参与人 1 有 3 个可选行动 —— “正面 (H)”、“背面 (T)”或者“中间 (M)”,因此参与人 1 有 3 个策略,分 别记为:
博弈与社会第一次作业

美国纽约郊外某公寓前,一位叫朱诺比的女子在回家途中遇刺。其间,尽管她大声求救,并 且至少有 38 位目击者看到了犯罪经过或听到了呼救,但竟没有一人拨打电话。本题将通过 一个博弈模型来对这个案例进行分析。
街道上的顾客可以决定在哪一家购买奶茶。购买后,他获得的效用为 10-Pi-tx(i=1,2)。
其中 Pi 是奶茶的价格,tx 是交通成本(这里,x 是他距离进行消费的奶茶店的距离,t 是单 位交通成本)。 (i)假设城管规定奶茶 GG 和奶茶 MM 的摊位位置(a 和 1-b)必须是固定的。这时,他们 只能通过价格战来争取消费者。请求出他们各自面对的需求曲线(也就是奶茶价格和销售量 的关系)。在均衡状态下,两人的价格、消费量和利润。 (ii)城管决定放松对摊位的管理。这样,为了争夺市场,奶茶 MM 和奶茶 GG 都可以改变 设摊地点(即他们可以选择 a 和 b)。在给定设摊地点后,他们再同时决定奶茶售价 P1 和 P2。 请问:在均衡时,两人选择的设摊位置各是什么?有人说,对于有缘人,无论是向左走,还 是向右走,他们终究总会在一起。在我们的故事中,这种说法对吗?
3、Braess 悖论 在交通规划中,增加道路建设往往被视为缓解交通拥堵的有效方法。但在 1968 年的一
篇论文中,数学家 Dietrich Braess 却提出了一个令人惊讶的观点,即:在个人独立选择路径 的情况下,为某路网增加额外的通行能力,有时非但不能缓解拥堵,反而会导致路网整体运 行效率的降低。本习题将向你介绍这一著名的悖论。
2、一锤定音?ຫໍສະໝຸດ 新一代“江南才子”唐伯狮、文征白和祝枝海参加由华府组织的绘画大赛,他们提交的
博弈论习题及解答

※第一章绪论§1.21. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?(见教材)2. 分别用规范式和扩展式表示下面的博弈。
两个相互竞争的企业考虑同时推出一种相似的产品。
如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。
企业B推出不推出企业A推出 (400,400) (700,-600) 不推出(-600,700) (-500,-500)3. 什么是特征函数? (见教材)4. 产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子?原因:个体理性与集体理性的矛盾。
例子:厂商之间的价格战,广告竞争等。
※第二章完全信息的静态博弈和纳什均衡1. 什么是纳什均衡? (见教材)2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。
先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。
然后用划线法求出该矩阵博弈的纯策略Nash均衡。
乙甲1 31 2,0 4,22 3,4 2,33. 求出下面博弈的纳什均衡。
乙L R甲U 5,0 0,8 D 2,6 4,5由划线法易知,该矩阵博弈没有纯策略Nash均衡。
由表达式(2.3.13)~(2.3.16)可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。
解:设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)}令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x)作出三条直线,如下图,图中粗的折线,就是F(x)的图象由图可知,纳什均衡点与β1无关,所以原问题化为新的2*2矩阵博弈:由公式计算得:。
博弈论练习1答案.docx
博弈论练习一答案一、名词解释博弈:一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略屮进行选择并加以实施,各自取得相应结果的过程。
零和博弈:所有博弈方在每种策略组合下的得益的总和始终为0的博弈。
完全信息静态博弈:纳什均衡:定义在博弃G = {Si,u\» ••• t }中•知果由各个博弈方的各一个策咯组成的某个策咯组合(对•…,§;)中,任一溥弈方i的策略彳• 都是对其余得弃方策略的组合(彳•・・・•对】,$二,・・・,<)的最佳对策,也即U t (si f V I 八:• $二1 ・•・・♦ $;)$如(斗♦心» $g,$二1 ,•••,$;)对任意%GS,都成立,则称〈sf ,•・•■$:)为G的一个絃纳什均#r w(Nash Equilibrium) 0 混合策略:定义在博弈G= {Si,S H M L▼・•・,%}中,博弈方:的策略空间为S t = {/]「・・,》}♦則博弈方i以概率分布pi =(加>随机在其k 个可选簞略中选择的“策略”,称为一个紀混合策略”,其中0W九<1对j = 1,…M都成止,且伽+…+如=1©纳什定理:无限次廛复博弈民间定理:设G是一个完全信息的赭态博弈。
用(€1»…,弘)记G的纳什均衡的得益■用(心刀表示G的任意可实现得益。
如果竝对任意博弈方i都成立,而5足够换近1,那么无限次重复博弃G(g. 6)中一定存在一个子博弈克美的纳什均衡,各博弈方的平均得益.就是(工],…,X M) o 动态博弈除了各博弈方同时决策的静态博弈以外,也有大量现实决策活动构成的博弈中,各博弈方的选择和行动不仅有先后次序,而且后选择、后行动的博弈方在自己选择、行动之前,可以看到其他博弈方的选择、行动,甚至还包括自己的选择和行动。
这种博弈无论在哪种意义上都无法看作同时决策的静态博弈,我们把这种博弈称为“动态博弈"(Dynamic Games)子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的, 有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一 部分,称为原动态博弈的一个“子博弈”。
博弈论课件习题_PPT课件
(3)
博T 弈 方 1M
L
2,0 3,4
博弈方2 R
4,2
2,3
(4)
这个2×2博弈有两个纯策略纳什均衡(M,L) 和(T,R)。
由于两个纯策略纳什均衡之间没有帕累托效率 意义上的优劣关系,双方利益有不一致性,因 此如果没有其他进一步的信息或者决策机制, 一次性静态博弈的结果不能肯定。由于双方在 该博弈中可能采取混合策略,因此实际上该博 弈的结果可能是4个纯策略组合中的任何一个。
L
M
R
博2 U 3,1
2,2
5,3
M 2,3 1,3
4,1
B 4,5 2,3
3,4
注:首先用严格下策反复消去法简化博弈,其次分析 选择列策略的博弈2的策略;最后求该博弈的混合策略 NE。
10、找出下列得益矩阵表示静态博弈的纳什么均 衡。
博方2
L
M
R
博2 U 4,3
5,1
6,2
M 2,1 8,4
U(s1)= s1 = 10 000- s2。因此s1 = 10 000- s2就是博
弈方1的反应函数。
(3)
博弈方2与博弈方1的利益函数和策略选 择是完全相似的,因此对博弈方1所选择 的任意金额s1,博弈方2的最优反应策略, 也就是反应函数是s2=10 000- s1。
本博弈有无穷多个纳什均衡,所有满足 该反应函数,也就是s1+s2=10 000的数 组( s1,s2)都是本博弈的纯策略纳什 均衡。
开发
甲 公 司 不开发
本国公司利益,有什
么好的方法?
乙公司
开发
不开发
-10,-10
100,0
0,100
0,0
《博弈论习题》课件
完全信息博弈
总结词
研究在所有参与者都拥有完全信息的状态下进行的博弈类型。
详细描述
完全信息博弈中,所有参与者都对其他参与者的策略和收益有完全的了解。这种情况下,参与者能够 准确地评估各种策略的优劣,并做出最优决策。完全信息博弈通常用于分析具有透明度和公正性的竞 争环境。
不完全信息博弈
总结词
研究在至少一个参与者拥有不完全信息的状态下进行的博弈类型。
详细描述
合作博弈强调参与者之间的合作与协商,通过达成协议或联盟来实现共同利益 的最大化。在合作博弈中,参与者通常会考虑对方的利益,寻求一种公平的解 决方案,以实现整体利益的最大化。
非合作博弈
总结词
研究参与者在不描述
非合作博弈强调参与者之间的竞争关系,每个参与者都试图 通过选择最优策略来实现自身利益的最大化。在非合作博弈 中,参与者通常不会考虑对方的利益,而是追求自身利益的 最大化,因此可能存在零和博弈的情况。
纳什均衡的应用实例
1 2
寡头市场
在寡头市场中,企业之间会形成纳什均衡,每个 企业都选择最优的产量策略来最大化自己的利润 。
拍卖
在拍卖中,竞拍者会根据对手的出价来调整自己 的出价,最终达到一个纳什均衡的状态。
3
劳资谈判
在劳资谈判中,工会和雇主会根据对方的策略来 调整自己的策略,最终达到一个纳什均衡的状态 。
博弈论的分类
合作博弈与非合作博弈、 完全信息博弈与不完全信 息博弈、静态博弈与动态 博弈。
博弈论的发展历程
博弈论的起源
博弈论的进一步发展
可以追溯到18世纪和19世纪初的零和 博弈,如国际象棋和围棋的策略。
20世纪50年代以后,博弈论不断拓展 到经济学、政治学、社会学等领域, 成为一门重要的学科。
光华管理学院《博弈与社会》电子教案 课件合集
PROSPECT UTILITY THEORY
• Reference-dependent utility:效用水平定义 在财富的变化上,而非财富的最终状态 上; • framing problem:认知心理学; • non-linear:风险(概率)是非线性的。
• 有限毅力(bounded willpower);
– 如一天工作不能超过2优选择由偏好和约束条件决定:人们 选择的不同可能是由于偏好不同,也可 能是由于面临的约束条件不同,如买 车; • 最优选择在个人边际成本等于边际收益 时达到; • 最优选择会随外生变量的变化而改变。
• 制度性约束:
– 如晚上12点必须熄灯;
关于理性人假设
• 理性人的定义:有一个很好定义的偏好 (well-defined preference);在给定约束下 追求偏好的最大化(maximization) • 偏好是如何形成的? • 关于偏好的假设:
– 完备性(completeness):任何两个可选择的 方案之间都是可比较的; – 传递性(transitivity):(偏好具有一致性)
偏好函数
• 如果偏好满足其他一些假设(特别是连 续性假设),可以定义一个偏好函数或 称效用函数(utility function);
Y
无差异曲线
U = f ( x, y )
• Lexicographic preferences • endowment effect.
A
B X
3
约束条件
• 技术性约束:
2
为什么学习博弈论?
• 博弈论是有关“互动行为”(interactive behavior)的科学
• “A sort of umbrella, or unified field theory for the rational side of social science. It develops methodologies that apply in principle to all interactive situations.”(Aumann and Hart, 1992) • “It provides solid micro-foundations for the study of social structure and social change.”(Jon Elster, 1982)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
乙 C1 甲 R1 10,5
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
15
个人理性——什么是经济学的基本问题? 什么是经济学的基本问题? 个人理性 什么是经济学的基本问题
——稀缺资源的优化配置 稀缺资源的优化配置 ——“经济人”的行为 “经济人” ——我们足够理性吗(关于 preference)? 我们足够理性吗( 我们足够理性吗 )?
9
第1步:剔除“C4” 步 剔除“ ” 无论甲选择什么, 无论甲选择什么,“C4”都不是乙的最优反应,即因为乙是理性的,所 ”都不是乙的最优反应,即因为乙是理性的, 以乙不会选择“ ” 以乙不会选择“C4”。 剔除该策略后博弈的标准式简化为: 剔除该策略后博弈的标准式简化为:
乙 C1 R1 R2 甲 R3 R4 8,10 0,20 20,8 15,15 10,2 0,100 10,5 4,5 C2 5,3 2,10 C3 8,4 15,5
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
18
博弈论最重要的解概念——纳什均衡 纳什均衡 博弈论最重要的解概念
——纳什均衡 纳什均衡 ——纳什均衡为什么重要? 纳什均衡为什么重要? 纳什均衡为什么重要 ——一个例子:古诺均衡 一个例子: 一个例子
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
19
自由提问及答疑
本课程使用以下公共邮箱发布部分材料: 本课程使用以下公共邮箱发布部分材料: E-mail: gameandsociety@ password:2010spring
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
乙 C1 R1 甲 R3 8,10 20,8 10,5 C2 5,3
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
13
第5步:剔除“C2” 步 剔除“ ” 无论甲选择什么, 无论甲选择什么,“C2”这时都不是乙的最优反应,即因为乙知道甲知 ”这时都不是乙的最优反应, 道乙知道甲知道乙是理性的,所以乙不会选择“ ” 道乙知道甲知道乙是理性的,所以乙不会选择“C2”。 剔除该策略后博弈的标准式简化为: 剔除该策略后博弈的标准式简化为:
乙 C1 R1 R2 甲 R3 R4 8,10 0,20 20,8 15,15 10,2 0,100 10,5 100,99 10,5 4,5 C2 5,3 2,10 C3 8,4 15,5 C4 5,3 20,5
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
6
对个体理性非效率的一个改进: “总体理性”(或合作解) ——对个体理性非效率的一个改进: 总体理性” 或合作解) 对个体理性非效率的一个改进
假设A和B的项目都是生产一种世界独有的产品,不可替代。如果A将B 收购,A将获得该产品垄断权。 此时A获得多少的利润? ——此时 获得 单位利润。 此时A获得 单位利润。 此时 获得4单位利润 为什么此时A的利润增加? ——通过收购,A成为垄断者,消除了与 竞争时的外部性,相当于 通过收购, 成为垄断者 消除了与B竞争时的外部性 成为垄断者, 竞争时的外部性, 通过收购 双方合作时的效果(通过产权交易,消除外部性) 双方合作时的效果(通过产权交易,消除外部性1,1
B
合作 不合作
2,2 3,0
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
5
个人理性和帕累托效率: 个人理性和帕累托效率:
该纳什均衡(同时也是占优策略均衡)不是帕累托最优的——可以改进 纳什均衡(同时也是占优策略均衡)不是帕累托最优的 可以改进 到(合作,合作)。 合作,合作)。 为什么——因为 的行为直接损害或增加 的收益,B也同样影响着 。 因为A的行为直接损害或增加 的收益, 也同样影响着 也同样影响着A。 为什么 因为 的行为直接损害或增加B的收益 存在外部性。 存在外部性。
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
8
2. 共同理性 (Common Knowledge of Rationality)
以下是一个博弈的标准式,用重复剔除占优策略(iterated elimination of strictly dominated strategy)的方法求解该博弈的解(预测该博弈的结果)。
A
合作 不合作 0,3 1,1
B
合作 不合作
2,2 3,0
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
4
纳什均衡和一致预期: 纳什均衡和一致预期:
纳什均衡是(不合作,不合作)。 纳什均衡是(不合作,不合作)。 一致预期体现在A认为在自己选择不合作情况下 选择不合作是理性的 一致预期体现在 认为在自己选择不合作情况下B选择不合作是理性的, 认为在自己选择不合作情况下 选择不合作是理性的, 所以, 的信念是合理的 同样B的信念也是合理的 的信念是合理的。 的信念也是合理的。 所以,A的信念是合理的。同样 的信念也是合理的。基于合理信念最终双 方均选择了不合作,一致预期成立并实现。 方均选择了不合作,一致预期成立并实现。
二零一零学年 春季学期
《博弈与社会》第1次习题课 博弈与社会》
Guanghua School of Management Peking University March 28, 2010
主要内容
· 作业(第1次) 作业( 次 · 从个人理性到策略性相互依存 · 提问及答疑
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
2
第1次作业 次作业
1. 理性选择与帕累托效率 (Rational Choices and Pareto Efficiency) )
2. 共同理性 ( Common Knowledge of Rationality )
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
乙 C1 R1 甲 R2 R3 10,5 4,5 8,10 C2 5,3 2,10 20,8 C3 8,4 15,5 10,2
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
11
第3步:剔除“C3” 步 剔除“ ” 无论甲选择什么, 无论甲选择什么,“C3”这时都不是乙的最优反应,即因为乙知道甲知 ”这时都不是乙的最优反应, 道乙是理性的,所以乙不会选择“ ” 道乙是理性的,所以乙不会选择“C3”。 剔除该策略后博弈的标准式简化为: 剔除该策略后博弈的标准式简化为:
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
17
博弈论的几个基本概念
——最重要的概念:策略(strategy) 最重要的概念:策略( 最重要的概念 ) ——策略的基础:信息集 策略的基础: 策略的基础 ——纯策略与混合策略 纯策略与混合策略 ——纳什均衡(一个例子:古诺均衡) 纳什均衡(一个例子:古诺均衡) 纳什均衡
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
7
“反垄断”意义何在?——一个视角 反垄断”意义何在? 一个视角
从这个例子中理解为什么要反垄断?是为了帕累托改进吗? ——消费者的权益在垄断的情况下少于在 和B竞争的情况下,反垄 消费者的权益在垄断的情况下少于在A和 竞争的情况下 竞争的情况下, 消费者的权益在垄断的情况下少于在 断不是帕累托改进,卡尔 希克斯改进 希克斯改进。 断不是帕累托改进,卡尔-希克斯改进。 ——通过反垄断,虽然垄断者的利润减少了,但是消费者的福利增加 通过反垄断,虽然垄断者的利润减少了, 通过反垄断 了,而且社会的总福利扩大了。 而且社会的总福利扩大了。
乙 C1 R1 甲 R2 R3 10,5 4,5 8,10 C2 5,3 2,10 20,8
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
12
第4步:剔除“R2” 步 剔除“ ” 无论乙选择什么, 无论乙选择什么,“R2”这时都不是甲的最优反应,即因为甲知道乙知 ”这时都不是甲的最优反应, 道甲知道乙是理性的,所以甲不会选择“ ” 道甲知道乙是理性的,所以甲不会选择“R2”。 剔除该策略后博弈的标准式简化为: 剔除该策略后博弈的标准式简化为:
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
10
第2步:剔除“R4” 步 剔除“ ” 无论乙选择什么, 无论乙选择什么,“R4”这时都不是甲的最优反应,即因为甲知道乙是 ”这时都不是甲的最优反应, 理性的,所以甲不会选择“ ” 理性的,所以甲不会选择“R4”。 剔除该策略后博弈的标准式简化为: 剔除该策略后博弈的标准式简化为:
2012-4-14
2010 Spring,《Game and Society》 第1次习题课
16
策略性相互依存——博弈论扩展了什么? 博弈论扩展了什么? 策略性相互依存 博弈论扩展了什么
——博弈论研究什么? 博弈论研究什么? 博弈论研究什么 ——博弈论告诉我们什么(为什么博弈论是有用的)? 博弈论告诉我们什么(为什么博弈论是有用的)? 博弈论告诉我们什么 ——我们足够理性吗(关于 common rationality)? 我们足够理性吗( 我们足够理性吗 )? ——从“strategically interdependent”到“essentially 从 ” interdependent” ”