互动博弈论——博弈论平话 2
博弈论平话

博弈论平话王则柯著中信出版社图书在版编目(CIP)数据博弈论平话/王则柯著. —北京:中信出版社,2011.4ISBN 978–7–5086–2656–7I. 博…II. 王…III. 对策论-普及读物IV. F224.32中国版本图书馆CIP数据核字(2011)第017280号博弈论平话BOYILUN PINGHUA著 者:王则柯策划推广:中信出版社(China CITIC Press)出版发行:中信出版集团股份有限公司(北京市朝阳区惠新东街甲4号富盛大厦2座邮编100029)(CITIC Publishing Group)承 印 者:开 本:787mm×1092mm 1/16 印 张:16.75 字 数:160千字版 次:2011年4月第1版印 次:2011年4月第1次印刷书 号:ISBN 978–7–5086–2656–7/F·2245定 价:39.00元版权所有·侵权必究凡购本社图书,如有缺页、倒页、脱页,由发行公司负责退换。
服务热线:010–84849283 http: // 服务传真:010–84849000 E-mail: sales@ author@目录前言·VII第一章 博弈三要素与囚徒困境·1民营书店的价格大战·3我怎样被博弈论吸引·6如此不公平,取胜概率却相等·10囚徒困境与博弈三要素·13从囚徒困境说严格优势策略均衡·16价格大战和双赢对局·19为什么主要讨论非合作博弈·22公共品供给的囚徒困境·25政治家的囚徒困境·28基数支付和序数支付·30美苏争霸的囚徒困境·33第二章 情侣博弈和协调博弈·37情侣博弈和纳什均衡·39情侣博弈的其他例子·42相对优势策略下划线法·45视觉友好的对角排列·48情侣博弈表达的对称性嗜好·51理性人一定自私自利吗?·54不该一律贬斥自利行为·57情侣的拥挤博弈·60默契是协调的一种方式·63劣势策略消去法的讨论·65第三章 简单博弈模型的应用·69智猪博弈和搭便车行为·71为什么大股东挑起监督经理的重任·74猎人博弈和帕累托优势·76斗鸡博弈和航行规则·79银行挤兑的成因和预防·83数据不同,结果各异·86囚徒困境两败俱伤的隐含条件·89禁鸣喇叭与交通顺畅·95串通作弊和风险优势·98营造克己奉公的制度环境·101“最惠客待遇”对谁有利·104风险优势的判定·107说说风险优势的从属地位·110风险厌恶的统计和理论·113| IV | 博弈论平话 |第四章 混合策略与均衡筛选·117扑克牌对色游戏·119混合策略和纳什定理·122寻找纳什均衡的反应函数法·125再说混合策略纳什均衡·130扑克牌讹诈游戏·136慕尼黑谈判模拟·141聚点均衡·143聚点均衡作为共识均衡·146聚点均衡的制度设置·148相关均衡·151商品品牌的“地域连坐”效应·154品牌地域连坐的博弈分析·157抗共谋均衡·161盯着不散伙的共谋·165德国世界杯警方的优势策略·169第五章 零和博弈与霍特林模型·173零和博弈与非零和博弈·175均衡的观察与验证·179纳什均衡与杂货铺定位·183西方两党政治的稳定性和欺骗性·187| 目录 | V |动机和实现不是一回事·191摊贩为什么都往市场门口挤?·193学校门口等出租车的争先行为·196多人博弈的霍特林模型·199对抗性排序·207经济学家的对称性偏好·211第六章 动态博弈和子博弈精炼均衡·215抓钱游戏·217你死我活,还是你好我好·221编排故事,加深理解·224博弈结果依赖制度设置·227树型博弈策略组合的粗线表示·230确定树博弈的纳什均衡·234树型博弈的子博弈·237子博弈精炼纳什均衡·240求解动态博弈的倒推法·244博弈论向自己出难题·247实验经济学和行为经济学·250索引·253| VI | 博弈论平话 |最近四五十年,经济学经历了一场博弈论革命。
博弈论

博弈论博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
生物学家使用博弈理论来理解和预测进化论的某些结果。
博弈论已经成为经济学的标准分析工具之一。
在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。
其中局中人、策略和收益是最基本要素。
局中人、行动和结果被统称为博弈规则。
概念:博弈论定义:我们把动物利用大自然移动的瘾魂,在决策人期待的空间里,形成相对均衡的语文学理论,称为博弈论。
(摘自《博弈圣经》中《人类未知的蓝色档案》一文)。
博弈论(Game Theory)又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。
博弈论又被称为对策论(Game·Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。
在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
博弈论就是研究互动决策的理论,所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。
博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。
此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
博弈基本概念·博弈要素:1.决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。
博弈论平话智慧解读人生

博弈论平话智慧解读人生人生是一场无法回避的博弈,无论我们是意识到还是不自觉地参与其中。
博弈论作为一门研究决策和策略的学科,为我们提供了一种全新的视角来解读和理解人生。
在这篇文章中,我们将探讨博弈论在平话智慧中的应用,以及它对人生的意义和启示。
第一章:博弈论的基本概念博弈论是一门研究多方决策问题的学科,它涵盖了决策制定者之间的相互影响和控制力。
在博弈论中,每个参与者都被视为一个理性的决策者,他们根据自己的利益和预期来制定策略。
第二章:博弈论在人际关系中的应用人际关系是一个充满博弈的领域。
博弈论为我们提供了一些有用的策略和解决方案,帮助我们更好地处理人际关系的挑战。
例如,在合作与竞争的关系中,博弈论告诉我们如何平衡个人利益和集体利益,以达到最佳解决方案。
第三章:博弈论与理性决策理性决策是博弈论研究的核心概念之一。
在人生中,我们经常需要做出各种决策,博弈论提醒我们要基于充分的信息和分析来做出决策,以最大化自己的利益。
然而,博弈论也提醒我们,有时候不完全理性的决策可能会带来更好的结果。
第四章:博弈论与风险管理风险是人生中不可避免的一部分。
博弈论教会我们如何评估和管理风险,以最大限度地减少损失并获得最佳回报。
从个人角度来看,博弈论告诉我们在面对风险时要坚持自己的底线,并尽可能通过合作和谈判来实现双赢的局面。
第五章:博弈论的思维模式博弈论注重逻辑思维和策略规划,培养了我们的决策能力和问题解决能力。
它教会我们关注整体利益而不仅仅是个体的利益,锻炼了我们的团队合作和合作能力。
通过运用博弈论的思维模式,我们可以在人生的道路上更加自信和明智地前行。
结语:博弈论是一门智慧的学科,它帮助我们更深入地理解和解读人生的种种困境和选择。
通过运用博弈论的原理和策略,我们可以更好地处理人际关系、提高决策能力、管理风险,并以更加理性和智慧的方式生活。
在博弈论的指导下,我们可以更加从容地面对人生的挑战,收获更多的成功与幸福。
博弈论平话读书笔记

博弈论平话读书笔记【篇一:博弈论平话读后感】博弈论平话读后感说实话,博弈论是一门比较晦涩难懂的课程。
而在21世纪,随着世界经济一体化的过程,博弈论的发展越见成熟,并且,不止在经济领域,在市场竞争,在政治生活、人际交往等方面均可以运用到。
我读的这本王则柯的《博弈论平话》比较清晰简单的阐述了博弈论的原理。
本书前言,王则柯先生就告诉我们,经济学正进行着一场博弈论的革命,人们对于博弈论表现出了极大的热情。
保罗〃萨缪尔森告诫我们:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解。
”首先,什么是博弈论?王则柯说,博弈论研究的是利益关联(包括利益冲突)的主体人的对局的理论,是分析人们在博弈中的理性行为的理论,是讨论人们在博弈的交互作用中如何决策的理论。
其实,我觉得这段话可以总结为,博弈论研究的就是策略形势。
怎么理解呢?到底哪些范畴需要用到策略形式这一概念呢?比较好排除的是,自由竞争企业是价格接受者,不必担心竞争者的行为;而垄断企业没有竞争者,市场价格由垄断企业的供给和市场的需求共同决定,垄断企业是价格的决定者。
这两者不在博弈论的范畴,那么处于这两者之间的如寡头企业等就要用到策略形式。
比如可口可乐和百事可乐公司,几乎垄断了美国的碳酸饮料的市场,他们之间的斗争,就是受对方影响很大的寡头之间的斗争。
每个博弈者在决定采取何种行动时,不但要考虑到自身的目的和利益,还必须考虑到他的决策对于其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求效用或者收益的最大化。
《博弈论平话》这本书从囚徒困境、价格大战、政治竞选、搭便车行为、扑克牌游戏、超市选址、闹市区打车等我们熟悉的故事和案例,深入浅出地介绍静态博弈、纳什均衡、零和博弈、双赢博弈、子博弈、帕累托优势、理性假设等博弈论的基本概念与方法,阅读起来毫无艰涩之感。
即使你没有什么数学功底,或者说从前没有接触过博弈论,也能很快被他所叙述的一个个故事吸引,这是作者的一种风格。
博弈论课件

博弈论强调参与者之间的互动关系,通过数学模型和理论分析来研究 策略选择和均衡结果。
博弈论的发展历程
博弈论的起源可以追溯到20世纪初,当时数学家和经 济学家开始研究游戏中的策略和均衡。
1944年,冯·诺依曼和摩根斯坦合著的《博弈论与经济 行为》标志着博弈论的诞生。
随后,纳什、泽尔腾和哈萨尼等学者进一步发展了博弈 论,形成了现代博弈论的基础。
商业竞争与合作
商业竞争
博弈论可以用于分析商业竞争中的策略和行为,例如价格战、广告战等。通过 博弈论,企业可以更好地理解竞争对手的策略,制定出更有效的竞争策略。
商业合作
博弈论也可以用于分析商业合作中的策略和行为,例如供应链管理、合资企业 等。通过博弈论,企业可以更好地理解合作伙伴的需求和期望,制定出更有效 的合作策略。
贝叶斯纳什均衡
在不完全信息博弈中,如果所有参与 者都根据自己掌握的信息选择最优策 略,则所有参与者都能获得最大收益 。
静态博弈与动态博弈
01
静态博弈
02
动态博弈
所有参与者在同一时间点选择策略并获得收益。
参与者的选择有先后顺序,后选择的参与者可以观察到先选择的参与 者的策略和收益。
03
纳什均衡
纳什均衡的定义
博弈优化方法
线性规划
线性规划是一种数学优化方法, 用于找到在满足一组约束条件下 最大化或最小化目标函数的最优
解。
非线性规划
非线性规划是数学优化的一种方 法,用于找到一组变量的最优值 ,使得一个或多个目标函数达到
最优。
动态规划
动态规划是一种通过将问题分解 为相互重叠的子问题来解决问题 的方法,每个子问题的解被保存
博弈论课件
汇报人:
汇报时间:202X-01-04
读书笔记--博弈论平话

无时不刻地博弈——《博弈论平话》读后感焦嘉程博弈论的目的在于巧妙的策略,而不是解法。
学习博弈论的目的,不是为了享受博弈分析的过程,而在于赢得更好的结局。
博弈的思想既然来自现实生活,它就可以高度抽象化地用数学工具来表述,也可以用日常事例来说明,并运用到生活中去。
博弈时时存在,它就在你的身边。
阅读本书,我们除了了解到令人震撼的社会真实轨迹之外,还可以学到最合适的为人处世方法。
世界经济一体化的发展。
伴随进行的,是大众传媒中经济术语的一体化。
现在,人们对于“零和博弈”、“囚徒困境”、“双赢对局”这些本来属于博弈论(game theory)的专门术语,已经耳熟能详。
难怪“当代最后一个经济学全才”保罗·萨缪尔森(Paul Samuelson)教授,在他生命的最后年月,告诫我们说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解。
”博弈论研究还表明,人们的社会行为和市场行为,常常不能够归结为彻底的“理性行为”,由此兴起的实验经济学在本书中也有反映。
保罗萨缪尔森告诫我们:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解。
”商业竞争、政治选举、职场生存、婚姻经营、朋友相处,就像两人对弈,常常是相当人格化的竞争。
一方的行为,对对手的影响很大,一方的利益,又受到对手行为的很大牵制。
这种面临不确定性的决策,固然需要斗智斗勇,但其中也有规律可循。
博弈论便是讨论利益关联的各方如何决策制胜的学问。
这本书是从囚徒困境、价格大战、慕尼黑谈判、诺曼底战役、所罗门王断案入手,初步介绍博弈的描述,寻求纳什均衡的方法,并且展示双赢对局、先动优势、后动优势、承诺和威胁及其可信性等概念,以及信息在博弈中的作用。
循着作者娓娓道来的博弈论故事,你不必具有很好的数学基础或掌握系统的经济学知识,就可以初步领会博弈论的真谛,在商业活动和日常生活中作出理性选择。
那样,“双赢”和“共赢”的结局会更多,损人不利己的后果会更少。
平话博弈论

表一
和尚三打水
打水 和尚一 打水 不打水
和尚二
不打水
(2,2,2) (-1,2,-1) (2,-1,-1) (2,2,-1) 表二
和尚三不打水 打水 和尚一 打水
和尚二 不打水
(-1,-1,2) (-1,2,2)
不打水
(2,-1,2) (0,0,0)
表一中,和尚二打水时,和尚一打水与不打水的支付相同,都是2个单 位;和尚二不打水时,和尚一的占优策略是不打水;综上所述,不管和尚 二打水不打水,和尚一打水的策略是弱策略,因此,和尚一会选择不打 水。按照同样的道理分析,则仍然得到和尚一和尚二都不打水的结局。 综合表二表三,给定其余两个和尚不打水,则和尚三的最优策略仍然是 不打水。这就是说,对于每个和尚,他们都不存在打水的内在动力。
同案囚徒中的每个囚徒所作出的他认为最好的选择,并不是这些囚徒整体上所能够得到
的最好选择。
”
“
囚徒困境的不同思考
假设针对对象变为警方的话,定罪效益5,逃脱效益-4,定轻罪效益-2
A
B
坦白 10
抵赖 1
坦白
抵赖
1
-4
可见,在社会整体层面看来,尽管囚徒困境对囚徒们不利,但却恰恰对社会本身有利。
”
看不见的手——市场调节
“
亚当· 斯密在《国富论》中提出的"看不见的手" 应该代指市场的自我调节能力和价格机制。
市场在无人操控的情况下,在人类最基本的逐 利思维的共同驱使中,市场获得类似自然界的 自我调节能力(适度的),即自我调节能力和价格 机制。
”
02
《美丽心灵》与博弈论
《美丽心灵》与博弈论
邀请美女跳舞
“ 亚当斯密:个体对于自己利益的最大追求,会导致全社会也达到利益最大化。
平话博弈论

2. 生活中的“囚徒困境”例子
例1 商家价格战
出售同类产品的商家之间本来可以 通过共同将价格维持在高位而获利,但 实际上却是相互杀价,结果都赚不到钱。 当一些商家共谋将价格抬高,消费 者实际上不用着急,因为商家联合维持 高价的垄断行为一般不会持久,可以等 待垄断的自身崩溃,价格就会掉下来。
东北林业大学 王威
东北林业大学 王威
博弈论是一门十分有趣但理论上又 是十分艰深的学问,我今天打算用一些 大家能够凭直观或简单分析就能把握的 例子为大家介绍博弈论的基本概念及应 用,以引起大家对这门目前已成为热门 科学的兴趣,并有初步的了解。这些例子 也是我们在日常生活中经常所遇到的问 题或观察到的现象,通过博弈论,我们 能够更加深刻地理解它们。
表3 交通博弈 司机2 缓行 缓行 司机1 抢行
8,8
9, 1
1,9
-2,-2
抢行
东北林业大学 王威
但当对方缓行时,自己抢行会占便 宜,获得支付9。 这个博弈中,“缓行”是劣战略, 剔除后得到“剔除劣战略后的占优战略 均衡”(抢行,抢行),这不是一个好的 均衡。当禁止鸣喇叭时,司机为了避免 造成交通事故,只得缓行,从而得到好 的结果(缓行,缓行)。
东北林业大学 王威
1996年,两位将博弈论应用于不对 称信息下机制设计的经济学家莫里斯 (Mirrlees)和维克里(Vickrey)、以及2001 年三位经济学家阿克洛夫(Akerlof)、斯 蒂格利茨(Stiglitz)和斯宾塞(Spence)因运 用博弈论研究信息经济学所取得的成就 而成为这两个年度的诺贝尔经济学奖得 主。
东北林业大学 王威
如果其他牧民约束放牧规模,我单 独一家人过度放牧不会破坏广褒的牧场, 但自己却获得了高额的收益。因此,任 何一位牧民的结论都会是:无论其他牧 民是否过度放牧,我选择“约束自己的 放牧规模”都是劣战略,从而被剔除。 大家最终都会选择过度放牧,结果导致 草地消失,生态破坏。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设市场份额一定,由于策略措施不同,通过预测,两企业市场占有分 析变动情况如上表所示。
12
求解方法之一:最小最大法——安全第一法
乙企业战略 1 甲企 战略 1 2 3 10 12 6 12 2 -1 10 8 10 3 3 -5 5 5 -1 -5 5 5
最小值
最大值
13
设有一矩阵对策,求均衡局势(对策)
30
在一个博弈里,如果所有参与人都有占优策略
存在,那么占优策略均衡是可以预测到的唯一的均衡, 因为没有一个理性的参与人会选择劣策略。
31
完全信息静态博弈
例1:囚徒困境 (prisoner’s dilemma)
囚徒2
坦白 -5,-5 -8,0 抵赖 0,-8 -1,-1
囚徒1
坦白 抵赖
思考求解方法的差异:
当解不唯一时,解之间的关系有两个性质: 1)无差别性; 2)可交换性。
此时,局中人可以不依赖于其他人的纯策略,而 选择构成解的最优策略。
17
作业1:求解下列矩阵对策
9 6 2 5 3 9 3 5 4 6 2 6 1 4 3 2 3 4 8 0 6 7 3 8 2 1 5 4 8 8 0 4 2 1 2 4
A
18
案例:
乙企业战略 1 甲 企 战 略
最大 值
最小值
乙企业战略 1 2 -1 10 8 10 3 3 -5 11 11
最小值
2 -1 10 8 10
3 3 -5 5 5 -1 -5 5 5 甲企 战略 1 2 3
1 2 3
10 12 6 12
10 12 6 12
-1 -5 6 无鞍点
最大 值
23
求解矩阵对策的其他方法
——2×2对策的公式法 ——2×m或n×2对策的图解法 ——迭代法 ——线性规划法(基本方法)
总思路: 首先判断是否存在鞍点,当鞍点不存在时,利用优超原则 与方法将原对策的赢得矩阵尽量简化,然后再利用其他方法进 行求解。
24
作业2:
利用优超法求解下列矩阵对策
A
3 5 7 4 6
4 0 3 6 0
0 2 9 8 8
3 0 5 9 5 9 7 6 8 3
25
解:用优超法化简
A
3 5 7 4 6
2 0 3 6 0
0 2 9 8 8
X 1-X
3 0 5 9 5 9 7 6 8 3
A
7 3 4 6
y
1-y
26
E
X
1-x
7 4
3 6
y 1-y y 1-y
E
7x+4(1-x)
解得X3*=1/3,X4*=2/3 y1*=1/2,y2*=1/2 则原对策矩阵的一个解是: X*=(0,0,1/3,2/3,0) y*=(1/2,1/2,0,0,0) 期望赢得值为5
22
思考:混合战略的现实意义?
齐王与田纪赛马博弈的混合均衡
齐王的赢得矩阵:
3 1 1 3 A 1 -1 -1 1 1 1 1 1
6-3x-2y+6xy
令 E x 3 6 y 0 则得到 y 1 / 2
3 6 y
E y
2 6 x
令
E y
2 6 x 0 则得到 x 1 / 3
A
3 5 7 4 6
2 0 3 6 0
0 2 9 8 8
3 0 5 9 5 9 7 5.5 8 3
5
策略式表达又称为标准式表达,在这种表 达中,所有参人同时选择自己的策略,所有参 与人选择的策略一起决定每个参与人的得益。 值得强调的是,这里参与人同时选择的是 “策略”,而不是“行动”。 在静态博弈中,由于参与人只选择一次,所 以策略就等同于行动。而在动态博弈中,策略 是参与人在各个阶段的行动的全面计划。
原因:局中人乙选择了策略2,使局中人甲得到了更多的赢得(8-(-1)(11-6)=4),所以对乙来说,策略2不是最优策略。 此时,双方的策略是局中人甲与乙策略集中的一个概率分布,即混和策略 (纯策略是混合策略的特例)。混合策略的采用是使双方得到的期望效用相同。
19
称G*={S1*,S2*,E}为对策G的混合扩充。E(x,y)=xTAy,此时的 博弈均衡局势是使
8
3
博弈的得益矩阵表示
一个博弈被称为有限博弈,如果:
第一,参与人的个数是有限的;
第二,每个参人可选择的策略个数是有限的。
有限博弈的策略式表达及其求解可以用得益矩阵直观地给出。
9
第二讲 完全信息静态博弈
序 一 二 基本概念简介 两人有限零和对策问题的解法 两人有限变和对策问题的解法
10
一 两人有限零和对策问题的求解
局中人II的策略
e
f
g a b c d
A
6 3 9 -3
1 -8 2 4 -1 -10 0 6
局 中 人 I 的 策 略
14
矩阵对策的均衡局势(f,b)
局中人II的策略
e
f
g a b c d
A
6 3 9 -3
1 -8 2 4 -1 -10 0 6
局 中 人 I 的 策 略
15
规律:如有
max min a ij min max a ij a i
最小最大法(安全第一法)与优超法在有限非零和博弈中的适用性?
32
对比:鞍点不存在时,求解两人有限零和对策问 题的方法之二—优超法
A
3 5 7 4 6
2 0 3 6 0
0 2 9 8 8
3 0 5 9 5 9 7 5.5 8 3
A
7 3 4 6
33
无占优策略均衡 的经典博弈模型
智猪博弈
按
大 猪 按 等待
3x+6(1-x)
E [7x+4(1-x)]y + [3x+6(1-x)](1-y) E
E x
6-3x-2y+6xy
令 E x
E y
3 6 y
3 6 y 0 则得到 y 1 / 2
E y
2 6 x
令
2 6 x 0 则得到 x 1 / 3
A
3 5 7 4 6
2 0 3 6 0
0 2 9 8 8
3 5 5 7 8
0 9 9 6 3
解得X3*=1/3,X4*=2/3 y1*=1/2,y2*=1/2
则原对策矩阵的一个解是: X*=(0,0,1/3,2/3,0) y*=(1/2,1/2,0,0,0) 期望赢得值为5
27
二 两人有限变和对策问题的求解
1 2
11
案例:
乙企业战略 1 甲企 战略 1 2 3 10 12 6 2 -1 10 8 3 3 -5 5
甲乙企业生产同一种电子产品,两企业均线通过改进管理获取更多的市 场销售份额。其中:
甲企业中的战略1代表降低产品价格;2 提高产品质量;3 推出新产品 乙企业中的战略1代表增加广告费用;2 增加位球王点;3 改进产品性能。
求解方法: 1 占优策略均衡; 2 严格劣策略的重复剔除;
对比:
两人有限零和对策问题的求解方法
3 纳什均衡(基本方法);
4 箭头法。
1)安全第一方法 2)优超法 3)2×2对策的公式法 4)2×m或n×2对策的图解法 5)迭代法 6)线性规划法(基本方法)
几个经典模型:
囚徒困境
坦白
囚徒1 坦白 -5,-5 -8,0
小猪
等待
1 1 3 1 -1 1
1 1 1 3 1 -1
1 -1 1 1 3 1
-1 1 1 1 1 3
A没有鞍点,只有最优混合策略: X*=(1/6,1/6,1/6,1/6,1/6,1/6) y*=(1/6,1/6, 1/6,1/6,1/6,1/6) 对策的值(对齐王而言):1
意义:当矩阵对策不存在鞍点时,竞争双方在开局前 均应对自己的策略加以保密,否则不保密的一方要吃亏。
0,-8 -1,-1
大 猪
按 等待
5,-1 9,-1
抵赖
性别战
足球 男 足球 芭蕾 2,1 0,0
女 芭蕾
斗鸡博弈
进 0,0 1,2 A 进 退 -3,-3
B 退 2,0
0,2
0,0
29
纳什均衡
1、占优策略均衡。一般来说,由于每个参 与人的得益是博弈中所有参与人的策略的函数, 因此每个参与人的最优策略选择依赖于所有其他 参与人的策略选择。但在一些特殊的博弈中,一 个参与人的最优策略可能可以不依赖于其他参与 人的策略选择,就是说,不论其他参与人选择什 么策略,他的最优策略是 唯一的,这样的最优 策略被称为“占优策略”。 如果一个博弈中,某个参与人有占优策略, 那么该参与人的其他可选择策略就被称为“劣策 略”。
互动决策论---博弈论平话 马小琪
黑龙江大学信息管理学院
1
博弈分析前要明确的几个问题
1 博弈视角?
(局中人还是局外人)
2 如何进行博弈分析?
(除了确定博弈要素之外还需要博弈分析方法)
3 博弈分析的难点? (对现实的贴近描述→分析的框架的作用) 4 均衡的现实含义?
(均衡与均衡结果的差异)
5 博弈分析是否能够完全预测博弈结果?
进 不进 (0,400) 在位者 在位者 (0,300) 打击 打击 (40,50) (30,80) (-10,100) (-10,0) 7
[1-P] 进
策(战)略式的表述:
1 、 博 弈 的 参 与 人 集 合 : i∈Γ , Γ=(1,2,…, n); 2、每个参与人的战略空间:Si i = 1,2,3,…,n; 3、每个参与人的得益函数:ui(s1, …, si…,sn),i=1,2,3, …,n。 用G={S1,…,Sn;u1, …,un}代表战 略式表述博弈。