第七讲(多人博弈)
博弈论完整版PPT课件

2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
第七讲 信息与博弈

从博弈论的角度,博物馆通过收费的形 式,把真正的科学爱好者、艺术爱好者与所 谓的“闲杂人员”甄别开来,以更好地保证 优质服务。
指鹿为马
赵高想要叛乱(篡夺秦朝的政权),恐怕各位 大臣不听从他,就先设下圈套设法试探。于是带来 一只鹿献给秦二世,说:“这是一匹马。”二世笑 着说:“丞相错了吧?您把鹿说成是马。”问身边 的大臣,左右大臣有的沉默,有的故意迎合赵高说 是马,有的说是鹿,赵高就在暗中假借法律中伤 (或陷害)那些说是鹿的人。以后,大臣们都畏惧 赵高。
赵高所采用的方法其实就是信息甄别的 一个典型选择。
保险公司通常要求潜在的投保人从各种具有不 同的免责条款和共同保险条款的方案中进行选择, 风险较小的投保人就会偏好于保险费较低但要求其 本人承担大部分风险的方案,而那些知道自己有较 高风险的投保人则会选择保险费较高而本人承担风 险较少的方案。这样,方案选择便反映出投保人的 风险类型。
上市公司的过度分红
在很多国家,政府对红利征税的税率比资本增 值的税率要高,通常政府对红利征税两次:一次对 公司,一次对个人,而对资本增值只对个人征税一 次。 因此,利润再投资自然比分红更符合股东利益, 但很多公司仍然热衷于分红。
公司的管理层与股民之间信息是不对称,他们 比股民更清楚地知道公司的真实业绩。在这种情况 下,业绩好的公司就采取多发红利的办法来向股民 发出信号,以区别于业绩不好的公司,而后者发不 出红利。 证券市场对分红这一信号的回应是股价上升, 从而补偿了股民因为分红交纳较高的税而蒙受的损 失。
在博弈中,往往会出现某些参与者所知 道的信息而另一些参与者并不知道的情况, 这种信息就是拥有信息一方的私有信息。正 是因为私有信息的存在,才导致了“信息不 对称”。
罗斯柴尔德家族的“凯旋门”
浙大《博弈论基础》蒋文华 第七讲 最后通牒和讨价还价

眼光的高度
请问:您最大的人 视野的宽度
生目标是什么? 5年后,10年后,
思维的深度
目标
20年后,30年后?
与时俱进
子
问
目 标
题
方法
踩空
现实
时间
抬头看山、低头走路
浙江大学校训
诸位来到这里,有两个问题需 要好好回答:一个是你到这里来 干什么?另一个是将来你将到哪 里去?
——竺可桢
特别提示:
“磨刀不误砍柴功”,误与不误, 取决于你想要砍多少柴!
三个道理:
第一,人们在决定其行动时,并不会仅仅 考虑到其经济利益,虽然这可能是最主 要的一个考量,他们也会考虑一些道德 和社会规范,比如公平原则,“己所不 欲,勿施于人”。
三个道理:
第二,一个社会如果在制度安排上能够 给人民更多可以拒绝(可以说“不”) 的权利,那么这个社会就会产生更多的 公平性,甚至会带来更多的效率改善。
提出分配方案
出价 X%
接受
(1-X,X) 拒绝 (0,0)
如果总金额是10万元,你的分配方案是多少?
第二节 最后通牒的实验结果
实验表明,大多数A分配给B的钱在40-50 元之间,给50元以上的情况极少见,如果 分配数量小于20元,方案被拒绝的概率很 高(约40%-50%),拒绝的可能性随着钱 数的减少而不断增大。
第三节 独裁者博弈
一、独裁博弈的设计
两人一组分100元,提议者提出分配方案,分 给响应者X元,留给自己100-X元;而无论响应 者同意与否,提议者都将得到自己的100-X元。 显然,此时提议者不会遭遇响应者的任何威胁。 基于纯粹利己的标准的博弈理论所得到的结果 将是提议者分给响应者0元(X=0)。
第二节 贴现因子
博弈论经典多人博弈

博弈论经典多人博弈艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。
也就是说,个人可以完全按照自己利益最大化的企图进行决策。
在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。
社会实践中有很多合作的问题。
比如国家之间的关税报复,对他国产品提高关税有利于保护本国的经济,但是国家之间互提关税,产品价格就提高了,丧失了竞争力,损害了国际贸易的互补优势。
在对策中,由于双方各自追求自己利益的最大化,导致了群体利益的损害。
对策论以著名的囚犯困境来描述这个问题。
A和B各表示一个人,他们的选择是完全无差异的。
选择C代表合作,选择D代表不合作。
如果AB都选择C合作,则两人各得3分;如果一方选C,一方选D,则选C的得零分,选D的得5分;如果AB都选D,双方各得1分。
显然,对群体来说最好的结果是双方都选C,各得3分,共得6分。
如果一方选C,一方选D,总体得5分。
如果两人都选D,总体得2分。
对策学界用这个矩阵来描述个体理性与群体理性的冲突:每个人在追求个体利益最大化时,就使群体利益受损,这就是囚徒困境。
在矩阵中,对于A来说,当对方选C,他选D得5分,选C只得3分;当对方选D,他选D得1分,选C得零分。
因此,无论对方选C或D,对A来说,选D都得分最多。
这是A单方面的优超策略。
而当两个优超策略相遇,即A,B都选D时,结果是各得1分。
这个结果在矩阵中并非最优。
困境就在于,每个人采取各自的优超策略时,得出的解是稳定的,但不是帕累托最优的,这个结果体现了个体理性与群体理性的矛盾。
在数学上,这个一次性决策的矩阵没有最优解。
如果博弈进行多次,只要对策者知道博弈次数,他们在最后一次肯定采取互相背叛的策略。
既然如此,前面的每一次也就没有合作的必要,因此,在次数已知的多次博弈中,对策者没有一次会合作。
多群体演化博弈均衡的渐近稳定性分析及其应用

多群体演化博弈均衡的渐近稳定性分析及其应用毕业论文标题1:群体演化博弈的基本理论和方法群体演化博弈是博弈论中的一种经典模型,其理论和方法已被广泛应用于社会、经济、生物学等领域。
本文首先介绍了群体演化博弈的基本理论,包括博弈矩阵、策略演化规则、博弈过程等关键概念。
随后,对利用演化博弈解决各类艰难问题的方法进行了详细描述。
最后以经典的“囚徒博弈”为例,说明了群体演化博弈所能提供的分析和预测能力。
群体演化博弈的理论和方法,是理解和应用群体行为的关键。
运用群体演化博弈模型可以模拟和预测自然和社会群体的行为变化,有助于研究决策制定的规律,以优化价值最大化的效果。
毕业论文标题2:多群体演化博弈的模型构建与分析本文主要研究在多个群体互相作用的情况下,多群体演化博弈的模型。
首先,通过对博弈矩阵和策略演化规则进行修正,构建了一个新的博弈模型。
然后,对该博弈模型中的各种策略演化规则进行了分析、比较,得出了策略演化路径的影响因素,并研究了不同演化路径所对应的群体策略和演化动态。
多群体演化博弈模型的研究和构建,有助于更好地理解多群体群体行为并进行预测。
此外,多群体演化博弈模型可以帮助制定群体调控方案,以更好地引导群体行为。
毕业论文标题3:博弈背景下的社会网络研究本文首先介绍了社交网络的基本理论,包括社交网络结构、社交网络度量、社交网络模型等基础知识。
然后,通过建立社交网络与博弈之间的关系,探讨了社交网络研究在博弈背景下所发挥的作用,并解释了社交网络对博弈演化和均衡的影响。
最后,结合聚类分析和仿真实验等方法,探讨了社交网络中不同因素对博弈策略的影响。
社交网络与博弈理论的结合,可以帮助更好地了解人类行为的规律。
在特定的博弈规则下,不同的社交网络结构和属性可以促进/阻碍策略的演化和均衡的保持。
社交网络与博弈的研究,对于了解社会现象的本质、制定公共政策等方面有着重要的指导意义。
毕业论文标题4:演化博弈模型在市场竞争中的应用本文主要研究了群体演化博弈模型在市场竞争中的应用。
基于神经网络的多人博弈智能决策模型

基于神经网络的多人博弈智能决策模型引言:多人博弈一直是人工智能领域中的一个重要研究方向。
博弈中的每个参与者都追求自己的利益,并考虑其他参与者的策略。
为了使智能体在多人博弈中做出最佳决策,神经网络成为一种非常有潜力的工具。
本文将介绍一种基于神经网络的多人博弈智能决策模型,并探讨其在实际应用中的潜力。
1. 引言多人博弈是指涉及多个决策者的决策过程。
决策者需要权衡自己的行动以及其他参与者的行动,以达到最佳结果。
传统的多人博弈理论主要依赖于数学模型和博弈论的方法来解决这个问题。
然而,随着神经网络的兴起,开发基于神经网络的决策模型已经成为一个热点研究领域。
2. 神经网络与多人博弈神经网络是一种模拟人脑神经元网络的计算模型。
它由多个节点(神经元)和连接节点之间的权重(突触)组成。
神经网络通过学习数据的模式和规律,能够预测未知数据的结果,并做出相应的决策。
在多人博弈领域,神经网络被用来建立参与者的决策模型。
3. 多人博弈智能决策模型基于神经网络的多人博弈智能决策模型包括以下步骤:3.1 数据收集与处理首先,需要收集多人博弈中的相关数据。
这些数据可以包括参与者的历史决策,游戏规则,以及其他相关信息。
然后对这些数据进行预处理,包括特征提取和归一化等方法。
3.2 模型训练接下来,使用收集到的数据训练神经网络模型。
训练过程可以通过监督学习、强化学习或生成对抗网络等方法进行。
在训练过程中,模型会通过调整网络参数来最小化预测结果与真实结果之间的差异。
3.3 决策预测与优化一旦模型训练完成,可以使用该模型来预测每个参与者的决策。
神经网络能够通过学习和总结历史数据中的模式来做出决策。
同时,模型还可以通过优化方法对决策进行调整,以达到更好的结果。
4. 实际应用与潜力基于神经网络的多人博弈智能决策模型在实际应用中具有广泛的潜力:4.1 社交网络分析社交网络中存在大量的多人博弈场景,例如社交媒体上的舆论引导、政治选举等。
基于神经网络的决策模型可以帮助分析参与者的策略,并预测结果。
第七讲 当前大国关系调整的新态势新特点新趋势

第七讲当前大国关系调整的新态势新特点新趋势北京国际问题学者洪成程教学目的: 2008年国际金融危机以来,美国、俄罗斯等大国对外政策酝酿新的调整,大国关系进入了一个深度调整期。
大国力量对比发生重要变化,越来越多的新兴大国在大国关系中发挥日益重要的作用,以欧美为中心的大国关系地缘重心面临调整,尤其是近期,美、俄、欧围绕乌克兰危机进行了多轮博弈,地缘战略博弈进一步加剧。
当前大国是合作多于角力,还是碰撞多于握手?大国关系调整过程中呈现什么新态势,对世界格局有哪些趋势性影响?通过教学,要让大学生认清大国关系的复杂性,调整、碰撞、依存是大国相处之道。
课程内容: 1.世界主要大国调整新态势2.当前大国关系调整的新特点3.当前大国关系调整的趋势性影响大国关系历来是牵动世界和平与发展的重要因素。
冷战结束以来,尤其是2008年国际金融危机以来,经济全球化、社会信息化、世界多极化深入发展,大国关系经历新一轮深刻调整。
各主要大国因应全球战略环境深刻变化,着眼增强综合国力和国际竞争力,纷纷推进对外战略调整,在政治上分化重组、经济上融合竞争、文化上交流交锋,形成既竞争制约又合作协调的大国关系态势,对今后一个时期国际和地区格局产生深远影响。
一、世界主要大国关系调整新态势1.美俄关系在起伏跌宕中重新走向较量冷战时期,苏美关系是影响重大国际地区事务走向的主要因素。
冷战结束后的俄美关系,其重要性、特殊性虽有所下降,但仍是当代国际关系中最重要的双边关系之一,其走势始终牵动国际战略全局。
苏联解体后,美俄两国对发展相互关系曾寄予期望,采取了一系列相关政策和措施,两国关系出现了短暂的“和谐”。
但从1994年开始,美囤通过北约东扩压缩俄罗斯的地缘战略空间,策动“颜色革命”推动原苏联国家的“民主化进程”,鼓励有关国家对俄罗斯的“离心倾向”,在欧洲分阶段部署导弹防御系统。
这些举动一再打击俄罗斯的西靠热情,导致美俄关系逐步趋冷。
2001年“9.11”事件发生后,美国反恐战争得到了俄罗斯积极支持,美俄关系迅速回暖。
第7讲不确定性与博弈论

• 大自然的变化无常等。
2020/11/22
三、减少风险和降低不确定性的方法
(一)投机(Speculation) • 定义——指从市场价格波动中获取利益
的行为。基本做法是:低价买进,高价 卖出;对买进和卖出的商品本身不直接 感兴趣。
• 原理:利用商品在空间上和时间上的价 格和数量差异实现转移,以促进市场功 能更加有效的发挥作用。
定对方 ✓ 监管/不被监管 ✓ 金融信用受到保护(保证金与盯市制度)/无保证
金制度 2020/11/2✓2 很容易被中止(对冲平仓)/通常不可能中止
• 功能(原理): 转移价格风险;(两面下注,相反操作) 形成权威性价格; 调控价格水平; 提高效率、稳定收益。
• 实例:农产品期货交易(玉米商品) (此例的前提是——未来玉米价格看跌)
➢参与人(players) 行动(actions) 信息(information)
➢策略(strategies) ➢支付(payoffs)
结果(outcome) 均衡(equilibria)
行动规则 (Rules of the game)
建模者的目的:在于运用博弈的规则来确定均衡。
2020/11/22
效率(efficiency)、公正(fairness)、
公平(equality)。
区别的实质:建模的途径不同。
2020/(11/合22 作博弈理论是公理性的,非合作博弈更具有经济上的特点)
非合作博弈类型
行动顺序 信息
静态
动态
完全信息
完全信息静态博弈; 纳什均衡; 纳什(1950,1951)
完全信息动态博弈; 子博弈精炼纳什均衡; 泽尔腾(1965)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 根据凯恩斯主义的学说,认为市场中除了存在协 调失败的问题外;同时,预期可能会影响经济的 潜在发展方向。
4 PDF 文件使用 "pdfFactory Pro" 试用版本创建
比例博弈
• 案例:上班的人对交通工具的选择 – 开车或坐公 交车。开车上班的人越多,越会增加交通堵塞, 路上花费的时间也就越长。
– 代表性经济人:上班的人。 – 状态变量:开车的人与坐公交的人的比例。
开车的收益始终高于 坐巴士的收益。因 此,开车在此博弈中 为占优战略。 然而如果所有人都开 车,他们的收益为1.5。这个战略会使 每个人的状况变得更 糟 – 社会两难。
协调博弈
• 还存在“协调失败”的情况:
– 在上面这个博会很糟糕。 – 消费者选择储蓄,而生产者选择简单生产的方式。 – 或是消费者选择消费,而生产者选择迂回生产的方式。
• 那么最终会产生哪一个均衡呢?
– – – – 寻找谢林点。 均衡1会形成经济中最大的潜在产出。 但是谢林点也可能基于以往的经验和预期。 如果生产者预期消费者花的比储蓄的多,消费者预期 生产者会选择产出小的简单生产方式,则也会形成一 个谢林点导致均衡2成为最终的结果。
净收益 第一个人排队 第二个人排队 第三个人排队 第四个人排队 第五个人排队 第六个人排队 18 15 12 9 6 3 预期收益 是否排队? 1/5)+5(1/5)=11 12.5 Yes 11 9.5 8 6.5 5 Yes Yes Yes No No
8(1/2)+5(1/2)=6.5 14(1/4)+11(1/4)+8(1/4)+5(1 /4)=9.5 17(1/5)+14(1/5)+11(1/5)+8(
的次序是随机的。那么每个 人接受如无的系会平等为 1/6。 每个人的期望收益都为: 20(1/6)+17(1/6)+14(1/6)+1 1(1/6)+8(1/6)+5(1/6)=12.5 总收益为75(=12.5×6)。
排队博弈
• “每个人都坐着”不是一个纳什均衡,因为个人可以通过排 队来提高他的收益。 • 然而通过下表我们可以看到,前四个人选择排队是因为其 排队的净收益大于其预期收益。而之后的人将不选择排 队,因为排队的净收益将小于其预期收益。
• 在2/3的左边,坐公交处于不利地 位,会有人转为开车。 • 在2/3的右边,开车处于不利地位, 在上述博弈中,如果交通堵塞使得开车者的收益 会有人转为做公交。 下降速度超过了乘坐巴士者的收益下降的速度。 • 在2/3的点上,没有人可以通过改变 • 那么占优均衡就不存在了,它会有一个纳什均衡。 战略而获利。
– 代表性经济人(representative agent)模型:假设所 有的参与者都是一致的,都具有相同的战略集,并 存在对称收益。
• 然而就像排队博弈中所看到的,虽然这些乘客有相同的 战略选择,但在均衡状态下,他们的处境完全不同。
多人博弈的简化假设
• 追逐博弈:
– 追逐者要在最短的时间抓住被追逐者。 – 追逐者的最佳反映是拉近他和被追逐者的距离。 – 而被追逐者的最佳反映是扩大他和追逐者的距 离。 – 在该博弈中,状态变量是什么? – 追逐者和被追逐者之间的距离。
比例博弈
在下图中,即开车者所占的比例为2/3处。
公共悲剧 (tragedy of the commons)
• 公共悲剧:
– 是指由于人们对公共资源的国度使用,造成了对资源 的破坏,使得所有人的整体收益降低。 – E.g.高速公路对于开车者和坐公交车者是公共资源,然 而开车者对它的使用更为频繁,很容易造成了资源的 “退化”,即交通堵塞。 – E.g.公共牧场
供给、需求和试算法
• 代表性经济人:买方和卖方。 • 状态变量:市场价格。 • 博弈规则:试算法 – 指一个反复试验来决定货物 或服务价格的过程。
– 拍卖商随机喊出一个价格,买方和卖方给出这个价位 上他们愿意购买和卖出的商品数量。如果需求量大于 供给量,拍卖商则再喊一个略高的价格。如果需求量 低于供给量,则拍卖商再给出一个略低的价格。这样 反复调整价格,知道买入的数量等于要卖出的数量。 此时,人们在最终达到的价位上买入和卖出事先声明 的量。这个价位称为均衡价格。 – 在拍卖商找到供需平衡的价位之前,没有人真正的买 入或卖出。
排队博弈
• 该博弈的纳什均衡为:
– 四个人排队,而两个人坐着。 – 除此之外,没有其他的纳什均衡。
• 该均衡是否是有效的?
– 我们可以通过计算它的总收益来判断。 – 该均衡的总收益为:18+15+12+9+5+5=67 – 这比不排队的总收益75要低,因此排队反而是 缺乏效率的。
多人博弈的简化假设
• 为了简化多人博弈,需要设定两个基本的假设:
鹰鸽博弈
• 在群体生物中,假设一种动物每次遇到另一种动 物都会为某种资源展开争斗,其间采取进攻或者 逃跑的战略。
– 如果两只鹰相遇,它们会进行争斗导致两败俱伤。 – 如果两只鸽子相遇,它们的行为模式是佯攻后逃跑。 – 如果一只鹰和一只鸽子相遇,鸽子会逃跑,而鹰占有 资源。 – 该博弈的收益矩阵如下。
• 在公共草地上,每增加一只羊会有两种结果:一是获得 增加一只羊的收入;二是加重草地的负担,并有可能使 草地过度放牧。经过思考,牧羊者决定不顾草地的承受 能力而增加羊群数量。于是他便会因羊只的增加而收益 增多。看到有利可图。许多牧羊者也纷纷加入这一行列。 由于羊群的进入不受限制,所以牧场被过度使用,草地 状况迅速恶化
• 在群体生物中,类似于鹰鸽博弈的情况最大的特点是:
– 它拥有两个以上的参与者,但在特定时间只能有两个参与者进行 组合。
知识补充~~
• 需求函数:Qd = α-βP
– Qd:(quantity of demand) 需求数量 – P:(price) 价格 – 一种商品的需求是消费者在一定时期内在各种可能的 价格水平愿意而且能够购买的该商品的数量。 – 商品价格和需求量之间是负相关关系。
公共悲剧
• 公共资源有许多拥有者,他们中的每一个都有使 用权,但没有权利阻止其他人使用,从而造成资 源过度使用和枯竭。
– 过度砍伐的森林、过度捕捞的渔业资源及污染严重的 河流和空气,都是“公地悲剧”的典型例子。
• 之所以叫悲剧,是因为每个当事人都知道资源将 由于过度使用而枯竭,但每个人对阻止事态的继 续恶化都感到无能为力。而且都抱着“及时捞一把” 的心态加剧事态的恶化。 • 这种集体频繁地使用公共资源的行为需要法规、 惯例的制约,或者由公益机构将其控制在一定范 围内,否则公共悲剧问题将无法解决。
收益的期望值 -25p+14(1-p)=0,p=0.36 -9p+5(1-p)=0, p=0.36
事实上,鹰和鸽子组成 的概率取决于两种鸟在 整个种群中所占的比例。 假设遇到鹰的概率是p。
鹰 鸽子
2 PDF 文件使用 "pdfFactory Pro" 试用版本创建
鹰鸽博弈
供应过剩和需求过盛
• 供应函数:Qs = δ+γP – Qs:(quantity of supply) 供应数量 – P:(price) 价格
– 一种商品的供给是指生产者在一定时期内在各种可能 的价格下愿意而且能够提供出售的该种商品的数量。 – 商品价格和供给量是正相关关系。
供需博弈
• 买卖双方都面临两种可能:
鸟B 鸟A 鹰 鸽子 鹰 -25,-25 -9, 14 鸽子 14,-9 5, 5
鹰鸽博弈
• 鸟A和鸟B的收益是对称的,这取决于与鹰组合的 概率p。 • 鹰的比例在该博弈中为状态变量。 • 鹰和鸽子最终会达到一定比例的共存。
– 如果鹰的比例小于36%,那么两种鸟的种群都会扩大。 – 如果鹰的比例大于36%,嘛呢两种鸟的种群都会缩小。 – 因为鹰群增加一只鹰的边际收益趋零时(鹰群发生内 斗),均衡将到来。
– 该博弈的收益矩阵如右表。
消费者 生产者 简单 迂回 储蓄 5, 5 10,10 消费 8, 8 6, 6
3 PDF 文件使用 "pdfFactory Pro" 试用版本创建
协调博弈
• 该博弈有两个纳什均衡:
– 均衡1:消费者选择储蓄,而生产者选择迂回;那么消 费者会为生产者提供需要的资金,而生产者可以为消 费者支付投资较高的回报。这对双方都是最好的选择。 – 均衡2:消费者选择消费,而生产者选择简单的生产方 式。
– 状态变量(stable variable):该变量用以描述博弈 的状态,参与者只需要知道这些变量就可以选出最 佳战略。
• 排队博弈中,状态变量为列队的长度。而谁是第一,谁 是第二并不需要去了解。
1 PDF 文件使用 "pdfFactory Pro" 试用版本创建
– 货物在声明的价位被卖出(或买入),没有盈余或短缺。 – 当价格不能平衡供需数量时,没有交易。
协调博弈
• “生产者”和“消费者”的协调博弈。
– 生产者的战略有:“简单”和“迂回”两种生产方式。
• “迂回” – 指机械化、培训、研发等高效的生产方式。然 而这需要通过销售债券和股票,从消费者那里筹集资金。
排队博弈 第七讲 多人博弈
• 假使有六个乘客在登机口等待检票。乘客可以选 择站起来去排队,也可以选择坐着。每位乘客所 获得的收益取决于他接受服务的次序,且站起来 排队将会减少乘客2单位的收益。该博弈的收益表 如下: 如果乘客不排队,接受服务
服务次序 第一 第二 第三 第四 第五 第六 总收益 20 17 14 11 8 5 净收益 18 15 12 9 6 3
• 买卖双方的战略选择:
– 宣布需求/供给函数上的数量。 – 宣布其他的数量。
– 消费者的战略有:储蓄和消费。
• 储蓄的资金可以用以购买公司债券和股票以获得将来预 期较高的收益。