博弈论-一种研究非对称协调博弈模型的量子方法

合集下载

博弈论是什么

博弈论是什么博弈论是一门研究决策和策略的数学理论，它研究决策者在互动中作出最佳选择的数学模型。

博弈论的研究对象是决策者之间的相互作用，无论是个体、组织还是国家之间的相互作用。

在博弈论中，个体决策者通常被称为“球员”(players)，决策者们的决策被称为“策略”(strategies)。

博弈论分析的目标是找到在各种不同策略组合中，球员可以通过分析其他球员的行动，作出最佳决策的方法。

博弈论通过建模和分析不同策略的结果，以及不同决策者之间的冲突和合作，来解决决策问题。

博弈论的起源可以追溯至20世纪的数学家、经济学家和游戏理论家。

它被广泛应用于经济学、政治学、社会科学和计算机科学等领域，以解决各种决策和策略问题。

博弈论有两个重要的分支，一是非合作博弈论，二是合作博弈论。

非合作博弈论研究的是在决策者之间缺乏合作的情况下的决策问题。

非合作博弈论分析的是每个决策者如何在互动中作出最佳决策，而不考虑其他决策者的影响。

其中最著名的非合作博弈论模型是“囚徒困境”。

囚徒困境是一种经典的非合作博弈论问题，描述了两个同时被捕的囚犯面临的决策问题。

如果两个囚犯都保持沉默，则他们将因不够证据而被判轻刑；如果一个人选择坦白，而另一个保持沉默，则坦白的囚犯将获得从刑期的豁免，而另一个将被判重刑；如果两个人都选择坦白，则他们将受到较重的刑期。

在这个例子中，每个囚犯的最佳策略是选择坦白，然而，当两个囚犯都选择坦白时，他们都会陷入囚徒困境，因为他们的总体利益会受到损害。

合作博弈论研究的是在决策者之间存在合作的情况下的决策问题。

合作博弈论分析的是决策者通过协商和合作来达成一致，并在互动中作出最佳决策。

其中最著名的合作博弈论模型是“合作对策”(cooperative games)。

合作对策是一种多人博弈论问题，在这种情况下，参与者通过协调策略，共同提高整体收益。

合作对策的目标是通过合作和协商，找到一种合理的分配方式，使得每个参与者都能获得相对公平和最大化的收益。

不对称信息中的博弈理论研究

不对称信息中的博弈理论研究博弈理论是一门数学分支，研究的是决策者之间的互动，包括他们的利益、行动和结果。

而不对称信息博弈则是博弈理论中的一个重要分支，它考虑的是决策者之间信息不对称的情况。

在不对称信息博弈中，每个决策者拥有的信息不同，即他们对其他决策者的利益、行动和结果的了解程度不同。

这种不对称的信息会导致博弈的结果出现偏差，因为某些决策者会刻意隐瞒信息或者利用信息不对称来获取更大的利益。

为了更好地理解不对称信息博弈，下面将介绍几个典型的例子。

例一：拍卖拍卖是一种常见的不对称信息博弈。

在一次拍卖中，卖方往往拥有比买方更多的信息。

卖方知道物品的真实价值，而买方则不知道，他们只能通过竞标来猜测真实价值。

这种信息不对称会导致买方在评估价格时出现偏差，从而影响拍卖结果。

为了解决这个问题，拍卖的设计者通常会规定一些规则，如加价规则、起拍价等，来减少信息不对称对拍卖结果的影响。

例二：信用评级信用评级是银行和投资者为了评估借款人信用风险而采用的一种手段。

借款人往往拥有比银行和投资者更多的信息，比如他们自己的收入和支出情况、家庭背景等。

这种不对称的信息可能会导致银行和投资者对借款人的信用风险评估不准确，从而影响他们的决策。

为了解决这个问题，银行和投资者采用了一些方法来纠正借款人信用风险评估的偏差，如通过对借款人的资产和收入进行调查、审核借款人的信用记录等。

例三：医疗保险在医疗保险中，保险公司拥有比被保险人更多的医疗信息，这也是一种典型的不对称信息博弈。

被保险人需要购买医疗保险来应对未来的疾病和治疗费用，而保险公司则需要评估被保险人的健康状况来确定保险费用。

如果被保险人有隐瞒病史或病情的倾向，那么保险公司就很难准确评估被保险人的健康状况。

为了解决这个问题，保险公司通常会进行调查和审核，以确定被保险人的真实健康状况，并制定相应的保险费用。

在不对称信息博弈中，信息的缺失和不确定性是博弈结果偏差的主要原因。

因此，在研究不对称信息博弈时，需要考虑如何减少信息不确定性和缺失，以减少博弈结果的偏差。

对称均衡非对称均衡博弈论

对称均衡非对称均衡博弈论
对称均衡和非对称均衡是博弈论中的重要概念，用于描述博弈中各方的策略选择和结果。

在博弈论中，博弈是指一种决策情形，其中参与者的利益受到彼此的影响。

对称均衡和非对称均衡都是描述博弈中可能出现的情况的概念。

首先，让我们来看看对称均衡。

在博弈论中，对称均衡是指参与者采取相同的策略，并且没有动机去改变自己的策略，因为任何一方的单方面改变都不会使其获益。

对称均衡的一个经典例子是“囚徒困境”博弈，其中两名囚犯面临合作或者背叛的选择。

在对称均衡中，如果两名囚犯都选择背叛，那么他们都会受到最严厉的惩罚，而如果两名囚犯都选择合作，那么他们都会受益。

因此，对称均衡发生在他们都选择背叛或者都选择合作的情况下。

其次，非对称均衡是指参与者采取不同的策略，并且在当前策略下没有动机去改变自己的策略，因为任何一方的单方面改变都不会使其获益。

非对称均衡的一个例子是“买方市场”博弈，其中卖方和买方在价格谈判中采取不同的策略。

在非对称均衡中，如果卖方设定了一个最低价格，而买方愿意接受这个价格，那么双方都没有动机改变自己的策略。

总的来说，对称均衡和非对称均衡是博弈论中用于描述参与者策略选择和结果的重要概念。

通过研究对称均衡和非对称均衡，我们可以更好地理解博弈中参与者的决策行为，以及他们可能达到的结果。

这些概念对于经济学、政治学以及其他社会科学领域都具有重要意义。

希望这个回答能够帮助你更好地理解对称均衡、非对称均衡和博弈论的相关概念。

倪世雄《当代西方国际关系理论》章节题库(国际关系理论研究在中国)【圣才出品】

第十章国际关系理论研究在中国简答题1．如何探讨国际关系理论构建的一般原理？答：探讨国际关系理论构建的一般原理要从历史和逻辑两大方面开始，具体包括：（1）从历史的角度看，人类认识世界的能力和范围有一个渐进积累的过程。

这也就是说，作为人类知识结晶的各类学科并不是从来就有的，也不是从一开始就能洞察出今后的发展方向的。

随着人类认识的深入和人类社会的向前发展，以国际关系为研究对象的国际关系学势必成为一门拥有自身相对独立的研究对象的相对独立的学科门类。

（2）从逻辑的角度看，每一个自成一体的客观事物皆可成为某一特定学科的研究对象，从而为该学科的独立性提供合法性基础。

与其他研究对象存在相互联系的研究对象并非一定不能成为一门独立的学科，关键是看这种联系是否危及到该研究对象自身的“自成一体”。

2．在创建中国国际关系理论体系过程中，应正确处理哪些重要问题？答：建立中国国际关系理论体系是一项光荣而艰巨的任务，在创建过程中必须正确地处理好若干重要问题，特别是以马列主义为指导的问题，中国特色问题、学术评价问题和对西方国际关系理论的评介问题。

（1）关于以马列主义为指导思想的问题马列主义、毛泽东思想、邓小平理论给我们留下了宝贵的理论遗产，其中关于国际关系的精辟论断仍是我们研究工作的指南。

要建立中国国际关系理论，首先要确立马列主义的指导地位，全面正确地阐述马列主义关于国际关系的基本观点。

（2）关于中国特色问题国际政治学的中国特色至少应包括三方面的内容：①以国家权力为核心，超越社会制度和意识形态，突出主权利益同强权利益的关系；②把生产力标准引进国际政治领域，确立经济优先观点，注重政治同经济的相互渗透；③以改革促发展，维护世界和平，正确处理稳定与进步的关系，建立公平合理的国际经济政治新秩序。

（3）关于建立国际关系理论的评价体系问题在上述国际关系学建设一般原理的启示下，我们可以建立一个三维的评价体系，以衡量中国国际关系学的现状。

这个评价体系的三个维度分别是：研究对象的丰富性、研究方法的多元性和研究层次的协同性。

博弈论最全完整ppt-讲解

模型
导论
二、博弈论与诺贝尔经济学奖获得者
1994年诺贝尔经济学奖获得者
美国人约翰-海萨尼(John C. Harsanyi) 和美国人约翰-纳什(John F. Nash Jr.)以及德国人莱因哈德-泽尔腾(Reinhard Selten)
获奖理由：在非合作博弈的均衡分析理论方面做出了开创性的贡献，对博弈论和经济学产生了重大影响。
如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为一个常数，这个博弈就叫常和博弈；
相反，如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为一个常数，这个博弈就叫非常和博弈。
常和博弈也是利益对抗程度最高的博弈。非常和（变和）博弈蕴含双赢或多赢。
导论
四、主要参考文献
课程主要内容
第一章完全信息静态博弈第二章完全信息动态博弈第三章不完全信息静态博弈第四章不完全信息动态博弈第五章委托-代理理论第六章逆向选择与信号传递
第一章完全信息静态博弈
博弈论的基本概念及战略式表述纳什均衡
纳什均衡应用举例混合战略纳什均衡纳什均衡的存在性与多重性
第一节博弈论的基本概念
与战略式表述
博弈论的基本概念与战略式表述
博弈论（game theory）是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈的战略式表述：G={N,(Si)iN,(Ui)iN} 有三个基本要素：（1）参与人（players）iN={1,2,…,n} ；（2）战略（strategies）,siSi(战略空间)；（3）支付（payoffs）,ui=ui(s-i,si)。
Because We Had a Flat Tire”

陈岳《国际政治学概论》章节题库(1-4章)【圣才出品】

第二部分章节题库导论国际政治学及其研究对象和方法一、名词解释1．国际政治答：国际政治是指全球性的政治活动，它与国际关系、国家间的互利与合作、各个国家的政治动态有很大的关系。

国际政治作为学科名称，与国际关系、世界政治通常同义，并且与国际研究相通。

在国际学术界，这几个概念的使用，并没有严格的区别，是可以互换的。

不过，在许多情况下，这几个概念的用法是有区别的。

由于每个国家的行为都会受到各种各样的国内因素和国际因素的影响，因此国际政治就成了一种变数复杂和多维的研究领域。

它不仅涉及政治因素，而且涉及军事、经济、文化、宗教、生态、法律、社会心理和意识形态等多个方面。

2．国际政治学答：国际政治学是政治学的一个分支，是揭示国际社会中各种国际政治行为主体之间的政治关系及其发展变化的一般规律的一门新兴学科，其内容包括国际社会、行为主体、政治关系和一般规律，其中政治关系是研究的主要内容，探寻一般规律是研究的主要目的。

国际政治学和国际战略学、国际经济学、国际法学、外交学等学科有着非常密切的联系，具有很强的综合性、交叉性、边缘性，这也是它的一个重要特点。

在国际政治学研究中我们要坚持以马克思主义为指导，此外，还必须坚持马克思主义基本的研究方法，包括政治与经济相结合的方法、历史分析法、比较分析法和定性／定量分析法。

3．研究途径与范式答：研究途径是指国际关系研究是通过一定的途径实现的。

这种途径包括研究问题、分析视角、资料搜集、概念运用、方法选择等要素，可以为研究提供指导，为回答有关问题提供准则。

在研究实践中，学者们通常会采用不同的途径，并因而会导致各种争论。

在这个过程中，如果某一种途径得到广泛认可，取得支配地位，成为标准的研究和解释框架，那么它就变成了该领域的范式。

范式的概念是美国学者托马斯·库恩首先提出的。

在社会科学中，可以说几乎不存在单一范式的情况。

如果应用范式的概念，大概只能按照比较宽泛的标准，即范式不过是指一种得到较普遍认可的研究框架。

博弈论知识点总结完整版

博弈论一：基本知识1.1定义:博弈论;又称对策论;是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论;是研究竞争的逻辑和规律的数学分支..即;博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用;以及不同决策主体之间的均衡..1.2基本要素：参与人、各参与人的策略集、各参与人的收益函数;是博弈最重要的基本要素..1.3博弈的分类：博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论..两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议binding agreement..倘若不能;则称非合作博弈Non-cooperative game..合作博弈强调的是集体主义;团体理性;是效率、公平、公正；而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大;强调个人理性、个人最优决策;其结果有时有效率;有时则不然..目前经济学家谈到博弈论主要指的是非合作博弈;也就是各方在给定的约束条件下如何追求各自利益的最大化;最后达到力量均衡..博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息;是否了解两个角度进行..把两个角度结合就得到了4种博弈：a、完全信息静态博弈;纳什均衡;Nash1950b、完全信息动态博弈;子博弈精炼纳什均衡;泽尔腾1965c、不完全信息静态博弈;贝叶斯纳什均衡;海萨尼1967-1968d、不完全信息动态博弈;精炼贝叶斯纳什均衡;泽尔腾1975 Kreps; Wilson1982 Fudenberg; Tirole19911.4课程主要内容：完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式：策略式表述 Strategic form; 扩展式表述Extensive form1.6占优均衡：a、占优策略：在博弈中如果不管其他参与人选择什么策略;一个参与人的某个策略给他带来的支付值始终高于其他策略;或至少不劣于其他策略;则称该策略为该参与人的严格占优策略或占优策略..对于所有的s-i; si称为参与人i的严格占优战略;如果满足：uisi;s-i>uisi';s-is-i; si' sib、占优均衡：一个博弈的某个策略组合中;如果对应的所有策略都是各参与人的占优策略;则称该策略组合为该博弈的一个占优均衡..1.7重复剔除严劣策略均衡：a、“严劣”和“弱劣”的含义：设 s i’和s i’’是参与人i可选择的两个策略;若对其他参与人的任意策略组合s-i; 均成立u i s i’; s-i < u i s i’’; s-i; 则说策略s i’严劣于策略s i’’ ..上面式子中;若将“<”改为“≤”;则说策略s i’弱劣于策略s i’’ ..b、定义：重复剔除严格策略就是各参与人在其各自策略集中;不断剔除严劣策略…如果最终各参与人仅剩下一个策略;则该策略组合就被称为重复剔除严劣策略均衡..二：纳什均衡Nash Equilibrium2.1纳什均衡定义：对于一个策略式表述的博弈G= {N;S i; u i; i ∈N}; 称策略组合s=s1; …s i; …; s n是一个纳什均衡;如果对于每一个i ∈N; s i是给定其他参与人选择s-i={s1; … ;s i-1; s i+1; … ;s n} 情况下参与人i的最优策略经济理性策略;即：u i s i; s-i≥ u i s i; s-i; 对于任意的s i∈S i ;任意的i∈N均成立..通俗定义：纳什均衡是一种策略组合;给定对手的策略;每个参与人选择自己的最优策略..纳什均衡是一种稳定的策略组合：当所有参与人的选择公开以后;每个人都满意自己作出了正确的选择；没有人能得到更好的结果了..在博弈论中这种结果被称为纳什均衡NE..2.2定理：Nash在1950年证明：任何有限博弈;都至少存在一个NE——Existence of Nash Equilibrium..即在一个有n个参与人的策略式博弈G={S1;…;Sn; u1;…;un}中;如果n是有限的;且Si是有限集i=1;…;n;则该博弈至少存在一个纳什均衡在混合策略意义下Wilson1971证明;几乎所有有限博弈;都存在有限奇数个NE;包括纯策略NE和混合策略NE..——Oddness Theorem2.3纳什均衡、占优均衡、重复剔除严劣策略均衡的关系定理 a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡;但反过来不一定成立；定理 b 纳什均衡一定不能通过重复剔除严劣策略方法剔除..2.4划线法先找出自己针对其他博弈方每种策略或策略组合对多人博弈的最佳对策;即自己的可选策略中与其他博弈方的策略或策略组合配合;给自己带来最大得益的策略这种相对最佳策略总是存在的;不过不一定唯一;然后在此基础上;通过对其他博弈方策略选择的判断;包括对其他博弈方对自己策略判断的判断等;预测博弈的可能结果和确定自己的最优策略..这就是划线法..2.5箭头法箭头法对于理解博弈关系很有好处;是寻找相对稳定性策略组合的分析方法..对博弈中的每个策略组合进行分析;考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益..如能;则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组..最后综合对每个策略组合的分析情况;形成对博弈结果的判断..划线法和箭头法的结果是一致的;可以相互替代..三：混合策略Mixed Strategies 纳什均衡3.1定义：混合策略的定义：在博弈G={N; Si; ui; i∈N}中;假设参与人i的纯策略构成的策略集合为Si={si1;…; sik};若参与人i 以概率分布pi=pi1;…; pik 在其k 个可选策略中随机选择“策略”;称这样的选择方式为混合策略..这里;0≤pij ≤ 1;对于j=1 ;…; k 都成立;且有; pi1+…+ pik=1..纯策略可看成特殊的混合策略..上述定义是在有限博弈前提下进行的..3.2混合策略意义下策略组合的表述{x1∈X1; …; xn∈Xn};其中Xi ; i =1; …; n表示参与人i所有纯策略生成的概率空间;xi为参与人i的一个具体混合策略猜硬币博弈的一个混合策略就可记为{1/2; 1/2;1/2; 1/2}3.3VNM效用函数Von Neumann and Morgenstern冯·诺依曼和摩根斯坦如果某个随机变量X以概率Pi 取值xi;i=1;2;…;n;而某人在确定地得到xi时的效用为uxi;那么;该随机变量给他的效用便是： UX =P1ux1 + P2ux2 + ... + Pnuxn表示关于随机变量X的期望效用..因此UX称为期望效用函数;又叫做冯·诺依曼——摩根斯坦效用函数VNM函数..3.4基于混合策略意义下的博弈策略式表述定义：基于v-N-M效用的策略式博弈由 a、参与人集合 b、每个参与人有一个纯策略集合 c、对于每一个参与人来说;由所有参与人纯策略组合构成的风险结果空间;存在一个v-N-M效用3.5混合策略意义下的纳什均衡定义：对于博弈G= {N; Si; ui; i∈N};基于v-N-M效用的混合策略组合α是一个纳什均衡;若对于每一个i; 以及i的任意一个混合策略αi;α对应的期望支付至少和αi;α-i 的期望支付一样大换句话说;称混合策略组合α是一个纳什均衡;如果没有一个参与人通过偏离策略αi 实现支付的增加3.6一个定理对于N-人静态博弈问题;设混合策略纳什均衡对应的策略组合为Xi ; X –i ..对于任意的i ;若最优混合策略为Xi= {x1;…;xl;0…0}不失一般性;假设前l个分量严格大于0;记分量xk k=1;…; l 对应的纯策略sk;则对于参与人i而言;sk与其他参与人的最优混合策略组合X –i 形成的局势的收益值;等于纳什均衡混合策略组合 Xi; X –i 的收益值..即ui sk; X –i = ui Xi; X –i 成立 ; k=1;…; l3.7方法：a、求解混合策略均衡可以用期望收益等值法b、2×2双矩阵博弈的图解法:反应函数的三个交点即是纳什均衡四：多重纳什均衡解及其分析4.1 帕雷托占优均衡帕雷托占优均衡的含义是：在多个纳什均衡中;若存在一个纳什均衡;其支付结果针对每个参与人而言都严格优于其它纳什均衡;则该纳什均衡是帕雷托占优纳什均衡..4.2风险占优均衡risk-dominant equilibrium参与人对风险占优均衡的选择倾向;有一种强化的机制..当部分或所有参与人选择风险占优均衡的可能性增强的时候;任一参与人选择帕雷托占优均衡策略的期望支付会进一步减小;而这又使得帕雷托占优均衡策略的支付更小;从而形成一种选择风险占优均衡策略的正反馈机制;并使其出现的概率越来越大..当参与人数目增加时;选择合作的风险将会更大;可借助该点考虑招标机制如何减少投标方勾结问题..上述问题是我们知道建立诚信机制社会的重要意义..上述问题引出一个博弈相关分支为协调博弈coordination game4.3聚点均衡由实际问题抽象出来的博弈模型中;更多的一类问题是：多个纳什均衡间不存在帕雷托占优关系或明显的风险占优关系;如夫妻爱好问题的两个纯策略均衡..这时如何预测哪一个纳什均衡会出现是一个很有意义的问题以夫妻爱好博弈为例;在实际中往往二人很默契地知道如何进行博弈;双方往往知道怎么进行选择策略;且能够相互了解这里面排除了互相协商后达成的一致实际博弈中参与人往往会利用博弈模型以外的信息;实现对特定博弈均衡一致关注的“聚点”这些信息如：参与人共同的文化背景或规范;共同的知识;具有特定意义事物的特征;某些特殊的数量、位置关系等聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性;但因为涉及因素太多;对于一般博弈模型很难总结普遍规律;只能具体问题具体分析聚点：人们通常会协调彼此的行为..你弱他就强；先例产生的影响远大于逻辑或者法律效力；人们总是乐于安守现状或接受自然形成的界线三八线4.4相关均衡correlated equilibrium实际上;在现实中遇到选择困难时;特别是在长期中反复遇到相似选择难题时;常会通过收集更多信息;形成特定的机制和规则;为某种形式的制度安排等主动寻找思路..相关均衡就是这样的一种均衡选择机制..对于实际中比较复杂的博弈问题;参与人是否有能力设计这种机制;并且有足够能力理解、信任这种机制;是有一定疑问的..相关均衡作为社会经济制度创新的一种解释也许更有意义..4.5防共谋均衡coalition-proof equilibrium 定义：如果一个博弈的某个策略组合满足a、没有任何单个参与人的“串通”会改变博弈的结果;即单独改变策略无利可图该策略组合是纳什均衡..b、给定选择偏离的参与人有再次偏离的自由时;没有任何两个参与人通过“串通”改变博弈的结果..c、依此类推;直到所有参与人都参加的串通也不会改变博弈的结果..满足上述要求的均衡策略组合称为“防共谋均衡”在有多个参与人的博弈中;若部分参与人通过某种形式的默契或串通形成小团体;可能得到比不串通个大的支付..这就是多人博弈的共谋问题..防共谋均衡是指这样的一个纳什均衡;在该均衡局势下;少数参与人集合不能通过均衡策略的偏离;实现更好的局部利益..防共谋均衡是两个以上参与人参加的博弈中;参与人在帕雷托占优均衡中进行合作思想的扩展..五：动态博弈5.1特点一类博弈行为通常需要参与人多步决策才能完成;具有明显的阶段性..博弈的结局、各参与人的收益由多阶段决策结果确定..各参与人的决策有一定的顺序..由于动态博弈各参与人进行决策具有明显的阶段性、行动次序性;通常用扩展式extensive form表述法描述这些信息..5.2博弈的扩展式表示参与人集合：i=1; … ;N..用N表示虚拟参与人“自然”；自然的含义是某些外生的客观概率分布事件参与人的行动顺序the orderof moves:描述各参与人在什么时候行动；参与人的行动空间actionset：在每次行动时;参与人可选择的行动集合；参与人的信息集information set：每次行动时参与人知道什么；参与人的收益函数：在行动结束之后;每个参与人得到些什么..自然选择的概率分布假定自然状态是共同知识..对于有限博弈;博弈树是常用的表述方式..5.3博弈树a若动态博弈是有限博弈;则可用博弈树表示该博弈..这里有限的含义是：各阶段各参与人的行动数目有限；博弈的阶段数有限..b博弈树的基本结构为结点nodes..包括决策结及终点结..决策结是参与人采取行动的时点；终点结是博弈行动路径的终点..枝branches..从一个决策结到它的直接后续结的连线;每一个枝代表参与人的一个行动选择..信息集..是决策结集合的一个子集..将博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结称为一个信息集..注：每个决策结都是同一个参与人的决策结..该参与人知道博弈进入该集合的某个决策结;但不知道自己究竟出于哪一个决策结若该信息集有两个或两个以上元素..5.4对于有限动态博弈;若参与人对彼此在各决策结点的行动集合;彼此的效用函数;历史的行动有着完全的了解;则称这样的博弈为完全信息动态博弈..如果博弈树的所有信息集都是单元素集;称该博弈为完美信息博弈game of perfectinformation..上述两个定义的差别在于对自然行动信息的描述..5.5动态博弈的策略式表述a相机选择contingent play动态博弈中参与人的策略是各自预先设定的;在博弈的各阶段;针对各种情况做出相应决策..即“等待”博弈到达自己的信息集包含一个或多个决策结后再决定如何行动..在策略式表述博弈中;参与人似乎是博弈开始之前就制定出了一个完全的相机选择;即“如果……发生;我将选择……”..b从扩展式表述构造战略式表述若把B的信息集从左到右排列;上述四个纯策略可以简单记为{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}..上面四个纯策略含义：当A选择开发时;B选择大括号中前面的策略；当A选择不开发时;B选择大括号中后面的策略..B的纯策略为：{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}A的纯策略为：SA=开发;不开发于是可以写成策略式表述形式;为开发;开发开发;不开发不开发;开发不开发;不开发开发-3;-3-3;-31;01;0不开发0;10;00;10;0在扩展式表述博弈中;所有n个参与人的一个纯战略组合s=s1;…;sn决定了博弈树上的一个路径..比如开发;{不开发;开发}决定了博弈的路径为A 开发 B 不开发1;05.6完全信息动态博弈纳什均衡存在性定理如果有限博弈是完美信息博弈;他还有一个纯战略纳什均衡Zermelo;1913..5.7逆向归纳法：a逆向归纳法求解策略：从动态博弈的最后一个阶段出发;对该参与人采用经济理性原则进行分析;逐步到推回前一个阶段相应参与人的行动选择;一直到第一阶段的分析方法..b逆向归纳法是求解完美信息动态博弈的经典方法..逆推归纳法是完美信息动态博弈分析中使用最普遍的方法..c与策略式分析比较：如果A选择U;那么B的信息集不能达到;我们说B的信息集不在均衡路径上out-of-equilibrium path.. 此种情况下;B的选择对A没有什么影响..因此;纳什均衡对一个参与人在非均衡信息集上的选择没有限制..但是;一个参与人在非均衡信息集上的战略可以影响其他参与人在均衡信息集上的选择..d逆向归纳法实质上是重复剔除劣战略法在扩展式博弈中的应用..逆向归纳法适不用于无限博弈和不完美信息博弈..逆向归纳法剔除了“非理性”的均衡策略5.8子博弈完美均衡子博弈精炼纳什均衡①子博弈概念：一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结Tx组成;它满足下列条件：x是一个单结信息集;即hx={x};对于所有的Tx中的x’;如果x’’与x’同属于一个信息集;则x’’也在Tx中..需要说明的是;G本身是自己的一个子博弈..②子博弈完美纳什均衡子博弈精炼纳什均衡扩展式博弈的一个战略组合s=s1;…;s i;…;s n是一个子博弈完美纳什均衡;如果它是原博弈的纳什均衡..它在每一个子博弈上都是纳什均衡③纳什均衡与子博弈精炼纳什均衡的关系前面分析说明;一个特定的纳什均衡决定了原博弈树上唯一的一条路径;这条路径称为“均衡路径”equilibrium path..相对该纳什均衡;其他路径称为非均衡路径out-of-equilibrium path..在每一个子博弈上给出纳什均衡意味着;构成子博弈纳什均衡的战略不仅在均衡路径的决策结上是最优的;同时在非均衡路径的决策结上也是最优的..对于有限完美信息博弈;前面介绍的逆推归纳法得出的纳什均衡即是子博弈精炼纳什均衡..六多阶段静态博弈6.1该类模型中至少在某个阶段参与人同时选择其决策..这类模型实质上就是完美信息动态博弈;因此仍然可以采用逆推归纳法进行分析..因为存在同时选择;因此每个阶段不再是单人优化问题;而是一个静态博弈..6.2前向归纳法：前面已经说明;完美信息动态博弈的经典求解方法为逆序归纳法..还有一种分析方式;就是前向归纳法forward induction..前向归纳法由科尔博格和莫顿斯1986提出..这里不进行严格的数学描述;仅通过一个例题进行说明..6.3重复博弈重复博弈repeated game的定义指同样结构的博弈重复多次;其中的每次博弈称为“阶段博弈stage game”..如两个多次犯罪的“囚徒问题”..由于动态博弈是相机行动;反映到重复博弈中;就是可以使自己在某个阶段的博弈选择依赖于其他参与人过去的行动历史..影响重复博弈均衡结果的主要因素是博弈重复次数和信息的完备性completeness..重复次数对参与人可能会有的影响是：参与人为了获得长远利益而牺牲眼前利益的策略成为可能..关于完备性;简单地说;但一个参与人的支付函数不为其他参与人所知时;该参与人可能有积极性建立一个“好”的声誉reputation以换取长远利益..在社会行为中;经常可以看到本质不好的人在相当长的时期内干好事的原因..定理：令G是阶段博弈;GT是G重复T次的重复博弈T<∞..那么;如果G有唯一的纳什均衡;重复博弈GT的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次即每个阶段博弈出现的都是一次性博弈的均衡结果..上述定理说明;只要博弈的重复次数是有限的;重复本身并不改变囚徒困境的均衡结果..上述定理中“唯一性”是一个重要条件..如果纳什均衡不是唯一的;上述结论就不一定成立..当博弈有多个纳什均衡时;参与人可以使用不同的纳什均衡惩罚前面阶段的不合作行为或奖励第一阶段的合作行为..（七）不完全信息静态博弈不完全信息静态贝叶斯博弈贝叶斯纳什均衡海萨尼转换拍卖理论八合作博弈可传递效用 transferableutility合作博弈的特征函数合作的分配可行分配核心的定义 Shapley 值。

博弈论-纳什均衡（非合作博弈均衡）

博弈论-纳什均衡（非合作博弈均衡）完全理性：理性指一种行为方式，它适合实现指定目标，而且在给定条件和约束的限度之内。

在不同的学科领域，理性所涵盖的内容存在着差异完全理性的内涵具有完全理性的行为人是个无所不知的超人，他具有纵向和横向方面完备的知识。

在纵向方面，他可以预测未来；在横向方面，他通晓资源、交易伙伴和环境等情况。

具体而言，行为人的完全理性包括以下隐含内容。

(1)不存在不确定性，即使存在不确定性，也可以预知不确定性的概率分布。

也就是说，对于具有完全理性的行为人来说，一切信息都是确定的。

(2)行为人具有可以确定的效用函数(消费者的效用函数和厂商的利润函数可以统称为效用函数)，同时行为人具有同质性以及一致性的偏好体系。

(3)选择结果具有描述不变性、程序不变性和前后关系独立性。

描述不变性要求行为人选择的先后顺序不应依赖于所描述或显示的选项，也就是说如果行为人经过再三思考，将两种描述视为同一问题的同义表达，那么它们必定导致相同的选择——即这种思考不存在异处；程序不变性要求不同方式的等价学说揭露相同的偏好次序；前后关系独立性指一项选择与其他替代方案互为独立的原则，它要求在给定Z而不提供有关X或Y 的新的信息的情况下，X 与Y的优先权顺序不应该依赖于Z是否有效。

(4)行为人具备完备的计算和推理能力，可以像计算机一样在数秒内从事无穷尽的计算步骤，同时也不存在感性因素对选择的干扰。

(5)选择意味着在各种方案或选择集中进行比较和挑选，因此完全理性的行为人可以设计出所有的被选方案，以及各项方案所产生的全部后果。

(6)一个确定的报酬函数，即行为人可以确定地赋予每项行动结果一个具体的量化价值或效用。

(7)确定性的结果，也就是行为人町以实现效用最大化或最优目标(消费者效用最大化和企业利润最大化)。

在上述条件下，建立在完全理性假设的基础上的主流经济学的方法论，即行为人的选择或决策意味着在资源约束的条件下实现效用最大化或利润最大化。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

量子决策过程——（p,q）。
决策过程结束：
测量量子态，|0>：S1，|1>：S2。根据测量结果|x,y>得到payoff值PA(Sx+1, Sy+1)和
PB(Sx+1, Sy+1) 。
（a）payoff矩阵
（b）payoff期望值（c）纳什均衡（p*,q*)
争论
与Eisert-Wilkens-Lewenstein量子博弈模型类似，术语不同，操作限制多；
介绍了一种非对称协调博弈模型
•Sexes game, Chicken game和Hawk-Dove game都包含在内
提出了一种基于量子纠缠特性的方法
• 考虑到对玩家的公平性，在选择量子初态和系数选择时都考虑到对称性。
• 本文采用了量子纠缠态来协调玩家，因此不需要玩家之间彼此交流或者求助第三方评判。
协调博弈
在给定其他参与人行为策略的条件下，没有人有激励改变其行
为策略；没有参与者希望其他参与者会愿意改变其
行为。
Sexes game
(O,O) (T,T) ：NE
在经典博弈模型中（如sexes game），当存在多重均衡时，由于双方都希望自己的利益最大化，因此无法实现协调。
本文提出了一种方法解决上述问题，该方法基于量子纠缠特性，且在给定的模型中能够得到唯一且最优的NE。
2
2
c b1 b2 , d b1 b2
2
2
（d）非对称博弈
Alice和Bob最初共享一个两量子比特的量子态： |Y>=C00|00>+C01|01>+C10|10>+C11|11>
在决策过程中：
Alice:p什么都不做，1-p对第一个量子比特执行sx； Bob:q什么都不做，1-q对第二个量子比特执行sx。
◦ Third NE:
Third NE的payoff值更小，因此理性玩家会更倾向于有最高payoff 的NE(1，1)。
情况4：如果c,d满足c=d
◦令 ◦ Payoff:
◦ 考虑safer：d1<d2,d3<d4,因此Alice和Bob选择（1，1）的危害更小。 ◦ Third NE:
Third NE的payoff值更小，因此理性玩家会更倾向于更safer的 NE(1，1)。
没有给出sexes game的唯一解，因为 NE(0,0)和(1,1)有相同的payoff值。
解释
术语更自然且与经典博弈理论一致；
目的找到最小操作集以重现经典博弈模型，且根据初始量子态选择的不同、最终结果不同；
该模型能够给出唯一解（什么都不做），因为什么都不做认为比做操作的代价小。
有趣的结果：在经典博弈模型中受益的策略在量子模型中并不一定受益。
初始量子态：Bell态（|01>+|10>)/2-1 NE: (1,1)和（0,0）选择哪一个？Safer one Risk：
NE: (1,1)和（0,0）风险相同，选择哪一个？
假定两个玩家有足够的理由选择NE(1，1)，即使它不是唯一的NE。为保持公平，要求|C01|=|C10|.
I：interesting NI: not interesting
PA(s1,s2)= PB(s2,s1) （a）对称博弈
H：hawk D: dove
（c）鹰鸽博弈
C：cross S : stop
Win>Tie>Lose>Crash （b）胆小鬼博弈
a1 a2 , b1 b2 ,
c a1 a2 , d a1 a2 ,
时间：2014年10月9日
背景创新点对称和非对称协调博弈 Marinatto-Weber量子博弈量子非对称协调博弈结论
已有研究
量子方法：重复博弈、演化稳定策略、经济学博弈、量子噪声下
的量子博弈
博弈论
数学模型：理性玩家之间冲突与合作问题
应用广泛：经济学、计算机科学、生物学、
政治学等。
情ቤተ መጻሕፍቲ ባይዱ1：如果c,d满足
◦令 ◦ Payoff:
◦ NE(1,1)是唯一的NE。
情况2：如果c,d满足c<d
◦令 ◦ Payoff:
◦ Third NE:
Third NE的payoff值更小，因此理性玩家会更倾向于有最高payoff 的NE(1，1)。
情况3：如果c,d满足c>d
◦令 ◦ Payoff: