3博弈论发展史

合集下载

微分博弈理论[优质PPT]

微分博弈理论[优质PPT]

经典案例:囚徒困境
• 一个案子的两个嫌疑 犯被分开审讯,警官 分别告诉两个囚犯, 如果你招供,而对方 不招供,则你将被立 即释放,而对方将被 判刑十年;如果两人 均招供,将均被判刑 两年。如果两人均不 招供,将最有利,只 被判刑半年。
经典案例:囚徒困境
• 两人同时陷入招供还 是不招供的两难处境。 但两人无法沟通,于 是从各自的利益角度 出发,都依据各自的 理性而选择了招供, 这种情况就称为纳氏 均衡点。
• 每一个局中人,不管他选 择什么方案,另一局中人 总希望使对方损失最大化, 也就是每个局中人将选择 使另一局中人把对方损失 最大化的企图最小化的策 略,这就是博弈论的最佳 策略准则。
纳什均衡点
• 纳什平衡,又称为非 合作赛局平衡,是博 弈论的一个重要概念, 以约翰·纳什命名。如 果某情况下无一参与 者可以独自行动而增 加收益,则此策略组 合被称为纳什均衡点。
• 方程(3)将这一微分博弈描述成最小最大值优化问题。
• L被设为在一个给定的仿真周期中,汽车侧翻角绝对值的 最大值,如方程(4)所示。
纳什均衡解
• 分析可得存在纳什均衡解(u*,w*),使得鞍点不等式 (5):
成立 • 纳什均衡解的含义是在最坏扰动W*(试图使L最大)
工况下,最好的控制器输入是U*(试图使L最小);反 之亦然。
纳什均衡解
• 其均衡解是通过进化遗传算 法得到的,对进化遗传算法 的适应性估计是在汽车仿真 软件Carsim上进行的。来自进化遗传算法的适应性估计
进化遗传算法流程图
数值仿真及结论
• 通过分析伯德图和在 Carsim中的仿真结 果,证明它设计的控 制器保证了在最坏的 转向角输入工况下最 坏防侧翻性能,同时 分别通过抵抗路面扰 动以及侧向加速度, 提供了良好的乘坐质 量以及防侧翻性能。

博弈论发展史上的重要人物

博弈论发展史上的重要人物


奥曼指出,竞争分配的核心和模式与厂商连 续统的市场相一致。奥曼通过精确表达完全竞争 观点的连续统模型,成功地使最初由埃奇沃思提 出,经许多其他模型改进的理论精确化,并从此 成为经济理论的基本准则之一。 完全竞争分析所获得的基本观点,使对完全 竞争之外的基本经济问题的研究成为可能并且更 加容易。在这方面,奥曼最重要的贡献和影响是 利用一个或更大的参与者的连续统建立的垄断和 寡头垄断竞争模型,以及公共经济学基于经济活 动和政治过程相互交织的税收模型,如表决、固 定价格模型等。

重复博弈论: 理论系统性的发展
• 重复博弈是指同样结构的博弈重复多 次,其中的每次博弈称为“阶段博弈”。 重复博弈是动态博弈中的重要内容,它可 以是完全信息的重复博弈,也可以是不完 全信息的重复博弈。奥曼对重复博弈的贡 献在于对理论系统性的发展起了一定的促 进作用。

完全信息的重复博弈的目的是解释 诸如合作、利他主义、报复、威胁(自 我破坏或其他)等现象。 • 而关于不完全信息的重复博弈的分 析被扩展至更一般的模型,即2人零和 博弈与非零和博弈。
合作与非合作博弈论: 非转移效用与理性的假设
• 非合作博弈论的重点是对个体的战略选 择,即每个参与者如何博弈,或者说选择 什么策略达到他的目标。与之不同,合作 博弈理论的重点则是对群体,并仅从更一 般的意义上阐述了每个联盟的赢得,而没 有说明如何赢得。
托马斯· 克罗姆比· 谢林

托马斯· 克罗姆比· 谢林 (Thomas Crombie 斯德哥尔摩宣布,将 2005年的诺贝尔经济学奖 授予美国马里兰大学的托马 斯· 谢林和以色列希伯莱大 学的罗伯特· 奥曼,以表彰 他们“通过博弈论分析,促 进了人们对冲突和合作的理 解”。

博弈论

博弈论

2.2.1 博弈论的定义现代经济学的最新发展有一个特别引人注目的特点,那就是博弈论在经济学中越来越受到重视。

博弈论,又称为对策论,它是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题①。

简单地说,就是研究决策主体的行为在发生直接相互作用时,他们如何进行决策,以及这种决策的均衡问题。

1944 年冯·诺依曼和摩根斯特恩(Morgenstern)合作出版了《博弈论与经济行为》(The Theory of Games and Economic Behavior),开始将博弈论引入经济学,成为现代经济博弈论研究的开端。

20 世纪50 年代纳什(John F. Nash)、塔克(Tucker)等人的研究,奠定了现代博弈论的基石。

在其后的几十年里,许多经济学家致力于博弈论的研究,1965 年泽尔腾(Reinhard Selten)将纳什均衡的概念引入了动态分析;1967-1968 年,海萨尼(John C. Harsanyi)把不完全信息分析引入博弈论的研究;1982 年克瑞普斯(David M. Kreps)和威尔逊(RobertWilson)分析了动态不完全信息条件下的博弈问题。

1994 年诺贝尔经济学奖授予了纳什、泽尔腾和海萨尼三位博弈论专家,此后在2001 年诺贝尔经济学奖同样授予了三位博弈论的专家②。

博弈论是一种关于行为主体策略相互作用的理论,它已形成了一套完整的理论体系和方法论体系。

它具有基本假设的合理性、研究对象的普遍性、研究结论的真实性、方法论的实证性等特点。

正是因为这些特点,博弈论的产生和发展引发了一场深刻的经济学革命,使得现代经济学从方法论,到概念和分析的方法体系,都发生了很大的变化。

正如克瑞普斯(Kreps)在《博弈论与经济模型》一书中指出“在过去一二十年中,经济学在方法论,以及语言、概念等等方面,经历了一场温和的革命,非合作博弈已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不①懂纳什均衡能够‘消化’近代文献的领域。

微分博弈理论教材

微分博弈理论教材
• 所谓鞍点规划就是以寻 求目标函数的鞍点为目 的的一种数学规划,用 以解决“极大值的极小 化”或“极小值的极大 化”问题。
Z
鞍点
Y X
马鞍面z=x2/4-y2/6
鞍点规划的数学模型
• 鞍点规划的数学模型:
• 上述鞍点规划模型中,决策变量x,y没有加任何限制。实 际上,x,y经常受到一定的约束,于是有以下约束鞍点规 划问题:
• 在数学中,把函数上具有上 述“极大一极小”性质的点 称为鞍点(Sadd了lePoint)。 把同鞍点有关的数学问题称 为鞍点问题。
形象地说,鞍点就是处于 “马鞍中央的点”,从纵向 看取极小值,从横向看取极 大值。
鞍点的含义
• 下面用二元函数z=f(x,y)来说明鞍点的含义: 对于二元函数z=f(x,y),(x*,y*)为其上一点。若 在邻域|x-x*|<£,|y-y*|<£内
博弈论
汇报人:张甲乐
什么是博弈论
• 博弈论亦称对策论, 运筹学的一个分支。 是研究有利害冲突的 双方在竞争性活动中, 如何制胜对方的最优 策略的数学理论和方 法。
博弈论的发展史
微分对策理论
《博弈·动态规划和计算机》
《博弈论和经济行为》
《战国策》 《孙子兵法》
古代产生了 朴素的博弈 论的思想
1944年美国 的J·冯诺意 曼和O·摩根 司坦发表了 巨著
• 这时,个体的理性利 益选择是与整体的理 性利益选择不一致的。
鞍点(Saddle point)
• 在微分方程中,沿着某一 方向是稳定的,另一条方 向是不稳定的奇点,叫做 鞍点。
• 在泛函中,既不是极大值 点也不是极小值点的临界 点,叫做鞍点。
• 在矩阵中,一个数在所在 行中是最大值,在所在列 中是最小值,则被称为鞍 点。

博弈论论文(囚徒困境案例纳什均衡案例完全信息静态博弈完全信息动态博弈)

博弈论论文(囚徒困境案例纳什均衡案例完全信息静态博弈完全信息动态博弈)

二、博弈论的发展史 2.1中国传统文化中的博弈论
在我国,博弈论的思想源远流长,古代人民很早就认识了博弈问题,虽然没有形 成一套完整的理论体系和方法,但博弈论的思想和实践活动,则可以追溯到 2000 多年 前。著名的"齐王与田忌骞马"就是一经典事例。这里,田忌进行的是"在给定齐王策略 不变情况下如何取胜"这一策略选择,实际上就是现代博弈论中的完全信息条件下的两 人博弈问题。著名的《孙子兵法》一书对战争胜负的认识,以及胜负之间诸因素的相 互作用的深刻论述,和所提出的一系列军事对策等,都反映出其系统的博弈论思想。 而《三十六计》则可以称做是一部活生生的军事博弈论教科书。《孙子兵法》和《三
博弈论论文
摘要:在现实生活中,人们的利益冲突与一致具有普遍性。因此,几乎所有的决 策问题都可以认为是博弈。虽然博弈论是数学的一个分支,但其应用范围十分广泛, 在经济学、管理学、社会学、政治学、法律学、军事学等领域都有许多成功运用博弈 论的案例。本文对博弈论发展简史、博弈论基本概念进行阐述,对囚徒困境、纳什均 衡、完全信息静态博弈、完全信息动态博弈、进行解析与案例分析。 关键词:博弈论、博弈论发展简史、博弈论基本概念、囚徒困境案例、纳什均衡 案例、完全信息静态博弈、完全信息动态博弈。
一、在生活中广泛应用的博弈论
在高飞老师的带领下,经过一段时间的学习,我对博弈论有了一些肤浅的理解。 诚然,一门学问想在短时间内有所深入理解是不现实的。生活之中到处充满着博弈, 有人说没有,那是因为缺少发现博弈现象的眼睛。 人生就是在弈棋,学会博弈。虽说 博弈不是万能的,但没有博弈现象存在的生活是万万不能的。 博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学 语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所 以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策 性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。目前在生 物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛 的应用。人们每天都面临着无数个选择,而博弈能运用具体的案例模型和相对应的决 策方法,让人们在最短的时间内作出最有利于自己的选择。 早在 1994 年,提出博弈均衡理论的纳什博士与他的伙伴哈尔萨尼教授、泽尔滕教 授就共同分享了当年的诺贝尔经济学奖和 93 万美元的奖金。2005 年,瑞典皇家科学 院再次把诺贝尔经济学奖颁给了有着以色列、美国双重国籍的罗伯特·奥曼和美国人托 马斯·谢林,以表彰他们在博弈论领域作出的贡献。纳什的贡献是在 1944 年与奥斯 卡·摩根斯特恩合著了《博弈论与经济行为》一书,标志着现代系统博弈理论的的初步 形成。而谢林和奥曼两位博弈论先驱在政治理论、社会学甚至生物学等方面成功运用 到了博弈学理论。奥曼用数学分析为博弈论列出了精确的公式,谢林则是想通过实践 来展示博弈论在社会各个领域的实际意义。他们两位利用博弈论对商业谈判、种族隔 离、武器控制等领域进行了实际分析,谢林教授认为博弈论运用的重要领域应该包括 核威慑和武器控制,同时还可以研究种族关系、有组织犯罪、雇员关系乃至自我管理 等方面。

博弈论发展史及主要著作

博弈论发展史及主要著作

博弈论发展史及主要著作博弈论发展史及主要著作纳什(JohnNash)、泽尔腾(ReinhardSelten)和海萨尼(JohnHarsany)三位博弈理论家和经济学家。

第一阶段:1944年以前,早期思想和基本概念的形成。

1838年,法国经济学家奥古斯汀古诺(AugustinCournot)在分析生产者竞争时,就利用均衡概念研究了寡头市场的情况,并使用了解的概念,该概念实际上是后来的纳什均衡的一种严格说法。

1881年英国经济学家埃奇沃斯(FrancisY.Edgworth)提出了"契约曲线(ContractCurve)"作为决定个体之间交易结果题目的一个解。

1913年,博弈论中第一个定理--泽梅罗定理(ZermeloTheorm)断言,国际象棋是严格确定的,尽管泽梅罗定理的适用范围是具有完全信息的两人零和博弈,但它的影响是巨大的,在五六十年代曾引起很多博弈论专家和经济学家的广泛深进研究。

1921― 1927年间,波莱尔(EmileBorel)发表了四篇关于策略博弈的文章,第一次给出了一个混合策略的现代形式,并找到了有3个或多个可能策略的二人博弈的最小最大解。

1928年,冯诺伊曼(JohnvonNeumann)证实了最小最大定理,该定理被以为是博弈论的精华,博弈论中的很多概念都与该定理相联系。

1930年泽尤森(F.Zeuthen)的著作《垄断题目与经济竞争》出版,在书中他提出了一个关于讨价还价题目的解,该解后来被海萨尼证实与纳什的讨价还价解是等价的。

此外,这一阶段还提出了博弈的扩展形式、纯策略、策略形式、混合策略、个体理性等重要概念。

第二阶段:1944~1959年,现代博弈论的建立与理论体系的基本形成。

1944年,美国普林斯顿大学的著名数学家冯诺伊曼和经济学家摩根斯坦(OskarMorg enstern)合著的《博弈论与经济行为》一书出版。

该书在详述两人零和博弈理论的同时,在博弈论的诸多方面做出了开创性研究,如合作博弈、可转移效用、同盟形式以及冯诺伊曼--摩根斯坦稳定集等,该书还说明了导致后来在经济学中广泛应用的公理化效用理论。

简述博弈论产生与发展过程

简述博弈论产生与发展过程

博弈论的发展历程一、博弈论起源博弈论(Game Theory)起源于上世纪初的数学领域,最初是作为数学的一个分支被研究的。

它主要研究在策略性决策场景中,参与者的最优行为及其相互影响。

这一理论的诞生,可以追溯到1913年,Borel在一般集合论的基础上定义了对策论的基本概念。

二、经典博弈理论在博弈论的发展历程中,经典博弈理论在上世纪中叶占据主导地位。

这一阶段的主要代表人物包括John von Neumann和Oskar Morgenstern。

他们于1944年合作发表了《博弈论与经济行为》一书,提出了著名的“冯·诺依曼-摩根斯坦博弈模型”,为现代博弈论的发展奠定了基础。

三、非合作博弈理论非合作博弈理论(Non-cooperative Game Theory)是上世纪50年代后期发展起来的,代表人物包括Gerard Debreu和John Harsanyi。

他们提出了非合作博弈的纳什均衡概念,成为现代博弈论中的重要基石。

非合作博弈理论主要研究在信息不完全或不确定的情况下,参与者如何选择自己的最优策略。

四、合作博弈理论与非合作博弈理论相对,合作博弈理论强调参与者之间的合作可能性和最优策略的均衡。

这一理论在上世纪60年代逐渐发展起来,代表人物包括R.B. Myerson和Roger Wollenstein。

合作博弈理论主要研究如何通过合作实现各方的利益最大化,以及如何分配这些利益。

五、演化博弈理论演化博弈理论(Evolutionary Game Theory)是在上世纪70年代发展起来的,其代表人物包括John Maynard Smith和George R. Price。

这一理论从生物进化论的角度出发,研究参与者如何通过学习和适应环境,实现最优策略的选择。

演化博弈理论在经济学、生物学和心理学等领域得到了广泛应用。

六、动态博弈理论动态博弈理论(Dynamic Game Theory)是在上世纪80年代开始发展的,其代表人物包括Arrow Kenneth J.和Leslie Richard Stallings。

微分博弈理论ppt课件

微分博弈理论ppt课件
• 这时,个体的理性利 益选择是与整体的理 性利益选择不一致的。
鞍点(Saddle point)
• 在微分方程中,沿着某一 方向是稳定的,另一条方 向是不稳定的奇点,叫做 鞍点。
• 在泛函中,既不是极大值 点也不是极小值点的临界 点,叫做鞍点。
• 在矩阵中,一个数在所在 行中是最大值,在所在列 中是最小值,则被称为鞍 点。
• 方程(3)将这一微分博弈描述成最小最大值优化问题。
• L被设为在一个给定的仿真周期中,汽车侧翻角绝对值的 最大值,如方程(4)所示。
纳什均衡解
• 分析可得存在纳什均衡解(u*,w*),使得鞍点不等式 (5):
成立 • 纳什均衡解的含义是在最坏扰动W*(试图使L最大)
工况下,最好的控制器输入是U*(试图使L最小);反 之亦然。
• 在数学中,把函数上具有上 述“极大一极小”性质的点 称为鞍点(Sadd了lePoint)。 把同鞍点有关的数学问题称 为鞍点问题。
形象地说,鞍点就是处于 “马鞍中央的点”,从纵向 看取极小值,从横向看取极 大值。
鞍点的含义
• 下面用二元函数z=f(x,y)来说明鞍点的含义: 对于二元函数z=f(x,y),(x*,y*)为其上一点。若 在邻域|x-x*|<£,|y-y*|<£内
纳什均衡解
• 其均衡解是通过进化遗传算 法得到的,对进化遗传算法 的适应性估计是在汽车仿真 软件Carsim上进行的。
进化遗传算法的适应性估计
进化遗传算法流程图
数值仿真及结论
• 通过分析伯德图和在 Carsim中的仿真结 果,证明它设计的控 制器保证了在最坏的 转向角输入工况下最 坏防侧翻性能,同时 分别通过抵抗路面扰 动以及侧向加速度, 提供了良好的乘坐质 量以及防侧翻性能。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.3.5 2005年罗伯特奥曼和托马斯谢林
3.3.6 2008年保罗克鲁格曼
3.4 博弈论研究的价值

3.3.2 子博弈完美纳什均衡和贝叶斯纳什均衡 (Subgame-Perfect Nash-Equilibrium; Bayes-Nash Equilibrium) 1965年和1975年兰哈德泽尔藤(Reinhard Selten)把 纳什均衡推广到动态博弈,并提出子博弈完美纳什均 衡; 1967-1968年间,约翰海萨尼(John Harsanyi)把纳 什思想推广到不完全信息模型,提出贝叶斯均衡; 他们与纳什一起分享1994年诺贝尔经济学奖
3.3.3 不对称信息条件下交易的对策 1996年诺贝尔经济学奖获得者詹姆斯莫里斯 教授和威廉姆维克瑞教授在20世纪60,70年 代提示不对称信息对交易带来的影响,并提出 相应对策.
3.3.4 信息经济 2001年诺贝尔经济学奖授予美国乔治阿克尔洛夫教 授,迈克尔斯彭斯教授,约瑟夫斯蒂格利茨教授. 20世纪70年代他们提示当代信息经济的核心,信息 是有价值的. 1970年阿克尔洛夫提出旧车市场模型并提出:市场 放开不能解决所有问题,信息是有价值的 1973年斯彭斯通过剖析人才市场盛行的造假行为指 出人才市场存在用人单位与应聘者之间的信息不对 称 ,造成"劣币"驱逐"良币"现象 斯蒂格利茨将信息不对称理论应用于保险和金融市场
(The theory of Games and Economic Behaviour)
被公认为是博弈论的开山之作.
以往的数学是在物理学的基础上发展起来的, 描述的是客观世界行为,而经济学研究的对象 更像是一场游戏中的参与者,相互之间预期对 方的行动,因此,描述,观察研究对象就需要 一系列的数学工具,这一套新的数学工具,被 他们命名为博弈论.
冯诺依曼和摩根斯坦的贡献
1,提出博弈的概念; 2,对效用理论给予公理依据; 3,零和博弈(Zero-sum Games)的最优解; 4,引进博弈论的一种形式,即合作博弈 (cooperative Games)
3.3 博弈论的发展
3.3.1 纳什均衡(Nash-Equilibrium) 1950年,约翰 纳什(John Nash)引入均衡(解) 的概念,即纳什均衡,将博弈论从零和博弈推 进到非零和博弈(即参与人会出现双赢或双输 的情况) 合作博弈中的讨价还价模型 定义非合作博弈及证明均衡解的存在 纳什获得1994年诺贝尔经济学奖
奥斯卡摩根斯坦( Oskar Morgenstern)
1902-1977,生于西里西亚的戈尔 利策.1944年加入美国籍.热心于将 数学应用于人类的各种战略问题(不 管是商业,战争,还是科学研究), 以便获得最大利益和尽可能地减少损失.他认 为 这些原理也同样适用于哪怕简单得象抛掷硬 币这样的游戏,因而提出了对策论(博弈 论).
3.2.2 早期突破 E策墨罗(EZermelo)于1913年对于象棋游戏 的研究.证明了象棋游戏总是有解,即在棋盘 的任何一种状态,两个参与者中的一个有赢的 策略.开创了求解一类博弈的技巧,即后退归 纳法
3.2.3 近代 (1) 约翰冯诺依曼(John von Neumann)于 1928发表的论文 (2) 1944年,科学家冯诺伊曼和经济学家奥斯 卡摩根斯坦合著《博弈与经济行为的理论》 《博弈与经济行为的理论》
第3章 博弈论发展历史
3.1 古代的博弈思想 3Байду номын сангаас2 博弈论的提出 3.3 博弈论的发展 3.4 博弈论研究的价值
3.1 古代的博弈思想
3.2 博弈论的提出
1.2.1 起源 法国经济学家奥古斯丁古诺(Augustin Cournot 1838)——古诺模型 英国经济学家弗朗西斯埃奇沃斯(Francis Edgeworth 1881) 伯川德(Bertrand)和斯坦克伯格(Stackelberg)
约翰冯诺依曼 ( John Von Neumann)
1903-1957,美藉匈牙利人.18岁与老师合作 发表第一篇数学论文,22岁获数学博士学位. 1927年一1929年冯诺依曼相继在柏林大学和汉堡 大学担任数学讲师.1931年成为美国普林斯顿大学 的第一批终身教授.1933年转到该校的高级研究所, 成为最初六位教授之一,并在那里工作了一生. 冯诺依曼是普 林斯顿大学,宾夕法尼亚大学,哈佛大学,伊斯坦堡大学,马 里兰大学,哥伦比亚大学和慕尼黑高等技术学院等校的荣誉博 士.是美国国家科学院,秘鲁国立自然科学院和意大利国立林 且学院等院的院士. 1954年任美国原子能委员会委员;1951年 至1953年任美国数学会主席."计算机之父""博弈论之父".
相关文档
最新文档