学科史:博弈论
博弈论方法

博弈论方法博弈论是一门多学科交叉学科,将数学、经济学、心理学、社会学、政治学等视野结合起来,研究智能体之间的决策行为,从而获得更有效的结果。
一、定义:博弈论主要是根据博弈的模型,对研究对象的博弈行为进行建模分析,利用数学技术找出一种最佳策略,从而达到解决大型复杂博弈决策问题。
二、历史发展:1. 早期发展:早期博弈论由英国数学家凯恩斯(John C.H.Keynes)所提出,他将博弈论用于了经济学,对二人博弈的构造展开过研究;2. 现代发展:20世纪50-60年代,美国数学家约翰·哈德曼(John von Neumann)与奥地利数学家普林斯顿(Oskar Morgenstern)共同编写的著作《博弈论理论》,奠定博弈论现代发展的坚实基础。
三、理论基础:1. 互相博弈:智能体彼此之间进行决策对抗,考虑彼此策略以及环境变量等;2. 博弈模型:针对某一特定问题,整理分析有限信息,建立博弈模型,以助于解决决策问题;3. 决策理论:主要研究决策者为得到最优解而所采取的收益最大化和风险最小化的策略;4. 决策树:是一种类型的博弈模型,用来建模智能体之间可能发生的决定步骤,有助于确定最优解。
四、应用:1. 经济学和金融学:博弈论模型在经济学和金融学中应用广泛,可用于垄断定价和资源分配;2. 游戏论:引入了许多人工智能技术,在策略行为方面有众多研究成果;3. 决策-支持系统:主要服务于决策支持,利用博弈论及其衍生的技术来求解决策方案;4. 武器决策:根据双边或多边博弈模型,来评估武器的有效性。
五、总结:博弈论由于其充分结合各种科学视角建模决策,因此受到越来越多的重视,广泛应用于经济学、金融学、游戏论、决策支持系统等诸多领域,对提高决策效率具有重要意义和作用。
未来,随着科技和数学等方面的发展,博弈论也将会得到更全面、更有效的应用,从而发挥更大作用。
博弈论

博弈类型:时间性
• 从行为的时间序列性,博弈论进一步分为静态博弈、动态 博弈两类:静态博弈是指在博弈中,参与人同时选择或虽 非同时选择但后行动者并不知道先行动者采取了什么具体 行动;动态博弈是指在博弈中,参与人的行动有先后顺序, 且后行动者能够观察到先行动者所选择的行动。通俗的理 解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌 类游戏等决策或行动有先后次序的,属于动态博弈。
智猪博弈
• 假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪 食槽,另一头安装着控制猪食供应的按钮,按一下按 钮会有10个单位 的猪食进槽,但是谁按按钮就会首 先付出2个单位的成本,若大猪先到槽边,大小猪吃 到食物的收益比是9∶1;同时行动(去按按钮), 收益比是7∶3;小猪先 到槽边,收益比是6∶4。那 么,在两头猪都有智慧的前提下,最终结果是小猪选 择等待。 "智猪博弈"由纳什于1950年提出。实际上小猪选择 等待,让大猪去按控制按钮,而自己选择“坐船”( 或称为搭便 车)的原因很简单:在大猪选择行动的前 提下,小猪选择等待的话,小猪可得到4个单位的纯 收益,而小猪行动的话,则仅仅可以获得大猪吃剩的 1个单位的纯收 益,所以等待优于行动;在大猪选择 等待的前提下,小猪如果行动的话,小猪的收入将不 抵成本,纯收益为-1单位,如果小猪也选择等待的话, 那么小猪的收益为 零,成本也为零,总之,等待还 是要优于生美女主动过来和你搭讪,并 要求和你一起玩个游戏。美女提议: “让我们各自亮出硬币的一面,或正 或反。如果我们都是正面,那么我给 你3元,如果我们 都是反面,我给你1 元,剩下的情况你给我2元就可以 了。”听起来不错的提议。如果我是 男性,无论如何我是要玩的,不过经 济学考虑就是另外一回事了,这个游 戏真的够公平吗? 绅士/美 女 绅士正 面 绅士反 面 美女正 面 3,-3 美女反 面 -2,+2
3博弈论发展史

奥斯卡·摩根斯坦( Oskar Morgenstern)
1902-1977,生于西里西亚的戈尔 利策。1944年加入美国籍。热心于将 数学应用于人类的各种战略问题(不 管是商业、战争,还是科学研究), 以便获得最大利益和尽可能地减少损失。他认 为 这些原理也同样适用于哪怕简单得象抛掷硬 币这样的游戏,因而提出了对策论(博弈 论)。
约翰·冯·诺依曼 ( John Von Neumann)
1903-1957,美藉匈牙利人。18岁与老师合作 发表第一篇数学论文,22岁获数学博士学位。 1927年一1929年冯·诺依曼相继在柏林大学和汉堡 大学担任数学讲师。1931年成为美国普林斯顿大学 的第一批终身教授。1933年转到该校的高级研究所, 成为最初六位教授之一,并在那里工作了一生. 冯·诺依曼是普 林斯顿大学、宾夕法尼亚大学、哈佛大学、伊斯坦堡大学、马 里兰大学、哥伦比亚大学和慕尼黑高等技术学院等校的荣誉博 士.是美国国家科学院、秘鲁国立自然科学院和意大利国立林 且学院等院的院士. 1954年任美国原子能委员会委员;1951年 至1953年任美国数学会主席。“计算机之父”“博弈论之父”。
3.2.2 子博弈完美纳什均衡和贝叶斯纳什均衡 (Subgame-Perfect Nash-Equilibrium; Bayes-Nash Equilibrium) 1965年和1975年兰哈德·泽尔藤(Reinhard Selten)把 纳什均衡推广到动态博弈,并提出子博弈完美纳什均 衡; 1967-1968年间,约翰·海萨尼(John Harsanyi)把纳 什思想推广到不完全信息模型,提出贝叶斯均衡; 他们与纳什一起分享1994年诺贝尔经济学奖
(The theory of Games and Economic Behaviour)
博弈论的发展历程

博弈论的发展历程虽然早在18世纪初以前便开始了对具有策略依存特点的决策问题的零星研究,但博弈论真正的发展还是在20世纪。
20世纪初期是博弈论的萌芽阶段,其研究对象主要是从竞赛与游戏中引申出来的严格竞争博弈,即二人零和博弈。
这类博弈中不存在合作或联合行为,对弈两方的利益严格对立,一方所得必意味着存在另一方的等量损失。
这符合下棋等二人室内游戏的情形,但应用在经济与政治上,则大多数情况并不合适。
此时,关于二人零和博弈理论有丰硕的研究成果,尤其是提出了博弈扩展型策略、混合策略等重要概念,为日后研究对象范围的拓展与研究的深化奠定了基础。
这一阶段最重要的成就是泽梅罗定理(1913)与冯·诺伊曼的最小最大定理(1928),后者为二人零和博弈提供了解法,同时对博弈论的发展产生了重大影响,例如非合作几人博弈中的基本概念——纳什均衡就是最小最大定理的延伸与推广。
1944年,美国数学家冯·诺伊曼(Von Neumann)和摩根斯坦(Morgensien)合著的《博弈论与经济行为》一书的出版,标志着系统的博弈理论的初步形成。
该巨著汇集了当时博弈论的研究成果,将其框架首次完整而清晰地表述出来,使其作为一门学科获得了应有的地位。
同时身为经济学家的摩根斯顿首先清楚而全面地确认,经济行为者在决策时应考虑到经济学上的利益冲突性质。
该书详尽地讨论了二人零和博弈,并对合作博弈作了深入探讨,开辟了一些新的研究领域。
更重要的是将博弈论加以空前广泛的应用,尤其是在经济学上,由于博弈论数学上的严整性与经济学应用上的广泛性,一些经济学家将该巨著的出版视为数理经济学确立的里程碑。
接下来的一段时期对合作博弈的研究有了长足进步。
按豪尔绍尼(1966)的观点,如果一博弈中意愿表示——协议、承诺、威胁——具有完全的约束力并可强制执行,则该博弈是合作的。
如意愿表示不可强制执行,则为非合作博弈。
非合作博弈随后发展起来,纳什、泽尔滕和豪尔绍尼因此而获奖,但当时注意力主要集中在合作博弈上。
博弈论发展史及主要著作

博弈论发展史及主要著作博弈论发展史及主要著作纳什(JohnNash)、泽尔腾(ReinhardSelten)和海萨尼(JohnHarsany)三位博弈理论家和经济学家。
第一阶段:1944年以前,早期思想和基本概念的形成。
1838年,法国经济学家奥古斯汀古诺(AugustinCournot)在分析生产者竞争时,就利用均衡概念研究了寡头市场的情况,并使用了解的概念,该概念实际上是后来的纳什均衡的一种严格说法。
1881年英国经济学家埃奇沃斯(FrancisY.Edgworth)提出了"契约曲线(ContractCurve)"作为决定个体之间交易结果题目的一个解。
1913年,博弈论中第一个定理--泽梅罗定理(ZermeloTheorm)断言,国际象棋是严格确定的,尽管泽梅罗定理的适用范围是具有完全信息的两人零和博弈,但它的影响是巨大的,在五六十年代曾引起很多博弈论专家和经济学家的广泛深进研究。
1921― 1927年间,波莱尔(EmileBorel)发表了四篇关于策略博弈的文章,第一次给出了一个混合策略的现代形式,并找到了有3个或多个可能策略的二人博弈的最小最大解。
1928年,冯诺伊曼(JohnvonNeumann)证实了最小最大定理,该定理被以为是博弈论的精华,博弈论中的很多概念都与该定理相联系。
1930年泽尤森(F.Zeuthen)的著作《垄断题目与经济竞争》出版,在书中他提出了一个关于讨价还价题目的解,该解后来被海萨尼证实与纳什的讨价还价解是等价的。
此外,这一阶段还提出了博弈的扩展形式、纯策略、策略形式、混合策略、个体理性等重要概念。
第二阶段:1944~1959年,现代博弈论的建立与理论体系的基本形成。
1944年,美国普林斯顿大学的著名数学家冯诺伊曼和经济学家摩根斯坦(OskarMorg enstern)合著的《博弈论与经济行为》一书出版。
该书在详述两人零和博弈理论的同时,在博弈论的诸多方面做出了开创性研究,如合作博弈、可转移效用、同盟形式以及冯诺伊曼--摩根斯坦稳定集等,该书还说明了导致后来在经济学中广泛应用的公理化效用理论。
博弈论历史

博弈论历史博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
以下是我为你整理的博弈论发展历史。
欢迎欣赏阅读。
博弈论发展历程博弈的原始思想萌芽于两千多年前,《孙子兵法》、《孙膑兵法》、《三十六计》、《六韬》等书中就有许多博弈案例,“田忌与齐王赛马”就是博弈实例之一。
《摩诃婆罗多》、《梨俱吠陀》、《圣经》中记述了骰子游戏,我国在春秋战国时期就出现六博、围棋等博弈。
在西欧,德国哲学家和数学家莱布尼茨于1710年就预言了关于策略博弈理论出现的必要性和可能性。
其后两年,詹姆斯·华尔德格拉特James Waldradre首次提出了“极小极大”定理的概念。
虽然对具有策略依存特点的决策问题的零星研究则可上溯到18世纪初甚至更早,但是,博弈论的真正发展与成熟还是在20世纪。
在20世纪20年代,法国数学家波莱尔 Borel最早用数学语言刻画了博弈问题,提出了“策略”和“混和策略”概念,用最佳策略和概念研究了下棋和其它许多具体的决策问题,并试图把它们作为应用数学的分支加以系统研究。
冯·诺伊曼Von Neumann是博弈论又称对策论的创始人之一,1928年他发表“关于伙伴游戏理论”Zur Theorie der Gesellschaftsspiele提出两人零和博弈的极小极大定理。
他首次证明了博弈论基本定理,即“每个矩阵博弈都能通过引进混合策略而被严格决定”,现代博弈论正式诞生。
他讨论了合作对策问题,特别是三人零和博弈中有两方联合的情形,结果表明在附加条件下,N人博弈问题的解存在且唯一。
1944年冯·诺伊曼和摩根斯坦Morgenstern合作的《博弈论和经济行为》一书提出合作博弈的基本模型,标志着系统的博弈理论的初步形成。
他们创立了博弈论研究的基本概念。
到20世纪50年代,合作博弈发展到鼎盛时期,包括纳什Nash和夏普里shapley的“讨价还价模型”,吉尔斯Gillies和夏普里关于合作博弈中的“核”Core的概念以及其他一些人的贡献。
简述博弈论产生与发展过程
博弈论的发展历程一、博弈论起源博弈论(Game Theory)起源于上世纪初的数学领域,最初是作为数学的一个分支被研究的。
它主要研究在策略性决策场景中,参与者的最优行为及其相互影响。
这一理论的诞生,可以追溯到1913年,Borel在一般集合论的基础上定义了对策论的基本概念。
二、经典博弈理论在博弈论的发展历程中,经典博弈理论在上世纪中叶占据主导地位。
这一阶段的主要代表人物包括John von Neumann和Oskar Morgenstern。
他们于1944年合作发表了《博弈论与经济行为》一书,提出了著名的“冯·诺依曼-摩根斯坦博弈模型”,为现代博弈论的发展奠定了基础。
三、非合作博弈理论非合作博弈理论(Non-cooperative Game Theory)是上世纪50年代后期发展起来的,代表人物包括Gerard Debreu和John Harsanyi。
他们提出了非合作博弈的纳什均衡概念,成为现代博弈论中的重要基石。
非合作博弈理论主要研究在信息不完全或不确定的情况下,参与者如何选择自己的最优策略。
四、合作博弈理论与非合作博弈理论相对,合作博弈理论强调参与者之间的合作可能性和最优策略的均衡。
这一理论在上世纪60年代逐渐发展起来,代表人物包括R.B. Myerson和Roger Wollenstein。
合作博弈理论主要研究如何通过合作实现各方的利益最大化,以及如何分配这些利益。
五、演化博弈理论演化博弈理论(Evolutionary Game Theory)是在上世纪70年代发展起来的,其代表人物包括John Maynard Smith和George R. Price。
这一理论从生物进化论的角度出发,研究参与者如何通过学习和适应环境,实现最优策略的选择。
演化博弈理论在经济学、生物学和心理学等领域得到了广泛应用。
六、动态博弈理论动态博弈理论(Dynamic Game Theory)是在上世纪80年代开始发展的,其代表人物包括Arrow Kenneth J.和Leslie Richard Stallings。
博弈论发展脉络和理论体系
博弈论发展脉络和理论体系博弈论是一门研究决策者在互相竞争和协同合作时所采取的策略和行动的数学理论,它主要研究的是在竞争环境下的决策问题,即某个人或机构采取的决策如何受到其他人或机构的决策的影响。
在博弈论的发展历程中,其理论体系经历了多个阶段的演变和发展,现将其脉络和理论体系做一简要介绍。
一、传统博弈论阶段(1944-1984)传统博弈论又称纯策略博弈论,它是博弈论早期的理论体系。
在这一阶段,博弈论家主要关注的是零和博弈问题(即博弈双方的利益是完全矛盾的,一方获利必然意味着另一方的损失),并且认为博弈参与者的理性是无限的,因此他们将人的行为视为机器人完美遵循的动作,从而导致了一些问题,例如纳什均衡理论。
二、非合作博弈论阶段(1985-1995)1985年,约翰纳什(John Harsanyi)和约翰·内什(John Nash)与雷因哈滕·塞尔丹(Reinhard Selten)共同获得了诺贝尔经济学奖,这也标志着博弈论进入了一个新的阶段:非合作博弈论阶段。
与传统博弈论不同的是,非合作博弈论允许参与者做出有限理性决策,因此更贴近现实世界。
同时,非合作博弈论也开创了博弈论的实证研究,即模拟实验和行为经济学的提出。
三、协作博弈论阶段(1996-至今)协作博弈论是博弈论的又一个重要分支,它与传统博弈论的零和博弈相反,认为在博弈中,参与者可以通过合作来实现共同福利的最大化,因此在这种博弈形式中,博弈双方并非完全矛盾的,而是各有所得。
协作博弈理论的提出对于博弈论理论体系的完善起到了重要作用。
总之,博弈论在发展历程中逐渐从理论到实践,从传统博弈到非合作博弈、再到协作博弈,增加了对真实世界的洞察力和预测性,对于解决现实问题具有重要的指导意义。
未来,博弈论还将继续深入研究,探索更加复杂、多样化的博弈形式,并进一步将其应用到各个领域,为社会进步和经济发展做出更大的贡献。
第六章博弈论
一般认为,1944年美国数学家冯•诺依曼(John Von Neumann)和经济学家奥斯卡•摩根斯坦 (Oskar Morgenstern)合著的《博弈论与经济 行为》(The Game Theory and Economic Behavior) 一书的出版,标志着系统的博弈理 论的形成。
❖该书详尽地讨论了二人零和博弈, 并对合作博弈作了深入探讨,开辟 了一些新的研究领域。更重要的是 将博弈论加以空前广泛的应用,尤 其是在经济学上,由于博弈论数学 上的严整性与经济学应用上的广泛 性,一些经济学家将该巨著的出版 视为数理经济学确立的里程碑。
“保证最低价格”策略
❖ “保证最低价格”条款。
❖ 该条款一般规定:“顾客在本 商店购买这种商品一段时间内,如 果发现其他任何商店以更低的价格 出售同样的商品,本店将退还差价, 并补偿差额的10%。”
❖ 一、单项选择题:
❖ 分析下列的报酬矩阵,回答问题:
John的 开业长时间 咖啡 馆 开业短时间
✓ 第一,不能让对方事先知道自己可 能采取的策略。
✓ 第二,必须采取随机选择的原则。 ✓ 第三,选择策略的概率一定要使对
方无机可乘。
动态博弈
➢重复博弈 ➢序列博弈
重复博弈
❖ 对重复博奕的研究结果证明有一种 最好的策略:只需将一个原则贯穿始终, 即“以牙还牙”(Tit-for-tat)。
❖ 以牙还牙策略的获胜有一个十分重 要的条件,即博弈是无限次重复的。
❖王则柯 :《新编博弈论平话》 中信出版社 ❖ 王则柯主编:《21世纪经济学教材:博弈论
教程》中国人民大学出版社
❖ 《美丽心灵》(A Beautiful Mind )是一部关于一个 真实天才的极富人性的剧情片。故事的原型是数学家 小约翰-福布斯-纳什(Jr.John Forbes Nash)。英俊而又 十分古怪的纳什早年就作出了惊人的数学发现,开始 享有国际声誉。但纳什出众的直觉受到了精神分裂症 的困扰,使他向学术上最高层次进军的辉煌历程发生 了巨大改变。面对这个曾经击毁了许多人的挑战,纳 什在深爱着的妻子艾丽西亚(Alicia)的相助下,毫不畏 惧,顽强抗争。经过了几十年的艰难努力,他终于战 胜了这个不幸,并于1994年获得诺贝尔奖。这是一个 真人真事的传奇故事,今天纳什继续在他的领域中耕 耘着。
《博弈论》
博弈论在大数据分析中的应用
数据挖掘
博弈论可以应用于数据挖掘中的关联规则挖掘、分类和聚类等问 题,如基于博弈论的关联规则挖掘算法等。
异常检测
博弈论可以应用于异常检测中的异常值识别和分类等问题,如基 于博弈论的异常检测算法等。
推荐系统
博弈论可以应用于推荐系统中的用户行为预测和个性化推荐等问 题,如基于博弈论的推荐算法等。
04
博弈论的应用领域
经济领域
价格竞争
博弈论可以用来分析企业之间的价格竞争,研究竞争对手的反应 和策略,以制定更有效的定价策略。
寡头市场
博弈论可以用来研究寡头市场的均衡和稳定性,分析不同寡头企业 的策略和相互影响。
拍卖理论
博弈论可以用来研究拍卖机制的设计和优化,以提高拍卖的效率和 公平性。
政治领域
线性方程组
02
求解博弈中的均衡策略通常需要解线性方程组。
特征值与特征向量
03
一些博弈问题可以通过分析矩阵的特征值和特征向量来得到解
决。
概率论与数理统计基础
概率分布
在博弈中,支付通常被假 设为随机变量,其分布可 以通过概率分布来描述。
期望与方差
支付的期望和方差是博弈 论中常用的概念,它们可 以用来衡量支付的不确定 性。
弈。
特点
混合博弈既强调参与者的合作与协 商,又强调参与者的竞争与对抗, 通过综合运用两种策略实现自身利 益最大化。
应用领域
混合博弈在经济学、政治学、社会 学等领域都有广泛的应用,尤其是 在现实世界中,很多博弈都可以被 视为混合博弈。
03
博弈论的数学基础
线性代数基础
向量与矩阵
01
博弈论中经常使用向量和矩阵来表示策略和支付。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学科史:博弈论摘要本文基于《科学革命的结构》一书中的理论,以“范式”和“革命”为主线,对博弈论的发展历史做出了概括。
并从博弈论学科史出发,对库恩的理论做出了自己的理解和诠释。
1 前言博弈论是数学内一个重要的分支学科,研究个体在竞争中的行为与策略。
现今的博弈论在其他很多学科中都具有不同程度的应用,对科学界产生了广泛的影响。
我们希望从范式的视角,来探讨博弈论的学科发展历史,以及它与其他学科之间的互动。
2 前范式时期的研究模型在博弈论建立前,人类对博弈问题的研究并不少。
诸如如何赢得一场赌博,如何让一个垄断企业获利最多,如何在一场比赛中击败对方,科学家在各式的博弈问题中都取得了不小的成果,然而不同类型问题的解决方法往往不互通,无法形成一个可以为所有博弈问题提供指导的研究模式或范例。
2.1博弈游戏博弈游戏是一类具有严格的数学规则的游戏,每个玩家需要规划出一个行动策略,以此来适应其他玩家的行为、并最优化自己的游戏结果。
Nim游戏是一种经典的双人博弈游戏,它起源的时间地点有多种说法,但可以确定,不迟于15世纪,Nim就在西方流行起来了。
1901年,数学家布顿发现了一种简单的规则来快速判断游戏的胜负。
然而,这种方法在皮特·海因提出的一种简易变形中失效了,此后的数十年间,数学家也没能找到可推广于各种变形的一般性方法。
①另外,点框游戏、独粒钻石游戏、扑克以及各种棋类,都吸引到了数学家的兴趣。
这些游戏大多有一定的衍生版本,组合数学、概率论等不同方向的数学理论在不同规则体系的游戏中发挥了作用,但不同类型之间的研究却鲜有联系。
②2.2 古诺模型1838年,经济学家古诺提出了双寡头垄断模型,描述了两个生产相同产品的垄断工厂如何通过调节产量来最大化自身利润。
这也是微积分理论在经济领域早期的一次重要应用。
然而,古诺模型基于大量的前提条件:市场内仅有两个工厂,其产品没有任何差异,标定的价格一样,单位产量成本固定,双方的决策都假定对方不会更改决策。
③现实中的情况却往往不这么理想:工厂可能不止两个,不同工厂的产品存在差异,可调节的因素不仅限于产量,单个工厂不能掌握所有信息,并可以根据对手的行动改变策略。
因此,该模型具有很大的局限性。
针对这些局限性,后继的科学家做了一些改进。
在伯特兰德模型中,工厂可以调整产品的价格,来进一步提升竞争力;斯塔克尔伯格模型中,两个工厂不再完全对称,它们的决策①罗见今.Nim—从古代的游戏到现代的数学[J].自然杂志,1986(01):65-69.②夏艳清. 古今数学游戏[D].辽宁师范大学,2002.③张旭平,林勇.古诺模型的演化分析[J].北方经济,2010(02):30-32.有时间先后次序;对于完全信息等其他方面的限制,也分别存在着扩展的模型。
①这些变形有各自的优势,但相较最初的古诺模型,并无重大突破。
3 极小极大值理论与《博弈论与经济行为》3.1 极小极大值定理的背景与提出Le Her博弈是一种双人扑克游戏,数学家瓦德哥锐于1713年的研究中,提出了其中一个玩家采取某种策略,使得对手无论如何行动,都能保证某个最小利益,而对手则会寻求一个防止其高于最小利益的策略。
②这是博弈问题研究中首个包含极小极大值思想的解。
1921至1927年,数学家波莱尔根据关于Baccarat赌博的研究,重新定义了策略等相关概念,并首次给出了可选策略不超过5时的二人零和博弈的最优策略。
虽然波莱尔在论述可选策略超过5的情况时存在错误的臆断,但他的研究已经清楚地体现了一般性的极小极大值思想,极小极大值理论甚至可以从中推导出来。
⑤1928年,冯·诺依曼独立地首次提出了极小极大值定理,并在同一年给出了证明。
此后,许多博弈问题的研究都开始基于极小极大值定理。
⑤此外,冯·诺依曼在提出该定理时仅仅25岁,也印证了库恩观察到的现象,提出具有革命性的理论的学者往往比较年轻或者进入该领域不久。
3.2 《博弈论与经济行为》的发表、思想与影响基于极小极大值定理,冯·诺依曼于1944年和经济学家摩根斯坦合著了《博弈论与经济行为》。
他们建立了一套公理化体系,让经济问题可以转化为博弈问题,并得到精确的形式化数学描述。
他们也定义了博弈规则的不同组成元素,使单个具体的博弈问题能表示成一般性的标准形式。
③在数学界,“这本书出版之后立刻引起了众多数学家(主要是在美国)对这一定理的重新证明和在其它数学领域上的应用,并引出了不少新的数学思想,如统计决策理论等”⑥。
过去各种具体的博弈游戏在极小极大值视角下,相关研究发展显著加快,例如Nim游戏的各种变形发现了一般性的研究方法,而这些研究也引申出了一些更加抽象的概念、理论。
在经济学界,这本著作提供了一个全新的数学化研究工具,“经济学家热情洋溢地翻阅着,希望可以找到新的数学工具加以利用”④。
此外,在政治与军事上,它也有很高的应用价值,得出了不少相关的博弈模型。
《博弈论与经济行为》对博弈问题的研究产生了革命性的影响,被视为博弈论学科建立的标志。
它为相关领域带来了一种数学化的世界观,吸引到了大量学者的认同,也源源不断地提供了新的谜,逐渐被科学共同体接纳,成为了学者们公认的一套研究范式。
与库恩理论不同的是,这一范式并不是某个具体的范例,而是一套相对抽象的规则体系,但其仍然能指导常规研究。
4 纳什博弈理论4.1 冯·诺依曼理论的局限性尽管冯·诺伊曼与摩根斯坦为博弈论贡献了最初的范式,其理论的局限性也相当明显。
①鞠治安. 博弈论的演化路径研究[D].贵州大学,2017.②尚宇红.极小极大值理论的历史发展[J].西北大学学报(自然科学版),2003(02):245-248.③尚宇红. 博弈论前史研究[D].西北大学,2003.④麦克雷. 天才的拓荒者——冯·诺伊曼传[M].范秀华,朱朝晖,译.上海:上海科技教育出版社,2008.著名经济学与博弈论学者鲍莫尔评价道,在由极小极大值定理导出的两人零和游戏模型中,“一个玩家若能做出任何减损其他玩家利益的行为,他就一定会采取这种行为”①。
换言之,如果两个玩家之间的利益并非是完全冲突的,冯·诺伊曼与摩根斯坦主要讨论的零和的博弈模型就显得不合适了。
在多人博弈的情形中,利益完全冲突的假设则显得更为不合适。
尽管《博弈论与经济行为》中对多人博弈中的联盟进行了诸多讨论,但其中并未对玩家之间无法形成有效协议的非合作博弈进行讨论,因而难以解决诸如囚徒困境这样的问题。
即使是对于合作博弈,其中提出的“稳定集”也并非一个令人信服的解的概念,在经济行为中的应用十分有限。
值得注意的是,以上指出的这些冯·诺伊曼理论的局限性是站在纳什的新范式之上对旧范式的批评,而非冯·诺伊曼等博弈论学者对当时范式局限性的自觉反思。
4.2 纳什的理论贡献与第一次范式转换由冯·诺依曼的旧范式向纳什的新范式转换的直接原因,并非是科学共同体中的一部分科学家对认识到了上述理论的危机而试图寻求新的理论,而是在很大程度上要归功于纳什的个人工作。
纳什在卡内基·梅隆大学读本科期间选修了一门经济学课程,这也是他通过数学模型研究经济行为的起点,纳什的一部分工作在当时就已经完成。
值得注意的是,纳什当时甚至不知道博弈论这一学科的存在,也没有了解到冯·诺依曼的工作。
②从库恩的观点来看,纳什能够在博弈论领域破除旧的范式并做出开创性的贡献,也许恰好与他对原范式缺乏了解有关。
1948年9月,纳什来到普林斯顿大学读博士。
在1950-1953的短短几年间,纳什发表了四篇开创性的论文,这几篇论文构成了新范式的基石。
约翰·海萨尼将纳什在这一阶段的贡献总结为三点:⑨1.纳什对非合作博弈与合作博弈做出了明确的区分,两者的区别在于玩家之间能否达成有约束力的协议。
2.对于非合作博弈,纳什给出了称为“均衡点”的解的概念,纳什所称的“均衡点”后来被称为纳什均衡。
3.对于两人合作博弈,纳什也给出了相应的解的概念。
从表面上看,纳什的工作是对冯·诺依曼理论局限性的回应,但其中蕴含的是对博弈中玩家概念的根本性转变,即库恩所谓世界观的转变。
曼弗雷德·霍勒就曾指出,在纳什博弈理论中,玩家具有绝对理性且他们期望他们的对手也是绝对理性的,而在冯·诺依曼与摩根斯坦的理论中则没有这样的假设。
③这种观念上的转变表明,纳什的理论并非对旧范式的修正,而是革命性地创造了一个新范式。
4.3 纳什范式之下的理论与应用发展新范式的发展并非毫无阻力,例如,冯·诺依曼与摩根斯坦曾多次公开批评纳什有关合作博弈与非合作博弈的区分。
⑨尽管如此,纳什的理论仍在较短时间内获得了多数博弈论学者们的接受。
例如,在纳什的成果发表之后,纳什非合作博弈与合作博弈的划分被广泛接受,并在几乎所有的研究中被当成两类不同的问题分开考虑。
此外,纳什均衡概念为研究各类博弈问题提供了有力工具。
最为著名的例子当属纳什的导师艾伯特·塔克提出的囚徒困境,这一经典的非零和博弈问题利用纳什均衡可以得到很好①Baumol, William J. Economic theory and operations analysis. Prentice-Hall, Inc., Englewood Cliffs, New Jersey, 1972.②Kuhn, Harold W., et al. The work of John Nash in game theory. journal of economic theory 69.1: 153-185, 1994.③Holler, Manfred J. Classical, modern, and new game theory. Jahrbücher für Nationalökonomie und Statistik 222, no. 5, 2002.的解答。
其他的一些理论研究也均以纳什的理论为基础。
例如,哈罗德·库恩在1953年提出了拓展式博弈的概念,这一博弈模型允许指定玩家的决策顺序以及玩家在博弈的每一阶段所知道的信息。
库恩同时给出了这一模型下的一些基本定理。
①同一年,沙普利与吉利斯则提出了“核概念”,为合作博弈提供了一个一般的解。
②1967到1968年,海萨尼构建出了不完全信息博弈的基本框架,并提出了这一模型下博弈的均衡点——通常也被称为贝叶斯纳什均衡。
③五六十年代也出现了博弈论在其他学科的初步应用,其中与博弈论关系最为紧密的仍是经济学。
其次,政治学,生物进化学,哲学中均出现了纳什均衡的应用。
④4.4 纳什范式面临的危机纳什于博弈论的贡献毋庸置疑,但其理论也受到了许多批评。