博弈论入门

合集下载

博弈论入门讲座心得体会

博弈论入门讲座心得体会

近日,我有幸参加了一场关于博弈论的入门讲座,主讲人是我国知名博弈论专家李教授。

此次讲座让我受益匪浅,不仅让我对博弈论有了初步的了解,还让我对现实生活中的诸多问题有了全新的认识。

以下是我对此次讲座的一些心得体会。

一、博弈论的基本概念博弈论,又称为对策论,是研究具有冲突和合作的个体或群体之间决策行为的数学理论。

在博弈论中,个体或群体被称为“博弈者”,他们通过策略的选择来影响博弈的结果。

博弈论主要研究以下几个方面:1. 博弈者:参与博弈的个体或群体。

2. 策略:博弈者在博弈过程中采取的行动方案。

3. 博弈结果:博弈者采取策略后所达到的状态。

4. 博弈类型:根据博弈者之间信息是否对称、博弈是否完全等标准,博弈论可分为多种类型,如零和博弈、非零和博弈、完全信息博弈、不完全信息博弈等。

二、博弈论在现实生活中的应用通过学习博弈论,我发现它在现实生活中的应用十分广泛。

以下列举几个例子:1. 经济领域:在市场竞争中,企业通过制定合理的定价策略、广告策略等,以期在博弈中获得优势。

此外,博弈论还可以用于分析国际贸易、资源配置等问题。

2. 政治领域:在政治决策中,博弈论可以用于分析不同政治势力之间的博弈关系,为决策者提供参考。

3. 社会领域:在人际交往中,博弈论可以帮助我们理解他人行为背后的动机,从而更好地处理人际关系。

4. 法律领域:在法律诉讼中,博弈论可以用于分析被告和原告之间的博弈策略,为律师提供辩护或诉讼策略。

三、博弈论的核心思想1. 利己主义:博弈论认为,博弈者追求自身利益最大化,这是博弈行为的基本出发点。

2. 策略互动:博弈者之间的决策并非孤立存在,而是相互影响的。

一个博弈者的策略选择会影响到其他博弈者的决策。

3. 有限理性:博弈者并非完全理性,他们在决策过程中会受到自身认知、信息获取等因素的限制。

4. 预测与应对:博弈者需要预测其他博弈者的行为,并制定相应的应对策略。

四、个人感悟通过此次讲座,我对博弈论有了以下几点感悟:1. 博弈论是一门实用的学科,它可以帮助我们更好地理解现实生活中的诸多问题。

「算法笔记」博弈论入门

「算法笔记」博弈论入门

「算法笔记」博弈论⼊门⼀、公平组合游戏 ICG1. 公平组合游戏的定义若⼀个游戏满⾜:1. 游戏有两个⼈参与,⼆者轮流做出决策。

2. 在游戏进程的任意时刻,可以执⾏的合法⾏动与轮到哪名玩家⽆关。

3. 不能⾏动的玩家判负。

则称该游戏为⼀个公平组合游戏。

2. ⼀些说明我们把游戏过程中⾯临的状态称为局⾯,整局游戏第⼀个⾏动的为先⼿,第⼆个⾏动的为后⼿。

我们讨论的博弈问题⼀般只考虑理想情况,即两⼈均⽆失误,都采取最优策略⾏动时游戏的结果。

定义必胜态为先⼿必胜的状态,必败态为先⼿必败的状态。

注意,在⼀般确定操作状态的组合游戏中,只会存在这两种状态,如果先⼿和后⼿都⾜够聪明,不会出现介于必胜态和必败态之间的状态。

⼀个重要的性质:⼀个状态是必败态当且仅当它的所有后继都是必胜态。

⼀个状态是必胜态当且仅当它⾄少有⼀个后继是必败态。

特别地,没有后继状态的状态是必败态(因为⽆法操作则负)。

⼆、Nim 博弈\(\text{Nim}\) 游戏是⼀个公平组合游戏。

⼤概是这样的:现在有 \(n\) 堆⽯⼦,第 \(i\) 堆有 \(a_i\) 个。

两⼈轮流操作,每⼈每次可以从任选⼀堆中取⾛任意多个⽯⼦,但是不能不取。

取⾛最后⼀个⽯⼦的⼈获胜(即⽆法再取的⼈就输了)。

结论:\(\text{Nim}\) 博弈先⼿必胜,当且仅当 \(a_1\oplus a_2\oplus \cdots \oplus a_n\neq 0\)。

证明:为了证明这个结论,我们需要证明:1. 所有⽯⼦都被取⾛是⼀个必败局⾯。

2. 对于任意⼀个局⾯,若 \(a_1\oplus a_2\oplus \cdots \oplus a_n\neq 0\),⼀定能得到⼀个 \(a_1\oplus a_2\oplus \cdots \oplusa_n=0\) 的局⾯。

3. 对于任意⼀个局⾯,若 \(a_1\oplus a_2\oplus \cdots \oplus a_n=0\),⼀定不能得到⼀个 \(a_1\oplus a_2\oplus \cdots \oplusa_n=0\) 的局⾯。

博弈论基础

博弈论基础

博弈论基础第一节博弈问题概述一、博弈的基本概念博弈论的基本概念包括:参与人、行为、信息、战略、支付函数、结果、均衡。

参与人是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体(如个人、厂商、国家)。

行动是指参与人的决策变量。

战略是指参与人选择行动的规则,它告诉参与人在什么时候选择什么行动。

例如,“人不犯我、我不犯人;人若犯我、我必犯人”是一种战略。

这里,“犯”与“不犯”是两种不同的行动。

战略规定了什么时候选择“犯”,什么时候选择“不犯”。

信息是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。

支付函数是参与人从博弈中获得的效用水平,它是所有参与人战略或行动的函数,是每个参与人真正关心的东西。

结果是指博弈者感兴趣的要素的集合。

均衡是所有参与人的最优战略或行动的组合。

上述概念中,参与人、行动、结果统称为博弈规则。

博弈分析的目的是使用博弈规则决定均衡。

二、博弈的分类根据博弈者选择的战略,可以将博弈分成合作博弈(cooperative games)与非合作博弈(non-cooperative games).合作博弈与非合作博弈之间的区别,主要在于博弈的当事人之间能否达成一个有约束力的协议。

如果有,就是合作博弈;反之,就是非合作博弈。

根据参与人行动的先后顺序,可以将博弈分成静态博弈(static game)与动态博弈(dynamic game)。

静态博弈是指,博弈中参与人同时选择行动;或者虽非同时行动,但行动在后者并不知道行动在先者采取了什么具体行动。

动态博弈是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。

根据参与人对其他参与人的了解程度,可以将博弈分成完全信息博弈(games of complete information)和不完全信息博弈(games of incomplete information)。

完全信息博弈是指:在每个参与人对所有其他参与人(对手)的特征、战略和支付函数都有精确了解的情况下,所进行的博弈。

博弈论基础

博弈论基础

其他参与人选择什么策略,某参与人的 最优策略是唯一的,这样的唯一的最优 战略被称为“占优策略”; � “博弈均衡”指博弈中的所有参与人都不想 改变自己的策略的这样一种状态。
(一)占优策略均衡
� 在一个博弈中,如果每个参与人都有一
个占优策略,且每个参与人都采取占优 策略,那么由所有参与人的(占优)策 略组合所构成的均衡就是占优策略均衡。 � 占优策略均衡的求解: 常用方法——划线法
“囚犯的困境”博弈中的“报酬矩阵” (Payoff Matris)
嫌犯B 坦白 不坦白 坦白 -10,-10 0,20 嫌犯A 不坦白 -20,0 -1,-1
三、占优策略均衡和纳什均衡
� (一)占优策略均衡 � (二)纳什均衡 � (三)占优策略均衡和纳什均衡比较
(一)占优策略均衡
� 占优策略(Dominant Strategies):不论
二、博弈的基本概念
� 1、参与人(players):一个博弈中独立决策、
独立承担结果的主体。 � 2、行动(actions or moves):参与人在博弈 的某个时点的决策变量。 � 3、策略(strategies):参与人在给定信息 集的情况下的行动规则 � 4、得益(pay off)(或支付、报酬):指在 一个特定的策略组合下参与人得到的确定效用 水平,或者是指参与人得到的期望效用水平。
(二)纳什均衡
� 在一个纳什均衡里,如果其他参与人不
改变策略,任何一个参与人都不会改变 自己的策略。
(二)纳什均衡
例:斗鸡博弈 B 进 A 退 0, 2 0,0 进 -3,-3 退 2,0
(三)占优策略均衡与纳什均衡比较
� 占优策略均衡要求任何一个参与人对于
其他参与人的任何策略选择来说,其最 优的策略都是唯一的。 � 纳什均衡只要求任何一个参与人在其他 参与人的策略选择给定的条件下,其选 择的策略是最优的。 � 占优策略均衡一定是纳什均衡,但纳什 均衡不一定就是占优策略均衡。

博弈论前四章笔记整理

博弈论前四章笔记整理

博弈论前四章笔记整理第一章:博弈论基础概念。

- 博弈的定义与要素。

- 博弈是指在一定的规则下,多个参与者(至少两个)进行策略选择并得到相应结果(收益)的过程。

- 要素包括参与者(局中人)、策略(每个参与者可选择的行动方案)、收益(每个参与者在不同策略组合下的所得)。

例如在“囚徒困境”中,两个囚犯是参与者,坦白或不坦白是他们的策略,不同策略组合下的刑期长短就是收益。

- 博弈的分类。

- 按参与者数量可分为两人博弈和多人博弈。

- 按策略空间是否有限分为有限博弈和无限博弈。

如猜硬币是有限博弈(正面或反面两种策略),企业的产量竞争(产量可在一定范围内连续取值)可能是无限博弈。

- 按收益情况分为零和博弈(一方的收益就是另一方的损失,总和为零,如赌博)、常和博弈(收益总和为常数)和非零和博弈(收益总和不为零,如企业合作共同开拓市场,双方都可能获利)。

第二章:完全信息静态博弈。

- 策略式表述(标准式表述)- 通常用一个矩阵来表示,行代表一个参与者的策略,列代表另一个参与者的策略,矩阵中的元素是对应的收益组合。

以“性别战”为例,丈夫和妻子选择看电影或看球赛,就可以构建一个2×2的收益矩阵。

- 占优策略均衡。

- 占优策略是指无论其他参与者选择什么策略,该策略都是某个参与者的最优策略。

如果每个参与者都有占优策略,那么由这些占优策略组成的策略组合就是占优策略均衡。

例如在“囚徒困境”中,每个囚徒的占优策略都是坦白,所以(坦白,坦白)是占优策略均衡。

- 纳什均衡。

- 纳什均衡是指在一个策略组合中,每个参与者的策略都是对其他参与者策略的最优反应。

即给定其他参与者的策略,没有参与者有动机单方面改变自己的策略。

与占优策略均衡不同,纳什均衡并不要求每个参与者都有占优策略。

例如在“性别战”中,(看电影,看电影)和(看球赛,看球赛)都是纳什均衡。

第三章:完全信息动态博弈。

- 扩展式表述。

- 包括博弈树的构建,节点表示参与者的决策点,树枝表示可选择的策略,终端节点表示博弈的结果并标有相应的收益。

高鸿业西方经济学-第10章博弈论初步dmqn.pptx

高鸿业西方经济学-第10章博弈论初步dmqn.pptx

30
第十章 博弈论初步 第三节 同时博弈:混合策略均衡
二、存在纯策略均衡时的混合策略均衡
求解混合策略纳什均衡的方法不仅适用于纯策略 纳什均衡不存在的情况,而且也适用于纯策略纳什均 衡存在的情况。在后面这种情况下,纯策略纳什均衡 将作为特例被包含在相应的混合策略纳什均衡之中。
2024年9月29日星期日
12
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
2.条件策略下划线方法的五步法 第二,在甲厂商的支付矩阵中,找出每一列的最大者 (每列的最大者可能不只一个),并在其下划线
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
13
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
个厂商都不再有单独改变策略的倾向时,整个博弈就 达到了均衡,即博弈均衡。
博弈均衡是博弈各方最终选取的策略组合,是博 弈的最终结果,是博弈的解。
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
8
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
四、纳什均衡
2.纳什均衡的概念 第一,纳什均衡的概念
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
24
第十章 博弈论初步 第三节 同时博弈:混合策略均衡
一、不存在纯策略均衡时的混合策略均衡
1.混合策略 第三,“混合”策略的概念
把甲厂商和乙厂商原来的策略叫做“纯”策略, 把赋予这些纯策略的概率向量叫做“混合”策略。
2024年9月29日星期日
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
23
第十章 博弈论初步 第三节 同时博弈:混合策略均衡

博弈论 基础 数学

博弈论 基础 数学

博弈论是一门研究决策问题的学科,它主要关注如何在有限的资源和信息条件下进行决策,以及不同决策对于结果的影响。

在博弈论中,人们通常会将所有可能的决策结果,以及不同决策结果的概率、收益等因素进行抽象和计算,从而得到最优决策方案。

博弈论的基础数学包括以下几个方面:
1. 集合论和命题逻辑:
-博弈论中的集合是指由一组元素组成的对象,在集合论中,可以用各种符号和运算来描述和计算不同集合之间的关系。

-命题逻辑是一种处理命题(或陈述)之间关系的方法,其中包括真值表、命题符号、蕴含关系等概念。

2. 概率论与统计学:
-在博弈论中,概率论用于计算不同决策结果的概率和期望收益,从而帮助人们进行决策。

-统计学则用于对已有数据进行分析和推断,从中发现规律、总结经验以及预测未来的趋势。

3. 线性代数:
-线性代数是一门研究向量空间和线性变换的学科,它在博弈论中被广泛应用于处理矩阵、向量、线性方程组等问题。

4. 最优化理论:
-最优化理论是一种研究如何在限制条件下找到最优解的方法,它在博弈论中被用来寻找最优决策方案。

5. 数理逻辑:
-数理逻辑是研究符号语言和推理的学科,它在博弈论中主要用于形式化建模和证明博弈论中的结论。

综上所述,博弈论的基础数学包括集合论、命题逻辑、概率论与统计学、线性代数、最优化理论和数理逻辑等多个方面。

掌握这些数学知识对于理解和应用博弈论具有重要的意义。

博弈论基础知识汇总

博弈论基础知识汇总

博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究,目前主要有两种方法。

一种是“进化博弈论方法”。

它将人类的经济活动和竞争性经济行为同生物的进化相类比,研究人类经济行为中的策略和行为方式的均衡,以及向均衡状态调整、收敛的过程与性质。

另一种新方法是“重复博弈论方法”,它运用更精细的均衡概念,如“子博弈精炼均衡”来分析历史与现实中的制度选择与变迁过程。

基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。

其中局中人、策略和收益是最基本要素。

局中人、行动和结果被统称为博弈规则。

博弈主要可以分为合作博弈和非合作博弈。

合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈、从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。

完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。

纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。

在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

博弈论看法博弈论的基本假设:参与人追求利润最大化。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

“博弈树”(game tree)
决策节点(decision nodes) 末端节点(terminal nodes) 图论(graph theory) 棱(edge) 有向棱(directed edges) 博弈的展开型表示(extensive-form representation of games) 展开型博弈(games in extensive form)
图1.1诺曼低战役攻防演练
敌 A B C D
+
a 我 b
+ _ + + _ _ _ + _
_ + + + + _
_ _ +
_ _ + _ +
c
图1.2攻防演练
敌 A B C D
+
a 我 b
+ _ + + _ _ _ + _
_ + + + + _
_ _ +
_ _ + _ +
c
图1.3攻防演练
敌军 B C
“囚徒困境”(prisoners’ dilemma)博弈

坦白
抵赖
-3
甲 坦白
-5 0 -1 -1
-3 0 -5
抵赖
“抓钱” 博弈
同时决策博弈(simultaneous-move games) 静态博弈(static game) 序贯决策博弈(sequential-move games) 动态博弈(dynamic game)
甲 不拿 乙 不拿 甲 不拿 乙 不拿 (6,4) 拿 拿 拿 拿
(2,0)
(1,3)
(4,2)
(3,5)
+
a 我军
_ + + _ + _
_ + _ _ +
b
c
图1.4攻防演练
敌军
B
C
+
我军 a
_ + + _
_ _ +
b
博弈三要素和囚徒困境
参与人或局中人(player) 行动(action)或策略(strategy) 对局(strategy profile)或策略组合 (strategy combination),记作 (a,B)。 参与人的支付ohn Nash, Jr.) 谢林(Thomas Schelling) 哈萨尼(John C. Harsanyi) 泽尔滕(Reinhard Selten) 夏普利(Lloyd Shapley)
美国本科教材:
迪克西特(Avinash Dixit)和斯凯思(Susan Skeath)
博弈论入门
北京邮电大学 高丛 副教授、博士 gaocong@
基本内容
博弈论的基本概念 基本方法 内容主要集中于完全信息静态博弈 以及完全信息动态博弈
Paul Samuelson
要想在现代社会做一个有文 化的人,你必须对博弈论有 一个大致了解。
经典意义上的经济学
形势严峻也好宽松也好,行为的结果是主 体人自己决策的结果。 Price maker Price taker
博弈论(game theory)
就是研究利益关联(包括利益冲突)的主 体人的对局的理论,是分析人们在博弈中 的理性行为的理论,是讨论人们在博弈的 交互作用中如何决策的理论。
《博弈论与经济行为》 1943年
Theory of Games and Economic Behavior
冯·诺意曼 John von Neumann 摩根斯滕 Oskar Morgenstern
《策略博弈》
(Games of Strategy, Norton, New York)
迪克西特(Avinash Dixit)和奈尔伯夫(Barry J Nalebuff)
《策略思维》
(Thinking Strategically, Norton, New York)
导入故事:
张三:两个师 李四:三个师 通往城市有甲乙两条路 为什么胜算概率是一半对一半?
图1.5诺曼低战役模拟
德军 A B C D
+1
a 盟 军 b
+1 -1 +1 +1 -1 -1 -1 +1 -1
-1 +1 +1 +1 +1 -1
-1 -1 +1
-1 -1 +1 -1 +1
c
二人博弈的支付矩阵(payoff matrix)
博弈的矩阵型表示(matrix-form representation of games) 博弈的正规型表示(normal-form representation of games) 博弈的策略型表示(strategic-form representation of games) 矩阵型博弈(games in matrix form) 正规型博弈(games in normal form) 矩阵博弈(game matrix)
图1.7“利益一致”的“抓钱博弈”
甲 不拿 乙 不拿 甲 不拿 乙 不拿 (5,5) 拿 拿 拿

(1,1)
(2,2)
(3,3)
(4,4)
图1.8“你死我活”的“抓钱博弈”
甲 不拿 乙 不拿 甲 不拿 乙 不拿 (10,0) 拿 拿 拿

(2,0)
(0,4)
(6,0)
(0,8)
图1.9“温和对抗”的“抓钱博弈”
李四有四种部署方案
A,三个师都驻守甲方向; B,两个师驻守甲方向,一个师驻守乙方 向; C,一个师驻守甲方向,两个师驻守乙方 向; D,三个师都驻守乙方向。
张三可以有三种部署方案:
a,集中全部两个师的兵力从甲方向攻击; b,兵分两路,一师从甲方向,另一师从乙方 向,同时发起攻击; c,集中全部两个师的兵力从乙方向攻击。
相关文档
最新文档