博弈论知识点总结完整版

博弈论知识点总结完整版
博弈论知识点总结完整版

博弈论

(一):基本知识

1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。

1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。

1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。倘若不能,则称非合作博弈(Non-cooperative game)。

合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。

博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。把两个角度结合就得到了4种博弈:

a、完全信息静态博弈,纳什均衡,Nash(1950)

b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)

c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)

d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)

1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈

1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)

1.6占优均衡:

a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。

对于所有的s-i,si*称为参与人

i的严格占优战略,如果满足:

ui(si*,s-i)>ui(si',s-i) ?s-i, ?

si' ≠si*

b、占优均衡:一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。

1.7重复剔除严劣策略均衡:

a、“严劣”和“弱劣”的含义:

设s i’和s i’’是参与人i可选择的两个策略,若对其他参与人的任意策略组合s-i, 均成立

u i(s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。

上面式子中,若将“<”改为“≤”,则说策略s i’弱劣于策略s i’’。

b、定义:重复剔除严格策略就是

各参与人在其各自策略集中,

不断剔除严劣策略…如果最终

各参与人仅剩下一个策略,则

该策略组合就被称为重复剔除

严劣策略均衡。

(二):纳什均衡(Nash Equilibrium)

2.1纳什均衡定义:对于一个策略式表述的博弈G={N,S i, u i,i∈N},称策略组合s*=(s1, …s i, …, s n)是一个纳什均衡,如果对于每一个i ∈N, s i*是给定其他参与人选择

s-i*={s1*, … ,s i-1*, s i+1*, … ,s n*} 情况下参与人i 的最优策略(经济理性策略),即:u i(s i*, s-i*) ≥ u i(s i, s-i*), 对于任意的s i∈S i ,任意的i∈N 均成立。

通俗定义:纳什均衡是一种策略组合,给定对手的策略,每个参与人选择自己的最优策略。纳什均衡是一种稳定的策略组合:当所有参与人的选择公开以后,每个人都满意自己作出了正确的选择;没有人能得到更好的结果了。在博弈论中这种结果被称为纳什均衡(NE)。

2.2定理:

Nash在1950年证明:任何有限博弈,都至少存在一个NE——Existence of Nash Equilibrium。即在一个有n个参与人的策略式博弈G={S1,…,Sn; u1,…,un}中,如果n 是有限的,且Si是有限集(i=1,…,n),则该博弈至少存在一个纳什均衡(在混合策略意义下)

Wilson(1971)证明,几乎所有有限博弈,都存在有限奇数个NE,包括纯策略NE 和混合策略NE。——Oddness Theorem

2.3纳什均衡、占优均衡、重复剔除严劣策略均衡的关系

定理a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡,但反过来不一定成立;

定理b 纳什均衡一定不能通过重复剔除严劣策略方法剔除。

2.4划线法

先找出自己针对其他博弈方每种策略或策略组合(对多人博弈)的最佳对策,即自己的可选策略中与其他博弈方的策略或策略组合配合,给自己带来最大得益的策略(这种相对最佳策略总是存在的,不过不一定唯一),然后在此基础上,通过对其他博弈方策略选择的判断,包括对其他博弈方对自己策略判断的判断等,预测博弈的可能结果和确定自己的最优策略。这就是划线法。

2.5箭头法

箭头法对于理解博弈关系很有好处,是寻找相对稳定性策略组合的分析方法。对博弈中的每个策略组合进行分析,考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益。如能,则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组。最后综合对每个策略组合的分析情况,形成对博弈结果的判断。划线法和箭头法的结果是一致的,可以相互替代。

(三):混合策略(Mixed Strategies)纳什均衡

3.1定义:混合策略的定义:在博弈G={N, Si, ui, i∈N}中,假设参与人i的纯策略构成的策略集合为Si={si1,…, sik},若参与人i以概率分布pi=(pi1,…, pik) 在其k个可选策略中随机选择“策略”,称这样的选择方式为混合策略。这里,0≤pij ≤1,对于j=1 ,…, k都成立,且有, pi1+…+ pik=1。纯策略可看成特殊的混合策略。上述定义是在有限博弈前提下进行的。

3.2混合策略意义下策略组合的表述

{x1∈X1, …, xn∈Xn},其中Xi , i =1, …, n表示参与人i所有纯策略生成的概率空间,xi为参与人i的一个具体混合策略猜硬币博弈的一个混合策略就可记为{(1/2, 1/2),(1/2, 1/2)}

3.3VNM效用函数(Von Neumann and Morgenstern冯·诺依曼和摩根斯坦)

如果某个随机变量X以概率Pi取值xi,i=1,2,…,n,而某人在确定地得到xi时的效用为u(xi),那么,该随机变量给他的效用便是:U(X) = P1u(x1) + P2u(x2) + ... + P n u(xn) 表示关于随机变量X的期望效用。因此U(X)称为期望效用函数,又叫做冯·诺依曼——摩根斯坦效用函数(VNM函数)。

3.4基于混合策略意义下的博弈策略式表述

定义:基于(v-N-M效用的)策略式博弈由a、参与人集合b、每个参与人有一个(纯)策略集合c、对于每一个参与人来说,由所有参与人纯策略组合构成的风险结果空间,存在一个v-N-M效用

3.5混合策略意义下的纳什均衡

定义:对于博弈G= {N, Si, ui, i∈N},基于v-N-M效用的混合策略组合α*是一个

纳什均衡,若对于每一个i, 以及i的任意一个混合策略αi,α*对应的期望支付至少和(αi,α*-i )的期望支付一样大

换句话说,称混合策略组合α*是一个纳什均衡,如果没有一个参与人通过偏离策略α*i 实现支付的增加

3.6一个定理

对于N-人静态博弈问题,设混合策略纳什均衡对应的策略组合为(Xi , X –

i ) 。

对于任意的i ,若最优混合策略为Xi= {x1,…,xl,0…0}(不失一般性,假设前l个分量严格大于0),记分量xk (k=1,…, l) 对应的纯策略sk,

则对于参与人i而言,sk与其他参与人的最优混合策略组合X –i 形成的局势的收益值,等于纳什均衡混合策略组合(Xi,

X –i )的收益值。即ui (sk, X –i ) = ui (Xi, X –i )成立,k=1,…, l

3.7方法:

a、求解混合策略均衡可以用期望收益等值法

b、2×2双矩阵博弈的图解法:反应函数的三个交点即是纳什均衡

(四):多重纳什均衡解及其分析

4.1 帕雷托占优均衡

帕雷托占优均衡的含义是:在多个纳什均衡中,若存在一个纳什均衡,其支付结果针对每个参与人而言都严格优于其它纳什均衡,则该纳什均衡是帕雷托占优纳什均衡。

4.2风险占优均衡(risk-dominant equilibrium)

参与人对风险占优均衡的选择倾向,有一种强化的机制。当部分或所有参与人选择风险占优均衡的可能性增强的时候,任一参与人选择帕雷托占优均衡策略的期望支付会进一步减小,而这又使得帕雷托占优均衡策略的支付更小,从而形成一种选择风险占优均衡策略的正反馈机制,并使其出现的概率越来越大。

当参与人数目增加时,选择合作的风险将会更大,可借助该点考虑招标机制如何减少投标方勾结问题。上述问题是我们知道建立诚信机制社会的重要意义。上述问题引出一个博弈相关分支为协调博弈(coordination game)

4.3聚点均衡

由实际问题抽象出来的博弈模型中,更多的一类问题是:多个纳什均衡间不存在帕雷托占优关系或明显的风险占优关系,如夫妻爱好问题的两个纯策略均衡。这时如何预测哪一个纳什均衡会出现是一个很有意义的问题

以夫妻爱好博弈为例,在实际中往往二人很默契地知道如何进行博弈,双方往往知道怎么进行选择策略,且能够相互了解(这里面排除了互相协商后达成的一致)

实际博弈中参与人往往会利用博弈模型以外的信息,实现对特定博弈均衡一致关注的“聚点”

这些信息如:参与人共同的文化背景或规范,共同的知识,具有特定意义事物的特征,某些特殊的数量、位置关系等

聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性,但因为涉及因素太多,对于一般博弈模型很难总结普遍规律,只能具体问题具体分析

聚点:人们通常会协调彼此的行为。(你弱他就强);先例产生的影响远大于逻辑或者法律效力;人们总是乐于安守现状或接受自然形成的界线(三八线)

4.4相关均衡(correlated equilibrium)

实际上,在现实中遇到选择困难时,特别是在长期中反复遇到相似选择难题时,常会通过收集更多信息,形成特定的机制和规则,为某种形式的制度安排等主动寻找思路。

相关均衡就是这样的一种均衡选择机制。

对于实际中比较复杂的博弈问题,参与人是否有能力设计这种机制,并且有足够能力理解、信任这种机制,是有一定疑问的。

相关均衡作为社会经济制度创新的一种解释也许更有意义。

4.5防共谋均衡(coalition-proof equilibrium)

定义:如果一个博弈的某个策略组合满足

a、没有任何单个参与人的“串通”会改变博弈的结果,即单独改变策略无利可图(该策略组合是纳什均衡)。

b、给定选择偏离的参与人有再次偏离的自由时,没有任何两个参与人通过“串通”改变博弈的结果。

c、依此类推,直到所有参与人都参加的串通也不会改变博弈的结果。

满足上述要求的均衡策略组合称为“防共谋均衡”

在有多个参与人的博弈中,若部分参与人通过某种形式的默契或串通形成小团体,可能得到比不串通个大的支付。这就是多人博弈的共谋问题。

防共谋均衡是指这样的一个纳什均衡,在该均衡局势下,少数参与人集合不能通过均衡策略的偏离,实现更好的局部利益。

防共谋均衡是两个以上参与人参加的

博弈中,参与人在帕雷托占优均衡中进行合作思想的扩展。

(五):动态博弈

5.1特点

一类博弈行为通常需要参与人多步决策才能完成,具有明显的阶段性。博弈的结局、各参与人的收益由多阶段决策结果确定。各参与人的决策有一定的顺序。

由于动态博弈各参与人进行决策具有明显的阶段性、行动次序性,通常用扩展式(extensive form)表述法描述这些信息。

5.2博弈的扩展式表示

?参与人集合:i=1, … ,N。用N表示虚拟参与人“自然”;

自然的含义是某些外生的

客观概率分布事件

?参与人的行动顺序(the order of

moves):描述各参与人在什么时候行

动;

?参与人的行动空间(action set):在每次行动时,参与人可选择的行动集

合;

?参与人的信息集(information set):每

次行动时参与人知道什么;

?参与人的收益函数:在行动结束之后,每个参与人得到些什么。

?自然选择的概率分布(假定自然状态是共同知识)。

?对于有限博弈,博弈树是常用的表述方式。

5.3博弈树

a若动态博弈是有限博弈,则可用博

弈树表示该博弈。这里有限的含义是:各阶段各参与人的行动数目有限;博弈的阶段数有限。

b博弈树的基本结构为

结点(nodes)。包括决策结及终点结。

决策结是参与人采取行动的时点;终点结是博弈行动路径的终点。

枝(branches)。从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择。

信息集。是决策结集合的一个子集。

将博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结称为一个信息集。

注:每个决策结都是同一个参与人的决策结。

该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟出于哪一个决策结(若该信息集有两个或两个以上元素)。

5.4对于有限动态博弈,若参与人对彼此在各决策结点的行动集合,彼此的效用函数,历史的行动有着完全的了解,则称这样的博弈为完全信息动态博弈。

如果博弈树的所有信息集都是单元素集,称该博弈为完美信息博弈(game

of perfect information)。

上述两个定义的差别在于对自然行动信息的描述。

5.5动态博弈的策略式表述

a相机选择(contingent play)

动态博弈中参与人的策略是各自预先设定的,在博弈的各阶段,针对各种情况做出相应决策。即“等待”博弈到达自己的信息集(包含一个或多个决策

结)后再决定如何行动。

在策略式表述博弈中,参与人似乎是博弈开始之前就制定出了一个完全的

相机选择,即“如果……发生,我将选

择……”。

b从扩展式表述构造战略式表述若把B的信息集从左到右排列,上述四个纯策略可以简单记为{开发,开发}{开发,不开发}{不开发,开发}{不开发,不开发}。上面四个纯策略含义:当A选择开发时,B 选择大括号中前面的策略;当A选择不开发时,B选择大括号中后面的策略。

B的纯策略为:{开发,开发}{开发,不开发}{不开发,开发}{不开发,不开发} A的纯策略为:S A=(开发,不开发)

于是可以写成策略式表述形式,为

在扩展式表述博弈中,所有

n个参与人的一个纯战略组

合s=(s1,…,s n)决定了博弈树

上的一个路径。

比如(开发,{不开发,开

发})决定了博弈的路径为

A→开发→B→不开发

→(1,0)

5.6完全信息动态博弈纳什均衡存在性定理

?如果有限博弈是完美信息博弈,他还有一个纯战略纳什均衡

(Zermelo,1913)。

5.7逆向归纳法:

a逆向归纳法求解策略:从动态博弈的最后一个阶段出发,对该参与人采用经济理性原则进行分析,逐步到推回前一个阶段相应参与人的行动选择,一直到第一阶段的分析方法。

b逆向归纳法是求解完美信息动态

博弈的经典方法。逆推归纳法是完

美信息动态博弈分析中使用最普遍

的方法。

c与策略式分析比较:如果A选择U,那么B的信息集不能达到,我们说B的信息集不在均衡路径上(out-of-equilibrium path)。此种情况下,B的选择对A没有什么影响。因此,纳什均衡对一个参与人在非均衡信息集上的选择没有限制。但是,一个参与人在非均衡信息集上的战略可以影响

其他参与人在均衡信息集上的选择。

d逆向归纳法实质上是重复剔除劣

战略法在扩展式博弈中的应用。逆

向归纳法适不用于无限博弈和不完

美信息博弈。逆向归纳法剔除了“非

理性”的均衡策略

5.8子博弈完美均衡(子博弈精炼纳什均衡)

①子博弈概念:一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结T(x)组成,它满足下列条件:

x是一个单结信息集,即h(x)={x};

对于所有的T(x)中的x’,如果x’’与x’同属于一个信息集,则x’’也在T(x)中。

需要说明的是,G本身是自己的一个子博弈。

②子博弈完美纳什均衡(子博弈精炼纳什均衡)

扩展式博弈的一个战略组合

s*=(s1*,…,s i*,…,s n*)是一个子博弈完美纳什

均衡,如果

它是原博弈的纳什均衡。

它在每一个子博弈上都是纳什均衡

③纳什均衡与子博弈精炼纳什均衡的

关系

前面分析说明,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,这条路径称为“均衡路径”(equilibrium path)。

相对该纳什均衡,其他路径称为非均衡路径(out-of-equilibrium path)。

?在每一个子博弈上给出

纳什均衡意味着,构成子博弈纳什

均衡的战略不仅在均衡路径的决策

结上是最优的,同时在非均衡路径

的决策结上也是最优的。

?对于有限完美信息博弈,前面介绍的逆推归纳法得出的纳什

均衡即是子博弈精炼纳什均衡。(六)多阶段静态博弈

6.1该类模型中至少在某个阶

段参与人同时选择其决策。

?这类模型实质上就

是完美信息动态博弈,因此

仍然可以采用逆推归纳法

进行分析。

?因为存在同时选择,

因此每个阶段不再是单人

优化问题,而是一个静态博

弈。

6.2前向归纳法:前面已经说

明,完美信息动态博弈的经典

求解方法为逆序归纳法。

?还有一种分析方式,就是前向归纳法(forward induction)。

?前向归纳法由科尔博格和莫顿斯(1986)提出。

?这里不进行严格的数学描述,仅通过一个例题进行说明。

6.3重复博弈

?重复博弈(repeated game)的定义

指同样结构的博弈重复多

次,其中的每次博弈称为

“阶段博弈(stage game)”。

如两个多次犯罪的“囚徒问

题”。

?由于动态博弈是相机行动,反映到重复博弈中,就是可以使自己在某

个阶段的博弈选择依赖于其他参与

人过去的行动历史。

影响重复博弈均衡结果的

主要因素是博弈重复次数

和信息的完备性

(completeness)。

重复次数对参与人可能会

有的影响是:参与人为了获

得长远利益而牺牲眼前利

益的策略成为可能。

关于完备性,简单地说,但

一个参与人的支付函数不

为其他参与人所知时,该参

与人可能有积极性建立一

个“好”的声誉(reputation)

以换取长远利益。

在社会行为中,经常可以看

到本质不好的人在相当长

的时期内干好事的原因。

定理:令G是阶段博弈,

G(T)是G重复T次的重复博

弈(T<∞)。那么,如果G有

唯一的纳什均衡,重复博弈

G(T)的唯一子博弈精炼纳

什均衡结果是阶段博弈G

的纳什均衡重复T次(即每

个阶段博弈出现的都是一

次性博弈的均衡结果)。

?上述定理说明,只要博弈的重复次数是有限的,重复本身并不改变囚

徒困境的均衡结果。

?上述定理中“唯一性”是一个重要条件。

?如果纳什均衡不是唯一的,上述结论就不一定成立。

?当博弈有多个纳什均衡时,参与人可以使用不同的纳什均衡惩罚前面

阶段的不合作行为或奖励第一阶段

的合作行为。

(七)不完全信息静态博弈

不完全信息静态贝叶斯博弈贝叶斯

纳什均衡海萨尼转换拍卖理论(八)合作博弈

可传递效用(transferable utility)合

作博弈的特征函数合作的分配可行

分配核心的定义Shapley 值

博弈论知识点总结完整版

博弈论 (一):基本知识 1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。 1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。 1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。倘若不能,则称非合作博弈(Non-cooperative game)。 合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。 博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。把两个角度结合就得到了4种博弈: a、完全信息静态博弈,纳什均衡,Nash(1950) b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965) c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)

d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991) 1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form) 1.6占优均衡: a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。 对于所有的s-i, si*称 为参与人i的严格占优战 略,如果满足: ui(si*,s-i)>ui(si',s- i) ? s-i, ? si' ?si* b、占优均衡:一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。 1.7重复剔除严劣策略均衡: a、“严劣”和“弱劣”的含义: 设 s i’和s i’’是参与人i可选择的两个策略,若对其他参与人的任意策略组合s-i, 均成立 u i(s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。 上面式子中,若将“<”改为“≤”,则说策略s i’弱劣于策略s i’’。 b、定义:重复剔除严格策略就 是各参与人在其各自策略集 中,不断剔除严劣策略…如 果最终各参与人仅剩下一个 策略,则该策略组合就被称 为重复剔除严劣策略均衡。

博弈论课程心得体会

《博弈论与信息经济学》课程心得体会 作为一名会计专业硕士,我选修这门课程是为了了解和学习一种思想方法,这种方法我很早就感兴趣,电影《美丽的心灵》中纳什的故事让博弈论在我心中显得非常神秘和高大上。第一堂课吕老师谈到博弈论已经成为一种主流方法时,学习的欲望变得更为强烈。经过九周的学习,尽管由于有些地方因为数学能力有限,不得尽懂,但我觉得自己起码已经揭开了这种方法的入门和核心的面纱。 我认为,会计专业硕士是为了培养立足于会计的高级管理人才而设置的,除了扎实的专业知识和理论功底,我觉得掌握思想方法是尤为重要的能力。面对会计行业的变革,作为一名研究生,财务管理能力和管理会计能力是我的核心竞争力。这两种能力需要缜密的思维,科学的方法。如果说缜密的思维更需要在学习和实践中不断历练,科学的方法就需要不断地去接触和了解,不断地去主动学习。博弈论就是一种科学的方法。我觉得博弈论是一种寻求均衡的科学,也是一种创造规则的科学。它让我了解面对不同利益相关者时怎么去寻求均衡、博弈,甚至创造有益的规则。同时,它让我有了一种更加科学、简洁的视角看待事物,非常实用有效而且简单漂亮。 博弈论的核心应该是纳什均衡,这是一个理性的策略组合,每个参与者在对方的选择一定情况下会做出纳什均衡策略组合中的策略。这种选择将是每个理性参与人最终的选择。这个道理很明了,也正是明了让这个理论非常有力。吕老师带着我们解决一个又一个案例中的问题时,我感觉到这种方法的神奇和独特。我印象里最深的是吕老师对法律的看法:法律让不可置信的承诺变成可置信的承诺,好的法律是看似严苛,但很少有人触犯它。以前在学习经济法时,我对“法律是一种合同”这种观点不是很在意,吕老师的说法让我有了新的认识。让不可置信承诺变成可置信的承诺,使得最有益的策略组合成为纳什均衡,在这一点上合同和法律的目的和性质是一样的。我还记得吕老师说《反国家分裂法》是一部非常好的法律,在以前我因为它几乎很少被使用而感觉不到这部法律的重量,但从博弈论的角度来看,这部法律使得针对台湾,宣布独立就会被制裁成为一种可置信的承诺,吕老师的解释让我非常赞同。我真的觉得自己看某些问题的视角发生了变化,更加地深刻和科学。 我觉得正是这种视角是我学习这门课程最大的收获。我知道,短短九周的学习远远不足以掌握博弈论,我甚至或许不能完整地计算出一道例题,但是我对它有了一个基本的认识,理解它的理论基础,最重要的在看一些问题时我可以尝试着用博弈论的角度去试试看。最可怕的不是不会用博弈论的技术和方法,可怕的是在能够使用它时我不知道以它的角度去看待问题,知道可以使用这门科学的技术和方法。经过这两个多月的课程,相信将来如果用的着这种方法时,我知道从哪里着手去学习。

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

(完整word版)博弈论给我的心得

博弈论给我的心里体会 潘慧明 201202034049 12金融数学 我是大学第二学期开始选修学习《博弈论》的,并且以前对它停留在表面意思。而在我的进一步对《博弈论》的学习下,我懂得了这门课程在我们的生活中无处不在,在未学习这门课程之前我对身边发生的一些事情无法用一个专业的学说来概述,经过这个学期的学习后,我才知道我身边发生的很多事情都可以用这门课程概述。那么什么是“博弈论”?所谓的“博弈论”——就是研究决策主体的行为发生直接相互作用时的决策及这种决策的均衡问题。并且学习后我还有个感受就是:博弈论有两个比较enlightening的观点,一是more information can hurt you(掌握更多的信息可能是一件坏事),二是more options can hurt you(拥有更多的选择可能是一件坏事).虽然博弈论主要用于研究经济问题,但是我觉得这些原理在我们现实生活中同样是适用的。 而且经过这段时间的学习,我现在对《博弈论》有了些比较肤浅的认识。诚然,一门学问想在短时间内有所深入理解是不现实的。生活之中到处充满着博弈,有人说没有,那是因为缺少发现博弈现象的眼睛。因此在生活中我们要懂得学以致用,要会灵活的去使用这门学科。 人生就是在弈棋,学会博弈。虽说博弈不是万能的,但没有博弈现象存在的生活是万万不能的。 社会生活中,共赢是一种优良的博弈方式。双赢策略其实是一种很高的智慧,帮助别人的同时接受别人的帮助,双方最终将获得独自奋战所不能拥有的东西。放弃内心的宁予外贼不予家奴的思想。中国人对竞争的理解大多不是“你死”就是“我活”,胜利的含义似乎就是阻止别人成功,可是这“胜利”是那么虚假,经不起风吹雨打,经不起时间考验。拥抱双赢,拥抱明天。双赢强调的是博弈双方的利益都要兼顾,就是所谓的“赢者不全赢,输者不全输”。但是双方都得到了满意的结果。这些双赢的事例,在商务上经常可以看到的。如:商务上的谈判,完完全全的运用到了《博弈论》的知识与原理来分析问题,并且从而找到最佳的均衡点,也就是最好的解决方法。 在所有的对抗和较量中,其胜负成败常常取决于三个基本的因素:机会或者说运气、体能和智能。头脑技能是一种策略技巧,或者说是在谋略方面的造诣。既然世间大多数对抗都与头脑技能有关,因此人们试图获得成功,就有必要研究在对抗局势中如何策略性地选择自己的行动。而今,博弈论就是一门专门研究互动局势下人们的策略行为的学问。事实上,每

博弈论 教案

《两种常见的博弈论模型》一课教案 审签: 2010 年 4 月 13日 班 级 课程名称 经济学基础 教 师 授课 时间 课 型 授课地点 课 题 项 目 认识完全信息静态博弈、完全信息动态博弈 课 时 任 务 通过学习完全信息静态、动态博弈,认识价格战及搭便车现象。 任务分解 1、知识准备:明确博弈论常见的5种分类及类型。 2、案例举例:囚徒困境、智猪博弈 3、模拟测试:分小组,应用所学独立解决智猪博弈问题。 教学 目标 专业能力 通过学习,能够运用博弈论知识分析解决“双寡头价格战问题”及生活中的搭便车现象。 知识目标 1.掌握博弈论的分类; 2.掌握完全信息静态及完全信息动态博弈论模型; 3.学会运用博弈论知识分析、解决分析价格战、搭便车的问题。 方法能力 1、培养学生的独立思考的能力; 2、培养学生学习博弈论的兴趣及爱好; 2、培养学生的团队合作及逻辑思维能力。 重 点 掌握完全信息静态博弈及其扩展运用。 难 点 运用博弈论知识解决分析价格战等恶性竞争问题及搭便车现象。 课堂练习 小组合作完成完全信息动态博案例—“卖鞭炮的选择” 课后作业 完成课后思考题 教学策略与方法 启发 讲解 任务驱动 多媒体演示 自主 描述 案例 分析 小组 讨论 归纳总结 实践 操作 √ √ √ √ √ √ √ √ 课后回顾 本次课程的优点: 存在的问题: 改进设想:

项目名称:博弈论与决策策略 任务:能够自主分析博弈论的模型并分析解决问题 一教学组织活动总过程设计:1、师生问好2、班长报告人数 老师活动:1、问好2、环顾学生 学生活动:1起立问好2、坐姿端正3、班长清 点人数,向老师报告。 活动达到的目标时间分配 创设情境,使学生注 意力集中,进入学习 状态 1分钟 二课程导入情境导入: 复习旧课,导入新课 以《囚徒困境》博弈论案例视频引入 老师活动: (1)老师引导学生回忆上节 课所学的内容,复习博弈论的五种 基本分类方式及类型。(2)播放关 于囚徒困境的视频,点出其中的重 点,并向学生提问。 学生活动: 跟着老师的思路回 忆上节课所学的内容。 认真观看视频并思考老 师所提问题。 活动达到的 目标: 复习旧课内 容为新课做 铺垫,视频 引入抓住学 生焦点。 时间分 配: 5分钟 三教学过程认识完全信息静态博弈 活动项目一:囚徒困境(11分钟) 1、首先,老师给出囚徒困境的博弈论模型。“囚徒困境模型”:该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑6年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑3年,而坦白者有功被减刑6年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。 提问:对于囚犯A而言,他会选择什么样的策略,囚犯B如何呢?(给2分钟时间让学生思考并分析此问题,并让他们尝试通过表格表达出囚犯A及B可能选择的策略及面临的后果) 我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑6年。(老师讲解,板书,学生对照自己所写跟老师是否一致) 提问:那么囚徒困境在我们生活中的哪些地方同样存在呢? 补充介绍“囚犯困境”的扩展:双寡头企业价格战、军备竞赛等。 归纳总结完全信息静态博弈的3点特性:(1)同时做出选择;(2)明确对方的选择与游戏规则(共同知识);(3)不管是否沟通过,无法做出有约束力的承诺(非合作)(最好由学生归纳出)

西方经济学课本知识点总结2

西方经济学课本知识点总结2

微观经济学 第一章导论 第二章需求曲线和供给曲线概述以及有关的基本概念 第三章效用论 第四章生产论 第五章成本论 第六章完全竞争市场 第七章不完全竞争市场 第八章生产要素价格决定的需求方面 第九章生产要素价格决定的供给方面 第十章一般均衡和福利经济学 第十一章市场失灵和微观经济政策 第一章导论 1.马歇尔综合及20世纪30年代西方经济学的三次补充 第二章需求曲线和供给曲线概述以及有关的基本概念 1.理性人假设

2.微观经济学的核心思想 3.需求—需求函数—需求表—需求曲线 供给—供给函数—供给表—供给曲线 4.供求定理 5.弹性(定义公式) (1)需求价格弹性:弧弹性—中点公式 点弹性—几何意义特征 不同弹性商品 P变化对P、Q的影响 影响需求价格弹性的因素 (2)扩展: 供给价格弹性 需求交叉价格弹性→替代关系互补关系 需求的收入弹性→正常品劣等品 6. 恩格尔定律 第三章效用论(消费者行为理论) 1.基数效用论 2.偏好的假定无差异曲线 3.商品的边际替代率公式 商品的边际替代率递减规律 4.预算线

5.消费者效用最大化的均衡条件 6.价格—消费曲线→需求曲线 7.收入—消费曲线→恩格尔曲线 8.替代效应收入效应 9.低档品正常品吉芬物品(吉芬难题) 10.不确定性风险 11.期望效用期望值效用 12.消费者风险态度 13.保险 第四章生产论 1.企业的本质 2.短期生产理论:一种可变生产要素的生产函数 边际报酬递减规律 MPL APL TPL关系 短期生产三个阶段 3.长期生产理论:两种可变生产要素的生产函数 边际技术替代率公式 边际技术替代率递减规律 4.等成本线 5.最优的生产要素组合

博弈论初学心得总结(可编辑修改word版)

博弈论学习心得 (全校性选修课期末论文) 序:初识博弈论 通过“囚徒困境”,我走进了博弈论这一精彩世界。为了让大家对博弈思想有一认识与掌握,老师课堂上让我们思考了不少或生动或实际的问题,比如“帽子”问题、强盗分金币问题、猜 全班数字的平均数问题、拍卖问题、市场进入问题等等。我曾自嘲地对舍友说:博弈论简直就 是对智商的考验,总觉得自己脑子不够使啊。不过,我相信,学习博弈论是会使人变聪明的,脑子越用越灵嘛。 学习博弈论的过程中,脑子里经常出现的几句话是:原来这个问题可以这么去想,原 来这种问题还可以用博弈的思想来解决,原来博弈的应用范围这么广,原来看似与数学无 关的问题都可以通过数学来解决。 博弈论,为我呈现了一方新天地。我好奇它的广度,敬畏它的深度,视之如导师如利器,小心摸索着。 一、博弈思想 学习博弈论,我最大的收获不是记住了什么模型、公式、转换,而是博弈思想。“授之 以鱼,不如授之以渔”,博弈思想尤如“渔”一般重要,是分析问题的基础。 博弈,需要换位思考,需要知已知彼。一定要充分考虑自己和其他参与者的各种战略 以及对彼此的影响,从而采取最佳行动。 比如课堂上一个问题:让每个人选一个介于1~100的数,谁的数字最接近全班平均 数的2/3,谁就是赢家。如果每个人随机选择的话,大家平均值应该在50 左右,50 的2/3 应该是33. 3,不过其他人可能也想到了这一点,这样就应该写22.2。如果继续想下去, 大家的平均值应该越来越小,最后1应该是理性分析的最佳答案。实际结果,普通如我的 只想了一步,33,有的人多想了一步,有的人多想了两步……答案总不会是1。 其实答案是什么不重要了,重要的是一个思考的过程。是一个“你知道我知道你知道 我知道你知道……”的N次换位思考的过程,你要知道他人有有多聪明,还要站在对方的 角度考虑对方认为你有多聪明…… 面对一些事情时,可能不需要过分多虑,太过天才,在一群平凡人中,反而不会是赢家。比如那些选了1的人。但是换位思考的方式却是受用终生的,可指导我们少吃亏、少 走弯路、尽可能快乐且适如地生活在复杂的社会中。 博弈的另一个重要思想,我认为是缜密的逻辑推理、全局意识以及化繁为简的转换。 比如在不完全信息博弈中,你所了解的信息是有限的,这就需要你想出各种可能性以及各 种战略组合下的收益。要分析别人的心理、分析影响别人行动的因素,分析各种战略组合 的概率,从而执果索因,比如完全信息动态博弈中的“逆向归纳法”,比如通过“海萨尼转换”将不完全信息博弈表述为完全但不完美信息的博弈(市场进入问题),从而充分利用已 有信息找到最优战略或均衡。可谓是“眼观六路,耳听八方”,“运筹帷幄”。 二、博弈案例分析两则

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

博弈论心得体会

博弈论心得体会 最初选择博弈论,是因为看了《美丽心灵》电影后,因而对John Forbes Nash Jr和博弈论产生了浓厚的兴趣。当看到选修课新开了博弈论,简直激动的不能自已,迫不及待就报名参加了。而在我的进一步对《博弈论》的学习下,我懂得了这门课程在我们的生活中无处不在。 博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。博弈论思想古已有之,中国古代的《孙子兵法》等著作就不仅是一部军事著作,而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 在社会中,人与人之间的对抗和较量是一个不容回避的话题,只有直面这些问题,个人才更有可能获得成功的机会。在所有的对抗和较量中,其胜负成败常常取决于3个基本的因素:机会或者说运气、体能和智能。通过抛硬币来赌输赢是纯粹依赖于个人运气的游戏;百米赛跑的胜负基本上取决于个人的全身技能;而篮球赛、战争等对抗,虽然也会受到运气的影响,体能也很重要,但决定胜负的更重要的因素是头脑技能的较量。 头脑技能是一种策略技巧,或者说是在谋略方面的造诣。既然世间大多数对抗都与头脑技能有关,因此人们试图获得成功,就有必要研究在对抗局势中如何策略性地选择自己的行动。而今,博弈论就是一门专门研究互动局势下人们的策略行为的学问。事实上,每个人每天都在与他人打交道,或竞争或合作。身处这样高度互动的环境之中,无论一个人是否知道博弈论,实际上他都不断地在与他人进行博弈,无论是他的父母、亲人、兄弟、老师还是商场对手、政治敌人……一个人可能不知道博弈论为何物,但是他的确常常在与他人进行着对抗和较量,在进行着一场又一场博弈;而生存本能,也让人们在不知不觉中学会了不少技巧。难怪经济学家萨缪尔森这样说着:“要在现代社会做一个有文化的人,你必须对博弈有一个大致的了解。”不过,对于大多数的人来说,学习博弈论并不是一件轻松的事情。 因为正式的博弈理论往往是用数学语言表达出来的,而社会中的大多数人都有数学恐惧症,虽然对于少数人来说数学的形式是那么优美,但大多数人把博弈论的学习看做是一件艰难的而痛苦的事情。 如果我们能熟练地掌握这一部分博弈论知识,对我们的学习和工作都大有裨益。深感短短一个学期的时间,对于博弈论这一门独具魅力的课程,只是从皮毛上略有了解。尽管如此,我还是学会了一种以博弈的观点来思考、分析、判断、解决问题的方法。就好比囚徒博弈的现象,我以前可能能够猜到结果,但这只是知其然而不知其所以然罢了。然而现在可就不同了,相似的问题我都能够用所学的博弈论知识去解释,能够了解其本质了。 我学过一段时间博弈论,一些思维过程中也可能自觉不自觉地使用一些博弈论思想,当制订政策或游戏规则,要保证所有人有参与积极性。这来源于“纳什均衡”概念,说起来当然简单。但我自己觉得,以前所知道的这条道理——制订游戏规则要保证所有人有参与积极性——是简单接受,没有逻辑,或者,在直觉层次觉得这是对的,但没有认识到它为什么对。千万不能把别人当傻瓜,如果把别人当傻瓜,吃亏的是自己,就像那个卖猫的故事。

博弈论基础复习

《博弈论基础》主要知识点 一、名词解释(5×2=10分) 策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 :一般地,将一个参与人所拥有的所有私人信息称为他的类型。 信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。 分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。 联盟

博弈论知识点总结

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己 的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处 环境以及其他参与者的行为形成正确的 信念与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完 全信息)等的信息。

1、

2、 既定下,消费者效用只依赖于自己 的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅 选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相 比,扩展式博弈更注重对参与人在博弈过程 {1,2,...,} n Γ=11 (,...,,...,) n i i n i s s s s ==∏

北大学习心得体会

北大学习心得体会 篇一:北京大学培训学习心得体会 北京大学培训学习心得体会 适逢大地苏醒、春暖花开之时,在区委的亲切关怀下,作为一名基层领导干部,我有幸参加了北京大学******领导干部前沿热点与公共管理高级研修班,在北京大学进行了为期一周的培训学习。有幸触摸了北大的百年文明,品读了伟大首都经济社会协调发展的精髓。通过学习,启发很大,受益匪浅,感慨颇多,同时也有很多个人心得体会,由于听课覆盖面较大,内容也较多,有些还来不及消化,不能一一陈述。在此就我的体会和感悟,结合自身工作,简要加以剖析。 培训期间,我们聆听了教授专家们深入浅出的讲座、激情飞扬的介绍、通俗易懂的解析,如哲学系杨立华教授的《儒家精神与现代生活》、政府管理学院白彦副教授的《中国式领导科学》、国家发改委经济研究所副司长藏跃茹的《“十二五”规划与转变经济增长方式》、清华大学社会学习系孙立平教授的《转型时期的社会和社会问题》、经济学院雎国余教授的《“十二五”规划与中国经济》、经济学院张延教授的《公共管理中的博弈论》、医学部唐登华教授的《领导者压力管理与心理调适》、新闻与传播学院姚惠忠副教授的《政府公共关系与危机处理》等。同时还结合教学内容进行了学习考察。一路学习,一路思考;感受北大人的新思想、新观

念,感慨首都经济社会协调发 展的高速度、高质量,倍受震憾,倍受启发。此次参观学习时间短,但学习内容丰富,拓宽了我们的视野,增长了见识,增强了我们加快发展经济的信心。 洗礼:全新感受 我们受训的北京大学历史悠久、人文厚重,是中国第一所国立综合性大学,作为新文化运动的中心和“五四”运动的策源地,作为中国最早传播马克思主义和民主科学思想的发祥地,作为中国共产党最早的活动基地,北京大学为民族的振兴和解放、国家的建设和发展、社会的文明和进步做出了不可替代的贡献,在中国走向现代化的进程中起到了重要的先锋作用,是国家培养高素质、创造性人才的摇篮、科学研究的前沿和知识创新的重要基地和国际交流的重要桥梁和窗口。据不完全统计,北京大学的校友和教师有400多位两院院士,中国人文社科界有影响的人士相当多也出自北京大学,是国家“211工程”和“985工程”重点院校。北京大学培训中心良好的培训条件和培训效果得到中组部的充分肯定,XX年被中组部、教育部确定为全国首批干部教育培训高校基地。 这次领导干部前沿热点与公共管理培训采取课堂讲授与参观考察相结合的形式,精心设置课程。主讲的教授都经过培训中心反复筛选,具有丰富的理论素养,具有很高的知

普林斯顿大学博弈论讲义10

Eco514—Game Theory Lecture10:Extensive Games with(Almost)Perfect Information Marciano Siniscalchi October19,1999 Introduction Beginning with this lecture,we focus our attention on dynamic games.The majority of games of economic interest feature some dynamic component,and most often payo?uncertainty as well. The analysis of extensive games is challenging in several ways.At the most basic level, describing the possible sequences of events(choices)which de?ne a particular game form is not problematic per se;yet,di?erent formal de?nitions have been proposed,each with its pros and cons. Representing the players’information as the play unfolds is nontrivial:to some extent, research on this topic may still be said to be in progress. The focus of this course will be on solution concepts;in this area,subtle and unexpected di?culties arise,even in simple games.The very representation of players’beliefs as the play unfolds is problematic,at least in games with three or more players.There has been a?erce debate on the“right”notion of rationality for extensive games,but no consensus seems to have emerged among theorists. We shall investigate these issues in due course.Today we begin by analyzing a particu-larly simple class of games,characterized by a natural multistage structure.I should point out that,perhaps partly due to its simplicity,this class encompasses the vast majority of extensive games of economic interest,especially if one allows for payo?uncertainty.We shall return to this point in the next lecture. Games with Perfect Information Following OR,we begin with the simplest possible extensive-form game.The basic idea is as follows:play proceeds in stages,and at each stage one(and only one)player chooses an 1

西方经济学课本知识点总结

微观经济学 第一章导论 第二章需求曲线和供给曲线概述以及有关的基本概念 第三章效用论 第四章生产论 第五章成本论 第六章完全竞争市场 第七章不完全竞争市场 第八章生产要素价格决定的需求方面 第九章生产要素价格决定的供给方面 第十章一般均衡和福利经济学 第十一章市场失灵和微观经济政策 第一章导论 1.马歇尔综合及20世纪30年代西方经济学的三次补充 第二章需求曲线和供给曲线概述以及有关的基本概念 1.理性人假设 2.微观经济学的核心思想 3.需求—需求函数—需求表—需求曲线 供给—供给函数—供给表—供给曲线 4.供求定理 5.弹性(定义公式) (1)需求价格弹性:弧弹性—中点公式 点弹性—几何意义特征 不同弹性商品P变化对P、Q的影响 影响需求价格弹性的因素 (2)扩展: 供给价格弹性 需求交叉价格弹性→替代关系互补关系 需求的收入弹性→正常品劣等品 6. 恩格尔定律 第三章效用论(消费者行为理论) 1.基数效用论 2.偏好的假定无差异曲线 3.商品的边际替代率公式 商品的边际替代率递减规律 4.预算线 5.消费者效用最大化的均衡条件 6.价格—消费曲线→需求曲线 7.收入—消费曲线→恩格尔曲线 8.替代效应收入效应 9.低档品正常品吉芬物品(吉芬难题) 10.不确定性风险

11.期望效用期望值效用 12.消费者风险态度 13.保险 第四章生产论 1.企业的本质 2.短期生产理论:一种可变生产要素的生产函数 边际报酬递减规律 MPL APL TPL关系 短期生产三个阶段 3.长期生产理论:两种可变生产要素的生产函数 边际技术替代率公式 边际技术替代率递减规律 4.等成本线 5.最优的生产要素组合 (1)成本既定,产量最大化 产量既定,成本最小化 (2)利润最大化→最有生产要素组合 (3)扩展线→规模报酬长期生产中规模报酬变化规律 第五章成本论 一、概念: 机会成本显成本-隐成本经济利润-正常利润 二、短期成本理论 1.边际报酬递减规律→决定短期成本曲线特征边际产量-边际成本 2.MC→TC AC 3.TC→AC MC 4.短期成本曲线与短期产量曲线的关系 MC-MPL AVC-APL 三、长期成本理论 1.长期总成本(推导):包络线 2.长期平均成本 (a)推导:由LTC推导包络线 (b)形状决定因素:规模(不)经济 (c)位置决定因素:外在(不)经济 3.长期边际成本推导:由LTC 由SMC 第六章完全竞争市场 1.市场划分市场类型的因素 2.完全竞争市场的四个条件 3.完全竞争厂商短期均衡 ◆需求曲线收益曲线 ◆利润最大化条件MR=MC ◆短期均衡MR=SMC ◆短期供给曲线 ◆生产者剩余 完全竞争厂商长期均衡 ◆厂商的两个选择

博弈论信息经济学知识点

博弈论与信息经济学 完全信息静态博弈 考察占优战略均衡概念及求解 解题思路:理性参与人做出是最优选择,该博弈存在占优战略均衡,据此可知答案为(3)。 考察重复剔除劣战略占优战略均衡概念及求解 说明:考察重复剔除劣战略,求解占优均衡的方法。答案:(U,L) 下面考察PNE及其解法

妻子 丈夫 (a )请检验,纳什均衡(最优战略组合)是同生共死;均衡结果是同生,或者共死; (b )请检验,占优均衡(占优战略组合)是坚强活着;均衡结果是同生(互相煎熬); (c )请检验,纳什均衡(最优战略组合)是你死我活;均衡结果是死活,或者活死; 显然,(c )情形之下,二人之间的仇恨比(b )中更深。 一些类型的博弈中,PNE 未必存在。以下考察MNE 及其解法 说明:猜谜游戏,是一种典型的零和博弈。这类博弈没有纯战略NE ,但是却存在混合战略 (c ) 活着 死了 (b ) 活着 死了 活着 死了 (a ) 活着 死了 活着 死了

NE。希望大家通过这个例子,加深对NE的概念及NE存在性定理的理解。同时,混合战略NE求解也是本题考察点。以下两个例子,与此相同,供大家练习使用。 模型化如下博弈:两个小朋友一起做猜拳游戏,每人有三个纯战略:石头、剪刀、布。胜负规则为:石头胜剪刀,剪刀胜布,布胜石头,如二人出手相同则未分胜负。二人同时出手。胜者的支付为1,负者的支付为-1,未分胜负时支付均为0。(1)请写出该博弈的支付矩阵,并判断其是否存在占优战略均衡。(2)该博弈是否存在纯战略纳什均衡,是否存在混合战略纳什均衡?如果存在,请写出。 下例来自张维迎,P131。 美国普林斯顿大学“博弈论”课程中有这样一道练习题:如果给你两个师的兵力,你来当司令,任务是攻克“敌人”占据的一座城市。而敌人的守备是三个师,规定双方的兵力只可整师调动,通往城市的道路有甲、乙两条,当你发起攻击时,若你的兵力超过敌人你就获胜;若你的兵力比敌人守备部队兵力少或者相等,你就失败。你如何制定攻城方案? 与零和博弈不同,有些博弈既有PNE,又有MNE。如以下性别战博弈和斗鸡博弈。 性别战博弈:

浙大学习心得体会

执行力提升培训学习体会 ------杨平湘 首先感谢市局党委给我这次赴浙江大学参加执行力提升培训的机会。走进心仪已久的名校,感受到浙大“高端、专业、规范、求实”的办学原则和浓厚的学习氛围,恭耳聆听了浙大倪荣教授、徐旭初教授、项贻强教授、张钢教授、李俊伟教授、蒋文华教授及浙江省委党校郑仓元教授、上海政法学院严励教授等名师的精彩讲授。教授学者们渊博的学识,丰富的教学管理经验、妙语连珠的讲授使我心悦诚服。在这短暂、形式多样、内容丰富的7天培训中,我学到了很多的新知识、新理论,让我受益匪浅,感触良多。本次培训,使我感受最深的有以下几个方面: 一、拓宽了思路,增长了见识 这次培训的内容是为我们公路人量身定做的,有较强的针对性和时效性。既有深入浅出的专业理论知识,又有可操作性的实践经验。授课专家、教授知识渊博、态度严谨、视角独特,为我们打开了解放思想、提升工作理念的窗口。通过学习,使我对当前宏观经济形势与政策解析、心理压力与情绪管理、博弈论与政府管理等尖端知识有了初步的了解,在政务礼仪,社会转型与社会治理创新、提升领导力和执行力等方面有了全新的认识。特别是听了郑仓元老师讲授的

《创新工作方法,提升执行力与领导力》,使我对提升领导力和执行力有了系统的、全新的认识,明白了领导力、执行力的基本内涵。所谓的执行力,顾名思义就是按质按量、不折不扣的完成工作任务,达到预期的目标。而领导力则是指领导者带领组织人员实现目标过程中,能力与权力结合产生的总效力。对于领导力和执行力的概念,虽然早就看到过、听说过,但是理解上很片面和肤浅,对其内涵、重要性和必要性理解不深,掌握不透。在过去的工作中,我过多地关注具体的事务性工作,认为管理就是将科室的工作尽职尽责地完成好,忽略了科室的整体规划和系统的人员教育工作,而路政工作实际操作多,宏观管理少,我对工作谋划不足,创新的意识不强,不利于工作的开展。领导力是执行力的本质,是执行力的保证和保障。而执行力就是执行领导的指令、贯彻领导的意图,所以,离开了领导力就谈不上执行力。执行力它渗透到每项工作的各个方面,执行到位,执行有力,事半功倍。执行不力,执行不到位,事倍功半。可以说,执行力是每项工作成败的关健,执行力就是一个单位、一个团体的生命力。因此,要提升领导干部的执行力,必须要解决好执行的问题,把执行变为自动、自发、自觉的行动,才能园满完成各项工作任务。 二、总结经验,提升能力

博弈论心得体会

博弈论心得体会 今年是我刚刚进入中央广播电视大学的第一年,刚进入大学的第一学期我就学到了一门新的课程,这门课程在我们的生活中无处不在,在未学习这门课程之前我对身边发生的一些事情无法用一个专业的学说来概述,经过一个学期的学习后,我才知道我身边发生的很多事情都可以用这门课程概述,他就是《博弈论》。那么什么是“博弈论”?所谓的“博弈论”——就是研究决策主体的行为发生直接相互作用时的决策及这种决策的均衡问题。 经过一段时间的学习,我对博弈论有了一些肤浅的理解,诚然,一门学问想在短时间内有所深入理解是不现实的。生活之中到处充满着博弈,有人说没有,那是因为缺少发现博弈现象的眼睛。 人生就是在弈棋,学会博弈。虽说博弈不是万能的,但没有博弈现象存在的生活是万万不能的。 社会生活中,共赢是一种优良的博弈方式。双赢策略其实是一种很高的智慧,帮助别人的同时接受别人的帮助,双方最终将获得独自奋战所不能拥有的东西。放弃内心的宁予外贼不予家奴的思想。中国人对竞争的理解大多不是“你死”就是“我活”,胜利的含义似乎就是阻止别人成功,可是这“胜利”是那么虚假,经不起风吹雨打,经不起时间考验。拥抱双赢,拥抱明天。双赢强调的是博弈双方的利益都要兼顾,就是所谓的“赢者不全赢,输者不全输”。但是双方都得到了满意的结果。 在社会中,人与人之间的对抗和较量是一个不容回避的话题,只有直面这些问题,个人才更有可能获得成功的机会。在所有的对抗和

较量中,其胜负成败常常取决于3个基本的因素:机会或者说运气、体能和智能。通过抛硬币来赌输赢是纯粹依赖于个人运气的游戏;百米赛跑的胜负基本上取决于个人的全身技能;而篮球赛、战争等对抗,虽然也会受到运气的影响,体能也很重要,但决定胜负的更重要的因素是头脑技能的较量。 头脑技能是一种策略技巧,或者说是在谋略方面的造诣。既然世间大多数对抗都与头脑技能有关,因此人们试图获得成功,就有必要研究在对抗局势中如何策略性地选择自己的行动。而今,博弈论就是一门专门研究互动局势下人们的策略行为的学问。事实上,每个人每天都在与他人打交道,或竞争或合作。身处这样高度互动的环境之中,无论一个人是否知道博弈论,实际上他都不断地在与他人进行博弈,无论是他的父母、亲人、兄弟、老师还是商场对手、政治敌人……一个可能不知道博弈论为何物,但是他的确常常在与他人进行着对抗和较量,在进行着一场又一场博弈;而生存本能,也让人们在不知不觉中学会了不少博弈技巧。 然而,通过本能所学习的博弈技巧,是既不系统也相当费劲的。因此,人们有必要以一种最为节省的方式来学习策略技巧。而最节省的方式,莫过于直接学习博弈论的知识了。难怪经济学家萨缪尔森这样说着:“要在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解。”事实上,不单一般人应该了解博弈论,各个领域的专家更应该了解博弈论——20世纪后半叶的历史表明,博弈论在军事、政治、商业、法律、经济学、生物学、心理学、社会学、历史学等诸多领域都已有非常成功的运用。

相关文档
最新文档