基于博弈论的决策信息系统的属性约简与智能体操作策略模型 (1)

基于博弈论的决策信息系统的属性约简与智能体操作策略模型 (1)
基于博弈论的决策信息系统的属性约简与智能体操作策略模型 (1)

问题重述:

随着科技的发展,社会的进步,智能体的出现也为学科的研究打开了一个新的局面。本题针对智能体的决策提出了问题,考虑到不同对象,不同的属性对智能体的影响,如何在不影响公平的情况下,科学地排除一些属性因素,得到属性约简的若干模式,通过这些模式对数据进行系统的约简。同时考虑到删减的属性个数越多越好的情况下,如何给出相对应的数学模型和算法,并通过附件所给数据进行求解验证。进一步,当各种属性重要程度不一的时或者在属性取值范围D 是②,③,④时讨论数学模型以及算法的拓展性。并且,若考虑到智能体的私下操作,该如何改进模型,才能更好的为智能体提供技术支持。最后,针对生活学习,从实际出发,进行对模型的讨论分析。

基本假设:

1.假设题目所给数据真实可靠;

2.假设每个对象在决策时知道其他人在该属性上所对应的数据,且他

们必须同时做出抉择;

3.假设对每个对象来说他放弃或者留下该属性是等可能的;

4.假设每个属性的重要程度相同,互不影响;

5.假设我们所评估的对象在这个问题里并没有一个具有约束力的协

议;

符号说明:

1. 我们用来描述评价体系的五元组 U A D f ∑();

2. U 表示一组需要评价的对象的集合;

3. A 表示一组用于评价U 中对象的属性,属性之间相互独立;D 代表A 中属性的取值范围,在本题中,所有属性的取值范围是一样的;

4. 函数f U A D ?→:,即对于每一个对象,每一个属性,给定D 中的某个值;

5. 符号∑是求和评价规则,即对于每一个对象,把与之对应的每个属性值求和。

6. 参与博弈的智能体用123

{}X U U U U U =?,,,,表示,相应的属性用123{}Y A A A A A =?,,,来表示,第i 个智能体的第j 个的可能的决策用

123{}

ij Y A a a a a =?,,,(这里a 的下标1,2,3y ?,代表对应的属性123Y A A A A ?,,,)并且,这里的1,2,3),(i a i y =?的值只有0,1,其中:0代表该智能体向决策者提建议去掉i A ,1代表该智能体向决策者提建议保留i A .

7. i M 用来表示考虑i 个智能体时任一智能体的决策矩阵,所谓决策矩阵是指反映了每一智能体所做所有可能的决策构成的矩阵。

8 . 效用函数(),i i E a f ,表示对于智能体所做的决策所带来的结果。

9 .用*123-{}i Y A a a a a =?,,,,表示第i 个智能体所做的实际选择。

问题分析:

在这个题目中,我们考虑的对象是智能体,所谓智能体,即那些能够思考、推理和决策的人或机器人。通过解决此问题,我们可以得到评估所有对象的一个更优化的方案,从而为解决实际问题提供方便。为了简单起见,我们把题目中的智能体考虑成人类,这样易于我们更好地与实际相联系。首先,类似与题目所给的评价成绩方法,评价智能体的体系或者方法也是将与智能体对应的属性的值求和,同时所求得的和越大则评价的对象越好,联系实际会很容易发现,这个问题与我们的奖学金评选有很大的相似性,即绩点或是平均分越高,该学生在学习上越优秀。

对于问题一来说,由于对象的属性太多,难以快捷方便地对对象做出评价,

于是,我们想通过简化我们的评估体系,那么将哪些因素(在题目中叫做属性)去掉使其不影响评估的结果,并且这样的操作是公平的,提出具体的算法和方案是第一问需要解决的,于是我们运用数学中的博弈论思想,首先找到了博弈论模型对其进行分析。同时,我们运用基于区分矩阵的约简模型,运用其中的理论证明了大概的结果。

通过观察第二问,我们发现,如何通过适当的模型与算法进行数据的处理,完成删减掉的数据越来越多是我们的目的,也就是说尽可能多地排除掉对整体评价影响不大的因素。并且我们需要通过仿真给出算法分析,系统地对算法从各方面做一个评价。

对于问题三来说,当属性加权(属性重要程度不同)的情况下,针对不同的

属性,某一对象去掉它或者留下它的可能性就不是相等的,所以就存在一概率值来描述该属性删掉的可能性,于是我们对所有对象的属性值求和之前,对于每一个对象的属性值乘上它所对应的概率再进行求和,然后就可以继续应用问题二所述模型和方法进行求解。

对于问题四来说,为了给智能体的私下操作提供技术支持,也就说,作为智

能体,他会将自己的利益最大化,从而在进行自身操作时,会尽可能保留对自己属性值贡献最大的属性,也就变得更加拟人化.

模型建立:

在建立合适的模型来解决我们的问题之前,有必要再次说明一下题目中所叙

述的评价体系。这个体系由 U A D f ∑()这个五元组来刻画,其中:U 表示一组

需要评价的对象的集合;A 表示一组用于评价U 中对象的属性,属性之间相互独立;D 代表A 中属性的取值范围,在本题中,所有属性的取值范围是一样的;函

数f U A D ?→:,即对于每一个对象,每一个属性,给定D 中的某个值;符号∑是求和评价规则,即对于每一个对象,把与之对应的每个属性值求和。

在这个问题中,我们所考虑的对象是参加评估的所有智能体,他们中的每个人都会想要在私人操作中获得最大的利益,从而他们在一定程度上是处于互相竞争的关系。在这样的情况下,每个人需要提出对自己有利的建议并且要考虑到自己的建议是不是能被决策者采纳。于是我们为了研究在评估体系中个体的实际行为和预测行为并研究他们的优化策略,我们可以考虑博弈模型。

首先,我们可以肯定,我们所评估的对象在这个问题里并没有一个具有约束力的协议,在博弈论里,我们称之为非合作博弈。继而,我们假定参与评估的智能体所做建议的决策是同时发生的,在博弈论里,我们称之为静态博弈。最后,在我们问题中,我们假设智能体之间的信息是透明的,也就是说我们所考虑的模型是一个完全信息静态博弈模型。

如上文介绍,参与博弈的智能体用123{}X U U U U U =?,,,

,表示,相应的属性用123

{}Y A A A A A =?,,,来表示,第i 个智能体的第j 个的可能的决策用123{}ij Y A a a a a =?,,,,(这里a 的下标1,2,3y ?

,代表对应的属性123Y A A A A ?,,,)并且,这里的1,2,3),(i a i y =?的值只有0,1,其中0代表该智能体向决策者提建议去掉i A ,1代表该智能体向决策者提建议保留i A 。根据我们的表示方法,我们可以用如下矩阵表示某一智能体的决策情况。其中,矩阵的每一行用来表示某一智能体所做的某一个可能决策。比如说,在只有两个属性的时候,我们得到任一个智能体的决策矩阵,如下:

M 2=0001101

1??

??????????

在有三个属性的时候,我们得到如下的某一智能体的决策矩阵:

M 3=0001000100011101

01011111?????????????????????????? 这样,我们就清楚的表示了某一智能体的决策情况,接下来,我们来考虑他们的决策带来的后果,为此,我们引进了所谓效用函数来刻画每个智能体评估成

绩的情况。

由于每个智能体最终的目的是想让自己的评估结果尽可能的大,所以我们将在i A 决策下的效用函数(),i i E a f 定义为:

1

y

i i i i E a f ==*∑ 其中,i a 代表该智能体对第i 个属性的决策,i f 表示对第i 个对象的第i 个属性的

取值

那么我们可以看到,决策矩阵的每一行都对应着一个效用函数的值,这个值的大小根据我们的定义就代表了评估结果的好坏。在博弈中的每一方都力求通过合适的决策行动使己方的效用函数最大化,在我们的问题中,每一个智能体采取不同的决策来使自己的评估结果最理想。

因此,我们用

*123-{}i Y A a a a a =?,,,, 来表示第i 个智能体所做的实际的决策,于是我们得到下列式子:

对于()()*111 1,2,3,2y j U E A E A j ≥=?:(,

) 对于()()*222 1,2,3,2y j U E A E A j ≥=?:(,

) …

对于()()* 1,2,3,2y x x xj U E A E A j ≥=?:(,

) 这列式子表示了每个智能体所做的最终实际的决策都对其是最有利的。

如果存在一个决策,使得在此决策下,对所有智能体都是最优的,那么把这个决策称为(纯)纳什均衡(Nash Equilibrium ),所谓(纯)纳什均衡即是这样的一种决策,在该决策下每一方的决策对于他方来说都是最优的所以对于这样的决策,在参与博弈的人中,没有任何一个参与者有理由偏离该决策。这样的决策满足下式:

()()*ij E A E A ≥

现在,来考虑我们题目中所提问题:

1)当{}0,1D =时,如果要求删减掉的属性个数不为零,那么请基于公平性等角度给出属性约简的若干模式(至少2种)。

在第一个问题中,我们将基于公平性理解为所做的对属性的删除行为是满足大部分智能体的利益,在我们的模型中,也就是说,我们需要找到一个纳什均衡点,在这种决策下,依据博弈论原理,是对所有人都有利的,也就是说,作为决策者,

上面的表格清楚地给出了我们评估的对象甲乙丙以及相应的属性123A A A 之间的关系,依据我们的模型,我们写出了用来表示智能体所有决策的决策矩阵M 。

M 3 = 0001000100011101

01011111??????????????????????????

此矩阵中的每一行都代表着智能体的一种决策,并且根据题目要求可知我们应该去掉全是0和全是1的那两行,依据我们所建模型,有:

1

y

i i i i E a f ==*∑ 此时{}0,1i f =. 对甲来说:1234561

10121E E E E E E ======,,,,, 对乙来说:12345601

0011E E E E E E ======,,,,, 对丙来说:1234561

11222E E E E E E ======,,,,, 我们可以清晰的看到,在这场博弈中,不管对甲乙丙,5E 都是最大的,也就是说,采取第五种决策对每个人都是有利的,这里的第五种决策就是这场博弈中的纳什均衡点,也就是我们所求的答案,即删去属性1A 。如果,我们没有找到对所有个体都有利的决策,即不存在纯纳什均衡点,那我们就去找那个满足个体数最多的决策作为我们的解。

现在我们从区分矩阵的角度出发,提出了属性约简的第二种办法。

定义1:设(), , , S U A V f =为一信息系统,S 的区分矩阵是一个n n ?矩阵,其任一元素

为:()()(), , ,{}}}c x y a A f x a f y a =∈≠,即:(),c x y 是区别对象x 和y 的所有属性的集合。其中n 为论域U 中对象的总个数。

定义2:设,()S U C D =?为一个决策表,其中C 为条件属性集,

D 为决策属性集,C D Ф?=,决策表S 的区分矩阵被定义为() c i j n n ?,其中

()(){|cij a C a xi a xj =∈≠,且xi xj ,满足}W

xi xj W xi xj (,),(,)表示: ()()()()()()())()xi PosC D xj PosC D xi PosC D xj PosC D xi xj

PosC D xi xj ind D ∈∧?∨?∧∈∨∈∧?(,(,

定义3:由区分矩阵()S Cij =导出的区分函数定义为: Cij =∧∨()。

定义4:设, a b 为区分矩阵中的两个元素,若b 中的属性包含了a 中的属性,则称

b 为a 的重复元素。

输入:决策表, ()S U C D =?。

输出:S 的属性约简。

步骤1:求出()(), PosC D ind D

步骤2:求出简化的析取式

(1)()()()()1,112m d b b b s ==∨∨??∨

(2)1i =

(3)如果i U <,则执行((4),否则转步骤3

(4) 1j i =+

(5)如果j U ≤,则执行(6),否则转(17)

(6)() ,c j i 置空

(7)如果

()()()()()()())()xi PosC D xj PosC D xi PosC D xj PosC D xi xj PosC D xi xj ind D ∈∧?∨?∧∈∨∈∧?(,(,)则执行(8),否则转(16)

(8)

1k = (9)如果k s ≤,则执行(10),否则转(12)

(10)如果()(),,a j k a i k ≠,则()()(),,c j i c j i b k =∨,执行(11)

(11) 1k k =+,转(9)

(12)

1, 0n flag == (13)如果n m ≤则执行(14),否则转(15)

(14)如果()d n 包含(),c j i ,则()(),d n c j i =, 1n n =+,

1flag =,转(13),否则 如果()d n () , c j i ,则() ,c j i 置空,转(16),否则,1n n =+,转(13)

(15)如果n m >且0flag =,则1m m =+, ()() ,d m c j i =

(16) 1j j =+,转(5)

(17) i i l =+,转(3)

步骤3:在步骤2中每求出一个(),c j i 就进行判断是否真包含于每一个() d n ,若为真则进行替换,为假不替换。所以在步骤2中求出的一维数组() d n 中的元素不可能存在真包含关系,但如果某个(),c j i 既真包含于()1d n 又真包含于() 2d n ,进行替换后() d n 可能存在相等的关系,

本步骤去除() d n 中的重复元素。

(1) 1i =

(2)

1j i =+ (3)如果()()d i d j =转(4)否则转(7)

(4)

k j =

(5)()() 1d k d k =+

(6)

1k k =+如果k m <转(5)否则1m m =-转(7) (7) 1j j =+如果j m ≤转(3)否则1i i =+如果i m <转(2)否则转步骤4 步骤4:将1i =到m ,做()d i 合取,得到简化区分函数,如果把()d i 中的属性个数为1的进行合取,则为区分矩阵的核。

步骤5:利用简化区分函数可以得到约简。

2).当{}0,1D =时,如果考虑删减掉的属性越多越好,在第一问的基础上,给出对应的数学模型和求解(被删掉的属性)算法。通过仿真给出算法评估。并针对由附件数据刻画的3个决策信息系统进行求解,分别给出删掉的属性及其数量(数量在摘要中要体现),其中行代表对象,列代表属性(对象,属性用阿拉伯数字标记)。

在这一问中,要求删掉的属性越多越好,也就是说,在我们找到的最有利决策中,我们希望出现尽可能多的零,这样系统便会大大的简化。重要的是,在此问中,同上题一样,我们都是站在决策者的角度去考虑问题的。于是我们可以再上面的模型的基础上做出一些改进。

在上面的模型中,我们只是找出了那一部分对每个智能体最为有利的抉择,反映在模型里,即为那一部分效用函数值最大的抉择,我们并没有仔细地处理所得到的结果。于是,在这个问题中我们将得到结果进行一系列处理,以此作为模型的后续部分。

先假设,我们得到了一列对各个智能体最为有利的决策,记为:

12111213121

22232123x K K x x x xK A A A A A A A A A A A A ??????????????

其中,第i 行表示对第i 个智能体最为有利的i K 个决策。

现在进行下列步骤来解决问题:

(1) 将上边矩阵的每一行作为一个集合{}123

i i i i i iK U A A A A =,给我们所得集合做通集,即12x U U U U =???。

(2) 如果U =?, 3)在属性加权(各种属性重要程度不一样)的情况下,或者D 取②,③④情形时讨论上述模型以及求解算法的拓展性。

在属性加权时,我们需要对第一问中的模型进行一些改变,由于各个属性的重要程度已经不再相同,我们需要对第一问中的模型进行一些改变,由于各个属性的

重要程度已经不再相同。联系实际,比如说在计算学生的绩点时,高数所占的比重与体育明显不同,这就是很好的例子。为了解决这个问题,我们在原有模型的基础上,对我们的效用函数做出了改动。

定义新的效用函数:

1y

i i i i i E a f pr ==**∑

其中,i pr 代表第i 个属性所占的比重

这样一来,我们接着按照问题1()中的模型,运用新的效用函数,就可以解决属

性加权的情况。并且,当D 取②,③,④情形时,我们运用问题1()中的模型足

甲乙丙的成绩情况如上表,并且假设高数物理和英语的权重分别是

60%20%20%,,。现在我们运用模型来解决问题。我们先写出甲乙丙的决策矩阵如下:

30001000100011101

01011111M ????????????????????????

=?? 出于实际考虑,该矩阵的第一行与最后一行不予考虑。

对于甲:118060%48E =??=

218020%16E =??=

317520%15E =??=

418060%18020%64E =??+??=

518060%17520%63E =??+??=

618020%17520%31E =??+??=

对于乙:117560%45E =??=

217020%14E =??=

318520%17E =??=

417560%17020%59E =??+??=

517560%18520%62E =??+??=

617020%18520%31E =??+??=

对于丙:116560%39E =??=

217020%14E =??=

319020%18E =??=

416560%17020%53E =??+??=

516560%19020%57E =??+??=

617020%19020%32E =??+??=

我们发现,没有一个效用函数在甲乙丙中同时取最大,也就是说,在这个例子里,纳什均衡点并不存在,但是我们又发现,5E 在乙丙中同时取得最大值,于是5E 就是我们所要寻求的解,即删去物理这个属性,只考虑高数与英语。上述例子中,我们将D 的范围扩充至[]1,100的情况并且赋予不同属性不同的权重,运用第一问中所建立模型,我们很好地解决了问题。

4)(2)中模型如何调整一遍可以用来给智能体的私下操作带来技术支持。

在这一问中,我们站在了智能体的角度来考虑问题,公平性已经不再是我们考虑的首要问题,怎样提出建议才能使我们的建议最有可能被决策者所接受从而对自己最为有利成为了为题的关键所在。

博弈论在管理制度中的应用

博弈论在管理中的应用

————————————————————————————————作者:————————————————————————————————日期:

博弈论在管理中的应用 不知道大家有没有为这些事情困惑过:为什么员工技能竞赛,技能比拼很难开展,即便开展了,为什么工作效率也没有像预想的那样提高?为什么企业中总有些人拖大家的后退而不努力工作?为什么有的领导手段强硬,有的领导风格怀柔?你是否为“办公室政治”烦恼不已?你有没与遇到过和你看法不一致,总是与你针锋相对的下属?遇到强硬的下属你该怎么办?为什么酒店联盟或者企业间的联盟总是很难做?你是否在做决策之时衡量反复却不知道选择何种策略?。。。。。。。。等等等等这些问题、困惑你是否明白其中的原理?你如何提出科学而又合理解决方法? 以上种种问题,你都能从博弈理论中得到合理而科学的解释。而大家是否了解博弈论呢。我们这次分享就是和大家一起了解博弈论的一些知识,并以隐藏在我们身边的博弈为例子,给大家提供解决某些实际问题的思路。 那么什么是博弈论呢?所谓博弈论,就是一套研究互动决策行为的理论。它实际上也可以看做是一种方式,既谋略性思考问题的方式。对博弈论通俗的理解就是,关于人与人的斗争中“老谋深算”的学问。 假如你正跟恋人用手机通电话,突然信号断了。这时你是会立即拨电话过去,还是等你的恋人拨电话过来?很显然,你是否拨电话过去取决于你的恋人是否会拨过来。如果你们其中一方拨,那么另一方最好是等待;如果一方等待,那么另一方最好拨过去。如果双方都拨,那么就会出现线路忙;如果双方都等待,那么时间就会在等待中消逝。 这,就是博弈。

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

博弈论(整理过名词解释和简答)

名词解释: 1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。 2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。 3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。 4、常和博弈:是指博弈双方的得益总和为非零的常数 变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。在经济学中,博弈论是研究经济主体的决策相互影响 6、战略:参与人在给定信息集的情况下的行为规则的完备描述。 7、均衡:所有参与人的最优战略组合。 8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。 9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。 10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。 11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。 12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。 13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件: (1)决策结x是单结信息集; (2)在一个信息集的决策结必须是同一个决策结的后续结。 14、子博弈精炼纳什均衡:如果一个纳什均衡中的各个子博弈的战略在每一个子博弈中都是最优的,即构成纳什均衡,则称该博弈为子博弈精炼纳什均衡。 15、静态博弈:指博弈中的参与人同时选择行为,或者虽非同时但后行动者并不知道前行动者采取了什么具体行动; 动态博弈:指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。 16、重复博弈:给定一个标准博弈G(动态/静态)重复进行T次,并且每次重复G之前,以前的博弈的结果各个博弈方都能观察到,这样的博弈过程成为“G的T次重复博弈”,记为G(T),G称为G(T)的博弈阶段。同样结构的博弈重复多次,其中的每次博弈称为阶段博弈。 17、不可置信的威胁:在纳什均衡中,不可置信的均衡战略,在博弈的规则下,使自己的支付变小的不理性的选择。 18、完全信息博弈:每一个参与人对所有其他参与人的特征,战略空间以及支付函数有准确知识的博弈。 19、类型:一个参与人所拥有的私有信息,是其个人特征的完备描述,博弈人知道,其他人不知道。

博弈论与纳什均衡

《博弈论与纳什均衡理论》 姓名张贺祺 学号 2010010404 专业政治经济学 指导老师张秉云

摘要 博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法,也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 关键字:博弈论;纳什均衡;合作博弈;非合作博弈

目录 摘要 (2) 关键字 (2) 一、引言 (4) 二、博弈论与纳什均衡的主要内容 (4) (一)博弈论的主要思想 (4) (二)博弈论的分类 (5) 三、经典案例 (7) (一)博弈论的经典案例 (7) (二)纳什均衡经典案例 (7) 四、博弈论和纳什均衡的重要影响 (8) (一)博弈论的重要影响 (8) (二)纳什均衡的重要影响 (8) 参考文献 (9)

博弈论与纳什均衡理论 一、引言 近代对于博弈论的研究,开始于策墨咯(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。 1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。 博弈论(Game Theory):亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 纳什均衡:(Nash equilibrium)又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。假设有n人局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 二、博弈论与纳什均衡的主要内容 (一)博弈论的主要思想 一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。博弈论模型可以用五个方面来描述:G = {P, A S, I, U) P:为局中人,博弈的参与者,也称为博弈方,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。决策人:在博弈中率先做出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。对抗者:在博弈二人对局中行动滞后的那个人,与决策人要做出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。他的策略可能依赖于决策人劣势的策略选择,因此对

关于定价的博弈论模型

CH13 关于定价的博弈论模型 分析寡头市场的最大困难在于策略问题。在此情形下,市场上仅有几家企业,每一家企业在做决策时,都必须在一定程度上考虑其它企业的行为。博弈论就是用以研究策略选择的一种主要的工具。 一、基本概念 在一些情况下,个人或企业必须作出策略性选择,并且最终的结果依赖于每一个行动者的选择,这种情况就可以看成是一个博弈。 1.博弈的三要素 任何一个博弈都必须具备三个要素: (1)博弈的参与者 参与人的具体身份无关紧要,在博弈中没有“好人”与“坏蛋”之分,我们只是简单地假设每个参与者在考虑到对手行为的前提下,做出最有利的策略性选择。 (2)策略 策略是博弈参与者的行动规则。 在非合作博弈中,参与者之间不能就策略选择达成一个有约束力的协议。 (3)支付(payoffs ) 支付是参与者的最终受益。支付包括了与博弈结果相关的所有方面,既包括显性的货币报酬,也包括隐性的参与者关于结果的心理感受。 2. 符号 两个参与者(A 和B )之间的博弈G 用下式表示 [,,(,),(,A B A B G S S U a b U a b 其中,A S 和B S 分别表示参与者A 和参与者B 的可选策略,(,)A U a b 和(,)B U a b 分别表示当参与者A 和B 分别选择策略a 和策略b 时,各自所得到的支付(,A B a S b S ∈∈)。 二、Nash 均衡 市场均衡:在均衡价格和产量下,买方和卖方都没有动力去改变自己的行为。

Nash 均衡:对于策略组合(**,a b ),如果给定其它参与者的策略,没有一个参与者会选择单方面偏离,那么这个策略组合就构成一个Nash 均衡。也就是说 ** * (,)(,)A A U a b U a b '≥ 对于所有A a S '∈ ** * (,)(,)B B U a b U a b '≥ 对于所有B b S '∈ 对纳什均衡的理解 设想所有参与者在博弈之前达成一个(没有约束力的)协议,规定每个参与人选择一个特定的战略。那么,给定其他参与人都遵守此协议,是否有人不愿意遵守此协议?如果没有参与人有积极性单方面背离此协议,我们说这个协议是可以自动实施的(self-enforcing ),这个协议就构成一个纳什均衡。否则,它就不是一个纳什均衡。 三、一个例子 两个厂商(A 和B )决定自己花多少钱用于做广告。每个厂商可以选择较高的预算(H )或较低的预算(L )。 1.博弈的扩展式表述 图13.1 2.博弈的策略式(规范式)表述 表13.1 3.占优策略和Nash 均衡 从表13.1可以看出,低预算(L )是厂商B 的占优策略,即不管厂商A 选择哪一种策略,L 都是厂商B 的最佳选择。由于该博弈的结构是公共知识,厂商A 也知道L 是厂商B 的占优策略,所以厂商A 将选择L 。因此,该博弈的均衡是(L ,L )。 请验证(L ,L )构成一个Nash 均衡,而其它三个策略组合都不是Nash 均衡。

从博弈论角度看古诺模型

从博弈论角度看古诺模 型 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

博弈论的观点看古诺模型 罗思蕴 (华中师范大学数学与应用数学系,武汉430079) 摘要:运用博弈论的研究方法,对古诺模型的几种变式进行分析,给出模型解法的代数表达式,并对结果进行适当的对比分析,最后总结出不同模型对结论的改变情况。 关键词:古诺模型纳什均衡完全信息不完全信息静态博弈动态博弈 古诺模型(Cournot model)是博弈论中最具有代表性的模型之一,也是是纳什均衡最早的版本。它是法国经济学家古诺(Augustin Cournot)在1938年出版的《财富理论的数学原理研究》一书中最先提出的。而古诺的定义比纳什的定义早了一百多年,足以体现博弈论这样一个学科是深深扎根于经济学的土壤中的。从经济学的角度,它的研究价值在于古诺模型是介于两种极端状况完全竞争和垄断之间。 在古诺生活的时代,大多数市场都只有少数的厂商经营,所以这个模型在当时是极具现实意义的。随着时间的推移,古诺模型也演变出了各种不同的版本。如果从博弈论的角度分析,有四种情况极具代表性:完全信息静态博弈的古诺模型、不完全信息静态博弈的古诺模型、完全且完美信息动态博弈的古诺模型、无限次重复博弈的古诺模型。 1 经典古诺模型 古诺模型最初的形态是来自于经济学的。在经济学中,寡头的概念是指那种在某一产业只有少数几个卖者的市场组织形式。古诺模型对寡头具有如下的基本假设。一,

假定一个产业只有两个寡头,每个寡头生产同质产品,并追求利润最大化。二,两个寡头之间进行的是产量的竞争而不是价格竞争,且产品的价格依赖于两者生产的产品总量。三,寡头之间无勾结行为。四,每个生产者都把对方的产出水平视为定值。五,边际成本为常数。 在经典的古诺模型中,每个企业具有相同的不变单位成本: 需求函数为: 第i个企业的利润为: 最优化的一阶条件为: 反应函数为: 解得纳什均衡为: 每个公司的利润为: 古诺模型是在假定寡头具有完全信息的基础上导出的。在这一均衡中,每个寡头都可以准确猜测对手的产量,从而选择自己的最大产出。 最重要的是,古诺均衡解在寡头无勾结的假定下求出的。如果考虑寡头之间相互勾结而达到均衡的情况,那么经过计算可以得到实际产出水平与实际价格上等于完全垄断条件下达到的产量与价格。更广泛的,考虑无勾结寡头市场、垄断市场、自由市场,可以得到:无论是产量还是价格,无勾结寡头市场都是处于中间的位置。也就是说,如果寡头市场不存在勾结的行为,其效率高于完全垄断,低于完全竞争。 2 博弈分类下的两种古诺模型 不完全信息静态博弈的古诺模型 完全信息静态博弈的古诺模型即经济学中最经典的形式,它假设了厂商相互完全

新《博弈与决策》期末复习指导

第一章博弈论的基本理论 (一)博弈论的基本概念 博弈:现实生活中,不同的决策人为了争夺资源、争夺机会使得决策人处于相互依存的复杂关系中,这就不得不思考他人有针对性行为对自身所产生的影响。 博弈就是一种游戏,在这种状态下,参与者必须作出选择,并对对方的选择作出判断,这种判断和选择决定了博弈的结果。每个对弈者在决定采取何种行动时不但要根据自身的利益和目的行事,也要考虑自身的决策行为对其他人的可能影响,以及其他人的行为对自身的可能影响,通过选择最佳行动计划,来寻求收益或效用的最大化。 博弈论:就是以参与人之间有针对性的行为产生的互动过程为研究对象的理论,探讨在互动过程中参与人的一般行为规律。博弈论的核心问题在于如何在“策略互动”的局势中找到局中人的最佳行为方式,使得采用最佳行为方式的局中人能获得最大的收益。所以博弈论可以简单理解尾研究策略互动局势中的局中人的理性行为的理论。 (二)博弈论的构成要素 1、博弈一般由以下几个要素组成,包括:参与人、行动、信息、策略、得益、结果、均衡等。 2、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体); 3、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策; 4、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排; 5、得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西; 6、均衡是所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合。 上述要素中,参与人、行动、结果统称为博弈规则,博弈分析的目的就是使用博弈规则来决定均衡。 二、博弈论的发展简史 1、萌芽阶段:博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。 2、产生阶段:1944年科学家冯·诺伊曼和经济学家奥斯卡·摩根斯坦合著《博弈论与经济行为》将二人博弈推广到n 人博弈结构并将博弈论系统的应用于经济领域,标志着博弈论作为一门独立的的学科诞生。 3、发展阶段:1950年,约翰·纳什(John Nash)引入均衡(解)的概念,即纳什均衡,将博弈论从零和博弈推进到非零和博

《管理经济学》(二)-论博弈论对企业决策的启示 (5)

南开大学现代远程教育学院考试卷 2020年度春季学期期末(2020.2) 《管理经济学》(二) 主讲教师:卿志琼 一、请同学们在下列(20)题目中任选一题,写成期末论文。 1、完全竞争市场、垄断竞争市场、寡头垄断市场和完全垄断市场特点比较分析 2、完全竞争市场的特点与评价 3、完全竞争市场厂商短期关门点决策 4、完全竞争市场厂商长期均衡的利润状况分析 5、完全垄断市场的特点分析 6、完全垄断市场厂商的长期均衡条件分析 7、论价格歧视及其条件 8、论一级差别定价、二级差别定价和三级差别定价的含义与适用条件 9、论垄断竞争市场的条件与企业决策 10、垄断竞争市场厂商的价格竞争与非价格竞争 11、寡头市场结构的特点分析 12、比较完全竞争、完全垄断和垄断竞争市场结构的长期均衡条件与效率分析 13、卡特尔定价与价格领导的含义与应用 14、论博弈论对企业决策的启示 15、运用某一市场结构分析企业的定价与产量决策 16、成本加成定价法的含义及其应用 17、企业不同的定价实践与应用 18、市场进入障碍与市场结构——以某市场为例 19、长期投资决策原则与应用 20、囚徒困境与纳什均衡的含义与应用 二、论文写作要求 1、论文题目应为授课教师指定题目,论文要层次清晰、论点清楚、论据准确; 2、论文写作要理论联系实际,同学们应结合课堂讲授内容,广泛收集与论文有关资料,含有一定案例,参考一定文献资料。 3、第13题——20题,可以加副标题。如第20题,囚徒困境与纳什均衡的含义与应用——以可口可乐与百事可乐广告战为例 三、论文写作格式要求: 论文题目要求为宋体三号字,加粗居中; 正文部分要求为宋体小四号字,标题加粗,行间距为1.5倍行距; 论文字数要控制在2000-2500字;

博弈论 案例

基本概念 (1)决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。(2)对抗者:在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。(3)局中人(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。(4)策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。(5)得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。(6)次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。(7)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果。纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a,b*)≤偶对(a*,b*)≥偶对(a*,b)。对于非零和博弈也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:对局中人A的偶对(a,b*)≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对(a*,b*)。有了上述定义,就立即得到纳什定理:任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要工具。通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。塞尔顿(R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点,从而形成了两个均衡的精炼概念:子博弈完全均衡和颤抖的手完美均衡。 博弈类型

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博 弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则 为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信 息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P,I),其中P为市场价格,I为消

费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 2、 参与人的行动顺序,即每个参与 人在何时行动; 3、 序列结构:每个参与人行动时面 临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息; 4、 参与人的支付函数。 比较: 1、战略式博弈从本质上来讲是一种静态模型。 2、扩展式博弈从本质上来讲是一种动态模型。 {1,2,...,} n Γ={1,2,...,}n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

博弈论在公共决策中的应用(最新)

博弈论在公共决策中的应用 一.领导干部要学点博弈论 1.几个富有启发性的案例 案例1:商家作出最低价格承诺的真相是什么?所谓最低价格承诺是指商家承诺自己的价格比任何对手都低,一旦有对手的价格比自己低,作承诺的商家将退回差额,并且承诺支付一定金额的违约罚金。 思考:商家为什么要作出这种承诺呢?是为了促销或者恶性竞争吗? 案例2:假设有三个候选人或候选方案:x、y 和z;有三个参加投票的人:甲、乙、丙。三个人对候选对象的态度分别如下:甲:x y z;乙:y z x;丙:z x y。(注:候选对象排位越靠前,表示越喜欢) 现在分别有三个投票程序:程序1,x与y先pk,然后胜利者进入下一轮与z进行pk;程序2,x与z先pk,然后胜利者进入下一轮与y进行pk;程序3,z与y先pk,然后胜利者进入下一轮与x进行pk。 思考:(1)上面每个程序的最终获胜者是谁?(2)为了保证丙自己心目中最喜欢的z当选,如果丙能够操纵投票程序,他应该采用哪个投票程序?(3)如果您是甲,为了

避免自己最不喜欢的丙当选,应该怎么办? 案例3:夫妻博弈(又称协调博弈) 妻 夫足球 芭蕾 思考:夫妻博弈最有可能出现的结局是什么?丈夫如何保证获得自己理想的结果——夫妻一起去看足球?妻子有没有办法扭转这一被动局面? 体会:什么是纳什均衡?纳什均衡的特点就是:在均衡状态下没有人愿意单方面改变自己的策略,也就是说,博弈各方所选择的策略互相构成了最优反应。 案例4:开店博弈 假设顾客均匀分布在一条街上,他们总是选择到离自己家最近得的商店购物;现有两位投资者均准备在街上开店,他们都希望到自己商店购物的顾客越多越好。请问:投资者应该

博弈论的总结|博弈论总结

博弈论学习的个人总结刘艳丽 第一部分基本情况 视频来源耶鲁公开课《博弈论》1----5讲,人人影视 参考资料耶鲁校园网 《博弈论--战略分析入门》,美,罗杰A麦凯恩,原毅军译,机械工业出版社,2006,42元《策略博弈》,阿维纳什迪克西特,蒲勇健译,中国人民大学出版社,第二版,2009,65元班级工商,人力08级学生 课时8节 我的时间投入视频26个小时;书籍,25小时;上网时间,无法统计。 第二部分知识层面 一、The five lessons五个基本的结论 1、Don"t play a strictly dominated strategy

2、Rational choices can lead to bad outcomes 3、You can"t get what you want 4、Put yourself in other people"s shoes 5、Yale students are evil 二、Game 2: "pick a number."数字游戏 Without showing your neighbor what you"re doing, put in the box below a whole number between 1 and a 100 [whole number between 1 and 100--integer.] We will calculate the average number chosen in the class. The winner in this game is the person whose number is closest to two-thirds times the average in the class. 三、The Prisoners" Dilemmasome examples囚徒困境 A joint project Price competition

博弈论与纳什均衡

第22卷哈尔滨师范大学自然科学学报 Vol .22,No .42006 第4期 NAT URAL SC I E NCES JOURNAL OF HARB I N NOR MAL UN I V ERSI TY 博弈论与纳什均衡 郭 鹏 (中国矿业大学) 杨晓琴 (鸡西大学) 【摘要】 纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础. 关键词:博弈论;纳什均衡;非合作博弈 收稿日期:2006-02-15 0 引言 博弈论又称对策论,是使用严谨的数学模型研究现实世界中冲突对抗条件下最优决策问题的理论.两千多年前,孙膑利用博弈论原理帮助田忌赛马取胜,就是早期博弈论的萌芽.作为一门正式学科,博弈论是在20世纪40年代形成并发展起来的,合作型博弈在20世纪50年代达到了巅峰期.然而,它过于抽象,实用性不强,其局限性日益暴露出来.50年代以来,纳什(Nash )、泽尔腾(Selten )、海萨尼(Harsanyi )等人使博弈论成熟并最终进入实用.最近三四十年,经济学经历了一场“博弈论革命”,引入博弈论的概念和方法改造经济学的思维,推进经济学的研究.1994年诺贝尔经济学奖授予3位博弈论专家纳什、泽尔腾和海萨尼,可以看作是一个标志,这也激发了人们了解博弈论的热情.博弈论作为现代经济学的前沿领域,已成为占据主流地位的基本分析工具. 简单地说,博弈论研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡.博弈论由3个基本要素组成:一是决策主体(Player ),又可以译为参与人或局中人;二是给定的信息结构,可以理解为参与人可选择的策略和行动空间,又叫策略集;三是 效用(U tility ),是可以定义或量化的参与人的利 益,也是所有参与人真正关心的东西,又称偏好或支付函数.参与人、策略集和效用构成了一个基本的博弈. 1 博弈论的主要思想 一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织:第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失. 博弈论模型可以用五个方面来描述:G ={P,A,S,I,U ) P:为局中人,博弈的参与者,也称为“博弈 方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标. A:为各局中人的所有可能的策略或行动的集合.根据该集合是有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策、重复博弈和微分对策等.

中国政府上下级博弈论

浅论中央与地方的博弈 一、问题的引入 改革开放以来,中国的经济发展取得了举世瞩目的成就,但中央政府与地方政府的矛盾和问题也日益突出。中央与地方的关系自古有之,但不同时期其具体的表现形式各异。在现阶段,中央政府与地方政府的关系已经不再是计划经济体制下的单纯意义上的“上传下达”的关系。中国的经济改革是一场自下而上的制度变迁过程,即地方政府“强迫”上级政府同意变革的过程,这也是中国经济转轨得以成功的关键。随着改革的深入,中央与地方政府的矛盾开始加剧:中央政府的许多政策出台后,地方政府并不认真执行。上有政策,下有对策。二者的政策博弈陷入白热化。近些年来,在宏观调控、环境保护、三农问题、农民工等诸多问题上,都可以看到中央政府与地方政府政策博弈的影子。 在改革发展中,中央与地方的矛盾十分突出:一方面是中央政府为了克服市场失灵,运用政府手段加强宏观调控,以求达到资源的合理有效利用;而另一方面,地方政府已经不完全是过去意义上的中央从属机关。因其所代表的地方利益与中央政府的宏观利益存在分歧,地方政府在政策制定和实施中,更多的是从自身利益出发,而不惜触犯中央的权威。 本文试图从博弈论的视角来分析当前中央与地方关系中存在问题的产生机制与影响,并分析提出构建新型中央与地方关系的可能性。 二、分析问题 当代中国的中央与地方关系中的一些突出问题是在改革开放以来,由于市场经济的导入而引起的利益分配问题所引发的。产生的具体原因及表现: 1.在财税方面,中央与地方财政体制改革推动了分权化的进程。分税制改革根据事权与财权相结合原则,将税种统一划分为中央税、地方税和中央地方共享税,并建立中央税收和地方税收体系,分设中央与地方两套税务机构分别征管;科学核定地方收支数额,逐步实行比较规范的中央财政对地方的税收返还和转移支付制度;建立和健全分级预算制度,硬化各级预算约束。分税制改革的效果是明显的,经过十多年的平稳发展,财政收入占GDP的比重和中央财政占全国财政的比重均有明显上升。但同时存在着诸多问题:财政支出的比重过低,预算外资金难以控制等等。 2.在政治管理领域,下放中央政府的某些人事管理权,在扩大地方利益的同时,加重其管理地方事务的职责。在市场经济条件下,具有非竞争性和非排他性的公共物品必须只能由政府提供。公共物品按其受益范围可分为两大类,一类是全国性公共物品,如国防、外交等;另一类是地方性公共物品,如消防、垃圾处理等。公共物品的资源配置应遵循的原则是政府所提供的公共物品必须尽量与受益区域内居民的消费偏好相一致。对于大多说公共商品而言,一定要明确其受益范围是不可能的,所以在界定中央与地方事权范围上难免有模糊之处,带来的必是责权不分。 3.在经济建设领域,中央给予地方众多特许权力,并下放大批国有企业。改

博弈论培训心得

博弈论培训心得 -------李佳航 经过两次对博弈论的培训本人感触很深,也看了许多关于博弈的案例也从案例从学习了很多关系学习生活为人方面的博弈。 学习后现在简单总结一下: 1、博弈论中有很多的模型,其实记住模型并不是最重要的东西,掌握将问题变成博弈格局图以及进行优势策略标注法,找到纳什均衡更加重要。世界上的事情千变万化,仅仅靠这几个模型是无法全部解释的,而且模型与模型之间,仅仅变换几个数字,则发生变化。 2、博弈论可以将社会问题变成一个数学模型来计算推理,因此我们运用此模型时,需要相对准确地核定博弈各方的支付大小,解决问题的过程中,可设法改变参数让博弈对自己更加有利。 3、基本博弈模型的作用在于解决问题时更加容易去套,而不需要计算即知道博弈的结果将是什么,因此对于分析问题是有益的。有了模型在,对于一些谈判,容易让人站在博弈论的高度去分析它,这往往让人对谈判更加具有控制力。 4、对于较为简单的事件,完全不需要学习博弈论即能找到问题的答案,我们现实生活中的都自然而然的达到了博弈的均衡结果。 本周培训主要是讲的卡尼曼的前景理论和损失规避。 前景理论: 1、“二鸟在林,不如一鸟在手”,在确定的收益和“赌一把”之间,多数人会选择确定的好处。所谓“见好就收,落袋为安。称之为“确定效应”。 2、在确定的损失和“赌一把”之间,做一个抉择,多数人会选择“赌一把”。称之为“反射效应”。 3、白捡的100元所带来的快乐,难以抵消丢失100元所带来的痛苦。称之为“损失规避”。 4、很多人都买过彩票,虽然赢钱可能微乎其微,你的钱99.99%的可能支持福利事业和体育事业了,可还是有人心存侥幸搏小概率事件。称之为“迷恋小概率事件”。 5、多数人对得失的判断往往根据参照点决定,举例来说,在“其他人一年挣6万元你年收入7万元”和“其他人年收入为9万元你一年收入8万”的选择题中,大部分人会选择前者。称之为“参照依赖”。 损失规避: 如何理解“损失规避”?用一句话打比方,就是“白捡的100元所带来的快乐,难以抵消丢失100元所带来的痛苦”。 前景理论最重要也是最有用的发现之一是:当我们做有关收益和有关损失的决策时表现出的不对称性。对此,就连传统经济学的坚定捍卫者保罗·萨缪尔森,也不得不承认:“增加100元收入所带来的效用,小于失去100元所带来的效用。” 这其实是前景理论的第3个原理,即“损失规避”(lossaversion):

博弈模型

有趣味的博弈论模型 按语: 本文已经发表在“百科知识”2009年6月下半月总第413期第14-15页;在今年2月下半月总第405期第11-13页上发表了“网络科学三大里程碑”;2005年11月上半月总第326期第21-22页发表了“网络科学的三大发现”。令我意外的是去年在网上偶然发现“共检索到 10 条读者推荐文章”(请看最后附录),这篇科普文章名列首位,我们还有一篇文章名列第七。如果读者有兴趣可以去看看,或等我有时间找出来。我觉得,把新兴科学应用通俗易懂的语言写出来,有利于科学知识普及。这也应该是一个科学工作者的责任。 在自然界和人类社会经济等领域中广泛存在合作与竞争,而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论(Game Theory),也称对策论,它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论,研究个体之间行为的相互影响和相互作用规律,它可以描述现实生活中参与者面对有限资源的合作与竞争行为。令人惊奇的是,有三次诺贝尔获奖者是博弈论的杰出科学家,他们是1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1994年经济学诺贝尔奖颁发给美国普林斯顿大学的纳什博士、塞尔屯、哈桑尼3位博弈论专家,1995年获奖的理性主义学派的领袖卢卡斯。博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。进入20世纪末,随着复杂网络科学的一些新的发现,博弈论也成为网络时代人们的一种思维方式、竞争与合作的模式。 博弈论对人有一个最基本假定:人是理性的,人在具体策略选择的目的全是使自己的利益最大化。博弈论就是研究理性的人之间如何进行策略选择的,因此博弈论也称为对策论。博弈论就凭这么一条最简单的假定可以展开广泛的研究,并获得了丰富多彩的结果,利用博弈论可以解读人类的社会行动或集体行动,更易理解人类社会的复杂性和特殊性。为了刻画个体间利益的冲突对整个系统的影响,人们已经提出和研究了许多博弈模型,比较著名的有三个模型:囚徒困境、“雪堆”博弈和“少数者”博弈,下面笔者通过对这三个模型进行简单而通俗的介绍,让大家了解博弈论及其应用概况。 “囚徒困境”模型 囚徒困境作为一个经典的博弈模型受到广泛关注。这个博弈模型假设两个小偷合伙作案时被捕,分别关在不同的屋子里,如果双方都拒绝承认同伴的罪行,则由于证据不足两人都会被轻判(收益为);为此,警方设计了一个机制:如果一方出卖同伴,而另一方保持忠 诚,则背叛者将无罪释放(收益为T ) ;坚持忠诚的一方将被重判(收益为);如果双方都背叛了对方,则双方都会被判刑(收益为R S P ) 。这里假设上述收益参数满足下面的条件:。对每个参与者来说,如果对手坚持忠诚,则他也选择忠诚得到的收益T R P S >>>R 小于他选择背叛得到的收益T ;如果对手选择背叛,则他选择忠诚得到的收益仍小于他选择背叛得到的收益。 S P 可见,无论对手采取哪种策略,自己的最佳策略就是背叛,双方都选择背叛称为囚徒困境的唯一“纳什均衡”(纳什因其提出的“非合作完全信息博弈的纳什均衡”概念而荣获了1994年的诺贝尔获得经济学奖);同时选择背叛所取得的平均收益要低于两个人同时选择合作取得的平均收益。在这种情况下,理性参与者面临着两难的困境。 自然界中广泛存在的合作现象——从单细胞生物的协同工作到人类的无私奉献的行为

相关文档
最新文档