1博弈论在通信中的应用

1博弈论在通信中的应用
1博弈论在通信中的应用

1博弈论在通信中的应用

博弈论之所以能在通信中应用是由于无线资源的稀缺性所致。以移动通信中的功率分配为例,接入系统的用户都希望分配到更多的功率,更多的资源意味着更好的服务和更高的通信质量。以每个用户作为博弈的主体,通过每个主体之间的博弈得到一个均衡的局面,让每个用户既能获得较好的服务又不至于因获得资源过多而干扰到其他用户,博弈论的应用显得尤为重要。

在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoners’ dilemma )博弈模型。该模型用一种特别的方式讲述了一个警察与小偷的故事。假设有两个小偷A 和B 联合犯事,私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8 年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2 年,而坦白者有功被减刑8 年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1 年。表2.1 给出了这个博弈的支付矩阵。

表2.1 囚徒困境博弈[Prisoner's dilemma]

2概率论在通信中的应用

信息具有不确定性,载有信息的信号是不可预测的,并且带有某种随机性,在信息的传输过程中,并非所有的信息都是有用的,而无用的那一部分,则被我们称为噪声。噪声更具有不确定性,并且也是不可预测的。在移动通信时,电磁波的传播路径在不断变化,同时,接收信号也是随机变化的。这时,通信中的信号源、噪声,以及信号传输特性都需要使用随机过程来描述。

对于随机过程,我们可以知道它是一个给定的时间函数;同时,在给定的任一时刻t1,全体样本在t1时刻的取值()tξ是一个不含t变化的随机变量。随机过程具有随机变量和时间函数的特点。随机过程的统计特性可以由分布函数和概率密度函数来描述,它可以分为一维、二维、...n维,当n越大时,则对随机过程的描述就越充分。同时我们也可以通过随机过程的数字特征(即均值、方差以及相关函数)更加简单直观的来描述随机过程的统计特性。

随机过程的统计特性:

1)一维分布函数

2)一维概率密度函数

3)二维分布函数和二维概率密度

4)n维分布函数和n维概率密度函数

随机过程的数字特征

1)数学期望(均值或统计平均)

设随机过程()tξ在给定的时刻t1的取值()t1ξ是一个随机变量,

起概率密度函数为

()t x f 1

11

则()t 1

ξ的数学期望为

()[]

()x t x f x t d E 1

1

1

1

1

1,?

-=ξ因为,t 1使任意取得,所以 可以将t 1

直接记

为t ,而x 1可以直接写为x ,这时,上式就变为随机过程在任意时刻的数学期望,所以上式可以写为 ()[]()dx t x x t E f ?∞

∞-=,1ξ 对于均值性质如下: 1)设C 是常数,则有E(C)=C;

2)设X 是一个随机变量,C 是常数,则有E(CX)=CE(X); 3)设X 和Y 是任意两个随机变量,则有E(X+Y)=E(X)+E(Y); 4)设X 和Y 是任意两个相互独立的随机变量,则有E(XY)=E(X).E(Y)。 本性质可以推广至任意个相互独立的随机变量之积的情况。 2)方差

方差就是均放置与均值平方之差,它表示在随机时刻t 对于均值的偏离程度。 3)相关函数

对于一维的概率密度函数用均值和方差就可以描述,对于二维概率密度函数的描述则仍需要引入概率论与数理统计学中的相关函数和协方差来对随机过程进行描述。 协方差函数

()()()[]()()[]

{}t t t t t t a a E B 221121,--=ξξ

=()[]()[]()dx dx t t x x f t x t x a a 212;12122211;,??∞

∞-∞

∞---式中:t 1、t 2——

为任意两个时刻;

()t a 1、()t a 2——所选取的两个时刻所得到的数学期望;

()t t x x f 2

,

1;2,

12

——二维概率密度函数。

相关函数

()()()[

]

()dx dx t t x x f x x t t t t E R 2

1

2

,

1;2,

12

2

1

212,1?

?∞

∞-∞

-==ξξ

式中:t 1、t 2——任取的两个时刻;

()t t x x f 2

,

1;2,

12

——二维概率密度函数

通过这些就可以对随机过程进行描述。通过对随机信号的描述我们可以正确的对信号做出判断和处理。

3.概率论在在信号的统计检测与估计中的应用

在对随机信号进行处理的过程中,我们难以避免的会遇到噪声和干扰,噪声和干扰会使我们在接收信号时,无法确定我们所收到的信号是否正确,更加的在增加了接收信号的不确定性,从而使信号的传输和接收产生误差。为了解决这个问题,在有限的条件下判断出信号的正确性,就需要通过统计推断中的假设检验理论来解决这个问题。 在统计学中,经过人们的长期实践,使得假设检验的一般过程比较明确。由于要检验的假设涉及总体均值μ,所以我们首先可以想到的是是否可以借助样本的均值x 这一统计量来进行判断。我们知道X 是μ的无偏估计,X 的观察值x 的大小在一定程度上,反映了μ的大小,所以,如果假设H 0为真,则一次实验的观察值x ,满足不等式

z a n

x 0

≥-σμ

几乎是不会发生的。现在,在一次实验中出现了满足z a n

x 0

≥-σμ

的x ,则我们可以怀疑原来假设的H 0的正确性而拒绝

H 0,

若出现的观测值x 满足z a n

x 20

<-σμ

此时没有理由拒绝假设H 0,因此,只能接受H 0.

在信号的统计检测与估计中,对于假设检验的定义是认为一个被观测的物理系统可能出于M 个状态之一。我们就称“系统处于状态

j (j =1,2,...,M)为假设H j ”。

由于 对系统一般只能进行有限的检测,假定观测数据矢量为

[]v v v N v

T

~,...,~,~21~=,?∈N

v ~,并令,()v P j ~为H j

为真时的观测数据为

v

~的条件概率密度;()M j j

,...,2,1=ζ为系统出于H

j

时的先检概率,显

然有

()1~0≤≤v

P j 及 ()??N

v d v P j

~

~=1

10≤≤ζj

11

=∑=M

j j

ζ

()v

P j

~又称为转移概率,它一般只决定于干扰与噪声。因为我们只能根据数据观测量来判断系统处于何种状态,但因为v

~是随机矢量,N 有限,所以要检测结果完全正确也是不可能的。

要判别在实际过程中,随机信号和有用信号存在的检测问题归结为:判别为在H H H M 1,1,0...-等M 个假设中的哪一个假设为真的问题。

经过进行统计判决的经验积累,在假设检验对信号进行统计判决时,一般遵循以下步骤:首先要对信号做出原假设;其次,选择出判决所要遵循的最佳准则;然后,进行试验,来获得进行信号统计所需要的资料;最后,根据数据和给定的最佳观测来进行统计判决。

这样,我们就可以根据判决结果来判断出信号的有无,从而使信号的接收和传输简便,避免了在接收信号时遇到的噪声和干扰,不易出现误差。

4概率论在网络编码感知的路由判据中的应用

Katti等提出的基于机会的网络编码方法(COPE)首次研究了网络编码在无线环境中的协议层面上具体实现的问题。在COPE 中, 每个节点编码组合数据后, 进行基于机会的路由。COPE的主要思想是节点首先对传输信道进行侦听,获取其邻居的相关信息,决定进行编码的机会,并在本地的先入先出FIFO(First Input First Output)缓存结构内进行编码,然后进行基于机会的路由。COPE协议要求每个节点利用本地信息各自决定哪些数据包需要进行编码以及如何进行编码。若节点Vi的发送队列中的k个数据分组p1,p2,…,pk能一起编码,构造一个能被下一跳节点正确解码的数据分组,则必须满足以下解码条件:每个参与编码的数据分组pj的下一跳节点Vj都获得除pj之外的其他参与编码的数据分组。

覃团发等由此提出了一种基于网络编码的无线Mesh路由协议,应用马尔科夫链模型,定义了网络编码感知的路由判据。代替了传统的期望传输次数(ETX)、期望传输时间(ETT)等判据,引入了COPE 中的期望资源消耗(ERC)判据,每个节点都维护着一个链路缓存用来存储链路的ERC信息。一旦链路的ERC信息发生变化,节点重新计算到达其他节点的最优路径。网络中的节点根据这一判据作出路由选择,能增加网络编码机会,降低网络资源消耗,最大化网络编码效率。

5.模糊理论在通信中的应用

模糊理论是指用到了模糊集合的基本概念或连续隶属度函数的理论。它可分类为模糊数学,模糊系统,不确定性和信息,模糊决策这五个分支,它并不是完全独立的,它们之间有紧密的联系。

模糊理论最近在通信中的应用越来越多,特别是用于智能识别、判断中。

囚徒困境--博弈论在谈判中的应用

背景:两个人因盗窃被捕,警方怀疑其有抢劫行为,但未获得确凿证据可以判他们犯了抢劫罪,除非有一个人供认或两个人都供认。即使两个人都不供认,也可判他们犯盗窃物品的轻罪。 囚徒被分离审查,不允许他们之间互通消息,并交代政策如下:如果两个人都供认,每个人都将因抢劫罪加盗窃罪被判2年监禁;如果两个人都拒供,则两个人都将因盗窃罪被判处半年监禁;如果一个人供认而另一个拒供,则供认者被认为有立功表现而免受处罚,拒供者将因抢劫罪、盗窃罪以及抗拒从严而被重判5年。如下表所示。 囚徒困境 在这个模型中,最终两人选择的策略都是供认,因为每个囚徒都会发现:如果对方拒供,则自己供认便可立即获得释放,而自己拒供则会被判0.5年,因此供认是较好的选择;如果对方供认,则自己供认将被判2年,而自己拒供则会被判5年,因此供认是较好的选择。 在上表中明显能够看到存在一种对双方都有利的策略:拒供。这种策略是一个有利的结局:分别被判0.5年徒刑。 “囚徒困境”有着广泛而深刻的意义。个人理性与集体理性的冲突,个人追求利己行为而导致的最终结局是一个“纳什均衡”(以其研究者数学家纳什命名),也是对所有人都不利的结局。甲、乙两人都是在供认与拒供策略上首先想到自己,这样他们必然要服长的刑期。只有当甲、乙都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。从利己目的出发,结果是损人不利己,既不利己也不利他。两个囚徒的命运就是如此。 因此,我们从“纳什均衡”中可以悟出:合作是有利的“利己策略”。也就是我们所说的“己不所欲勿施于人”。其次,“纳什均衡”是一种非合作博弈均衡,在现实商务伙伴之间非合作的情况要比合作情况普遍,因此对非合作博弈的研究更具有现实意义。

范里安《微观经济学:现代观点》(第9版)课后习题详解-(博弈论的应用)【圣才出品】

第30章博弈论的应用 1.在一个双人博弈纳什均衡中,每一个参与人都在针对什么作出最优的反应?在一个占优策略均衡中,每一个参与人又都在针对什么作出最优的反应? 答:(1)在纳什均衡中,每个参与人都对其他选手的最优反应作出了自己的最优反应。 (2)在一个占优策略均衡中,每个参与人的选择都是对其他选手所有选择的最优反应。特别地,占优均衡一定是纳什均衡,但纳什均衡却未必是占优均衡。 2.在有关混合策略的章节中,考虑行参与人和列参与人的最优反应。它们会产生最优反应函数吗? 答:行参与人和列参与人没有最优反应函数。如图30-1所示,这两条曲线分别体现了行参与人和列参与人对应于对方选择时的最优反应。曲线的交点就是纳什均衡。在这种情况下,博弈存在三个均衡,其中,两个是纯策略均衡,一个是混合策略均衡。当行参与人选择r=2/3时,列参与人存在无穷多个最优反应,而不是像函数的数学定义所要求的那样,只有一个最优反应。

图30-1 最优反应曲线 3.在一个合作博弈中,如果博弈双方作出相同的选择,那么,结果对于他们两个对这都令人满意。这个结论是否正确? 答:这个说法不正确。 这是因为合作博弈的结果取决于博弈的收益,而非两个人是否选择相同的策略。比如在汽车博弈中,如果双方都选择直线驾驶,他们将陷入最糟糕的境况。 4.本章正文指出,在均衡状态,行参与人在62%的时间内会得分。这个数值是如何得到的? 答:博弈的均衡策略为“行参与人按0.7的概率踢向左方,而列参与人以0.6的概率扑向左方”,由于射门方向和扑救方向共有四种组合,从而得到每种组合的概率分布如表30-1所示。 表30-1不同组合的概率分布

博弈论及其应用(期末学习报告)

博弈论及其应用长虹与同行家电业的价格战 姓名: 学号: 学院: 专业:

博弈论及其应用 长虹与同行家电业们的价格战 一、事件背景 由军工厂转型的长虹是国内最早从日本松下引进彩电生产线的企业。1985年,军人气质十足的倪润峰执掌长虹。1994年,长虹在上海证交所上市;1995宣布自己成为“中国最大彩电基地”。 1996年,长虹的指挥官倪润峰决定拿出更大的动作。提出一个令人意外的“产业报国”计划。1996年,本土彩电企业陷入最艰难的苦战时刻,一个潜在的危机正在步步逼近。4月1日开始,彩电的进口关税将大幅下降。3月26日,长虹宣布,所有品种彩电一律大幅度让利销售,降价幅度从8%到18%。随后,猝不及防的其他中国厂家纷纷选择跟进。彩电业的价格大战,就在这样一种“产业报国”的氛围之中,拉开大幕。 价格战刚刚开打一个月,长虹的市场占有率就上升到19%,比降价前增加了7.9%。到年底,长虹坐稳了“彩电大王”的宝座。中国每卖出三台彩电,有一台出自长虹,有一台是外资品牌,还有一台才是其他国内品牌。倪润峰逐渐把国内同行们逼到了死角。在此战之前,国内各省市其实还有60多个地方性的彩电品牌,它们大部分是国有企业,作为当地的支柱产业割据一方,小富即安。然而在长虹的降价冲击下,大多数企业迅速凋零,成为行业重组中一颗颗散落的棋子,只能到长虹、康佳、TCL那里请求收购。彩电业从此步入由五六家大公司瓜分市场的时代。这一年,预算内国有企业的净销售利润率降低到历史最低点,亏损总数是1985年的28.6倍。相比之下,全国乡镇企业的产值增长22%,中外合资企业的所得税增长40%。 1997年,用价格战给中国企业家们好好上了一课的倪润峰被推上了事业的巅峰,1998年,在价格战中得到洗礼的国内同行开始显山露水。1999年,长虹的净利润下降74%;2000年5月,倪润峰卸下总经理职务,退隐江湖。2000年6月9日,康佳和TCL在内的九大国内彩电巨头联手组成价格联盟,准备正面迎击长虹的价格战。2005年4月16日,在这个特意挑选的休市日,长虹公布了2004年年报,抛出中国股市有史以来上市公司亏损之最:36.81亿元。价格战的发明者和坚决的拥护者,为最后的豪赌交出了最昂贵的学费。 二、各方的观点

博弈论经济中的应用

2009-2.3论博弈方法在宏观经济政策中的应用 随着理性预期理论的兴起,宏观经济学对预期在经济政策制定中的作用给予了相当的重视,由此产生了博弈理论在宏观经济政策理论方面的应用。事实上,这也构成了西方宏观经济学,特别是宏观经济政策理论的一种发展。 一、 货币政策的博弈论描述 按照西方学者的说法,货币政策可以看成政府(中央银行)与工会之间的一场博弈。政府为了达到低通货膨胀的目标,需要影响工人的工资协议,而这又取决于工会组织如何预期并作出相应的反应。 这场博弈的规则是,工会组织以一致要求增加货币工资作为第一步,工会须在增加名义工资还是不增加名义工资之间作出选择。政府走第二步,如果政府可以自由运用相机抉择权,它可以在提高货币增长率和不提高倾向增长率之间作出选择。于是,这场博弈存在下面四种可能的结果。 二、 货币政策的博弈模型 为了以简单的方式用博弈论分析上述货币政策,用一个具体的博弈模型来说明。 如上所说,博弈的局中人为政府(中央银行)和工会,政府的策略有两个:不提高货币增长率和提高货币增长率,为简单起见,分别将其记为“不增”和“增”。工会的策略也有两个:不增加货币工资和增加货币工资,也分别将其记为“不增”和“增” 。四种可能的博弈支付(即:可以用货币来衡量的好处)由下述矩阵表

示。 在上述矩阵中,数对中的第一个数表示工会所获得的支付,第二个数表示政府的支付。例如,策略组合(不增,增)的支付为(1,7)表示,如果工会采取不增加货币工资的策略,政府采取提高货币增长率的策略,则工会的支付为1(由于工人的实际工资下降,从而使其境况恶化,因此该支付数值相对较小),而政府的支付为7(该支付数值相对较大的原因在于,当工会没有改变名义工资时,政府提高货币增长率会使失业减少,同时又不存在价格上涨的压力,从而政府会获得较大的利益。 从微观经济学的博弈论基本知识可知,这里所给出的模型与“囚徒困境”的结构是一致的。于是,容易理解,从工会和政府共同的观点看,最好的选择是工会不要求增加货币,政府不增发货币。但从博弈两方自身利益看,无论对方选择什么策略,采取“增”这一策略总是最好的选择。然而,一旦博弈的双方从各自的利益出发都选择“增”策略,工会和政府都会面对“更坏”的结果:双方所获得的支付都比他们同时选择“不增”策略时的支付要低。在单期静态博弈的情况下,这一模型的解,即策略组合(增,增)便构成纳什均衡,因为经济一旦处于这一状态,任何一方要改变策略都会使其自身的状况变坏。就像“囚徒困境”模型一样,虽然博弈双方都采取“不增”的策略组合从总体上说是最有利的,但这一状态是不稳定的。由于双方都从利己的动机出发,结果都采取“增”策略,虽不是最有利的结局,但却是一个稳定的结局。总之,这一简单的博弈论模型刻画了政府(中央银行)和公众(工会)在宏观经济政策方面的复杂关系。 三、 时间不一致性

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博 弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则 为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信 息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P,I),其中P为市场价格,I为消

费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 2、 参与人的行动顺序,即每个参与 人在何时行动; 3、 序列结构:每个参与人行动时面 临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息; 4、 参与人的支付函数。 比较: 1、战略式博弈从本质上来讲是一种静态模型。 2、扩展式博弈从本质上来讲是一种动态模型。 {1,2,...,} n Γ={1,2,...,}n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论在经济学中的应用

博弈论在经济学中的应用 刘肃素 (华中师范大学经济与工商管理学院 2011211086) 摘要:博弈论是研究策略博弈的数学理论,亦称对策论。它的作用在于发现普遍有效的博弈原则。在现代经济社会中充满了博弈,这就需要了解博弈的思想,用科学理论来指导行为。博弈论应用于经济学,已经和正在引起现代经济学一系列的发展和突破。博弈论在经济学中所取得的重大进展发现,博弈论方法越来越成为经济学研究的主流方法。随着博弈论在现代经济学中的运用和研究的深化以及经济复杂性现象的不断涌现,博弈论的经济学研究呈现出合作化、对称化和连续化的发展新趋势。 关键词:博弈论经济学对策论应用 Abstract:game theory is the mathematical theory of research strategy game, which is also called game theory. It is found that the average effective principles of game. In the modern economic society is full of game, this game, you need to understand in a scientific theory to guide behavior. Game theory is applied to economics, has been and is causing a series of modern economics development and breakthrough. Major progress was made in the game theory in economics, found that the game theory method is becoming the mainstream in the economics research method. With

博弈论与社会科学方法论(潘天群)

通识课 课程中文名称:博弈论与社会科学方法论 课程英文名称:Game Theory and Methodology of Social Sciences 课程代号:开课学期:第一学期(秋学期) 主讲教师:潘天群职称:教授、博导 研究专长:博弈论、逻辑学、科学方法论 所在院系:哲学联系电邮:tqpan@https://www.360docs.net/doc/4516454907.html, 授课对象:全校二、三年级本科生(不限专业) 一、主讲教师简介: 潘天群,哲学博士,现为南京大学哲学系、南京大学现代逻辑与逻辑应用研究所教授、博士生导师。兼任中国逻辑学会常务理事、中国逻辑学会经济逻辑专业委员会副主任委员。教育部新世纪人才(2006)。曾于2001年9月-2002年2月在美国纽约大学政治学系从事“博弈论中的方法论问题”的访问研究。 主要研究领域为:逻辑学、哲学、博弈论。在《哲学研究》等国内外学术杂志发表学术论文约70余篇。独立出版著作5部:《行动科学方法论》,《博弈生存——社会现象的博弈论解读》、《博弈思维——逻辑使你决策制胜》、《社会决策的逻辑结构》与《合作之道——博弈中共赢方法论》。其中《博弈生存——社会现象的博弈论解读》,自2002年出版以来深受读者欢迎,为畅销书与长销书,已出版第三版。 主持国家社会科学基金项目“博弈论的哲学基础与应用功能研究”(2009)。 二、课程简介 由于“他人”与“我”是既合作又竞争的关系,研究冲突与合作的博弈论自上一世纪由冯?诺依曼等人创立与发展以来,对社会现象表现出强大的解释力,已经成为社会科学的一个通用工具。迄今至少有五位博弈论专家获得诺贝尔经济学奖,许多诺贝尔经济学奖获得者其研究与博弈论相关。博弈论也也渐渐渗透到自然科学(如生物学、人工智能)之中。 本课程突破数理博弈论的框架,结合主讲教师十年来的研究工作,构建适合

初探博弈论及其应用【开题报告】

毕业论文开题报告 信息与计算科学 初探博弈论及其应用 一、选题的背景与意义 在人类历史上,很早就有了博弈思想的故事,如众所周知的“田忌赛马”。在社会生活中,我们也能碰到类似的情形和现象,如下棋、打扑克、猜拳等想用自己的战术去取胜,这就是所谓的博弈现象。博弈论是研究理性的个体在相互依存时如何做出决策的一门理论知识,主要是强调决策主体的行为而引起的直接相互作用。 上世纪80年代以后,博弈论经历了突飞猛进的发展,主要是在经济方面的发展,越来越多的人把它归为主流经济学的重要组成部分。不仅是在经济上有广泛的应用,而且在军事、信息、政治等方面也能看见它的影子。1994年的诺贝尔经济学奖获得者就是三位博弈论的专家。以后又有三次奖授给了与博弈论有关的专家。在我国,经济学界对经济博弈论的关注和兴趣也在迅速增强。由于博弈论应用的广泛性和实用性,越来越来多的人开始学习和研究博弈论。可以说,博弈论正将进入一个崭新的阶段。 二、论文的主要思想 博弈论研究理性的个体在相互依存时如何作出决策。因此博弈论在研究时需要作出一定的假设,当然也包括一些基本定义。所以本文从介绍博弈论的基本假设和基本概念开始,在对基本概念了解的基础上学习博弈论中的经典模型,从中学习博弈过程中的双方博弈思维,然后再选取一些实际中的例子,运用所学的博弈论思维,从博弈双方的角度考虑得出该做出何种决策。 三、研究的步骤及方法 研究步骤 1. 1.10——1.20 明确毕业论文的设计方向,查阅文献资料,完成开题报告。 2. 2.10——2.25 撰写文献综述,翻译外文资料。 3. 2.26——3.05 列出论文正文部分的撰写提纲。 4. 3.06——4.01 撰写论文初稿。 5. 4.02——4.20 根据指导老师的建议进一步修改。 6. 4.21——4.27 论文定稿,装订成册,按时完成其它各项任务,准备答辩。 研究方法

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

1.3.7 博弈论分析方法的主要特征

博弈论分析方法的主要特征 博弈论已形成一套完整的思想体系和方法论体系。其分析方法具有下列特征: 1. 研究对象的普遍性和应用范围的广泛性 人们的行为之间存在相互作用与相互依赖,不同的行为主体及其不同的行为方式所形成的利益冲突与合作,已成为一种普遍现象,这使博弈论的研究对象具有普遍性。一切涉及到人们之间利益冲突与一致的问题、一切关于竞争或对抗的问题都是博弈论的研究对象。 现实社会中广泛存在的合作与非合作博弈、完全信息与不完全信息博弈的事实,使博弈论的研究内容和应用范围十分广泛,涉及到政治学、社会学、伦理学、经济学、生物学、军事学等诸多领域,在经济学中的应用尤为突出。 2. 研究方法的模型化、抽象化以及涉及学科的综合性 一是运用数学模型来描述所研究的问题,使博弈论的分析更为精确。 二是研究方法具有抽象化的特征,由于博弈论分析大量使用了现代数学,使它所描述和分析的过程及所揭示的结论都带 有抽象、一般化的特点。 三是博弈论分析方法所体现的模式化特征,博弈论为人们提供了一个统一的分析框架或基本范式,从而使博弈论能够分 析和处理其它数学工具难以处理的复杂行为,成为对行为主 体间复杂过程进行建模的最适合的工具。

四是博弈论方法所涉及的学科的综合性。在博弈论分析中,不仅要应用现代数学的大量知识,还涉及到经济学、管理学、 心理学和行为科学等学科。 3. 研究方法的实证性与研究结论的真实性 博弈论中的最佳策略是经济学意义上的最优化,它只回答是什么导致博弈均衡,均衡的结果是什么,所遵循的基本原则是科学结论的客观性和普遍性。从实践上看,博弈论突破了传统的完全竞争、完全信息假定,更加强调决策者的个人理性,强调不完全信息、不完全竞争条件下的经济分析,强调决策个体之间的相互影响和相互作用等外部性,强调通过规则、机制和制度的设计和优化在个人理性得到满足的基础上达到个人理性和集体理性的一致,等等。作为一门方法论科学,除了提供分析和解决博弈问题的独特和新颖的具有战略思维的思想方法以外,还提供了更加贴近现实的分析工具并填补了传统经济分析的许多空白。从这个意义上说,博弈论方法具有实证的特征,使研究结果更具有真实性。

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论基础及应用

博弈论(对策论、游戏论) 博弈论又名对策论、游戏论,是一门研究互动关系“游戏”的参与者各自选择策略的科学,博弈论把这些复杂关系理论化,以便分析其中的逻辑和规律,并对实际决策提供指导和借鉴。 游戏三要素(博弈的规则、结构): 1、博弈、游戏参加者。 博弈论分析,假定参与者都是机智而理性的。 2、行为和策略空间。 博弈参与者必须知道他自己及其对手伙伴的策略选择范围,并了解各种策略之间的因果关系。 3、有可评价优劣高下的决策行为结果。 博弈论用数字表示这类结果,并称之为支付。 支付矩阵 可以用支付矩阵(得益矩阵、收益矩阵、赢得矩阵)来描述一个博弈结构。 厂商B 厂商A 支配策略: 由于游戏参与者试图实现自身利益最大化并具有理性的决策能力,加上信息方面的假定,所以上述支付矩阵表示的博弈具有一个简单而确定的结果。从厂商A角度来说,它采取策略“下”而得到的支付总是好于“上”(2,1分别对1,0)。同样,对于厂商B来说,选择策略“左”得到的利益总是优于“右”(1,2分别对0,1)。因此,我们可以确定预期均衡选择策略是A选择“下”而B选择“左”的策略。 囚徒困境: 下面支付矩阵表示著名的“囚徒困境”游戏,从博弈论角度看,这是一个存在支配均衡的博弈;因为对囚犯A、B来说,无论对方如何选择,“坦白”都是各自的最优选择。 虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保持沉默,然而,由于猜忌,试图获得更大好处(3个月刑期)等竞争性动机阻碍了他们达到更好的互利选择,他们面临“囚徒困境”。我们将看到,寡头垄断厂商经常面临类似的困境。 囚犯B 囚犯A 纳什均衡: 支配均衡是一个特例,并非每个博弈都存在支配均衡。下面修改的支配均衡表示博弈中,厂商A、B在选择做广告问题上存在的策略关系。其中厂商A没有支配策略,因为A的最佳决策取决于B的选择。例如,当B选择做广告时,A应当选择做广告,由此得到10而不是6的支付得益,然而,当B选择不做广告时,A应当选择不做广告,从而得到20而不是15的支付得益。假定两个厂商需要同时决策,A应当如何决策?

历史的制度分析:博弈论分析方法

历史的制度分析:博弈论分析方法 把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究,目前主要有两种方法。一种是“进化博弈论方法”(evolutionary game approach)。经济学中的进化博弈论是在生物学的进化博弈论的基础上产生、发展起来的。它将人类的经济活动和竞争性经济行为同生物的进化相类比,研究人类经济行为中的策略和行为方式的均衡,以及向均衡状态调整、收敛的过程与性质。采用这一方法的研究者认为,社会制度并不是由什么人有意设计出来的,而是在那些适应环境和社会变化的新的制度结构不断被发现、更为理想的制度结构不断被保存的过程中产生的。这就是所谓的“适应性进化”过程。进化博弈论的引入,就是为了分析和说明社会制度的这一适应性进化过程。进化博弈论之所以在制度变迁理论中受到重视,主要是因为它是在不严重依赖决策者计算能力的前提下来说明均衡选择过程,从而在纳什均衡的理性主义解释遇到理论困难时,显示出了通过进化机制实现纳什均衡的可能性。 应用博弈论研究制度变迁的另一种新方法是“重复博弈论方法”(repeated game approach),它运用更精细的均衡概念,如“子博弈精炼均衡”(subgame perfect equilibrium)来分析历史与现实中的制度选择与变迁过程。其中最具代表性的,就是格瑞夫进行的“历史的比较制度分析”。 所谓的重复博弈,实际上是指同样结构的博弈重复地进行多次。与一次性博弈不同,它是由若干个阶段博弈(stage game)构成的一个完整的和相对长期的博弈过程。因此,在重复博弈中,各博弈方的着眼点就不是其在某一阶段上的局部利益或短期利益,而是他们在整个博弈过程中的总体利益和长期利益。当各博弈方面对不同的策略选择时,他必须考察到其在当前阶段的博弈中所采取的策略,不致在随后阶段中引起其他博弈方的对抗、报复或恶性竞争。也就是说,他不能像在一次性博弈中那样,毫不顾及其他博弈方的利益。有时,一方若作出一种合作姿态,可能会使其他博弈方在随后的阶段中也采取合作态度,从而实现共同的长远利益。这样,在重复博弈中就存在着比一次性博弈更大的合作的可能性,也有可能实现比一次性博弈更有效率的均衡。重复博弈论的这一特征,为它说明人类之间的合作行为,特别是说明历史与现实社会中体制与制度的演变过程,提供了强有力的支持。 在历史的比较制度分析那里,制度被定义为本身是“自我实施的对行为的非技术决定的约束” ,即所谓的自我实施制度(self-enforcing institution )。自我实施制度的一个最基本的特征,就是它的自发产生和自我实施的性质。与那些由国家和法律强制实施的制度不同,自我实施制度必须是参与人各方经过协商、谈判、讨价还价后自愿达成一致的结果。因此,历史的比较制度分析将自我实施制度视为特定历史条件下制度博弈的一种均衡状态或均衡结果。自我实施制度产生的过程,也就是制度博弈各方在特定的战略局势中,根据自己不同的目标自主地选择各自的最优策略与对手进行博弈,最后求得制度均衡的过程。而所谓的“子博弈精炼均衡”,恰恰是指在构成动态博弈的所有子博弈阶段上都实现了纳什均衡。这就是说,一个子博弈精炼均衡,必须是各博弈方在整个博弈的每个阶段(子博弈)都选择了不愿单独改变的策略(纳什均衡)的最终结果。如果我们从博弈论的角度来观察自我实施制度,就会发现自我实施制度与子博弈精炼均衡之间的内在联系。简单地说,自我实施制度所具有的自发产生和自我实施的基本属性,说明了它必定是制度博弈各方在每个子博弈中都选择了不愿单独改变的最优策略的结果,也即实现子博弈精炼均衡的结果。更直接地说,自我实施制度的产生,必定是一个制度博弈实现了子博弈精炼均衡的结果。反过来说,如果一个制度博弈实现了子博弈精炼均衡的结果,那它也应该是自我实施的。

博弈论三大经典案例

经典的囚徒困境 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ?若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ?若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ?若二人都互相检举(互相“背叛”),则二人同样判监2年。 用表格概述如下: 甲沉默(合作)甲认罪(背叛) 乙沉默(合作)二人同服刑半年甲即时获释;乙服刑10年 乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ?若对方沉默、背叛会让我获释,所以会选择背叛。 ?若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 由囚徒困境可以写出类似的员工困境: 一名经理,数名员工; 前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人都超负荷工作 如果某人不听从吩咐,其他人听从吩咐,则此人下岗。其他人继续工作 如果所有人都不听从经理吩咐,则经理下岗 但是,由于员工之间信息是不透明的,而且,都担心别人听话自己不听话而下岗,所以,大家只能继续繁重的工作. 囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

博弈论在生活中的运用

TECHNOLOGY AND MARKET Vol.18,No.6,2011 0引言 博弈最基本的意思是弈棋,博弈本身是一种游戏,博弈论最初主要是研究象棋、桥牌、赌博,研究做出何种选择会让自己打败对手。因而最初博弈论只是一种经验的描述,而不是一种系统的理论,20世纪40年代,冯·诺伊曼(John Von Neumann)与摩根斯坦恩(Oskar M orgenstern)合作出版的《博弈论与经济行为》(1944)一书第一次系统地将博弈论引入经济学中,标志着系统的博弈理论的形成,他们定义博弈论(GameTheory)是“研究决策主体的行为在直接相互作用时,人们如何进行决策、以及这种决策如何达到均衡的问题”[3]。 博弈论的应用范围非常广泛,在现实生活中一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后一次或多次,对各自允许选择的行为或策略进行选择并加以实施,并各自从中取得相应结果或收益,这个过程便是博弈的过程。[1]市场竞争、环境保护、公共资源的利用与开发,乃至国家间的军备竞争、各种竞技比赛等都属于博弈现象。它涉及经济学、政治学、军事、外交、国际关系、公共选择等领域。 1博弈论在日常生活中的运用 古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。我们最早接触的一个博弈论在生活中的运用恐怕就是,2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜。齐王与田忌各用上、中、下等马进行三场比赛,比赛为三局两胜制。在同等级的马中,齐王的马均优于田忌的马。在该比赛中我们知道会有六种策略: 为了赢得比赛,孙膑为田忌制定了对策,采取第六种策略。以劣马对齐王的上马,以上马对齐王的中马,以中马对齐王的下马,结果田忌赢得了两场比赛的胜利。田忌采用的是占优策略,即站在自己的立场上,无论对方如何选择,都能避免出现最糟糕的结果,实现自己的最大利益。在本故事中,齐王的参赛决策是透明的,依次用自己的上、中、下三匹马参与比赛,他没有考虑到对方为赢得最大利益将作出的决策,或者是没能发现自己的决策中存在的可被对手利用的漏洞。这种博弈在日常生活中很常见,参与人根据对方的策略选择自己的策略方式,以期得到利益最大化,甚至反败为赢。 这个例子是调整顺序来赢得比赛,在生活中我们也常遇到狭路相逢的情况,两辆车相向而行在一条很窄的路上,两位车主是都进还是都退,还是一个前进一个倒退。当然,如果哪方选择倒退可能导致耽误时间之类的损失,先行者可能会赢取时间,这就涉及到我们所说的斗鸡博弈,这是生活中很常见的一个现象,这个时候,我们用一个博弈标准式来表示,两位车主分别用甲乙代替,这个时候有四种策略,则标准式可以表示为: 有这个标准式的矩阵,我们可以选择这样的策略来达到纳什均衡,甲:乙选择(前进,后退)或(后退,前进),即其中一个选择后退,在生活中如果遇到这样的事,两个都想赢得时间的话只会两败俱伤,而如果一方选择倒退会给两方都带来好处。当然,我们在生活中还会遇到很多其他的博弈例子,例如恋爱中的男女是选择去看电影还是去选择看足球赛,男方是该求婚还是该放弃求婚。甚至是在儿童游戏剪刀石头布中是出剪刀,石头还是布都会涉及到博弈论。 2博弈论在经济生活中的运用 在经济生活中,各国之间的贸易谈判,同类产品的几个生产厂家进行广告宣传,争夺国际国内市场,企业对自己的一种商品定价,需要考虑市场上同类商品的价格等都涉及博弈[5]。博弈论在经济生活中的应用最广泛、最成功。经济学家对博弈论的贡献很大,特别是在动态分析和不完全信息中引入博弈论。经济学和博弈论的研究模式具有本质的相容性,其核心就是强调个体理性,也就是在给定的约束条件下追求效用最大化。这使得博弈论逐渐发展成为经济学的一部分。 在经济生活中,我们通常会遇到生产同种商品的厂家降低价格来扩大商品的市场份额,以此来击败对手,假如A、B两公司实力相当,市场份额既定。首先考虑厂商A,厂商A觉得,不管 博弈论在生活中的运用 付冬芹,丰容基 (安徽大学经济学院,安徽合肥230601) 摘要:博弈论研究的就是纳什均衡,把博弈双方每个阶段所要发生的事情罗列出来,然后再去按阶段进行分析,最终找到我们想要的均衡的最佳点。生活中,我们经常会有意无意地用博弈论知识来解决问题,掌握博弈论的相关知识有利于我们更好地进行决策。 关键词:博弈论;竞争;均衡 doi:10.3969/j.issn.1006-8554.2011.06.14 4专题研究 192

论文-博弈论方法在经济学中

经济生活中的博弈论应用 摘要:博弈,这个原来只是在学术圈出现的名词,如今已经越来越多地走进了我们的生活。博弈论是运筹学的一个重要分支,其中,非合作博弈(non- cooperative game)是现代博弈理论中的核心内容和重要基础,下面通过对经典案例囚徒困境和智猪博弈的分析,对纳什均衡相关定义的研究,得到了在经济决策中行为人如何决定最优决策的方法。在此基础上,以纳什均衡作为理论支撑点,结合得益矩阵分析解决了经济生活中商家价格战的一些实际问题。 关键词:博弈论;均衡点;得益矩阵;纳什均衡

目录 一.引言 (3) 二.博弈论与纳什均衡的主要内容 (3) 2.1博弈论的主要思想 (3) 2.2博弈论的分类 (4) 2.3纳什均衡 (4) 2.4 纳什均衡的分类 (4) 三.案例分析 (5) 3.1 囚徒困境(1950年,图克) (5) 3.1.1案例分析 (5) 3.1.2案例应用 (6) 3.2 智猪博弈(1950年,约翰.纳什) (6) 3.1.1 案例分析 (7) 3.1.2 案例应用 (7) 四.价格战博弈 (8)

一.引言 近代对于博弈论的研究,开始于策墨咯(Zermelo),波雷尔(Borel)以及冯·诺伊曼(V on·Neumann)。1928年冯·诺伊曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺伊曼和摩根斯坦共同撰写了时代巨著《博弈论与经济行为》并将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学期的基础和理论体系。1950-1951,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,以此为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼等人的研究也对博弈论的发展起到了不小的推动作用。 二.博弈论与纳什均衡的主要内容 2.1博弈论的主要思想 书上是这样定义的:博弈是指一些个人或者组织面对一定的环境条件,在一定的规则下同时或者先后一次或者多次从各自允许选择的行为或策略中进行选择并加以实施,进而各自取得相应结果的结果。现代科学将这种“对策论”、“对局理论”称之为博弈论,主要研究公式化了的激励结构间的相互作用。从上述定义中可以看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的

相关文档
最新文档