二人零和有限对策

合集下载

对策论浅谈

对策论浅谈

对策论浅谈136410107 赵芳 13数学与应用数学(基地班)一.前言对策论,经济管理中亦称博弈论,是运筹学的一个重要分支,研究对象是带有对抗性质的模型,它的中心问题是:什么是对策的解和解的存在性以及如何求解。

在现实生活中,我们经常会遇到带有竞争性质的现象,例如下棋、打扑克、体育比赛、军事斗争等。

这类现象的共同特点是参与者往往是利益互相冲突的双方或多方,而对抗的结局并不取决于某一方所选择的策略,而是由双方或者多方所选择的策略决定。

这类带有对抗性质的现象称为“对策现象”。

对策论发展的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般日常生活等有着密切的联系,并且处理问题的方法有明显的特色,所以日益引起广泛重视。

而我本身又十分喜欢去解决带有博弈性质或者是需要被优化的问题,所以这次的运筹学小论文我就选择了“对策论”板块。

在早期,研究对策论的学者几乎全是数学家,但由于对策论涉及领域广泛,今天有许多来自各个领域的专家学者都开始对对策论进行研究探索,特别是经济学家和军事家。

我国古代早就孕育着对策论的朴素思想,战国时期的“齐王赛马”就是一个典型的对策论例子。

这也是我们课本教材的一个例子,同时也有学者发表论文再次对这个例子进行讨论(参考文献①)。

对策论按照不同的分类方式可以分成很多类,有非合作和合作对策,二人或多人对策,静态对策和动态对策等。

最近,我们刚刚学习了两人零和对策矩阵,很疑憾教材(参考文献②)上只是了解了实值矩阵对策,那若是赢得矩阵的元素只能确定在一个区间内,而不是具体的数值呢?而我现在就稍微深入一下,进一步介绍一下区间支付两人零和矩阵对策。

二.两人零和矩阵对策(1)定义定义2.1.1设n R 为n 维欧氏空间,n R +是它的非负集合,n m R A ⨯∈为实矩阵。

称mS ≤Γ, n S A >为常规两人零和矩阵对策,其中{}1,=∈=+x e R x S T m m 为局中人I 的策略集,{}1,=∈=+y e R y S T m n 为局中人J 的策略集,A 为支付矩阵。

对策论的基本概念

对策论的基本概念
假设: 局中人都是理智的,等智力的. ➢ 策略集:
– 策略: 可供局中人选择的一个实际可行的完整的行动 方案.
– 策略集:局中人所拥有的对付其它局中人的手段、方案 的集合。每局中人,都有自己的策略集,一般每一局 中人的策略集中至少应包括两个策略。
对策现象的基本要素
➢ 赢得函数(支付函数)
对策中, 每一局中人所出策略形成的策略组称为一个局势。例如, si 是第 i 个局中人的
运筹学
一个策略,则 n 个局中人的策略形成的策略组
s (s1, s2 ,sn ) , s 就是一个局势,全体局势的集合 S 可用各局中人策略集的笛卡尔积表示,即
S S1 S2 Sn 当一个局势 s (s1, s2 ,sn ) 给定以后,就用一个数来表示局中人的得失(或输赢),显
然,这种“得失”或“输赢”是局势的函数,称为支付函数。通常用正的数字表示局中人的
运筹学
对策论的基本概念
➢对策论的由来和发展历史 ➢ 对策现象的基本要素 ➢ 对策问题举例及对策的分类
对策论的由来和发展历史
在社会生活和经济、经常碰到各种各样具有竞争或利益相对抗的现象,研 究对抗或竞争现象的数学理论和方法,称为对策论。 20 世纪初数学家波雷尔(Borel)和策墨洛(E.Zermelo)开始用数学方 法研究对策现象,研究对象主要是日常生活中的一些游戏(如扑克、象棋 等),因而对策论在相当长的时间内发展缓慢。 冯• 诺依曼(Von Neumann)在 1928 年创立了二人零和对策理论,为对策 论的进一步发展奠定了基础。 1944 年冯•诺伊曼和摩根斯特恩(Morgenstern)合著的《对策论与经济 行为》一书的出版,标志着系统的对策理论的初步形成。 1994 年三位长期致力于对策论的理论和应用研究的学者纳什(John F Nash)、泽尔腾(Reinhard Selten)和海萨尼(John Harsanyi)共同获 得诺贝尔经济学奖,则更是对对策论地位和作用的最具权威性的肯定。 2005 年,以色列经济学家罗伯特·奥曼和美国经济学家托马斯·谢林获 得诺贝尔经济学 奖。罗伯特·奥曼提出的“重复博弈 ”分析,目前成为所 有社会科学的主流分支。托马斯·谢林提出了冲突局势理论,在上世纪 50 年代和 60 年代的冷战时期,该理论极大地影响了美国政府对核威慑的 态度。

第1章 矩阵对策

第1章  矩阵对策
策被称为矩阵对策).对策按如下方式进行,局中人 1 选择行 i ∈ M ,局中人 2 选择列 j ∈ N ,
此时局中人 1 和 2 是同时并且独立地进行选择.因此局中人 1 获得支付 aij ,局中人 2 获得支
( ) 付 −aij .如果支付是一个负数, 那么可以认为是局中人的实际损失.
记具有支付矩阵 A 的对策 Γ 为 ΓA ,并且根据矩阵的维数,称之为 (m × n) 对策.如果
果它被隐藏在那里)的概率为 0 < βi ≤ 1 ,i = 1, 2, , n .如果找到目标,局中人 1 获得收益 为α .在其中隐藏和搜索物体的坑的编号是局中人的策略,局中人 1 的支付等于期望收益与
寻找目标时所付出的努力之差.隐藏和搜索目标的问题可以转化为矩阵对策,其支付矩阵为
⎡αβ1 −τ1 −τ1 −τ1
选择进行攻击的目标(局中人 1)和防卫目标(局中人 2)的问题可以转化为矩阵对策,
其支付矩阵为
⎡β1τ1 τ1
A
=
⎢ ⎢
τ2
β2τ 2

⎢ ⎣
τn
τn
τ1 ⎤
τ2
⎥ ⎥

β

n
⎥ ⎦
例 1.1.5 (离散型搜索对策)有 n 个坑,局中人 2 在 n 个坑中之一隐藏物体,局中人
1 希望找到它.在寻找第 i 个坑时局中人 1 付出的努力为τi > 0 ,在第 i 个坑中找到目标(如
m −1 > n ,则 a10 = n +1+1 = n + 2 , a11 = n −1+1 = n , a1 j = n − j +1−1−1 = n − j −1,
2 ≤ j ≤ n .一般情况下(对任意的 m 和 n )元素 aij , i = 0, m , j = 0, n 以及支付矩阵可以

对马海战中的零和博弈

对马海战中的零和博弈

读书文摘题目:对马海战中的零和博弈作者:小之书报刊名:《世界军事》2015年六月下,第50~54页1905年,在朝鲜半岛和日本九州岛之间的对马海峡,由日本海军大将东乡平八郎指挥的联合舰队,对阵俄国海军中将罗热斯特文斯基指挥的太平洋舰队第2、第3分舰队,进行了一场大海战。

战役以日方大获全胜而告终,俄国太平洋舰队第2、第3分舰队三分之二的舰只被摧毁,几乎全军覆没,而日方仅损失3艘鱼雷艇。

对马海峡海战,是近代海战史上著名的以少胜多的战例之一。

110年后的今天,对于这场海战的分析仍然不无启迪意义。

俄、日舰队指挥员指挥员是一支军队的灵魂,为了深人分析对马海战的成败得失,绕不开对俄、日舰队指挥员及其成长背景的剖析。

1902年7月的一天,俄国31艘军舰在波罗的海的雷维尔水面列队,向前来访问的德皇威廉二世致敬。

沙皇尼古拉二世和威廉二世乘坐快艇登上了俄巡洋舰“里宁”号,一同检阅海上编队并观看海上演练。

“里宁”号巡洋舰舰长罗热斯特文斯基在近3个小时的演练中,镇定自若地指挥军舰完成机动和射击靶标等课目,给德皇留下了很好的印象。

德皇离舰上岸时,对沙皇说:“我希望我的海军军官都能像罗热斯特文斯基这样能干。

”和平时期的一次偶遇,决定了罗热斯特文斯基此后的人生轨迹。

两年后,当俄、日战争爆发时,罗热斯特文斯基已升任海军中将,并且临危出任司令,率领由波罗的海舰队主力编成的太平洋第2、第3分舰队,紧急前往远东支援俄军对日作战。

1904年10月14日,罗热斯特文斯基指挥的30艘战舰、6艘运输舰、2艘医院船从芬兰湾的利那帕亚起锚,向位于西伯利亚东岸的符拉迪沃斯托克(海参崴)进发。

舰队沿大西洋,绕过非洲大陆,穿过印度洋,经马六甲海峡进入中国南海和东海,在1905年5月中旬到达上海并进行了短暂补给。

罗热斯特文斯基的对手,日本联合舰队司令东乡平八郎,早年在英国留学,深得英军“坚船利炮”之精神,对英国海军战神纳尔逊在特拉法尔加海战前下达的“英格兰要求每个人恪守职责”的动员令情有独钟。

对策论也称博弈论

对策论也称博弈论

对策论也称博弈论,是研究斗争策略的数学理论。

所谓斗争策略是指两个或两个以上参加斗争的各方,具有相互矛盾的利益,为了使自己获胜,他们各自采取对付对方所用的各种可能的办法。

对策论是一门应用性很强的学科,与人们的生产实践有着密切的关系,特别在经济管理、政治和军事方面的作用,已引起了广泛的注意,其处理问题的特殊又吸引着为数不少的数学工作者。

可以举出很多对策论的例子。

如在日常生活中的下棋、打桥牌、猜拳、体育竞赛等,斗争的各方,都各有自己的长处和短处,在竞赛过程中,各方都设法发挥自己的长处,进攻别人的短处,尽一切可能战胜对方。

在军事方面,对策论的例子更是到处可见,进攻和防守,包围与反包围,围剿与反围剿,在国际上侵略与反侵略,封锁与反封锁,目的都是在保存自己,消灭对方。

在经济领域内,国际间的贸易谈判,争夺原料与市场的斗争、限制进口和反限制的斗争。

在国内,各工厂与企业之间的产品竞争,商业上的市场竞争,销售和顾客的讨价还价等等,各方都想在谈判中取胜或在竞争中挤垮对方。

在政治方面,国与国间的外交谈判,国内各政治集团之间的和平谈判,各方都想在谈判中处于有理地位,或在谈判中得到好处。

上面所列举的各种现象,都是相互斗争或竞争的现象,称为对策现象。

对策论就是研究斗争各方如何战胜对方的数学理论。

依照局中人在对策中所能利用的信息总和来分类,如全信息对策等。

在对策模型中,占有重要地位的是二人有限零和对策。

一般也称之为矩阵对策。

在这种对策中,局中人在各种局势下的支付,可以用一个局中人的支付矩阵来表示。

二人有限零和对策是研究得对比完善的一直对策,理论的研究和求解方法都比较完整。

且其理论是研究其他对策模型的基础。

一般地,设矩阵对策{}A P P G ,,21=的支付矩阵为{}mxn ij a A =如果对某个k,存在一个i ,使对每个n j ≤≤1都有:()1,1,1≠≤≤≤≤≤k m i m k a a ij kj 成立,则对局中人1P 而言,策略1A 优于k a 。

对策

对策

分蛋糕博弈



两个小孩怎么分蛋糕? 经典的故事,经典的解答:一个分,一个选。 现实多如此,权利与利益的合理分配将有效促进公平与效 率。经营权与所有权的分置的确使得经济更加活力。不过 分蛋糕的进阶模型却强调了讨价还价的策略,分蛋糕不是 一次性的,而是多回合的,而且出现成本:蛋糕在融化。 时间成本的加入,将使得分配变得复杂化。双方如果不能 及时达成交易,不仅集体的收益将减量,而且个体的收益 也将减少。在此情况下,利用时间成本以及承诺、威胁将 对其中一方极其有利。顾客可能迫于情势,必须尽快结束 谈判,这时卖方却不慌不忙,故意拖延,顾客一方将不得 不在价格上作出妥协。 顾客一方当然也有策略,它的策略就是货比三家,要求承 诺或威胁。这个前提是买方市场的存在。顾客还应当保护 自己讨价还价的能力,这就是顾客有权投诉商家。
酒吧博弈


如果人人理性,那么每一天到达酒吧的人数将是差不多正 好的,但是人非圣贤,往往是有限理性的。第一次到酒吧 的人多,那么大多人人认为酒吧人太多,太挤。第二次决 定的时候,参考前次而不去酒吧。少数去的人发现酒吧的 人第二天很少,感觉很爽,第三次将继续回来,并重新带 回许多人……循环就此开始。酒吧博弈一方面显示,现实 的博弈参与者,是极其有限理性的,其理性只前延后伸一 小段。历史数据只对计算机有用,对人,则不一定。 另一个方面,酒吧博弈指出,胜利者永远只是少数。尽管 酒吧存在调谐的可能,譬如发短信时时提醒,但成本恐怕 太高。而在其他场合,少数派可能更加会设置种种障碍阻 止后进者的上升。也就是说,我们的世界仍然是操弄在少 数派的手中。不过,总算这个世界不是模型,少数派的道 路到底还是有迹可循的。老练的将军仍旧会在八卦迷阵中 找到唯一的生门。若你想要,必须做一个更加老练的将军。

管理运筹学_北京理工大学中国大学mooc课后章节答案期末考试题库2023年

管理运筹学_北京理工大学中国大学mooc课后章节答案期末考试题库2023年1.需求为随机的单一周期的报童问题是要解决()的问题。

答案:期望损失最小2.在经济订购批量存储模型的灵敏度分析中,当订货费或存储率预测值有误差时,该选择何种存储策略()。

答案:选择原最优存储策略3.下例错误的结论是()答案:检验数就是目标函数的系数4.在报童所订购报纸的模型中,下列哪些不等式不符合最优数量 Q*求解的是()。

答案:__5.【图片】的可行域是():答案:6.根据最大最大原则为以下问题选出最优行动方案?【图片】答案:S27.A工厂生产同一规格的设备,每季度的单位成本依次是1万元、1.2万元、1.3万元、1.5万元。

设备当季度卖出不产生任何存储、维护费用,若积压一季度需存储、维护费用0.05万元,则设备的单位费用(单位:万元)为:答案:8.存储论要解决的问题是:答案:何时补充物资。

_当需要补充物资时,补充的数量是多少。

9.根据动态规划的时间参量是连续的还是离散的、决策过程的演变过程是确定性的还是随机性的,可以将动态规划的决策过程分为哪些决策过程:答案:离散随机性_连续随机性_离散确定性_连续确定性10.下列成本中属于存储成本的是:答案:购买物资所用资金的利息。

_仓库管理人员的劳务费。

_储存仓库的费用。

11.对偶价格小于0时,约束条件的常数项增加一个单位,则对于求min目标函数的线性规划,其最优值的数值会增大。

答案:正确12.关于线性规划的最优解判定,说法不正确的是()答案:求目标函数最大值时,如果所有检验数都小于等于零,则有唯一最优解13.求目标函数值最小的线性规划单纯形表的大M法,在约束条件中加入人工变量是()答案:为了构造约束系数矩阵中的单位矩阵14.求解目标函数值最大的线性规划问题中,在确定出基变量的时,根据minbi/ aij选取入基变量的原因是()答案:确保下一步迭代新得到的bj值都≥015.关于线性规划的原问题和对偶问题的关系,两个问题的最优解的值一致。

数据模型决策对策论

24
二人有限非零和对策
纳什均衡:如果给定了甲的选择,乙的选择是最优的;并且 给定乙的选择,甲的选择也是最优的,那么这样的一组策略 就是一个纳什均衡.

不坦白
坦白
不坦白 甲
坦白
-1,-1 -0.25,- 10
- 10 ,-0.25 -5,-5
双方最佳结果是:抗拒从宽。实际结果往往是:坦白从宽,牢底坐穿
3(0,0,1)
0.6 17/30 2/3 0.7 0.75 43/60
甲:行局中人;乙:列局中人
6
对策论的基本概念
其中:公司甲的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 公司乙的策略集:S2={ 1, 2, 3}。
下面矩阵称公司甲的赢得矩阵:
2/3 0.6 0.6 0.5 2/3 17/30 0.5 17/30 2/3
0.7
5(1,0,1)
0.7
6(0,1,1)
0.6
2(0,1,0)
0.6 2/3 17/30 0.75 0.7 43/60
3(0,0,1)
0.6 17/30 2/3 0.7 0.75 43/60
双方都是从采用不同的策略可能出现的最坏的结果中选
择一种最好的结果作为决策依据(从最坏处着想,去争
取最好的结果),该原则假定局中人是保守性的决策者。
4
对策论的基本概念
数据:
当甲公司决定只在东城区修建两个超市,且乙公司也决定在
东城区修建一个超市时,甲公司的市场占有率为:
40% 2 30% 2 30% 2 2
3
3
33
此时乙公司的市场占有率为1/3,若甲公司的市场占有率上
升,则乙公司的市场占有率就会下降,双方的利益是激烈对抗

高级微观经济学 第八章 博弈论

第八章 博弈论前面章节对经济人最优决策的讨论,是在简单环境下进行的,没有考虑经济人之间决策相互影响的问题。

本章讨论这个问题,建立复杂环境下的决策理论。

开展这种研究的的理论叫做博弈论,也称为对策论(Game Theory)。

最近十几年来,博弈论在经济学中得到了广泛应用,在揭示经济行为相互制约性质方面取得了重大进展。

大部分经济行为都可视作博弈的特殊情况,比如把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。

博弈论的思想精髓与方法,已成为经济分析基础的必要组成部分。

第一节 博弈事例博弈是一种日常现象,例如棋手下棋,双方都要根据对方的行动来决定自己的行动,双方的目的都是要战胜对方,互不相容,互相影响,互相制约。

一般来讲,博弈现象的特征表现为两个或两个以上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。

当所有当事人都拿定主意作出决策时,博弈的局势就暂时确定下来。

博弈论就是研究这种不相容现象的一种理论,并把当事人叫做局中人(player)。

博弈论推广了标准的一人决策理论。

在每个局中人的收益都依赖于其他局中人的选择的情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个局中人都必须考虑其他局中人面临的问题。

下面来举例说明。

例1.便士匹配(Matching Pennies)(二人零和博弈)设博弈中有两个局中人甲和乙,每个局中人都有一块硬币,并且各自独立安排硬币是否正面朝上。

局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲赢得1元,乙输掉1元;如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输掉1元,乙赢得1元。

对于这个博弈,每个局中人可选择的策略都有两种:正面朝上和反面朝上,即甲和乙的策略集合都是{正面,反面}。

当甲和乙都作出选择时,博弈的局势就确定了。

显然,该博弈的局势集合是{(正面,正面),(正面,反面),(反面,正面),(反面,反面)},即各种可能的局势的全体,也称为局势表,即表1。

运筹学

一、单选题(共40 道试题,共100 分。

)V 1. 对于第二类存储模型——进货能力有限,不允许缺货,下列哪项不属于起假设前提条件()A. 需求是连续,均匀的B. 进货是连续,均匀的C. 当存储降至零时,可以立即得到补充D. 每个周期的定货量需要一次性进入存储,一次性满足标准答案:D2. 在完全不确定下的决策方法不包括下列的哪一项()A. 悲观法B. 乐观法C. 最大收益法D. 等可能性法标准答案:C3. 所谓确定条件下的决策,是指在这种条件下,只存在()A. 一种自然状态B. 两种自然状态C. 三种或三种以上自然状态D. 无穷多种自然状态标准答案:A4. 单纯形法的迭代计算过程是从一个可行解转换到目标函数值更大的另一个可行解。

A. 对B. 错标准答案:B5. 下例错误的说法是A. 标准型的目标函数是求最大值B. 标准型的目标函数是求最小值C. 标准型的常数项非正D. 标准型的变量一定要非负标准答案:C6. 求般获得最好经济效益问题是求如何合理安排决策变量(即如何安排生产)使目标函数最大的问题,求最大的目标函数问题,则记为max Z;若是如何安排生产使成本是最小的问题,则记为min Z .A. 对B. 错标准答案:A7. ()是用来衡量所实现过程优劣的一种数量指标A. 状态B. 决策C. 状态转移D. 指标函数标准答案:D8. 在实际工作中,企业为了保证生产的连续性和均衡性,需要存储一定数量的物资,对于存储方案,下列说法正确的是( )A. 应尽可能多的存储物资,以零风险保证生产的连续性B. 应尽可能少的存储物资,以降低库存造成的浪费C. 应从多方面考虑,制定最优的存储方案D. 以上说法都错误标准答案:C9. 约束条件为AX=b,X≥0 的线性规划问题的可行解集是()A. 补集B. 凸集C. 交集D. 凹集标准答案:B10. 存货台套的运费应列入()A. 订货费用B. 保管费用C. 进厂价D. 其它支出标准答案:C11. 基可行解中的非零变量的个数小于约束条件数时,该LP问题可求得( )。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

毕业论文(设计) 题 目: 二人零和有限对策问题的研究 学 院: 数理与信息学院 学生姓名: 梁世龙 学 号:060503202 专 业:数学与应用数学 班 级:B06数学(2)班 指导老师:金丽 起止日期:2010.03.01~2010.05.07

2010 年 6 月 18 日 浙江海洋学院本科毕业论文

I 摘要

二人零和有限对策是对策论的分支问题. 而对策论是应用数学的一个分支问题, 目前在生物学, 经济学, 国际关系, 计算机科学, 政治学, 军事战略和其他很多学科都有广泛的应用. 二人零和有限对策是一种最基本的策略, 它的一套比较成熟的理论和算法是研究其他各种对策的基础. 本文主要讨论二人零和有限对策问题的基本理论和算法, 并了解在实际问题中的应用. 关键词: 二人零和有限对策; 对策论; 鞍点 浙江海洋学院本科毕业论文

II Finite Two Person Zero-sum Games

Abstract Finite two person zero-sums game is a branch of game theory, and game theory is a branch problem of applied mathematics. It has a wide range of application in biology, economics, international relations, computer science, political science, military strategy and many other disciplines at present. Finite two person zero-sum games is a basic strategy, it has the mature theory and algorithms, it is the basis for study the other game problems. This article focuses on the basic theory and algorithms of Finite two person zero-sums game, and understands the applications of practical problems.

Keywords: Finite two person zero-sums game; Game theory; Saddle point 浙江海洋学院本科毕业论文

III 目录

摘要 ................................................................................................................... I Abstract ...................................................................................................................II 1 前言 ..................................................................................................................... 1 2 对策 ..................................................................................................................... 2 2.1 对策的例子 ................................................................................................... 2 2.2 对策的基本要素 ........................................................................................... 2 2.3 展开型对策 ................................................................................................... 5 2.4 对策的分类 ................................................................................................11

3 二人零和有限对策 ........................................................................................... 12 3.1 矩阵对策的基本概念 ................................................................................. 12 3.2 混合策略 ..................................................................................................... 17 3.3 最大最小定理 ............................................................................................. 25 3.4 矩阵对策的最优策略 ................................................................................. 27 3.5 矩阵对策与线性规划的关系 ..................................................................... 36 3.6 矩阵对策的求解 ......................................................................................... 42

4小结 .................................................................................................................... 54 致谢 ................................................................................................................ 56 浙江海洋学院本科毕业论文

1 1 前言

对策论是研究竞争性行为的数学分支. 在日常生活中的下棋、打牌、体育竞赛等, 在社会生活中如战争、企业的竞争等, 都具有竞争或对抗的性质, 我们把这一类行为称为对策行为. 在对策行为里, 参加竞争的个体有不同的目标和利益. 为了实现各自的目标, 每个个体必须考虑对手的各种行动方案, 并尽量选取对自己最有利的策略. 二人零和对策是指参与对策的局中人只有两个, 每个人的策略集均是有限集并且两个局中人的赢利之和为零(或某个常数). 在对策论中理论最简单又最完善的部分是二人零和对策, 它是其他各部分理论的基础. 在一个二人对策问题中(例如两人进行对抗性竞赛), 参加者分别为局中人甲和乙, 他们都有自己的策略. 若甲有m个策略, 乙有n个策略. 当甲选取第i个策略时,乙选取第j个策略, 这便形成一种局势. 此时甲、乙双方会有赢得

或损失. 若甲所得为,,1,2,,;1,2,,ijafxijimjn, 乙的所得为,ija, 则,ija为甲取第i个策略、乙取第j个策略时甲的支付(或赢得).[1]

上述问题可用矩阵方法进行处理. 因此这类对策也称为二人零和矩阵对策. 对策论的中心问题是局中人采取何种策略才能使自己赢得最多(或损失最少). 从数学角度看, 二人零和对策问题可以分为二人零和有限对策和二人零和无限对策, 在这里我们只讨论二人零和有限对策. 二人零和有限对策是一种最简单、最基本的策略. 说它简单是因为只有两个局中人, 并且每个局中人只有有限个策略; 说他基本是因为它有比较成熟的理论和算法,是研究其他对策的基础. 二人零和有限对策也称为矩阵对策. 在每局中, 两个局中人独立选择一个策略(互相都不知道对方的策略), 而两人的收益总和为零. 在这种对策中, 两个局中人的利益是完全相反的, 因此不可能合作. 本文中我们主要介绍二人零和有限对策的理论和矩阵对策问题的求解方法. 浙江海洋学院本科毕业论文

2 2 对策

2.1 对策的例子[2] 例2.1 田忌赛马问题. 战国时期, 齐国的国王与一名叫田忌的大将进行赛马. 双方各出三匹马, 分别为上(等)马、中(等)马、下(等)马各一匹. 比赛时, 每次双方各从自己的三匹马中任选一匹马来比, 输者付给胜者1千两黄金, 共赛三次. 当时, 三种不同等级的马相差非常悬殊, 而同等级的马, 齐王的比田忌的要强. 谋士孙膑给田忌出了个主意: 每次比赛先让齐王牵出他要参赛的马, 然后用下马对齐王的上马, 用中马对齐王的下马, 用上马对齐王的中马. 结果田忌二胜一负, 赢得1千两黄金. 由此看来, 两人采取什么样的策略(出马次序)对胜负是至关重要的. 例 2.2 冬季取暖问题. 某单位要在秋季决定冬季取暖所用煤的储量. 在正常的冬季气温下,需要消耗15吨煤, 但在较暖或较冷的时候分别需要10吨和20吨煤. 设煤的价格随着冬季的冷暖程度而有所变动: 在较暖、正常、较冷的气温下分别为每吨100元、120元、150元. 假设在秋季煤价为每吨100元. 问在没有当年冬季准确的气象预报条件下, 秋季储存多少吨煤才合理? 例 2.3 罪犯两难问题. 甲、乙两人因犯罪而牵涉于某案件中, 但法院只掌握其部分罪证. 如果他们都不承认, 则他们将被作为较小的违法案件的被告而受到惩罚(例如各判刑一年); 如果两人都认罪, 则两人都被判刑, 但考虑其认罪态度, 可以给予减刑(例如各判刑六年); 如果一人认罪, 而另一人拒不承认, 则认罪的可以宽大处理(例如判刑3年), 而拒不认罪者将受到严惩(例如判刑10年), 问甲、乙应该怎样选择才能对自己有利? 2.2 对策的基本要素 对策模型的形式千差万别, 但都必须包括三个基本要素: 局中人, 策略集和支付函数. (1) 局中人 对策中, 有权决定自己行动方案的参加者称为局中人(player), 一般的用N表示局中人的集合. 在一个对策中至少要有两个局中人. 局中人除了可以是一个自然人外, 还可以是代表着共同利益的一个集团, 例如球队、企业、国家. 在研究人与大自然作斗争时, 人和自然都是局中人. (2) 策略集

相关文档
最新文档