数学建模 对策与决策模型

合集下载

数学建模综合评价与决策方法

数学建模综合评价与决策方法

数学建模综合评价与决策方法数学建模综合评价与决策方法是指在数学建模的过程中,采用合适的评价方法对建模结果进行评估,并基于评估结果做出决策。

这是一个重要的环节,能够帮助我们判断建模的合理性、有效性,为决策提供科学依据。

本文将介绍几种常用的数学建模综合评价与决策方法。

一、灰色关联度分析灰色关联度分析是一种综合评价方法,适用于多指标、多层次的决策问题。

其基本思想是通过灰色关联度指标来衡量不同因素与目标之间的关联程度,从而评估各个因素对目标的贡献程度。

具体步骤如下:(1)确定评价因素和目标;(2)进行数据归一化,将各个指标转化为单位化的变量;二、层次分析法(AHP)层次分析法是一种量化分析方法,用于处理多准则决策问题。

该方法将决策问题层次化,通过构建判断矩阵对各层次的因素进行定量分析,从而得出最终的决策结果。

具体步骤如下:(1)确定层次结构,将决策问题层次分解为上、下级层次;(2)构建判断矩阵,通过专家评分或经验判断,构造各层次因素之间的重要性判断矩阵;(3)计算权重,通过特征向量法计算各个因素的权重;(4)一致性检验,通过判断矩阵的一致性指标和一致性比例判断判断矩阵的可靠性;(5)计算综合权重,通过将各个层次的权重相乘得到综合权重;(6)进行评价和排序,根据综合权重对各个决策方案进行评价和排序,从而得到最终的决策结果。

三、模糊综合评判法模糊综合评判法是一种适用于部分信息不确定的评价方法。

该方法通过建立模糊综合评判模型,将不确定的信息转化为模糊数,并通过模糊数的运算进行综合评价。

具体步骤如下:(1)确定评价指标和权重;(2)进行数据模糊化,将具体数值转化为模糊数;(3)构建模糊关系矩阵,将模糊数代入模糊关系矩阵中;(4)进行模糊数的运算,通过模糊数的运算得到各个因素的评价结果;(5)进行评价和排序,根据评价结果对各个决策方案进行评价和排序。

综合评价与决策方法是数学建模的重要环节,可以帮助我们对建模结果进行客观、科学的评估,并基于评估结果做出决策。

数学建模案例分析--对策与决策方法建模3混合策略对策模型

数学建模案例分析--对策与决策方法建模3混合策略对策模型

§3 混合策略对策模型并不是所有的矩阵对策在纯策略意义下都有解,即有鞍点。

例如:两家电视台各种节目搭配时的甲台节目收视率如下表:表1 甲台节目收视率(%)乙台节目1节目2甲台节目A7040节目B4555用上述方法对此例进行计算,得到表格如下:表2 基于甲台节目收视率的双方对策分析表(%)乙台节目1节目2 a = 45甲台节目A704040节目B455545 b = 557055a≠b由表中可知,a≠b。

如果甲台播放节目A,以期得到70%的收视率,此时乙台一定不会播放相应对策组合(节目A,节目1)中的节目1,而是播放节目2,因为对策组合(节目A,节目2)对乙台来说,可以获得60%的收视率。

但若乙台播放节目2,甲台一定不会播放这个组合要求的节目A,必然改播节目B,因为对策组合(节目B,节目2)甲可以获得55%的收视率。

同理可以推出,若甲台播放节目B,乙台必然改播节目1,但若乙台播放节目1,甲台必然改播节目A,这样看来每对策组合都不能使双方同时满意。

这就是矩阵对策双方不存在最优纯策略的原因。

象这样的对策进行多次时,就有了混合策略的概念,即某一局中人以一定的概率随机地采用各个策略。

一般来说,在一个矩阵对策中,如果局中人甲的赢得矩阵为,则他的最优混合策略是下面线性规划问题的解。

局中人乙的最优混合策略是下面线性规划问题的解。

由线性规划理论可知,上面两个线性规划问题都有解,且其中。

记上式两端的值为,而相应的的值为,则局中人甲采用混合策略时,他可保证期望赢得至少为,而采用其它策略则期望赢得可能低于。

局中人采用混合策略时,可保证期望损失不超过,而采用其它策略则期望损失可能大于。

上例中局中人甲的策略为:以概率采用纯策略;局中人乙的策略为:以概率采用纯策略,那么局中人甲的期望赢得是其中,,。

局中人甲的最优混合策略是下面线性规划问题的解。

同样局中人乙的最优混合策略是下面线性规划问题的解。

通过数学软件,可以算出局中人甲的最优混合策略,他的期望赢得至少为0.5125,局中人乙的最优混合策略,他的损失期望不超过0.5125。

第八章决策与对策模型

第八章决策与对策模型

8. 决策与对策模型
8.1 多属性决策与层次分析法 8.2 风险性决策与非确定性决策 8.3 非合作对策 8.4 合作对策
8.1 多属性决策与层次分析法
多属性决策(MADM) (Multiple Attribute Decision Making) 为一特定目的在备选方案中确定一个最优的 (或 给出优劣排序、优劣数值), 而方案的优劣由若干 属性(准则、特征、性能)给以定量或定性的表述.
D (dij )mn , dij 0 ~决策矩阵
决策矩阵的获取
• 调查、量测各方案对属性的取值(定量, 偏于客观). • 决策者打分评定或用层次分析法的成对比较得到 (定性, 偏于主观).
1)决策矩阵及其标准化 决策矩阵D的列~各方案对某属性的取值(属性值). 各属性物理意义(包括量纲)不同 决策矩阵标准化 标准化第1步:区分 费用型属性 价格X1 效益型属性 性能X2, 款式X3
dij A1 A2 A3 X1 25 18 12 X2 9 7 5 X3 7 7 5
8.1.2 多属性决策的决策矩阵与属性权重 1)决策矩阵及其标准化 n个属性 X1, X2, …, Xn m个备选方案 A1, A2,…,Am dij ~Ai对Xj的取值
25 9 7 汽车 D 18 7 7 选购 12 5 5
属性权重取信息熵法结果:w=(0.5330,0.3293,0.1377)T
汽车选购
用3种综合方法确定3种汽车的优劣顺序
1. 简单加权和法 (SAW)
v Rw
R归一化 R最大化
v=(0.3110,0.3260,0.3629)T v=(0.7228,0.7492,0.8143)T
v归一化
v=(0.3162,0.3277,0.3562)T

《对策与决策模型》课件

《对策与决策模型》课件
运用两种模型进行分析
使用对策模型和决策模型,分别对该案例进行深入分析和评估。
分析结果和结论讨论
讨论对策模型和决策模型在案例分析中得出的结果和结论,并分享观点和见解。
总结和反思
1 两种模型的优劣
总结对策模型和决策模型 的优劣之处,以及它们在 不同情境下的适用性。
2 课程内容和收获
回顾本次课程的主要内容 和学习收获,以及如何将 理论知识应用于实践。
3 需要改进和学习的方

指出学生在进一步学习和 实践中需要改进和学习的 方向,激发学生对策略和 决策的兴趣。
结束语
主要目标和达成情况
概括本次课程的主要目标和学生的学习情况,评估 达成情况。
加强学习和实践
鼓励学生继续加强对策略和决策的学习和实践,以 提高管理和决策能力。
《对策与决策模型》PPT 课件
本课程旨在介绍对策与决策模型,以及它们在战略规划和决策制定中的重要 性。通过本课程,您将学习如何应用这些模型来解决各种组织和管理挑战。
概述
策略与决策的定义
解释策略和决策的概念以及 它们在组织中的作用。
策略和决策的区别
探讨策略和决策之间的异同 以及它们在不同情境下的应 用。
决策模型
决策模型的基本概念
介绍决策模型的核心概念,包括 信息收集、分析、评估和选择最 佳方案。
决策模型的四个要素
解释决策模型的四个重要要素, 包括问题定义、决策条件、选择 方法和风险评估。
决策模型的应用示例
通过实际案例,展示如何运用决 策模型来做出明智的决策。
实际案例分析
提供一个实际案例
选择一个与战略决策相关的实际案例,为后续分析做准备。
策略与决策的重要性
阐述策略和决策对组织成功 的重要性,并解释为什么它 们需要系统化的模型。

数学模型第十一章对策与决策方法建模115不确定型决策

数学模型第十一章对策与决策方法建模115不确定型决策
它所对应的方案三,即购进西瓜8000公斤为最 优方案。
2024/7/24
数学模型
五、后悔值准则
后悔值准则的含义是:当某一自然状态发 生后,由于决策者没有选择收益最大的方案, 而形成的后悔值或损失值。
决策的一般步骤为:
(1)将收益值转变为相应的后悔值,计算方法 为:
后悔值=同一自然状态下的最大收益值-收益值 (2)选出后悔值中每个方案的最大值。 (3)选择这些后悔值中的最小者,并以它对应 的方案为最优方案。
例如,水果商对于购进水果的品种与数量常常会感到 头疼,尤其是在夏季,水果批发的风险更大。以西瓜为例, 不同的气温不仅会影响其销售量,而且还会影响其价格。 因此,水果商在进货时必须面对的一个问题就是西瓜的购 进量多少时最为合理。对于这种问题,未来的情况是未知 的,具有较大的不确定性。假设水果商无法预知各种气温 出现的概率,决策表如下:
(3)选择这些后悔值中的最小者900(元), 它所对应的方案三,即购进西瓜8000公斤为最 优方案。
2024/7/24
数学模型
Max(600,150,-300)=600(元) 它所对应的方案一,即购进西瓜2000公斤为最优 方案。
2024/7/24
数学模型
四、折衷准则 某些情况下,用乐观准则或悲观准则来处
理问题可能比较极端,这就需要对它们进行综 合。所谓折衷准则就是指在乐观准则与悲观准 则之间的折衷。用乐观系数 (0 1) 表示乐 观的程度,那么悲观系数就是1 。
数学模型
一、乐观(Max Max)准则 乐观准则是指决策者所持的态度是乐观
的,不放弃任何一个可能获得最好结果的机 会,充满着乐观冒险精神,争取各方案最大
收益值中的最大值。 决策的一般步骤为:

数学建模案例分析--对策与决策方法建模6决策树法

数学建模案例分析--对策与决策方法建模6决策树法

§6 决策树法对较为复杂的决策问题,特别是需要做多个阶段决策的问题,最常用的方法是决策树法。

决策树法是把某个决策问题未来发展情况的可能性和可能结果所做的预测用树状图画出来。

其步骤如下:1、用方框表示决策点。

从决策点画出若干条直线或折线,每条线代表一个行动方案,这样的直线或折线称为方案枝。

2、在各方案枝的末端画一个园圈,称为状态点,从状态点引出若干直线或折线,每条线表示一个状态,在线的旁边标出每个状态的概率,称为概率枝。

3、把各方案在各个状态下的损益期望值算出标记在概率枝的末端。

4、把计算得到的每个方案的损益期望值标在状态点上,然后通过比较,选出损益期望值最小的方案为最优方案。

例1某厂准备生产一种新产品,产量可以在三种水平n1、n2、n3中作决策。

该产品在市场上的销售情况可分为畅销、一般和滞销三种情况,分别为S1、S2、S3。

通过调查,预测市场处于这三种情况的概率分别为0.5、0.3、0.2。

三种决策在各种不同市场情况下的利润见下表:表1 基于各种决策的各种市场情况的利润表(万元)我们可以计算每种决策下利润的期望值:实行在水平n1下生产的利润的期望值为:90×0.5+30×0.3-60×0.2=42实行在水平n2下生产的利润的期望值为:60×0.5+50×0.3-10×0.2=43实行在水平n3下生产的利润的期望值为:10×0.5+9×0.3-6×0.2=6.5由于在水平n2下生产利润的期望值最大,因而应选择产量水平n2生产。

可以应用决策树帮助解决这样的决策问题,把各种决策和情况画在图1上:图1图中的方框(□)称为决策点,圆圈(○)称为状态点,从方框出发的线段称为对策分支,表示可供选择的不同对策。

在圆圈下面的线段称为概率分支,表示在此种对策下可能出现的各种情况。

在概率分支上注明了该情况出现的概率。

在每一个概率分支的末端注明了对应对策和对应情况下的收益(利润)。

决策类问题数学建模模型

决策类问题数学建模模型
决策类问题数学建模模型是一种将现实生活中的问题转化为数学问题,并通过数学方法来进行分析和解决的方法。

一般来说,决策类问题包括了多个决策变量、目标函数以及一系列约束条件。

数学建模的目标是通过建立数学模型,确定决策变量的最优取值,使得目标函数的值达到最大或最小值,同时满足约束条件。

常见的决策类问题模型包括线性规划模型、非线性规划模型、整数规划模型、动态规划模型等。

这些模型可以根据问题的特点灵活应用,从而得到最优的决策结果。

例如,在生产调度中,可以使用线性规划模型来确定最佳的生产量,使得总成本最小化,同时满足产能约束和市场需求;在项目管理中,可以使用整数规划模型来确定最佳的资源分配方案,使得项目进度最短化,同时满足资源约束和技术要求。

决策类问题数学建模模型的优势在于能够将问题简化为数学形式,通过数学方法的求解,得到最优的决策结果。

然而,建立模型时需要考虑问题的实际情况、约束条件和目标函数的合理性,同时依赖于数学建模者的经验和专业知识。

因此,在建立模型时需要充分了解问题背景,并结合数学方法的特点和技巧,才能得到有效的决策结果。

对策与决策模型

对策与决策模型策略是个人或组织用来达到特定目标的行动计划。

当面对重要决策时,采取正确的策略尤为重要。

然而,制定策略并非易事,因为决策者需要综合考虑各种因素和风险。

因此,我们需要有效的对策与决策模型来辅助我们的决策过程。

1. 定义决策模型决策模型是指用来描述和解决问题的一种逻辑框架。

它通常包括问题定义、目标设定、解决方案的生成和评估等步骤。

决策模型可以是定性的,也可以是定量的。

在制定决策模型时,需要考虑问题的复杂性、可行性以及可预测性。

2. 常见的决策模型2.1. SWOT分析模型SWOT分析模型是一种常用的对策与决策模型。

SWOT代表着公司(或个人)的优势(Strengths)、劣势(Weaknesses)、机会(Opportunities)和威胁(Threats)等方面。

通过对内部和外部环境的评估,可以制定相应的对策。

2.2. 五力模型五力模型是迈克尔·波特开发的一种对策与决策模型。

该模型通过评估竞争对手、供应商、客户、替代品和市场进入壁垒等因素,帮助企业确定竞争战略。

2.3. 敏捷决策模型敏捷决策模型是一种面向复杂和动态环境的决策模型。

该模型鼓励快速反应、多样化的方法和分阶段的决策。

通过迭代和渐进的方法,可以更好地适应不确定性和变化。

3. 决策模型的应用决策模型可以应用于各个领域,包括企业管理、市场营销、公共政策制定等。

在企业管理方面,决策模型可以帮助管理者制定战略发展计划、人员配置和资源分配等。

而在市场营销方面,决策模型可以帮助企业确定市场定位、产品定价和促销策略等。

此外,政府机构使用决策模型来制定公共政策,以最大程度地满足社会需求。

4. 决策模型的挑战与解决方案制定决策模型面临许多挑战,如信息不完整、风险评估困难和模型选择等。

为了克服这些挑战,我们可以采取以下解决方案。

4.1. 多源信息收集在制定决策模型之前,我们应该收集来源广泛的信息,以便全面评估问题和风险。

4.2. 风险分析与评估针对可能的风险,我们可以进行风险分析和评估,以确定其潜在影响和可能的解决方案。

对策与决策2


四、决策问题
人们在处理问题时,常常会面临几种可能出现的自然情况,同时又存 在着几种可供选择的行动方案。此时,需要决策者根据已知信息作决 策,即选择出最佳的行动方案,这样的问题称为决策问题。面临的几 种自然情况叫做自然状态或简称状态。状态是客观存在的,是不可控 因素。可供选择的行动方案叫做策略,这是可控因素,选择哪一方案 由决策者决定。 由前述可以看出,决策问题应包含三方面信息:状态集合 Q={ θ 1,…, θ n}、策略集合A = { α1,…, α m}及收益R = {aij},其中aij表示 如果决策者选取策略i而出现的状态为j,则决策者的收益值为aij(当aij为 负值时表示损失值)。 决策问题按自然状态的不同情况,常被分为三种类型:确定型、风险型 (或随机型)和一种可能自然状态的决策问题。 这种决策问题的结构较为简单,决策者只需 比较各种方案,确定哪一方案最优即可。
2、风险型决策问题 在风险型决策问题中存在着两种以上可能出现的 自然状态。决策者不知道究竟会出现哪一种状 态,但知道各种状态出现的概率有多大。
例 在开采石油时,会遇到是否在某处钻井的问题。尽管勘探队已作了大 量调研分析,但由于地下结构极为复杂,仍无法准确预测开采的结果, 决策者可以决定钻井,也可以决定不钻井。设根据经验和勘探资料,决 策者已掌握一定的信息并列出下表。
(2)随机误差项在不同样本点之间是独立的,不存在序列相关:
cov(ε i , ε j ) = 0, i ≠ j
(3)随机误差项与解释变量之间不相关:
cov(ε i , xij ) = 0, i = 1,
, n; j = 1,
,k
2 参数的最小二乘估计
ˆ ˆ 求 (b0 , b1 , ˆ , bk ) , 使得如下函数最小:

数学建模 对策与决策模型PPT文档共25页

数学建模 对策与决策模型
11、获得的成功越大,就越令人高兴 。野心 是使人 勤奋的 原因, 节制使 人枯萎 。 12、不问收获,只问耕耘。如同种树 ,先有 根茎, 再有枝 叶,尔 后花实 ,好好 劳动, 不要想 太多, 那样只 会使人 胆孝懒 惰,因 为不实 践,甚 至不接 触社会 ,难道 你是野 人。(名 言网) 13、不怕,不悔(虽然只有四个字,但 常看常 新。 14、我在心里默默地为每一个人祝福 。我爱 自己, 我用清 洁与节 制来珍 惜我的 身体, 我用智 慧和知 识充实 我的头 脑。 15、这世上的一切都借希望而完成。 农夫不 会播下 一粒玉 米,如 果他不 曾希望 它长成 种籽; 单身汉 不会娶 妻,如 果他不 曾希望 有小孩 ;商人 或手艺 人不会 工作, 如果他 不曾希 望因此 而有收 益。-- 马钉路 德。
谢谢!
21、要知道对好事的称颂过于夸大,也会招来人们的反感轻蔑和嫉妒。——培根 22、业精于勤,荒于嬉;行成于思,毁于随。——韩愈
23、一切节省,归根到底都归结为时间的节省。——马克思 24、意志命运往往背道而驰,决心到最后会全部推倒。——莎士比亚
25、学习是劳动,是充满思想的劳动。——申斯基
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、对策的基本要素
(1)局中人。参加决策的各方被称为决策问题的局中人, 一个决策总是可以包含两名局中人(如棋类比赛、人与大自 然作斗争等),也可以包含多于两名局中人(如大多数商业 中的竞争、政治派别间的斗争)。局中人必须要拥用可供其 选择并影响最终结局的策略,在例3中,局中人是A、B两名 疑犯,警方不是局中人。两名疑犯最终如何判刑取决于他们 各自采取的态度,警方不能为他们做出选择。
1
2
3
4
5
可知,不存在纯策略。
0 5 / 6 1 / 2 5 / 6 1 1 R 1 1/ 2 3 / 4 3 / 4 3 / 4 2 1 3 min max aij 易求得 max min aij j j i i 2 4
若A的最佳策略为(x,1-x)( x是A选择 1 的概率。) 对于
对策问题
对策问题的特征是参与者为利益相互冲突的各方,其结局 不取决于其中任意一方的努力而是各方所采取的策略的综合 结果。 先考察几个实际例子。 例1 (田忌赛马) 田忌赛马是大多数人都熟知的故事,传说战国时期齐王 欲与大将田忌赛马,双方约定每人挑选上、中、下三个等级 的马各一匹进行比赛,每局赌金为一千金。齐王同等级的马 均比田忌的马略胜一筹,似乎必胜无疑。田忌的朋友孙膑给 他出了一个主意,让他用下等马比齐王的上等马,上等马对 齐王的中等马,中等马对齐王的下等马,结果田忌二胜一败, 反而赢了一千金。
对策与决策模型
对策与决策模型
对策与决策是人们生活和工作中经常会遇到的择优活动。 人们在处理一个问题时,往往会面临几种情况,同时又存在 几种可行方案可供选择,要求根据自己的行动目的选定一种 方案,以期获得最佳的结果。 有时,人们面临的问题具有竞争性质,如商业上的竞争 、体育中的比赛和军事行动、政治派别的斗争等等。这时竞 争双方或各方都要发挥自己的优势,使己方获得最好结果。 因而双方或各方都要根据不同情况、不同对手做出自己的决 择,此时的决策称为对策。在有些情况下,如果我们把可能 出现的若干种情况也看作是竞争对手可采取的几种策略,那 么也可以把决策问题当作对策问题来求解。
Hale Waihona Puke 注:设A方用概率xi选用策略 i,B方用概率yj选用策略 j,

i 1 i j 1
m
n
j
1

且双方每次选用什么策略是随机的,不能让对方看出规律,
策略 S A:
α1,…, αm SB:
策略
β1,…, βn
概率
x1,…,xm
概率
y1,…,yn
分别称SA与SB为A方和B方的混合策略。
(2)策略集合。局中人能采取的可行方案称为策略,每一 局中人可采取的全部策略称为此局中人的策略集合。对策问 题中,对应于每一局中人存在着一个策略集合,而每一策略 集合中至少要有两个策略,否则该局中人可从此对策问题中 删去,因为对他来讲,不存在选择策略的余地。应当注意的 是,所谓策略是指在整个竞争过程中对付他方的完整方法, 并非指竞争过程中某步所采取的具体局部办法。例如下棋中 的某步只能看作一个完整策略的组成部分,而不能看成一个 完整的策略。当然,有时可将它看成一个多阶段对策中的子 对策。策略集合可以是有限集也可以是无限集。策略集为有 限集时称为有限对策,否则称为无限对策。 记局中人i的策略集合为Si。当对策问题各方都从各自的策 略集合中选定了一个策略后,各方采取的策略全体可用一矢 量S表示,称之为一个纯局势(简称局势)。
例如,若一对策中包含A、B两名局中人,其策略集合分别为 SA = { 1,…, m},SB = { 1,…, n}。若A选择策略 i而B选策 略 j,则( i, j)就构成此对策的一个纯局势。显然,SA与 SB一共可构成m×n个纯局势,它们构成表。对策问题的全体 纯局势构成的集合S称为此对策问题的局势集合。
Rmn
表示若A选取策略i而B选取策略 j,则A之所得为aij(当 aij<0时为支付)。
表4
局中人B
1 局中人A 1 2 (8, 2) (4, 6) 2 (1, 9) (9, 1) 3 (7, 3) (3, 7)
3
4
(2, 8)
(6, 4)
(6, 4)
(4, 6)
(8, 2)
(6, 4)
在有些两人对策的赢得表中,A之所得并非明显为B之所失, 但双方赢得数之和为一常数。例如在表4中,无论A、B怎样选 取策略,双方赢得总和均为10,此时,若将各人赢得数减去两 人的平均赢得数,即可将赢得表化为零和赢得表。
嫌疑犯B 供认 嫌疑犯A 供认 不供认 ( 3, 3) ( 0, 7) 不供认 ( 7 , 0) (1.5,1.5)
表中每对数字表示嫌疑犯A、B被判刑的年数。如果两名疑犯均担心对 方供认并希望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。
从这些简单实例中可以看出对策现象 中包含的几个基本要素。
A的策略为
1 2
:飞机从不同的路线进入。
:飞机从同一条路线进入。 :对每一条路线配备一个连。 :对两条路线各配置两个连。 :对一条路线配两个连,为另条路线各配一个连。
B的策略为
1 2 3 4 5
:对一条线路配三个连,对另一条路线配一个连。 :对一条路线配四个连。
由题意得A的赢得矩阵为
m
( m, 1)
( m, 2)

( m, j)

( m , n)
(3)赢得函数(或称支付函数)。对策的结果用矢量表示, 称之为赢得函数。赢得函数F为定义在局势集合S上的矢值函 数,对于S中的每一纯局势S,F(S)指出了每一局中人在此 对策结果下应赢得(或支付)的值。综上所述,一个对策模 型由局中人、策略集合和赢得函数三部分组成。记局中人集 合为I = {1,…,k},对每一i∈I,有一策略集合Si,当I中每 一局中人i选定策略后得一个局势s;将s代入赢得函数F,即 得一矢量F(s) = ( F1(s),…,Fk(s)),其中Fi(s)为在局势s下局中人 i的赢得(或支付)。 只讨论两名局中人的对策问题,即两人对策,其结果可以推广 到一般的对策模型中去。对于只有两名局中人的对策问题,其 局势集合和赢得函数均可用表格表示。
1 5/6 3/4 1/2 1/2
则 解得
1 x
1 1 x 2 3
3 x 8
风险型决策问题
例 某工程按正常速度施工时,若无坏天气影响可确保在30天内按期完 工。但根据天气预报,15天后天气肯定变坏。有40%的可能会出现阴雨 天气而不影响工期,在50%的可能会遇到小风暴而使工期推迟15天,另 有10%的可能会遇到大风暴而使工期推迟20天。对于可能出现的情况, 考虑两种方案: (1)提前紧急加班,在15天内完成工程,实施此方案需增加开支18000元。 (2)先按正常速度施工,15天后根据实际出现的天气状况再作决策。 如遇到阴雨天气,则维持正常速度,不必支付额外费用。 如遇到小风暴,有两个备选方案:(i)维持正常速度施工,支付工程延 期损失费20000元。(ii)采取应急措施。实施此应急措施有三种可能结 果:有50%可能减少误工期1天,支付应急费用和延期损失费共24000元; 有30%可能减少误工期2天,支付应急费用和延期损失费共18000元;有 20%可能减少误工期3天,支付应急费用和延期损失费共12000元。
例2 (石头—剪子—布) 这是一个大多数人小时候都玩过的游戏。游戏双方只能选 石头、剪子、布中的一种,石头赢剪子,剪子赢布,而布又 赢石头,赢者得一分,输者失一分,双方相同时不得分,见 下表。 表1
石头 石头 剪子 布 0 -1 1 剪子 1 0 -1 布 -1 1 0
例3 (囚犯的困惑) 警察同时逮捕了两人并分开关押,逮捕的原因是他们持有 大量伪币,警方怀疑他们伪造钱币,但没有找到充分证据, 希望他们能自己供认,这两个人都知道:如果他们双方都不 供认,将被以使用和持有大量伪币罪被各判刑18个月;如果 双方都供认伪造了钱币,将各被判刑3年;如果一方供认另一 方不供认,则供认方将被从宽处理而免刑,但另一方面将被 判刑7年。将嫌疑犯A、B被判刑的几种可能情况列表如下: 表2
G = { SA, SB, R }
例4
给定G = { SA, SB, R},其中SA = { 1, 2, 3},SB = { 1, 2, 3, 4}
1
2
3
4
12 6 30 22 1 R 14 2 18 10 2 6 0 10 16 3 从R 中可以看出,若A希望获得最大赢利30,需采取策略 1,但此时若B 取策略 4,A非但得不到30,反而会失去22。为了稳妥,双方都应考虑到 对方有使自己损失最大的动机,在最坏的可能中争取最好的结果。局中 人A采取策略 1、 2、 3时,最坏的赢得结果分别为
3 1 R 3 1
4 4 1 1
2 2 3 1
给定一个两人对策只需给出局中人A、B的策略集合SA、 SB及表示双方赢得值的赢得矩阵R。综上所述,当遇到零和 对策或可转化为零和对策的问题时,R可用通常意义下的矩 阵表示,否则R的元素为一两维矢量。 故两人对策G又可称为矩阵对策并可简记成
max min aij min max aij
i j j i
VG
min ai* j max aij* VG
j j
,则称( i* , j*)为对策G的鞍点或稳定解,赢得矩阵中与(i* , j* ) i* ai* j* 称为赢得矩阵的鞍点, 相对应的元素 与 分别称为局中人A与B的 j* 最优策略。
超过2。注意到在赢得矩阵中,2既是所在行中的最小元素又是所在列中的 最大元素。此时,只要对方不改变策略,任一局中人都不可能通过变换策 略来增大赢得或减小损失,称这样的局势为对策的一个稳定点或稳定解, (注:也被称为鞍点) 定义1 对于两人对策G = { SA, SB, R},若有 ,则称G具有稳定解,并称VG为对策G的值。若纯局势( i* , j* )使得
相关文档
最新文档