第一章 决策论基础知识(博弈论-河海大学,王慧敏)

合集下载

博弈论与决策论

博弈论与决策论

主讲人:邓光耀1、几个定义•定义1.1 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论主要研究公式化了的激励结构间的相互作用。

是研究具有斗争或竞争性质现象的数学理论和方法。

也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

生物学家使用博弈理论来理解和预测进化论的某些结果。

•定义1.2 序贯博弈是指参与者选择策略有时间先后的博弈形式。

因此,某些对局者可能率先采取行动,它是一种较为典型的动态博弈,而重复博弈则可视为一种特殊的动态博弈形式。

•在序贯博弈中,先行者可能占据一定的有利地位,我们把它叫做先行者优势。

•定义1.3 决策论(Decision theory)决策论是根据信息和评价准则,用数量方法寻找或选取最优决策方案的科学,是运筹学的一个分支和决策分析的理论基础。

在实际生活与生产中对同一个问题所面临的几种自然情况或状态,又有几种可选方案,就构成一个决策,而决策者为对付这些情况所取的对策方案就组成决策方案或策略。

2、序贯博弈之例•例1:桌上有25枚硬币,每次可以取1枚、2枚或者3枚。

你与对手交替选择,谁先选到第25枚硬币谁就胜利。

假设你首先选择,你这样才能保证自己胜利?•解答:你应当这样选择:每次选择的最后一个数依次为1、5、9、13、17、21、25,这样无论对方如何选择,你均可以保证自己胜利。

也就是说你要保证每次最后选择的是4n+1型的数。

而这种保证是可以做到的,读者可以思考一下原因。

•推广1:此类游戏可以推广到选择4k+1枚硬币的情形,优胜策略也是保证每次最后选择的是4n+1型的数。

•推广2:设步长为a,(例1中步长为3),则形如(a+1)k+1枚硬币的情形,优胜策略也是保证每次最后选择的是(a+1)n+1型的数。

3、囚徒困境• 3.1 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。

决策与博弈理论分析

决策与博弈理论分析

3
公共资源分配
在公共资源分配问题中,博弈论可以帮助分析各 方利益诉求和冲突,寻求合理的资源分配方案。
04 基于博弈论决策方法论述
完全信息静态博弈下决策方法
最小最大定理
在完全信息静态博弈中,参与人可以通过选择策略使得自己的最小收益最大化, 即采用最小最大定理进行决策。
纳什均衡
纳什均衡是完全信息静态博弈中的一种稳定状态,参与人在该状态下无法通过单 方面改变策略来增加收益。因此,在决策时应考虑纳什均衡的存在。
通过本课程的学习,我掌握了决 策与博弈论的基本理论和方法, 能够运用所学知识分析和解决实 际问题。
不足之处
在学习过程中,我发现自己在理 论深度和广度方面还有待加强, 需要更加深入地学习和理解相关 知识。
未来计划
我计划在未来的学习中,继续深 入探究决策与博弈论的理论体系, 并尝试将所学知识应用于实际研 究和项目中。
决策与博弈理论分析
目录
• 决策理论基本概念 • 博弈论基础知识 • 决策与博弈关系探讨 • 基于博弈论决策方法论述 • 决策与博弈在现实生活应用举例 • 总结与展望
01 决策理论基本概念
决策定义及分类
决策定义
决策是指在不确定条件下,为实 现特定目标,从多个可行方案中 选择一个最优方案的过程。
决策分类
决策过程与影响因素
决策过程
包括问题识别、信息收集、方案制定、方案评估和选择等步骤。
影响因素
决策者的个人特征(如价值观、经验、能力等)、组织环境(如组织结构、文 化、资源等)以及外部环境(如市场状况、政策法规等)都会对决策过程产生 影响。
02 博弈论基础知识
博弈论定义及发展历程
博弈论定义
博弈论是研究决策过程中理性人之间相互作用及决策均衡的 理论。它分析在竞争或合作环境中,参与者如何根据各自掌 握的信息和对未来结果的预期,选择最优策略以最大化自身 利益。

完整版)博弈论知识点总结

完整版)博弈论知识点总结

完整版)博弈论知识点总结博弈论是研究决策主体在相互作用中做出的决策以及均衡问题的学科。

该学科的研究假设包括:1)决策主体是理性的,会尽可能地最大化自己的收益;2)完全理性是共同知识;3)每个参与者都能对环境和其他参与者的行为形成正确的信念和预期。

博弈中涉及到的变量包括:参与人、行动、战略和信息。

完全信息指每个参与人都了解其他参与人的支付函数,而完美信息则指在博弈过程中,每个参与人都能观察和记忆之前的行动选择。

不完全信息则表示参与人没有完全掌握其他参与人的信息,存在不确定性因素。

博弈与传统决策的区别在于,博弈是决策主体之间的相互作用,需要考虑其他决策者的选择和效用函数。

博弈的表示形式包括战略式博弈和扩展式博弈,其中战略式博弈适用于描述不需要考虑博弈进程的完全信息静态博弈问题,而扩展式博弈则更适用于描述动态博弈问题。

与战略式博弈不同,扩展式博弈更注重参与者在博弈过程中面临的决策问题的序列结构分析,而不是仅关注博弈结果的描述。

扩展式博弈包括参与人集合、参与人的行动顺序、序列结构和参与人的支付函数等要素。

战略式博弈是一种静态模型,而扩展式博弈是一种动态模型。

博弈论可以分为合作博弈和非合作博弈,其中合作博强调团体理性、团体最优决策和效率,而非合作博弈强调个人理性和个人最优决策。

根据参与人行动先后顺序的不同,博弈可以分为静态博弈和动态博弈,后者包括先行动者获得先行动者行动信息的情况。

根据参与人对信息的掌握程度,博弈可以分为完全信息和不完全信息博弈。

根据决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。

不同类型的博弈有不同的均衡类型和求解方法,顺序的不同也会影响均衡结果。

Hotelling价格竞争模型是一种重要的扩展式博弈,用于描述两个企业在同一市场上的价格竞争。

相对应。

占有均衡是指在博弈中存在一组参与人的战略选择,使得每个参与人都无法通过改变自己的战略来提高自己的支付。

第1章 决策分析概论PPT课件

第1章  决策分析概论PPT课件
管理就是决策
改善企业内部管理、提高生产效率、改善产品质量 虽仍是提高效益和竞争能力的有效途径,但已不能 满足需要,更重要是提升整体效果,将企业放到复 杂外部环境中思考问题,科学分析、作出合理有效 对策、克敌制胜
波音与协和的市Байду номын сангаас策略
大型民用客机市场策略(60 年代) 70年代的民航运输市场需 求及经济发展水平,旅客 的经济承受能力
50年代,Simon发表《管理决策科学》等著作, 突出决策在管理中的位置。
60年代,K.Arrow《社会选择和个人价值》
决策科学的发展
60年代以后,许多学者在决策分析这一学科分 支领域的各方面,如序贯决策、多目标决策、 群决策、多层多人多目标决策等进行了大量工 作。
运筹学和决策分析对于决策概念的狭义理解 : 为决策机构在对其控制下的业务活动进行决策 时,提供以数量化为基础的科学方法 。
一、决策分析的类型
按决策目标的数量
❖ 单目标决策 ❖ 多目标决策
按决策的自然状态
❖ 确定型决策 ❖ 非确定型决策 ❖ 风险型决策
按决策的动态性
❖ 静态决策 ❖ 动态决策
一、决策分析的类型
按决策的问题结构与程序
❖ 程序性决策(Programmed Decision) ❖ 非程序性决策(Non-programmed Decision)
如果用oij(i = 1,2,3;j =1,2)分别表示方案ai在
状态θj下的决策结果,这个无数据决策问题所
出现的全部结果,可以表示为
Savage实例
1.4 决策分析的基本要素
决策者
受社会、政治、经济和心理等诸多因素影响的决策 主体,可以是个体或群体。
决策目标
决策问题对于决策者所希望希望实现的目标,可以 是单个目标,也可以是多个目标。

经济学中的博弈论与决策理论

经济学中的博弈论与决策理论

经济学中的博弈论与决策理论博弈论和决策理论是经济学中两个重要的分支,它们研究了当涉及到决策和行为选择时,个体之间如何相互作用和相互影响。

这些理论为了解人们在经济环境中作出的决策提供了一种强大的框架。

本文将探讨博弈论和决策理论的基本概念、应用以及对经济学的重要性。

一、博弈论博弈论是研究决策制定者之间相互作用和决策制定的一种数学模型。

它的核心理念是通过分析决策制定者之间的策略选择和可能的结果,来确定最优的决策。

博弈论的一个关键概念是博弈的参与者,他们在特定情境下做出决策,并受到其他参与者决策的影响。

1.1 纳什均衡纳什均衡是博弈论中的一个重要概念。

它描述了一个状态,在该状态下,参与者之间的策略选择是相互协调的,没有人会单方面改变自己的策略来获得更好的结果。

简而言之,纳什均衡是一种稳定的策略选择状态。

1.2 进化博弈论进化博弈论是博弈论的一个分支,它结合了生物学与博弈论的原理。

在进化博弈论中,参与者的策略会随着时间的推移而演化。

那些能够在长期的演进中存活和繁衍的策略将成为主导策略。

这种理论有助于解释为什么在自然环境中存在着一些稳定的行为模式。

二、决策理论决策理论是研究决策制定者如何在面临不确定性的情况下做出决策的一门学科。

它关注的是决策者在不确定信息和风险中作出决策的过程和规律。

决策理论在经济学领域具有广泛的应用,用于解释经济主体(如消费者、生产者)在面对不确定的市场条件下做出的决策。

2.1 风险决策理论风险决策理论是决策理论中的一个重要分支,它研究如何在面临风险和不确定性的情况下做出决策。

在风险决策中,决策制定者权衡可能的结果和概率,以确定最佳的决策方案。

不同的风险态度和风险偏好将对决策结果产生重要影响。

2.2 启发式和认知偏差启发式和认知偏差是指人们在决策过程中所依赖的简化方法和决策中所存在的常见误差。

例如,人们通常倾向于根据可获得的信息做出决策,而不是综合所有可能的信息。

认知偏差也可能导致人们对风险的评估有所偏差,从而影响决策结果。

决策与博弈论课件

决策与博弈论课件

商业决策与博弈
商业策略
决策与博弈论在商业竞争中有着 广泛的应用,如价格战、广告投 放、市场份额争夺等场景,通过 博弈分析可以帮助企业制定更加
合理的策略。
合作与竞争
决策与博弈论可以帮助企业理解 在商业环境中的合作与竞争关系 ,促进企业间的合作,实现共赢

风险管理
通过决策与博弈论,企业可以更 好地预测竞争对手的可能行动, 从而制定应对策略,降低风险。
大数据与决策与博弈论
大数据在决策与博弈论中的应用
随着大数据时代的来临,越来越多的数据可用于分析和研究决策与博弈论问题。例如, 利用大数据分析来研究市场中的竞争策略、消费者行为等,从而更好地理解博弈中的策
略互动和结果。
大数据对决策与博弈论的影响
大数据的应用为决策与博弈论提供了更广泛的数据来源和分析工具,有助于更深入地理 解博弈中的复杂性和不确定性。同时,大数据也要求研究者具备更高的数据处理和分析
优化的学科。
参与者
在博弈中,参与者通常被称为 局中人,他们各自追求自己的 利益或目标。
行动与策略
局中人在博弈中的行动和策略 选择,决定了博弈的结果和均 衡。
支付
局中人在博弈中的收益或损失 ,是衡量博弈结果的重要指标

博弈论的基本类型
零和博弈
在一场零和博弈中,一 方的收益等于另一方的
损失,即总和为零。
人工智能与决策与博弈论
人工智能在决策与博弈论中的应用
随着人工智能技术的不断发展,越来越多的学者开始探索如何将人工智能应用于 决策与博弈论中。例如,利用机器学习算法来分析复杂的博弈数据,或者通过智 能代理来模拟人类行为,从而更好地理解博弈中的策略互动。
人工智能对决策与博弈论的影响

博弈论知识点总结完整版

博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。

即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。

1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。

1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。

两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。

倘若不能,则称非合作博弈(Non-cooperative game)。

合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。

目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。

博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。

把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。

管理决策分析第1讲-决策理论基础知识


多属性决策
群决策
在线群决策
管理决策分析
8
课程目标
应对不确定的技术
化解冲突的技巧
综合决策的能力
管理决策分析
9
目 录
1 决策分析的基本概念 2 决策问题的特点和要素 3 管理决策分析示例 4 决策模型 5 决策支持系统
管理决策分析
10
什么是决策
“决策”一词的起源:
“夫运筹策帷幄之中,决胜于千里之外,吾不如 子房”——《史记.汉高祖本纪》 20世纪50年代,英国学者巴纳德、斯特恩等首先 提出“Decision Making”,用来解决组织管理中 的分权问题 西蒙(H. A. Simon)强调决策在组织管理中的重要 作用——“管理就是决策” 中国学者最初将“Decision Making”翻译成“做 出决定”,后来翻译成“决策”

管理决策分析
30
如何进行科学决策?
做决策时要求科学的严肃性 及时掌握可靠的信息,高质量的信息的正确决
策的基础
遵从科学的决策程序:明确目标、方案择优、
试验(或仿真)、反馈优化等
采用科学的决策技术和方法 有合理的决策机构 良好的反馈系统,从而根据反馈结果,调整决
策方案,进行决策优化
管理决策分析
20
决策的属性特征 (3)
信息性
信息是决策的基础 非常规信息环境下的决策是非常困难的
经济性
信息的价值和获得信息的成本是一对矛盾 信息经济学
动态性
决策是一个动态过程,要不断根据决策执行结果的反 馈信息和决策环境的变动信息来做出新的决策
模糊性
决策问题往往没有最优解,只有符合决策人偏好的满 意解
对目标的选择 对达到目标的各种方案的选择

决策与博弈理论分析PPT

纳什均衡的局限性
纳什均衡假设每个玩家都完全理性,能够准确预测对手的策略,这在现实中可能并不成 立。
混合策略均衡分析
混合策略均衡
指在博弈中,每个玩家都有一定的概率采取不同的策略。
混合策略均衡的特点
混合策略均衡是一种更加现实的博弈结果,因为在实际生 活中,玩家往往无法准确预测对手的策略,需要采取一定 的随机性来应对。
国际政治博弈案例
总结词
国际政治博弈
详细描述
国际政治中,各国之间的利益冲突和战略互动经常需要运用博弈论来分析。例 如,冷战期间的美苏博弈、国际贸易谈判中的利益博弈等。
市场博弈竞争案例
总结词
市场竞争博弈
详细描述
在市场竞争中,企业之间经常运用博弈论来分析竞争对手的策略和市场格局,以制定有效的竞争策略 。例如,价格战、广告战等。
随着大数据和人工智能技术的快速发 展,如何利用这些技术提高决策效率 和精度也是未来研究的重要方向之一。
THANKS
感谢观看
06
结论与展望
决策与博弈理论的重要性和意义
决策与博弈理论在经济学、管理学、 政治学等领域具有广泛的应用价值, 为解决现实问题提供了重要的理论支 持和实践指导。
决策与博弈理论的发展对于推动相关 学科的进步和交叉融合具有重要意义, 有助于促进学科之间的交流和合作。
该理论有助于理解个体和群体在决策 过程中的行为特征和决策偏好,为企 业制定战略、政府制定政策提供科学 依据。
行为决策理论
关注实际决策过程中人的心理、情感和认知等因 素对决策的影响。
当代决策理论
综合了古典和行为决策理论的观点,强调理性和 非理性因素在决策中的共同作用。
02
博弈理论概述
博弈的定义与分类

决策理论基本知识

❖ 竞争型决策:指决策主体在利益相互影响得环境中策 略得选择问题。
决策理论与方法-决策理论基本知识
按其她方式划分(1)
❖ 按决策问题得性质划分
程式决策:指经常重复得决策问题。 非程式决策:指那些尚未发生过、不容易重复出现得决策
问题。
❖ 按决策目标得数量划分
单目标决策 多目标决策
决策理论与方法-决策理论基本知识
❖ 竞争型决策问题:借助博弈论建立相应得模型。
决策理论与方法-决策理论基本知识
决策理论基本知识
为什么要研究决策?
❖ 任何个人、企业、事业单位和政府机构都离不开决 策。个人决策关系到个人得成败得失,组织决策关系 到组织得生死存亡,国家决策关系到国家得兴衰荣辱。
❖ 然而任何决策其结果完全符合预期情况得很少,总就 是或多或少地偏离原先期望,甚至截然相反。
❖ 缩小这种偏离正就是决策研究得目标。
❖ 管理决策:指企事业单位得管理者所进行得决策。特点:管理 得艺术性决定了管理决策没有相同得标准和不变得准则;逐 个解决问题;一种不停顿得滚动式决策。如经营方向决策、
营销决策、投资决策。(战略层、管理层、业务层)
❖ 公共决策(社会决策):指国家、行政管理机构和社会团体所进 行得决策。特点:决策问题得清晰度较差(原因复杂);追求公 众共识。
❖ 实验法(Experiment): 在控制其她额外变量得条件 下,通过对一个变量得操纵来测量另外一个变量得变 化 实验室实验 现场实验
决策理论与方法-决策理论基本知识
建模方法
❖ 仿真法(simulation):创设与真实环境几乎完全相同得情境 (实验室仿真和计算机仿真),并通过反复试验获得问题得模型。
决策理论与方法-决策理论基本知识
决策过程
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
决策者之间冲突与合作的数学模型的研究。 博弈论为分析那些涉及两个或更多个参与者且其决策会影 响相互间的福利的局势提供了一般的数学方法。
近代博弈论始于策墨洛(Zermelo,1913)、波雷尔(
Borel,1921)、冯.诺依曼(Von Neumann,1928)与摩根 斯特恩(Morgenstern,1944)合著的伟大的奠基性著作。 博弈论方面的许多早期著作都是在第二次世界大战期间在普 林斯顿完成的。
1.7
占优
有时决策者发现主观概率难以确定,无论决策者的 信念是什么,某些决策选择对他来说都不可能是最优 的。在由决策理论转向博弈论之前,我们在这里介绍 一些能说明何时这种与概率无关的论断会成立的基本 结论。 凸性是许多数理经济学中出现的集合的一个重要特 征。一个向量集是凸的(convex),其充要条件: 对于任意两个向量p和q以及0与1之间的任一数字 , 若p和q都在这个向量集中,则向量 p (1 )q 也一 定在这个集合中。从几何意义上说,凸性意味着连接 集合内任意两点的整个线段也都一定包含于此集之中 。
对结果或彩金偏好的定量刻划的效用函数(utility function ),和一个能刻划其对所有相关位臵因素的主观概率分布( subjective probability distribution)来描述。
1.2
决策理论的基本概念
不确定性下的决策通常是用下述两个模型之一来描 述: ※ 概率模型(probability model)和状态变量模型( state-variable model) ※在每一模型中,我们所说的决策者都是在彩票( lotteries)中进行选择的人。 ※两者的区别在于其对彩票的定义不同:在概率模型 中,彩票是彩金的概率分布;而在状态变量模型中 ,彩票是从可能状态集到彩金集的函数。
定理1.5
若给定 u : X R 和X中的y,则 () 中使得y为 最优的所有p所组成的集合是个凸集。
1.7
占优
一般地,一个随机策略(randomized
( Z )表
这里给出一些基本的符号:对于一个有限集Z,用
示集上的概率分布集,即
( Z ) q : Z R q ( y ) 1 yZ
且q( z ) 0,z Z
(按照常规的集合记号,上述大括号中的“Ⅰ”表示“使得 ”)
令X表示决策者最终可能获得的彩金(prizes)所组成的

xX
f ( x t ) 1 。令L表示所有这
样的彩票所组成的集合,就是 L f : ( X ) 对 中的任一状态 t 和L中的任一彩票 f ,f ( t ) 表示在状态
f ( t ) ( f ( x t ))xX ( X ) t 下由 f 确定的X上的概率分布,即:
1.1
博弈论、理性和智能性
对于仅假设理性而不假设智能性的理论,可以考虑 经济学中的价格理论这一例。在价格理论的一般均衡 模型中,假定每个个体都是追求效用最大化的理性决 策者,但并不假定他们像价格理论家那样对经济模型 的全波结构有所了解。在价格理论模型(pricetheoretic models)中,个体只观察某些中间价格 信号并且对此做出反映,并且假定每个个体都相信, 他可以在这些价格上交易任意数量而不管这个经济系 统中是否有人实际上愿意与其做交易。
1.7
占优
凸性是许多数理经济学中出现的集合的一个重要特征。一个
向量集是凸的(convex),其充要条件: 对于任意两个向量p和q以及0与1之间的任一数字 ,若p和q都 在这个向量集中,则向量 p (1 )q 也一定在这个集合中。 从几何意义上说,凸性意味着连接集合内任意两点的整个线段 也都一定包含于此集之中。
1.3


公理系
1.3


公理系
1.3


公理系

1.4
期望效用最大化定理
上的一个条件概率函数(conditional-probability
function)时任何一个这样的函数 p : () ,它能对 中的每个状态t和事件S都具体指定非负的条件概率 p(t S ) 且使得
的结果或者股票市场未来的行情都是很好的例子,我们称这 类事件为主观未知(subjective unknowns)事件。安斯库 姆和奥曼(1963)的“轮盘彩票”(roulette lotteries)或 奈特(knight,1921)的“不确定性”都相当于是依赖主观 未知事件的赌博。
1.2
决策理论的基本概念
1.2
决策理论的基本概念
博弈论的逻辑根源在于贝叶斯理论(Bayesian decision
thero)。事实上,博弈论可以看作是决策理论(对两个或 两个以上决策者情形)的一种推广,或者作为决策理论在 本质上的逻辑完备。因此,要理解博弈论的根本思想,就 应该从研究决策理论开始。
任何一个理性决策者的行为应该都可以用一个能给出其
1.2
决策理论的基本概念
对于L中的任意两个彩票 f 和 g ,以及 中的任一事件S
,当且仅当,如果决策者知道了世界真实状态在 S中,则对 他来说, f 至少是和 g 一样的理想选择的时候,我们才写作 这就是说,当且仅当决策者在只知道事件S已经发 生而又必须在 f 和 g 之间择一时,选择了彩票 f ,才有 给定这个关系 ,我们可以定义关系( s )和 为
1.1
博弈论、理性和智能性
当我们像博弈论专家或社会科学家那样分析一个 博弈时,如果局中人知道我们对此博弈所知道的一 起,并能做出我们对此局势所能做出的一切推断, 我们就说此博弈的局中人时智能的(Intelligent)。 博弈论一般都假设局中人在上述意义上是智能的, 因此如果我们研究出一个能描述某个博弈中智能局 中人行为的理论,并且我们相信这一理论是正确的 ,那么我们也必须假设该博弈的每个局中人都了解 这一理论及其预测。
1.6
贝叶斯模型的局限性
期望效用最大化的解释力可以通过凸动扰动( salient perturbations)分析而扩展到许多貌似矛盾 的情形分析。某给定决策问题的一个扰动就是任何另 一个(在某种意义上)与之非常相似的决策问题。对 任何一个给定的决策问题,如果实际面临这个决策问 题的人很可能会采取其在某个扰动决策问题中一样的 行动,我们就说这个扰动是凸出的。当然们发现决策 问题难以理解而且扰动情形又与他们通常体验的情形 很相像时,这个决策问题的特定扰动可能也是凸出的 。如果我们能对个人决策问题的凸出扰动进行预测, 那么在这个凸出扰动中最大化他期望效用的决策可能 会时对其行为的一个准确预测。
1.2
决策理论的基本概念
概率模型适用于描述彩金依赖于具有明显客观规律的事
件这一赌博,我们称这样的事件为客观未知。 Eg:安斯库姆 和奥曼(1963)的“轮盘彩票”(roulette lotteries)、奈 特(knight,1921)的“风险(risks)”
另外,很多事件不具有明显的概率;一个未来运动赛事
1.2
决策理论的基本概念
我们所说的彩金(prize)可以是任何的商品组合或资源
配臵。我们假定,定义X中的彩金时已经使得这些彩金是互 不相同的,且穷尽了决策者各种决策的可能。
决策者关于世界真实状态可能拥有的信息可以用一个事
S S 且 S
件(event)来描述,每个事件都是 的一个非空子集。我 们用 表示所有事件组成的集,则
我们就称他是理性的(rational) ※在基于决策理论的基本结论而建立起来的博弈论中,我 们假设每个局中人的目标是最求其个人期望支付值的最 大化,支付则是用某个效用(utility)尺度来衡量的。
1.1
博弈论、理性和智能性
※借助于理性决策者应该如何行动方面所做的一些非常弱 的假设,冯.诺依曼和摩根斯特恩(1947)证明了,对任 一理性决策者,一定存在某种方式对他所关心的各种可 能结果赋予效用数值,使其总是选择最大化自己的期望 效用。我们成这一结论为期望效用最大化定理( Expected-utility maximization theorem)。 ※在证明效用最大化定理成立的过程中,关键的假设是肯 定性(sure-thing)或替代性(substitution)公理:如 果偏好选项1胜于选项2,那么就有,他在知道事件A无 论发生还是不发生之前都应该偏好选项1胜于选项2。
1.4
期望效用最大化定理
这就是我们所说的期望效用最大化定理
1.5


贝叶斯条件概率系
我们定义有限集 上的一个贝叶斯条件概率系( Bayesian conditional-probability system)[或简称为条 件概率系(conditional-probability system)]为 上满足 贝叶斯公式的任何一个条件概率函数p。也就是说,如果p 是 上的一个贝叶斯条件概率系,则对 的每一个非空子 集S, p( S ) 都是 上的一个概率分布,使得 p(S S ) 1 , 且
1.2
决策理论的基本概念
贝叶斯理论概述:
贝叶斯理论的主要观点时将参数u看作随机变量,并具有 反映实验前关于u所有信息的先验分布,而在得到样本 X ( x1 , x2 , , xn ) 后,由X与先验分布得到u的后验分布,对 u所作的任何统计推断必须依据u的后验分布,因为后验分 布包含了参数u的所有信息。 h(u x) p(u) L(u x) 贝叶斯理论可以简单的表示为: L(u x ) p( u)为先验密度函数; 其中: h(u x ) 为后验密度函数; 为样本密度函数,称之为似然函数。
主讲人: 王慧敏 河海大学商学院
第一章 决策论基础知识
1.1 1.2 1.3 1.4 1.5 博弈论、理性和智能性 决策理论的基本概念 公理系 期望效用最大化定理 贝叶斯条件概率系
1.6
相关文档
最新文档