博弈论基础复习.doc

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

《博弈论基础》复习大纲

一、名词解释(5X2 = 10分)

策略型博弈

它是由三个部分组成，即局中人、策略和各种策略组合中所得到的利益。

纳什均衡

指参与博弈的每-局屮人在给定其他局屮人策略的条件下选择上策所构成的一种策略组合。

混合策略

局屮人的混合策略是其纯策略空间上的一种概率分布，表示局屮人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。

扩展型博弈

博弈存在着局中人行动的先后次序，是对具有动态结构的决策形式进行研究的规范分析工具。

博弈树

对于任何一种双人完备博弈，都可以用一个博弈树来描述，并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。

完美信息博弈

是指一次只有一个局中人在行动，而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。

子博弈

指由原扩展型博弈屮的一个决策节点与它的所冇后续节点组成的博弈。

行为策略

是指每一个参与人在每一个信息集上随机的选择行动。

逆向归纳法

逆向归纳法是求解子I■専弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时，从最后一个子博弈开始逆推上。

冷酷策略

又称触发策略。指参与人在开始时选择合作，在接下来的博弈中，如果对方合作则继续合作，而如果对方一旦背叛，则永远选择背叛，永不合作。

类型

一般地，将一个参与人所拥有的所有私人信息称为他的类型。

静态贝叶斯均衡

是-种与类型有关的策略组合，其屮每个局屮人在给定自己类型和其它局屮人策略的情况下最大化自己的期果效用函数。

信号博弈

是研究具有信息传递作用的信号机制的一般傅弈模型，其基本特征是两个I■専弈方，分别称为信号发出方和信号接收方。

分离均衡

信号博弈中的完美贝叶斯均衡之一，这种均衡中不同类型的发送者以概率1选择不同的信号, 接收者完全可以通过信号来准确判断岀发送者的类型。

混同均衡

信号博弈中的完美贝叶斯均衡之一，这种均衡中不同类型的发送者选择了相同的信号，接收者无法从信号中得到新的信息，无法对先验信念进行修正。

联盟

设：={1,2,-..,/}为局中人集合，则其中任意一非空子集S u ＜为一个联盟。

特征函数

特征函数型博弈对每一种可能联盟给出相应的联盟总和收益，也就是给出了一种集合函数，称为特征函数。

核

多人合作博弈中所冇不被超优的分配的集合。

核仁

合作博弈核仁解所依拯的基本思想是:在分配属于核仁的条件下，最不理想的联盟也要优于任何其它分配向量的最不理想的联盟。

二、判断题(5X1 = 5分)

三、简答题(4X7 = 28分)

策略型博弈的基本要素。

策略型博弈的基本要素有：

局屮人：即博弈的参与者，可以是自然人、企业、政府、社团等。

策略：指每个局屮人在博弈屮可选择釆用的行动方案。

支付：指每个局中人从各种策略组合中获得的收益。

什么是纳什均衡？你是如何理解的？

纳什均衡及其理解：

在一个博弈过程中，无论具它局中人的策略选择如何，局中人都会选择某个确定的策略，则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略，局屮人谁都没有动机单方面偏离该状态，那么这个组合就被定义为纳什均衡。

1 •是完全信息静态傅弈的解的一般概念。

2•毎一个严格占优战略均衡一定是纳什均衡，反之不然。

3•每一个逐步剔除严格劣战均衡一定是纳什均衡，反Z不然。

比较策略型博弈的纯策略和混合策略。

纯策略是指每个局中人在博弈中可选择采用的行动方案，混合策略是局中人的纯策略空间上的一种概率分布，表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。纯策略可视为混合策略的特例，也就是对某个纯策略赋予概率1而对其他纯策略赋予概率0 的混合策略。

分析两人两策略博弈构成囚徒困境博弈应满足的条件。囚徒困境博弈说明了什么问题?

P. 14

说明了个体理性和集体理性之间的矛盾；市场失灵。

简要分析扩展型博弈的构成要素。

（1）参与人集合；虚拟参与人——自然。

（2）行动顺序：谁在什么时候行动。

（3）参与人的行动空间：每次行动时，局小人可进行的选择

（4）参与人的信息集：信息是参与人有关博弈的知识，如有关“自然”的选择、其他参与人的特征和行动的知识等。

（5）参与人的支付函数：指在一个特定策略组合下参与人得到的确定（期望）效用水平

（6）外生事件的概率分布。

如何理解完全信息动态博弈下的纯策略和行动？

彳亍动与策略

行动：是参与人在博弈的某个时点（某个信息集）的决策变量。行动组合：参与人的行动的有序集。

策略：是参与人在给定信息集情况下的行动规则，它规定参与人在什么时候选择什么行动。在静态博弈中，策略和行动是等价的。

在动态博弈屮，策略在给定信息集下完整的行动方案，与行动是不同的。

理解子博弈和掌握逆向归纳法求解思想。

子博弈是指由原扩展型博弈屮的一个决策节点与它的所有后续节点组成的博弈。

一个扩展式表述博弈的子博弈是原博弈的一部分，它应满足下列条件：

（1）.始于单结信息集的决策结x（但不包插原博弈的初始结）。

⑵•包含博弈树屮策结x的所有后续结（包插终点结）。

（3）•没有对任何信息集形成分割。

逆向归纳法思想分析：

冇限博弈一定存在一个最后的决策结（其直接后续结是终点结）的集合，在该决策结上行动的参与人将选择一个最大化自己的支付的行动；给定这个参与人的行动，倒数第二个决策结上的参与人将选择一个可行的行动最大化自己的支付；如此类推，直至初始结。

该倒推过程完成吋得到了一条路径，该路径给出了每一个参与人的一个特定的策略，它是一个纳什均衡（子傅弈精炼纳什均衡）。逆向归纳法实质是重复剔除严格劣策略方法在扩展式I■専弈中的运用。

你是如何理解混合策略的纯化定理的?

你是如何理解不完全信息博弈中的不完全信息？

不完全信息是指一种博弈局势中局屮人对其他局屮人（或者他自己）与该种博弈局势冇关的事前信息了解不充分，而不是博弈中产生的与局中人实际策略选择有关的信息。

从技术上看，博弈的不完全信息表现为对博弈的基木数学结构了解不充分。在策略型博弈中, 则表现为对博弈的三种组成部分，即局中人、策略和支付有着不完全的了解。

在理论上，各类不完全信息情形都可归结为对支付函数的不完全信息。