浅析“囚徒困境”模型中的“理性”假设

浅析“囚徒困境”模型中的“理性”假设
浅析“囚徒困境”模型中的“理性”假设

浅析“囚徒困境”模型中的“理性”假设

“囚徒困境”博弈模型中个体理性和集体理性的冲突对经济学的基本假设——“理性经济人”造成了严重挑战。认为“囚徒困境”中之所以出现表面的理性冲突是因为囚徒并非真正理性,之后笔者试着给出了两种可以化解这种冲突的方案:一种是改变博弈的理性选择方式,一种是集体理性工具说或集体利益幻象说,这一过程构成笔者对“理性经济人”假设的反思。

标签:“理性经济人”假设;囚徒困境;个体理性;集体理性

引言

“理性经济人”假设是西方经济学理论分析的逻辑起点,它为构建精致庞大的经济学理论体系奠定了一个公理化的起点。在以此为前提取得了丰硕的理论研究成果的同时,它也遭到了众多批判和质疑。1950年普林斯顿大学的塔克(Tucker)教授提出的“囚徒困境”博弈模型是对这一假设的有力冲击。在这一模型里,每个囚徒都是“理性的”,而且他们也都知道对方是“理性的”,每个囚徒都选择了对自己而言是理性的“占优策略”,而结果对每个人而言却都是次劣的,对集体而言则是最劣的[1],这不符合“理性经济人”假设的逻辑结果,即个体理性的利益最大化行为的自然结果即是集体利益的最大化。这促使笔者思考,或者是研究者们在这一模型里对“理性经济人”假设的理解有偏差,或者是这一假设本身即有暗伤存在,囚徒博弈只是帮助我们发现了这一点;或者是这一假设根本不适用于分析该模型中囚徒的策略选择行为,这一点显然是试图逐渐扩张到解释预测一切人类行为的帝国主义经济学所不愿意承认的。而笔者深信,每个囚徒可以选择的“沉默”(合作)与“坦白”(背叛)两种策略不可能都是不理性的,至少有一个策略是相对最为理性的;同样,仅有可能出现的四种结果(最优,次优,次劣,最劣)也不可能对于每个囚徒而言都是不理性的,至少有一个结果是相对最为理性的[2],在模型中如何使理性的策略与理性的结果统一起来,即实现手段理性与目标理性的统一,这是理性的任务。

一、“囚徒困境”及其出现的原因分析

“囚徒困境”博弈模型最初由普林斯顿大学的塔克教授提出。经典的“囚徒困境”如下所述[3]:

两个囚徒被警察抓住后分别关押,警方知道他们有罪,但是苦于缺乏充足的证据。警察给他们的政策是“坦白从宽,抗拒从严”。每个囚徒面临的两个策略选择“沉默”(合作)和“坦白”(背叛)。如果一方“坦白”,而另外一方“沉默”,则坦白方将被释放,而沉默方将被判重刑10年;如果双方均“坦白”,则每人将被判刑8年;如果双方均“沉默”,警方因为没有足够的证据而只能给他们轻微的象征性惩戒,判刑半年。

他们的支付矩阵如下所示:

相关主题
相关文档
最新文档