不完全信息博弈
不完全信息下的博弈论研究

不完全信息下的博弈论研究博弈论是研究博弈策略和操作的一门学科,在经济学、社会学、政治学等领域中都有广泛应用。
不完全信息博弈是博弈论研究中的一种重要形式,它强调在博弈过程中参与者没有完全信息,即某些信息是隐匿的或者是不确定的。
在这种情况下,参与者需要借助策略、推理、信息获取等方式来预测对手的动作,以达到最优的结果。
不完全信息博弈的典型例子是扑克游戏。
每个玩家手中的牌都是隐匿的,他们无法得知对手的牌面,而只能通过自己的牌和对手的表现来猜测对手手中的牌。
这种情况下,每个玩家需要制定最优的策略,包括加注、跟注、弃牌等操作,以获得尽量高的胜率。
在不完全信息博弈中,玩家需要根据对手的表现和自己手中的信息来猜测对手的策略。
如果对手的表现不符合自己的预期,就需要调整自己的思路和策略。
例如,在扑克游戏中,如果对手加注的次数比较频繁,那么他可能手中的牌比较好,这时候自己就需要加强对手的猜测和评估,调整自己的策略。
在博弈论研究中,不完全信息博弈的分析需要考虑如下因素:1.信息的不完全性:参与者无法获得完整的信息,需要根据已有的信息和对手的表现来猜测对手的意图。
2.策略的制定:参与者需要制定最优的策略,同时预测对手的策略,以获得最高的胜率。
3.信息获取:参与者需要通过各种手段获取对手的信息,包括观察行为、分析表现、推理对手的策略等。
4.均衡点:在不完全信息博弈中,均衡点是指参与者遵循一定的策略后所达到的状态,该状态对各方来说都是最优解,没有任何一方能够通过改变自己的策略来获得更好的结果。
不完全信息博弈的研究成果在实际应用中具有广泛的价值。
例如,在金融市场中,交易员需要通过对市场信息的收集和分析,来制定交易策略和风险控制方案;在竞拍市场中,竞拍者需要通过对对手出价的猜测和分析,来制定最优的出价策略。
此外,不完全信息博弈还被广泛应用于人工智能领域。
例如,在计算机博弈领域中,通过对不完全信息博弈的研究,可以开发出更加智能和自适应的游戏程序;在机器人与人类进行交互的情境中,即使双方都有不完全信息,机器人如果能够学习并推测人类的行为,就有望更好地实现人机交互。
不完全信息博弈

• 这个博弈的一个纯策略ai(ci) 是从﹝c’, c’’﹞到﹛0,1﹜的一个函数,其中0表示不 提供,1表示提供。参与人的支付函数为: • Ui(ai,a j, ci)=max(a1, a2)-aici • 如果j提供,i不提供, Ui(0,1, ci)=max(0, 1)-0ci=1;如果i提供, j不提供, Ui(1,0, ci)=max(1, 0)-1ci=1-ci • 贝叶斯均衡是一个策略组合,便得对于每 个i和每个可能的ci,策略ai﹡ (ci) 最大化参 与人i的期望效用。
因为z j≡Prob﹙ c’ ≤c j ≤c j ﹡﹚= P﹙ c j ﹡﹚ ,均衡分割点ci﹡必须满足ci﹡=1P﹙ c j ﹡﹚。因此ci﹡ 和c j ﹡都必须满足 方程c﹡=1- P(1-P﹙ c ﹡﹚)。假定存在 唯一的一个c﹡,解这个方程,那么下列条 件一定成立: ci﹡ = c﹡= 1- P﹙ c ﹡﹚。 比如说,如果P(· )是定义在﹝0,2﹞上 均匀分布( P(c)≡c/2 ),那么c﹡是唯 一的,等于2/3。为了检查c﹡=2/3确实是个 均衡点,如果参与人i不提供,他的期望支 付是P(c﹡)=1/3;如果成本为c﹡时提供, 他的期望支付为1- c﹡,提供是最优的。
• 那么q2L =1/2(5/4-q1); q2H =1/2(3/4-q1) • 企业1不知道企业2的真实成本从而不知道企 业2的最优反应是q2L还是q2H ,因此企业1选 择q1最大化下列期望利润函数: • E u1 =1/2 q1 (1- q1- q2L )+ 1/2 q1 (1- q1q2H ) 解一阶条件可得企业1的反应函数: • q1﹡= 1/2 (1- q1H- q2L )=1/2(1-Eq2) • 解反应函数可得贝叶斯均衡为: • q1﹡=1/3; q2L﹡=11/24; q2H﹡=5/24
第三章 不完全信息静态博弈

二、例子
1、抓钱博弈 这个博弈有两个非对 称纯战略均衡:一个 参与人抓,另一个参 与人不抓;一个对称 混合战略均衡:每个 参与人以0.5的概率 选择抓。 (1)完全信息
参与人2 抓 参与人1 不抓 抓 -1,-1 1,0
不抓 0,1
0,0
(2)不完全信息 每个参与人有相同 参与人2 的支付结构,但若 抓 不抓 他赢了,其利润是 抓 -1,-1 1+θ1,0 (1+θi)。 θi是参 参与人1 与人的类型,参与 不抓 0 , 1+θ 0,0 人i自己知道θi,但 另一参与人不知道。 假定θ 在[-ε,+ε]区间上均匀分 i 布。
博弈方的类型 原来的静态博弈,即各 中选择行动方案 a1 , , a n 个实际博弈方
u i u i ( a 1 , , a n , i ), i 1, , n
根据海萨尼公理,假定分布函数P(θ1,…,θn)是所有 参与人的共同知识,用θ-i =(θ1,…, θi-1 ,θi+1,…,θn)表示 除i之外的所有参与人的类型组合。这样, θ= (θ1,…, θn)= (θi,θ- i)。称pi(θ-i | θi)为参与人i的条 件概率,即给定参与人i属于类型θi的条件下,他有 关其他参与人属于θ- i的概率。根据条件概率规则, p i , i p i , i p i i | i p i p i , i 这里, p (θi)是边缘概率。如果类型的分布是独立的, pi(θ-i | θi)= p (θ-i)。
2
均衡意味着两个反应函数同时成立。解两个反应函数 得贝叶斯均衡为:
q1
*
1 3
; q2
L*
完全信息博弈和不完全信息博弈例子

完全信息博弈和不完全信息博弈例子完全信息博弈和不完全信息博弈是博弈论中常见的两种博弈模型。
在完全信息博弈中,参与者对对手的策略和利益有完全了解,而在不完全信息博弈中,参与者对对手的策略和利益了解不完全。
下面将给出10个例子来说明这两种博弈模型。
1. 完全信息博弈:象棋对局象棋是一种典型的完全信息博弈。
在游戏开始之前,双方玩家对对手的棋子摆放和可能的走法有全面的了解。
每一个棋子的能力和走法都是公开的,玩家可以根据对手的走法进行推理和决策。
双方都可以清楚地看到棋盘上的所有信息,这使得象棋成为一个完全信息博弈的范例。
2. 完全信息博弈:扑克牌游戏扑克牌游戏是另一个典型的完全信息博弈。
在游戏开始之前,玩家可以看到自己的牌和公共牌,可以推断其他玩家手中可能的牌型。
玩家可以根据对手的表情、下注行为和牌型推断对手的策略,并做出相应的决策。
3. 完全信息博弈:国际象棋比赛国际象棋比赛是另一个典型的完全信息博弈。
在比赛开始之前,双方选手可以看到对手的棋子摆放和可能的走法,可以根据对手的走法进行推理和决策。
选手可以通过分析对手的行为和棋局的发展,制定出相应的策略。
4. 完全信息博弈:囚徒困境囚徒困境是博弈论中著名的例子。
在这个博弈中,两个囚犯被关押在不同的牢房中,检察官给每个囚犯提供了一个交代罪行的机会。
如果两个囚犯都选择交代,那么他们都会被判刑。
如果两个囚犯都选择保持沉默,那么他们都会被判轻刑。
如果一个囚犯交代而另一个保持沉默,那么前者将获得豁免,后者将被判重刑。
这个博弈的特点是,双方玩家知道对方的利益和策略,并可以根据对方的策略做出自己的决策。
5. 完全信息博弈:足球比赛足球比赛是一种典型的完全信息博弈。
在比赛开始之前,双方球队都可以看到对方的阵容和战术,可以根据对手的策略进行相应的调整。
球队可以根据比赛的进展和对手的表现,调整自己的战术和策略。
6. 不完全信息博弈:扑克牌对局尽管扑克牌游戏可以被看作是完全信息博弈的例子,但在某些情况下,扑克牌对局也可以被看作是不完全信息博弈。
不完全信息博弈

(0.6)
不建厂
2,1
3 ,0
不完全信息静态下市场进入的博弈树
进入E 高建厂成本 [0.4] 建 (0,-1)
不进入D (2,0) E (2,1)
N○
[0.6]
1
低建厂成本
不建
建 不建
2
D
E
(3,0) (1,-1) (4,0) (1)
D E
D
(3,0)
不完全信息静态市场进入模型 --求解思路
不妨假设:
企业1的单位成本c1是共同信息,企业2的单位成本
c2 是其私人信息,它有高成本 c2H 和低成本 c2L两种情 形,设低成本的概率为p,它是双方的共同知识。
• 给定企业 2 知道企业 1 的成本时,企业 2 将最大化其利
润函数:
π2=q2(a-c2-q1-q2),
其中c2=c2H或c2L依赖于企业2的实际成本。 由此可得企业2的反应函数为: q2*(q1, c2)=(a-c2-q1)/2 它不但依赖于企业1的产量q1,而且依赖于自己的成本 c2。分别记q2L、q2H为企业2在低成本和高成本下的最 优反应产量,分别为:
不完全信息静态市场进入模型 --期望收益
• 在位者有两个信息集:高成本类型和低成本类型, 因而有4种纯策略;潜在进入者只有进入不进入两 种纯策略。 • 海萨尼转换后,支付矩阵变为: 潜在进入者 进入 不进入 0.6,-1 3.2,0 1.2,0.2 2.6,0 1.4,-0.2 3.6,0 2,1 3,0
图示——完全信息情形
q2
q1*(q2) 1/2 1/6 1/4 5/12
在完全信息情形下,满足以上条件时, 若企业2为低成本时,纳什均衡产量为 q1*=1/4,q2L*=1/2。 若企业2为高成本时,则企业1和2的纳 什均衡产量分别为5/12和1/6。 完全信息时的纳什均衡
不完全信息静态博弈

练习
自然”以均等的概率决定得益是下述得益矩阵1的 (1)若“自然”以均等的概率决定得益是下述得益矩阵 的 ) 情况还是得益矩阵2的情况 并让博弈方1知道而不让博弈方 的情况, 情况还是得益矩阵 的情况,并让博弈方 知道而不让博弈方 2知道;( )博弈方 在T和B中选择,同时博弈方 在L和R 知道;( 中选择, 知道;(2)博弈方1在 和 中选择 同时博弈方2在 和 中进行选择。找出贝叶斯纳什均衡。 中进行选择。找出贝叶斯纳什均衡。 L T B 1,1 0,0 1 R 0,0 0,0 T B L 0,0 0,0 2 R 0,0 2,2
如果在位者是高成本的,则均衡是进入者进入, 如果在位者是高成本的,则均衡是进入者进入,在 位者默许;如果在位者是低成本的, 位者默许;如果在位者是低成本的,均衡是进入者 不进入,在位者打击。 不进入,在位者打击。 因此,如果在完全信息情况下, 因此,如果在完全信息情况下,知道在位者是高成 则进入者进入;知道在位者是低成本, 本,则进入者进入;知道在位者是低成本,则进入 者不进入。 者不进入。 但现在进入者并不知道在位者究竟是高成本还是低 成本,因此很难进行选择。 成本,因此很难进行选择。
暗标拍卖
拍卖和招投标是经济活动中普遍采用的重要交易工具, 拍卖和招投标是经济活动中普遍采用的重要交易工具,有许 多不同的方式。暗标拍卖是典型的不完全信息静态博弈。 多不同的方式。暗标拍卖是典型的不完全信息静态博弈。 暗标拍卖的基本特征:密封递交标书;统一时间公证开标; 暗标拍卖的基本特征:密封递交标书;统一时间公证开标; 标价最高者以所报标价中标。 标价最高者以所报标价中标。 这种博弈的博弈方就是所有投标人; 这种博弈的博弈方就是所有投标人;各个博弈方的策略就是 他们各自提出的标价;中标博弈方的得益是其对拍卖标的的 他们各自提出的标价; 估价与成交价格之差,未中标博弈方的得益为0.由于各博弈 估价与成交价格之差,未中标博弈方的得益为 由于各博弈 方的标书是密封递交和同时开标的, 方的标书是密封递交和同时开标的,各博弈方在选择自己的 策略之前都无法知道其他博弈方的策略, 策略之前都无法知道其他博弈方的策略,而且这是一个一次 性选择问题,所以是静态博弈问题。 性选择问题,所以是静态博弈问题。
完全信息博弈和不完全信息博弈例子

完全信息博弈和不完全信息博弈例子一、完全信息博弈的例子:1. 战争博弈:两个国家之间的战争可以被看作是一个完全信息博弈。
在这种情况下,每个国家都知道对方的军事力量、资源和战略,因此可以做出相应的决策,例如增加军事投入、调整战略等。
2. 棋类游戏:例如国际象棋、围棋等,这些游戏中,双方玩家都知道对方的棋子位置和规则,因此可以通过计算和预测对方的行动来做出最佳决策。
3. 拍卖:拍卖是一个经典的完全信息博弈。
在拍卖中,卖家和买家都了解物品的属性、市场需求和竞争对手的出价,因此可以根据这些信息来制定自己的出价策略。
4. 投标竞争:在企业之间的投标竞争中,每个企业都知道自己的成本、竞争对手的能力和市场需求,因此可以根据这些信息来制定自己的投标价格和竞争策略。
5. 股票交易:在股票市场上,投资者可以根据公司的财务报表、行业趋势和市场预期来做出投资决策。
这些信息都是公开的,每个投资者都可以获得相同的信息。
6. 价格竞争:在一个完全竞争的市场中,所有的卖方都知道其他卖方的价格和产品质量,因此可以根据市场需求和成本来制定自己的价格策略。
7. 职业博弈:在职业生涯中,每个人都可以根据自己的技能、经验和市场需求来选择自己的职业方向和工作机会。
8. 选举竞争:在政治选举中,候选人可以根据选民的偏好、政策议程和竞争对手的策略来制定自己的竞选策略。
9. 赛车比赛:在赛车比赛中,每个车手都知道自己和其他车手的技术水平、赛车性能和赛道条件,因此可以根据这些信息来制定自己的赛车策略。
10. 模拟游戏:在模拟游戏中,玩家可以根据游戏中的规则、目标和对手的行动来制定自己的游戏策略,例如《模拟城市》、《模拟经营》等。
二、不完全信息博弈的例子:1. 扑克牌游戏:扑克牌是一个典型的不完全信息博弈。
每个玩家只能看到自己的手牌和公共牌,对手的手牌是未知的。
因此,玩家需要通过对对手的行动、下注和表情的观察来推测对手的手牌和策略,并做出相应的决策。
不完全信息博弈求解方法

不完全信息博弈求解方法1. 嘿,大家想想看,贝叶斯法则不就是个超级厉害的办法嘛!就好像你去猜一个盒子里有啥,先根据经验猜一下,然后随着新信息的出现不断调整猜测,这多妙啊!比如玩猜数字游戏,一开始你可能瞎猜个 50,然后别人说大了,你不就赶紧调整范围往小了猜嘛!贝叶斯法则就是这样帮我们在不完全信息下越来越接近真相。
2. 还有呢,最大期望策略也是超有用的呀!这不就像你在走路,会选择那条看起来最有可能带你到目的地的路嘛!比如说你在商场找一家店,你会根据之前的经验和现在看到的指示牌,选择那个最有可能找到店的方向走,这就是最大期望策略在起作用呢!3. 哎呀呀,精炼贝叶斯均衡也是很关键的哦!就好像两个人跳舞,要配合得特别好才行!比如在谈判的时候,双方都要根据对方的表现和可能的反应来调整自己的策略,达到一种平衡,这就是精炼贝叶斯均衡的魔力呀!4. 大家别忘了信号传递呀!这就如同黑夜中的灯塔,给你指引方向呢!举个例子,公司面试时,候选人展示各种证书和经历,就是在给公司传递信号,让公司更好地了解自己呀!5. 那逆向归纳法也是不能小瞧的呢!就像是你倒着推理一个事情的过程。
好比下棋,你会想如果我走这一步,对方可能怎么回应,然后依次往前推,这不就是逆向归纳法嘛!6. 重复博弈也很有意思呀!是不是像和老朋友一次又一次的互动呀?就像你和邻居经常打交道,慢慢就知道对方的脾气和习惯了,然后根据这些来调整自己的行为,多有意思呀!7. 动态规划也得重视起来呀!这就好像你在规划一个漫长的旅程,一步一步地安排。
比如说在项目管理中,根据不同阶段的情况,合理安排资源和时间,不就是动态规划嘛!8. 信息甄别也超重要的啦!这就像在一堆石头里找宝石,得有方法去分辨呀!像在招聘中设置不同的考核环节,就是为了甄别出真正适合的人才呢!9. 最后呀,策略性行动可不能忽略哦!这就如同下棋时的布局,要有长远眼光呢!比如企业在市场上做出一些行动来影响竞争对手的判断,这就是策略性行动的威力呀!总之,这些不完全信息博弈求解方法都很有用,大家要好好掌握呀!。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
不完全信息博弈博弈论在20世纪70年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出一种特别的魅力。
我们主要介绍不完全信息静态博弈与不完全信息动态博弈的一些基本知识,目的是给读者对不完全信息博弈理论及其应有一个初步的了解。
在不完全信息博弈里,参与人并不完全清楚有关博弈的一些信息。
大多数纸牌游戏是不完全信息博弈。
在桥牌里,你并不知道你伙伴手中的牌,也并不知道坐在左右两位对手手里的牌。
你在作决策时,必须对其他三位手中的牌作一个估计,而没有确切的信息。
在拍卖商品或工程招投标中,参加拍卖的潜在买主愿意为拍卖品所支付的最高价格或参加工程招投标的投标者愿意为工程开出的最低价格只能是各个潜在买主或投标者心中的秘密,其他人是不清楚的,即使潜在买主或投标者告诉其他人他们愿支付的最高价格或最低价格,其他人也不会相信他们说的是真的。
当你与一个陌生人打交道时,你并不知道他的特征,如喜欢什么,不喜欢什么。
事实上,即使与你长期共事的人,也很难说你对他有完全的了解;当你想买一件古董或名画时,你并不知道卖主愿意脱手的最低价格是多少,或买主愿意出的最高价格是多少;当一个企业想进入某个市场时,它并不清楚已在市场上的企业的成本函数。
如此等等,这样的例子举不胜举。
类似上述这些不满足完全信息假设的博弈称为不完全信息博弈。
当然,如果对博弈对手一无所知,那么,也就无从博弈。
现实生活中,大多数情况下,虽然对于对手的一些特征不完全了解,但总不至于一无所知。
例如,打牌时,虽然不知道对手具体拿什么牌,但根据自己的牌,还是可以对手的牌有一个估计的,而且,随着牌局的展开,人们会不断改变这些估计。
这些估计,可以用数学上的“概率分布”来表示。
在博弈论中,贝叶斯博弈所指的是:博弈参与者对于对手的收益函数没有完全信息(incomplete information);因此贝叶斯博弈也被称为不完全信息博弈。
在约翰·海萨尼的研究框架下,我们可以将自然(Nature)作为一个参与者引入到贝叶斯博弈中。
自然将一个随机变量赋予每个参与者。
这个随机变量决定了该参与者的类型(type),并且决定了各个类型出现的概率、或是概率密度函数。
在博弈进行过程中,根据每个参与者的类型空间所赋的概率分布,自然替每个参与者随机地选取一种类型。
海萨尼的这一方法将贝叶斯博弈从不完全信息转化为不完美信息(此时,有的参与者不知道该博弈的历史)。
参与者的类型决定了该参与者的收益函数。
在贝叶斯博弈中,不完全信息所指的是,至少存在一个参与者,他(她)不能确定其他某个参与者的类型,从而也不能确定其收益函数。
不完全信息静态博弈中的归纳推理1.古巴导弹危机二战后,美国和苏联两个超级大国形成了对峙,组成了两大敌对阵营。
1962年苏联偷偷地将导弹运送到古巴对付美国,但却被美国的侦察机发现,于是美国决定对古巴进行军事封锁,美苏之间的战争一触即发。
面对美国的反应,苏联面临着是将导弹撤回国还是坚持部署在古巴的选择。
而对于美国,则面临着是挑起战争还是容忍苏联的挑衅行为的选择。
博弈矩阵如下:在这个博弈中,假设Va,Vb∈{1,-4},如果双方都选择进攻,则会发生一场战争。
对每一方而言,如果决策者属于鹰派,则会选择进攻,其支付为1;如果决策者属于鸽派,则可能会选择撤退,其支付为-4。
每一方都知道自己属于哪一派,但这一信息是自己的隐私,所以说这是一个不完全信息博弈问题。
又因为双方的行动有先后顺序,但是后行动者美国并不知道先行动者苏联所采取的行动,只能通过所掌握的有限信息进行归纳,从而预测出对方可能会采取何种策略,因此它也是一个静态博弈。
在美国对苏联的行动考虑对策时,可以选择的策略有多种,从默许到温和的制裁直至全面对抗,事实上,它选择了最强烈的反应并取得了成功。
美国这样推理:如果苏联采取进攻,那么当Va=1时,他的最好反应是进攻;而当Va=-4时的最好反应是撤退。
如果苏联选择撤退,那么无论他的私人信息是什么,他的最好反应都是进攻。
此外,根据美国情报部门所掌握的信息和对对手苏联决策层的估计,即赫鲁晓夫的强硬姿态背后苏联内部对此各种态度的冲突和综合,苏联的实力、赫鲁晓夫执行其意旨的能力等估计的基础上,美国当局做出了正确的反应。
虽然苏联也可以这样推理,但是赫鲁晓夫错误地估计了对方的反应,认为美国会容忍这种后果,而事实相反。
所以说,这是一种不完全归纳推理,即从若干个个别性前提推出一个特称结论的推理。
2.海萨尼转换在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型是不清楚的。
如果一些局中人不知道另一些局中人的支付函数,或支付函数不是共同知识,局中人就不知道他在与谁博弈,博弈的规则是没有定义的。
因而在1967年以前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。
海萨尼提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然”。
自然首先行动,它决定每个局中人的特征。
每个局中人知道自己的特征,但不知道别的局中人特征。
这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N的行动选择,第二阶段是除N外的局中人的静态博弈。
这种转换被称为“海萨尼转换”,这个转换把“不完全信息”转变成为完全但不完美信息,从而可以用分析完全信息博弈的方法进行分析。
什么是不完全信息动态博弈在动态博弈中,行动有先后次序;在不完全信息条件下,博弈的每一参与人知道其他参与人的有哪几种类型以及各种类型出现的概率,即知道“自然”参与人的不同类型与相应选择之间的关系,但是,参与人并不知道其他的参与人具体属于哪一种类型。
由于行动有先后顺序,后行动者可以通过观察先行动者的行为,获得有关先行动者的信息,从而证实或修正自己对先行动者的行动。
在不完全信息动态博弈一开始,某一参与人根据其他参与人的不同类型及其所属类型的概率分布,建立自己的初步判断。
当博弈开始后,该参与人就可以根据他所观察到的其他参与人的实际行动,来修正自己的初步判断。
并根据这种不断变化的判断,选择自己的策略。
相关例子以下是几个关于不完全信息动态博弈的例子:1.黔驴技穷精炼贝叶斯均衡是完全信息动态博弈的子博弈精炼纳什均衡与不完全信息静态博弈的贝叶斯纳什均衡的结合。
贝叶斯方法是概率统计中的一种分析方法。
它是指根据所观察到现象的有关特征,并对有关特征的概率分布的主观判断(即先验概率)进行修正的标准方法。
中国著名成语故事黔驴技穷,就是贝叶斯方法思想的一个典型表达。
老虎没有见过驴子,因而不知道自己比驴子强还是弱。
老虎的战略是:如果自己弱,那就只能躲,如果自己强,那就吃驴子。
对于自己并不了解驴子,老虎的做法是不断试探,通过试探,修改自己对驴子的看法。
如果驴子表现温顺无能,老虎就认为驴子是美食的概率比较大,起初驴子没有反应,老虎认为驴子不像强敌,胆子越来越大。
后来驴子大叫,老虎以为驴子要吃它,吓的逃走,但后来想想,又觉得不一定,于是继续试探,直到驴子踢老虎,老虎才觉得驴子“仅此技耳”,于是采取自己强时的最优行动——吃驴子。
2.信号传递由于信息不完全,每个人都希望向对方传递对自己有利的信号。
比如,在招聘时,应聘者总是显示自己最好的一面。
谈判中,企业总是把最能显示自己实力的一面展示出来。
公司越来越注意企业形象的塑造。
女孩子总是把自己打扮得漂亮。
人们总是把最好的衣服穿在外面。
等等。
问题是,对方不一定相信你所传递的信号是真实的。
有的信号,一下子是难以识别真伪的,需要时间。
所以,“百年老店”是最好的信号传递方式。
曾经有几家美国的企业联合控告日本公司倾销,美国法院的判决是:控告不成立,因为不可能有哪家公司能够长期采用低于成本的价格。
所以,长期采取低价策略的企业传递的信号是:我是低成本的,你成本高,别来。
长期在CCTV黄金时段做广告的厂商传递的信号是:我有实力,企业经营一直不错。
出示自己的高学历证书和各种获奖证书的求职者传递的信号是:我是一个优秀的应聘者。
有的小公司对业务采取不冷不热的态度,传递的信号是:我不愁没业务做。
故意装着要离开的顾客传递的信号是,把价格再降点,否则我走了。
初恋时经常找不怎么符合逻辑的借口去找对方但又不说出口,传递的信号是,我对你有意思,你呢?当然指望是对方先说出来。
由于对方不一定相信你传递的信号,而甄别信号需要成本,所以,一定要传递可信(可观测)、并且甄别成本低的信号。
为什么招聘单位看重学历,因为学历容易甄别,而且比起能力的描述来,相对可靠;为什么顾客喜欢买名牌产品,因为名牌是经过很多年才形成的,广告、产品质量、服务质量等因素起了很大的作用,名牌传递的信号就是:质量好,服务好。
教育信号传递模型是分析劳动力市场上工人的教育水平如何传递有关能力的信息的模型。
在这个模型里,企业的生产率取决于工人的能力。
工人的能力可能高可能低,工人本人知道,雇主不知道;教育本身不改进工人的能力,但却可以传递有关这种能力的信息,原因是,教育要花费成本,而高能力的人的教育成本相对于低能力的人的要低,因为一个笨蛋要比一个聪明人遭受更大的痛苦才能完成必修的课程,拿到文凭。
这样,文凭就成为能力的象征,尽管它不一定是能力的源泉。
高能力的人要把自己与低能力的人分开,就要选择受更多的教育,企业看到受过教育的人就推断是高能力,支付高工资。
如果这个模型是正确的话,我们也许不应该简单地因为所学内容无用就否定一种教育制度,如中国古代社会的科举制度,它或许也具有信号传递的功能。
一种行动要起到某种传递信息的功能,行动者必须为此付出足够的成本,否则,所有其他类型的参与者都会模仿。
这也就是说,只有负担成本的行动才是可信的。
简单地告诉对方“我是低成本企业”、“我是强者”、“我是好人”、“我是高能力的人”之所以不传递信息,就是因为这类“行动”不花成本,谁都可以效仿。
低成本企业要把自己与高成本企业分开从而阻止进入者进入,就得定一个比短期垄断价格低的价格牺牲一部分短期利润;强者要把自己与弱者分开以免遭持强欺弱者的进攻,就要吃比一般情况下多的辣椒;好人要把自己与坏人分开,就得干更多更大的好事;高能力的人要把自己与低能力的人分开,就得接受没有实际价值的教育,如此等等。
这种为传递信息支付的成本是由信息的不完全性导致的。
那么,是不是说不完全信息就一定是件坏事呢?不一定。
在有限次重复囚徒困境博弈中,不完全信息可以导致合作的后果,而在完全信息下是不可能的,理由是,当信息不完全时,当事人为了获得合作带来的长期利益,不愿过早地暴露自己的本性。
说得更通俗一点,在一种长期的关系中,一个人干好事还是坏事常常不取决他在本性上是好人还是坏人,而很大程度上取决于其他人在多大程度上认为他是好人。
给定其他人并不知道自己的真实面目,一个坏人也会在相当长的时间内干好事。
从这个意义上讲,过早地揭穿坏人的“真面目”也许不是一件好事,因为坏人干好事本身并不一定是件坏事。