博弈论与信息经济学
Game Theory and Economics of Information
主讲:景普秋
单位:山西财经大学经济学院
E-mail: pqjing@
博弈论基本思想
人们在日常生活中进行着博弈,与配偶,朋友,陌生人,老板/员工,教授等。
类似的博弈也在商业活动、政治和外交事务、战争中进行着——在任何一种情况下,人们相互影响以达成彼此有利的协议或者解决争端。
博弈论为众多学科提供了分析的概念和方法:经济学和商学,政治科学,生物学, 心理学和哲学。
如何在“博弈”中获胜?
日常生活中的博弈(“游戏”)往往指的是诸如赌博和运动这样的东西:
赌抛硬币
百米赛跑
打网球/橄榄球
How can you win such games?
许多博弈都包含着运气、技术和策略。
策略是为了获胜所需要的一种智力的技巧。它是对于如何最好地利用身体(物质)的技巧的一种算计。
什么是策略博弈?
What is a Game of Strategy?
策略思考本质上涉及到与他人的相互影响。其他人在同一时间、对同一情形也在进行类似的思考。
博弈论就是用来分析这样交互式的决策的。
理性的行为指的是:明白自己的目的和偏好,同时了解自己行动的限制和约束,然后以精心策划的方式选择自己的行为,按照自己的标准做到最好。
博弈论对理性的行为又从新的角度赋予其新的含义——与其他同样具有理性的决策者进行相互作用。
博弈论是关于相互作用情况下的理性行为的科学。
如何在博弈中获胜?
…… 真的能在博弈中(总是)获胜吗?
对手和你一样聪明!
许多博弈相当复杂,博弈论并不能提供万无一失的应对办法。
例1:无谓竞争(The GPA Rat Race)
你所注册的一门课程按照比例来给分:无论卷面分数是多少,只有40%的人能够得优秀,40%的人能得良好。
所有学生达成一个协议,大家都不要太用功,如何?想法不错,但无法实施!稍加努力即可胜过他人,诱惑大矣。
问题是,大家都这么做。这样一来,所有人的成绩都不比大家遵守协议来得高。而且,大家还付出了更多的功夫。
正因为这样的博弈对所有参与者存在着或大或小的潜在成本,如何达成和维护互利的合作就成为一个值得探究的重要问题。
存在双赢的博弈吗?
例2:焦点博弈 “We Can’t Take the Exam,
Because We Had a Flat Tire”
两个学生想要推迟考试,谎称由于返校途中轮胎漏气,未能很好地备考。
教授分别对他们提出了问题:“哪个轮胎漏气?”如何应答?
他们本应该预计到教授的招数,提前准备好答案。
在博弈中,参与者应该向前看到未来的行动,然后通过向后推理,推算出目前的最佳行动。
如果双方都没有准备,他能够独立地编出一个相互一致的谎言吗?
例2:焦点博弈 “We Can’t Take the Exam,
Because We Had a Flat Tire”
“乘客侧前轮”看起来是一个合乎逻辑的选择。
但真正起作用的是你的朋友是否使用同样的逻辑,或者认为这一选择同样显然。并且是否你认为这一选择是否对他同样显然;反之,是否她认为这一选择对你同样显然。……以此类推。
也就是说,需要的是对这样的情况下该选什么的预期的收敛。这一使得参与者能够成功合作的共同预期的策略被称为焦点。心有灵犀一点通。
例2:焦点博弈 “We Can’t Take the Exam,
Because We Had a Flat Tire”
我们无法从所有这样的博弈的结构中找到一般和本质的东西,来保证这样的收敛。
某些博弈中,由于偶然的外因可以对策略贴标签,或者参与者之间拥有某些共同的知识体验,导致了焦点的存在。
没有某个这样的暗示,默契的合作就完全不可能。
例3:为什么教授如此苛刻?
许多教授强硬地规定,不进行补考,不允许迟交作业或论文。
教授们为何如此苛刻?
如果允许某种迟交,而且教授又不能辨别真伪,那么学生就总是会迟交。
期限本身就毫无意义了。
避免这一“滑梯”通常只有一种办法,就是“没有例外”的策略。
例3:为什么教授如此苛刻?
问题是,一个好心肠的教授如何维持如此铁石心肠的承诺?
他必须找到某种使拒绝变得强硬和可信的方法。
拿行政程序或者学校政策来做挡箭牌
在课程开始时做出明确和严格的宣布
通过几次严打来获得“冷面杀手”的声誉
导论
博弈均衡与一般均衡
博弈论与诺贝尔经济学奖获得者
博弈论的基本概念与类型
主要参考文献
导论
一、博弈均衡与一般均衡
案例:囚犯困境
-6,-6
0,-9
坦白
-9,0
-1,-1
抵赖
坦白
抵赖
支付
嫌疑人B
嫌疑人A
与传统微观经济学的比较
一致性
利益最大化原则
均衡原则
不一致
人与人之间的关系-个人理性导致集体非理性-设计协调性机制-满足个人理性前提下达到集体理性
信息不完全-委托-代理理论、信号传递与信息筛选模型
导论
二、博弈论与诺贝尔经济学奖获得者
1994年诺贝尔经济学奖获得者
美国人约翰-海萨尼(John C. Harsanyi) 和美国人约翰-纳什(John F. Nash Jr.)以及德国人莱因哈德-泽尔腾(Reinhard Selten)
获奖理由:在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响 。
约翰·纳什 1928年生于美国
约翰·
海萨尼 1920年生于美国
莱因哈德·泽尔腾,1930年生于德国
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞(William Vickrey)
获奖理由:前者在信息经济学理论领域做出了重大贡献,尤其是不对称信息条件下的经济激励理论的论述;后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献。
詹姆斯·莫里斯 1936年生于英国
威廉·维克瑞,1914-1996,生于美国
2001年诺贝尔经济学奖获得者
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由:在“对充满不对称信息市场进行分析”领域做出了重要贡献。
约瑟夫·斯蒂格利茨,1943年生于美国的印第安纳州,1967年获美国麻省理工学院博士头衔,曾担任世界银行的首席经济学家,现任美国哥伦比亚大学经济学教授
乔治·阿克尔洛夫 1940年生于美国的纽黑文,1966年获美国麻省理工学院博士头衔,现为美国加利福尼亚州大学经济学教授。
迈克尔·斯彭斯 1948年生于美国的新泽西,1972年获美国哈佛大学博士头衔,现兼任美国哈佛和斯坦福两所大学的教授。
2005年诺贝尔经济学奖获得者
以罗伯特·奥曼色列经济学家罗伯特-奥曼(Robert J. Aumann)和美国经济学家托马斯·谢林(Thomas C. Schelling)
获奖原因:“通过博弈论分析加强了我们对冲突和合作的理解”所作出的贡献而获奖。
罗伯特·奥曼 托马斯·谢林
导论
三、博弈论的基本类型
合作博弈与非合作博弈
合作博弈(cooperative game)
达成有约束力的协议(binding agreement),强调团体理性,强调效率、公正、公平
非合作博弈(non-cooperative game)
强调个人理性,其结果可能有效率,也可能无效率。
纳什均衡(NE)
子博弈完美纳什均衡(SPNE)
贝氏纳什均衡(BNE)
完美贝氏纳什均衡(PBNE)及序贯均衡(SE)
完全信息 不完全信息
静态
动态
非合作博弈的基本分类
静态博弈与动态博弈
(static games and dynamic games)
同时决策或者同时行动的博弈属于静态博弈;先后或序贯决策或者行动的博弈,属于动态博弈
即使决策或行动有先后,但只要局中人在决策时都还不知道对手的决策或者行动是什么,也算是静态博弈
完全信息博弈与不完全信息博弈
(games of complete information and
games of incomplete information)
按照大家是否清楚对局情况下每个局中人的得益。
“各种对局情况下每个人的得益是多少” 是所有局中人的共同知识(common knowledge)。
据“共同知识”的掌握分为完全信息与不完全信息博弈。
完美信息博弈与不完美信息博弈
(games with perfect information and
games with imperfect information)
是关于动态博弈进行过程之中面临决策或者行动的参与人对于博弈进行迄今的历史是否清楚的一种刻划。
如果在博弈进行过程中的每一时刻,面临决策或者行动的参与人,对于博弈进行到这个时刻为止所有参与人曾经采取的决策或者行动完全清楚,则称为完美信息博弈;否则位不完美信息。
零和博弈与非零和博弈
(zero-sum game and non-zero-sum game)
如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为零,这个博弈就叫零和博弈;
相反,如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为零,这个博弈就叫非零和博弈。
零和博弈是利益对抗程度最高的博弈。
常和博弈与非常和博弈
(constant-sum game and variable-sum game)
如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为一个常数,这个博弈就叫常和博弈;
相反,如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为一个常数,这个博弈就叫非常和博弈。
常和博弈也是利益对抗程度最高的博弈。
非常和(变和)博弈蕴含双赢或多赢。
导论
四、主要参考文献
张维迎著,《博弈论与信息经济学》,上海三联书店、上海人民出版社,1996年版。
Roger B. Myerson著:Game Theory(原文版、译文版),中国经济出版社,2001年版。
王则柯、李杰编著,《博弈论教程》,中国人民大学出版社,2004年版。
艾里克.拉斯缪森(Eric Rasmusen)著,《博弈与信息:博弈论概论》,北京大学出版社,2003年版。
因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著,《信息经济学引论:激励与合约》,上海财经大学出版社,2004年版。
施锡铨编著,《博弈论》上海财大出版社,2000年版。
谢识予编著,《经济博弈论》,复旦大学出版社,2002年版。
谢识予主编,《经济博弈论习题指南》,复旦大学出版社,2003年版。
课程主要内容
第一章 完全信息静态博弈
第二章 完全信息动态博弈
第三章 不完全信息静态博弈
第四章 不完全信息动态博弈
第五章 委托-代理理论
第六章 逆向选择与信号传递
第一章 完全信息静态博弈
博弈论的基本概念及战略式表述
纳什均衡
纳什均衡应用举例
混合战略纳什均衡
纳什均衡的存在性与多重性
第一节
博弈论的基本概念
与战略式表述
博弈论的基本概念与战略式表述
博弈论(game theory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈的战略式表述:G={N,(Si)iN,(Ui)iN}
有三个基本要素:
(1)参与人(players)iN={1,2,…,n} ;
(2)战略(strategies),siSi(战略空间);
(3)支付(payoffs),ui=ui(s-i,si)。
案例1:囚犯困境
-6,-6
0,-9
坦白
-9,0
-1,-1
抵赖
坦白
抵赖
支付
嫌疑人B
嫌疑人A
均衡与均衡结果
均衡战略(坦白,坦白)
均衡支付(-6,-6)
第二节 纳什均衡
占优战略均衡
重复剔除的占优战略均衡
纳什均衡
完全信息静态博弈的几点特性
同时出招,出招一次;
知道博弈结构与游戏规则(共同知识);
不管是否沟通过,无法做出有约束力的
承诺(非合作)
一、占优战略均衡
占优战略:不管对手战略为何,该参与人可找到一最佳战略。
定义:在博弈G={N,(Si)iN,(Ui)iN}中,如果对所有的参与人i,si*是它的占优战略,那么所有参与人选择的战略组合(s1*,…,sn*)成为该对策的占优战略均衡。
案例1:囚犯困境
-6,-6
0,-9
坦白
-9,0
-1,-1
抵赖
坦白
抵赖
支付
嫌疑人B
嫌疑人A
“囚犯困境” 的扩展
两个寡头企业选择产量
公共产品的供给
军备竞赛
经济改革
结论:一种制度安排,要发生效力。必须是一种纳什均衡;否则,制度安排便不能成立。
价格大战
5,5
1,6
高价
6,1
3,3
低价
高价
低价
支付
百事可乐
可口可乐
案例2:智猪博弈
猪圈里圈两头猪,一头大猪,一头小猪。猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就要付出2个单位的成本。若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。支付如表。
案例2:智猪博弈
0,0
9,-1
等待
4,4
5,1
按
等待
按
支付
小猪
大猪
智猪博弈的扩展
股份公司承担监督经理职能的大股东与小股东
股票市场上炒股票的大户与小户
市场中大企业与小企业在研发、广告上的博弈
公共产品的提供(富户与穷户)
改革中不同利益分配对改革的推动
二、重复剔除的占优战略均衡
绝对劣势战略:si是一绝对劣势战略当且仅当存在另一战略si’Si使得ui(si,s-i)< ui(si’,s-i) 对所有s-iS-i均成立。( si’ 未必是优势战略)
重复剔除的占优战略均衡:逐次删去绝对劣势战略得到唯一的占优战略。
例:重复剔除的占优战略均衡
4,5
2,7
1,1
3,4
0,2
2,3
参与人2
L M R
参与人1
U
D
例 重复剔除的占优战略均衡
2,8
9,6
3,0
3,6
8,4
2,1
6,2
5,1
4,3
参与人2
L M R
参与人1
U
D
M
例 重复剔除的占优战略均衡
5,3
2,4
0,2
3,0
0,1
0,2
3,0
1,3
1,0
参与人2
L M R
参与人1
U
D
M
三、纳什均衡
定义:指一战略组合有以下特性:当参与人持此战略后,任一参与人均无诱因偏离这一均衡;s*=(s1*,…,sn*)=(si*,s-i*)是一纳什均衡,当且仅当对所有参与人而言,ui (si*,s-i*) ui (si’,s-i*)对所有si’Si 均成立。简单而言,当s1*是对s2*的最适反应,s2*也是s1*的最适反应时,(s1*,s2*)就是二人博弈的纳什均衡。
命题1:纳什均衡在占优战略重复剔除解法中不会被剔除
命题2:重复剔除的严格占优战略均衡一定是纳什均衡。
例 纳什均衡求解
6,6
3,5
3,5
5,3
0,4
4,0
5,3
4,0
0,4
参与人2
L M R
参与人1
U
D
M
作业
4,8
5,8
6,6
8,5
5,8
5,7
7,6
6,6
7,7
乙
左 中 右
上
中
下
甲
一个两人同时博弈的支付竞争如下所示,试求纳什均衡。是否存在重复剔除占优战略均衡?
第三节 纳什均衡应用举例
古诺(Cournot)寡头模型
沙滩卖冰
豪泰林(Hotelling)价格竞争模型
公共地的悲剧
一、古诺寡头模型
特点:存在两家厂商;同时行动确定产量。
通过预测另一家厂商的产量来选择自己的利润最大化产量,寻求预测均衡。
厂商1表示为:max p(y1+y2e)y1-c(y1),得出y1=f1(y2e),同理得出y2=f2(y1e),称为反应函数,两条曲线的交点为古诺模型的解。
古诺寡头模型的纳什均衡
反应函数
y1=f1(y2)
y2=f2(y1)
(y1*,y2*)
是该对策的
纳什均衡解。
y1* y12y11 y10
y2*
y22
y21
y1
o
y2
f1(y2)
f2(y1)
例题:古诺模型的解
假设p=a-(y1+y2),C1=y1c,C2=y2c
则根据利润最大化的一阶条件分别得到反应函数
y1=f1(y2)=(a-y2-c)/2,
y2=f2(y1)=(a-y1-c)/2,
求出均衡产量为(1/3(a-c),1/3(a-c)),为纳什均衡,
均衡利润为(1/9(a-c)2,1/9(a-c)2)
古诺模型的解:与垄断市场的比较
假设为一垄断企业,则有:
Max =y(a-y-c),
得到垄断企业的最优产量
y=1/2(a-c) y1+y2=2/3(a-c)
垄断利润为=1/4(a-c)2 2/9(a-c)2
寡头竞争的总产量大于垄断产量的原因在于每个企业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应。
寡头厂商与垄断厂商的比较
1/3(a-c) 1/2(a-c)
1/2(a-c)
y1
o
y2
f1(y2)
f2(y1)
1/3(a-c)
0 ¼ ½ ¾ 1
二、沙滩卖冰
假设游客沿沙滩{0,1}间均匀分布,现有两位卖冰者,他们会将摊位选在哪个位置?假设游客就近购买。
生活中还有哪些类似的例子?
三、豪泰林模型
寡头企业竞争战略是价格
伯川德(Bertrand)模型:产品同质,均衡价格等于边际成本,类似于完全竞争市场均衡。
豪泰林(Hotelling)模型:存在产品差异,均衡价格不等于边际成本,垄断性提高
假定长度为1的线性城市,消费者均匀分布在[0,1]区间内,分布密度为1;两个商店1、2分别位于x=0,x=1,即城市的两端;消费者购买商品的旅行成本与商店的距离成反比,单位距离的成本为t;住在x的消费者在两个商店之间是无差异的,需求D1=x,D2=1-x,x满足:p1+tx=p2+t(1-x),解得x=(p2-p1+t)/2t。
0 x 1
商店1 商店2
豪泰林模型:以空间上差异为例
豪泰林模型:以空间上差异为例
根据两个商店的利润函数,1=(p1-c)x, 2=(p2-c)(1-x)选择使利润最大化的价格,得到一阶条件,求得p1*=p2*=c+t,均衡利润1=2=t/2
旅行成本越高,产品差异越大,均衡价格从而均衡利润也越高。
原因:随着旅行成本上升,不同商店出售的产品之间的替代性下降,每个商店对附近的消费者的垄断能力加强,
当旅行成本为零时,不同商店的产品之间具有完全的替代性,则为伯川德均衡结果。
四、公共地的悲剧
生物学家和生态学家哈丁(Garrett Harden)在《科学》(1968年,第162卷)发表《公地的悲剧》。
考虑一块对所有的人都开放的牧场,在着的制度下,可以预期,每一个放牧的人都会在公地上放牧尽可能多的牲口。
增加一头牲口既有正效用,也有负效用。
正效用是牲口的销售收入,增加一头为+1
负效用使每增加一头带来的过度放牧的损失,每一个放牧着承担-1/n
放牧者合理的决策是增加牲口,直至马瘦毛长,公地毁灭。
四、公共地的悲剧
资源没有排他性产权:草地放牧、公海捕鱼、小煤窑的过度开发;另一类是人们向其中排放废物的公地。
草地放牧:n个农民,每个拥有羊的数量为gi,G=gi,v(G)代表每只羊的价值,与草地上放牧的总数G相关,饲养量增加到一定程度,随着数量继续增加,羊的价值会下降,即v’(G)<0
农民的利润函数i=giv(gj)-gic
最优化的一阶条件:i/gi=v(G)+giv’(G)-c=0
增加一只羊有正效应(羊的价值)、负效应(新增羊使之前所有羊的价值下降)
个人边际成本小于社会边际成本,个人最优决定的饲养总量大于社会最优决定的饲养总量
五、斗鸡博弈
0,0
0,2
退
2,0
-3,-3
进
退
进
1
2
支付
“斗鸡博弈”的扩展
夫妻间吵架
警察与游行队伍
公共产品的供给(两富户修路)
第四节 混合战略纳什均衡
混合战略(mixed strategies)
定义:*=(1*,…,n*)=(i*,-i *)是一纳什混合战略均衡,当且仅当对所有参与人而言, i*是-i*的最适反应,ui(i*,-i *) ui(I’,-i *),对所有i’i成立)。
持混合战略的前提是在均衡时两种战略的报酬会相等,是预期支付最大化的推导结果。
掷硬币
-1,1
1,-1
反面
1,-1
-1,1
正面
反面
正面
1
2
支付
p 1-p
q
1-q
参与人1:max Eu=q(p(-1)+(1-p)1)+(1-q)(p1+(1-p)(-1))
=-pq+q-pq+p-pq-1+q+p-pq
=-4pq+2q+2p-1
一阶条件为零求得:p=1/2
掷硬币的分析
给定参与人1(q,1-q),参与人2的支付是:q+(-1)(1-q)(正面)=(-1)q+(1-q)(反面);
给定参与人2(p,1-p),参与人1的支付为:
p(-1)+(1-p)(正面)=p+(-1)(1-p)(反面);
求得(1/2,1/2)是纳什混合战略均衡
如果两种战略报酬不相等,那么就变为
纯战略(pure strategies) 了。
混合战略均衡的博弈原则
两博弈方不能让对方知道或猜到自己的选择,因而必须在决策时利用随机性;
两博弈方选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过针对性地倾向某一策略而在博弈中占上风。
例:在掷硬币的博弈中,参与人1选正面、反面的概率q,1-q,一定要使参与人2选正面的和反面的期望得益相等。
单纯战略与混合战略的定义
G={N,S,U}是一个战略式有限博弈,参与人i的战略空间S中的任一元素si称为i的一个单纯战略(pure strategy);定义在Si上的一个概率分布函数pi(si)代表了一个混合战略(mixed strategy)——这个战略的内容是:参与人i以概率pi(sij)选择单纯战略sij,而pi(sij)=1。
单纯战略是混合战略的特例,因为任一单纯战略si都可以理解为i以概率1选择si,以0概率选取其他所有单纯战略。
引入混合战略,参与人的目标需要修改为“最大化自己的期望支付”
Selton:小偷和守卫的博弈
一小偷欲偷窃有一守卫看守的仓库,如果小偷偷窃时守卫在睡觉,则小偷就能得手,偷得价值为V的赃物;如果小偷偷窃时守卫没有睡觉,则小偷就会被抓住。设小偷被抓后要坐牢,负效用为-P,守卫睡觉而未遭偷窃有S的正效用,因睡觉被窃要被解雇,其负效用为-D。而如果小偷不偷,则他既无得也无失,守卫不睡意味着出一份力挣一分钱,他也没有得失。
0,0
0,S
不偷
-P,0
V,-D
偷
不睡
睡
小偷
守卫
支付
小偷与守卫的博弈
守卫得益(睡)
S
0
1
pt(小偷偷的概率)
pt*
pt*/
-D
-D/
小偷的混合策略
S到-D连线的纵坐标是在横坐标对应的小偷“偷”窃概率下的守卫选择“睡”的期望得益,即S(1-pt)+(-D)pt
加重对守卫的处罚在短期中的效果是使守卫真正尽职,但在长期中恰恰是会降低盗窃发生的概率(激励的悖论)
小偷得益(偷)
V
0
1
Pg(守卫睡的概率)
Pg*
Pg*/
-P
-P/
守卫的混合策略
小偷的混合策略分布不受P的影响,因此政府加重对小偷的惩罚在长期中并不能抑制盗窃,最多只能抑制短期的盗窃发生率,它的作用主要是使守卫可以更多地偷懒
齐威王田忌赛马
古代齐威王与大将田忌赛马,田忌的谋士孙膑运用计谋帮助田忌以弱胜强。
比赛规则:田忌与齐威王各出三匹马,一对一比赛三场,每一场的输方要赔1000斤铜给赢方。双方的马按实力都可以分为上、中、下,但齐威王的上、中、下均优于田忌的上、中、下。实际上,田忌的上马、中马要优于齐威王的中马、下马。
比赛结果:田忌连输三场;后孙膑建议,以上对中、以中对下、以下对上,结果以2:1赢得比赛。
齐威王田忌赛马
前述为单方面运用策略的故事,如果齐威王预料到田忌的做法,必然会改变各匹马出场的次序。
本博弈中博弈双方的利益是完全对立的,是严格竞争的零和博弈,不会有纯策略纳什均衡,必然是一个混合策略均衡。
假设齐威王采取六种战略的概率分别为pa,pb,pc,pd,pe,pf(加总为1),则田忌采取六种战略的期望得益相等,则得出齐威王与田忌均以1/6的相同概率随机选择各自的六个纯策略,构成本博弈唯一的混合策略纳什均衡。
3,-3
1,-1
1,-1
-1,1
1,-1
1,-1
下中上
1,-1
3,-3
-1,1
1,-1
1,-1
1,-1
下上中
1,-1
1,-1
3,-3
1,-1
1,-1
-1,1
中下上
1,-1
1,-1
1,-1
3,-3
-1,1
1,-1
中上下
-1,1
1,-1
1,-1
1,-1
3,-3
1,-1
上下中
1,-1
-1,1
1,-1
1,-1
1,-1
3,-3
上中下
下中上
下上中
中下上
中上下
上下中
上中下
齐威王
田忌
齐威王田忌赛马
齐威王田忌赛马
在上述混合策略下,齐威王的期望得益为1/6(3+1+1+1+1-1)=1;田忌的期望得益为1/6(1-3-1-1-1-1)=-1,即多次进行这样的赛马,齐威王平均每次能赢田忌1000斤铜,这是因为齐威王三匹马的总体实力略胜田忌三匹马总体实力的缘故
混合策略反应函数
将博弈方的策略空间扩展到包括混合策略,将纳什均衡扩展到包括混合策略纳什均衡以后,求纳什均衡反应函数的分析方法也可以扩展到求混合策略纳什均衡。
反应函数即一博弈方对另一博弈方每种可能的决策内容的最佳反映决策构成的函数。在纯策略的范畴内,反应函数是各博弈方选择的纯策略对其他博弈方纯策略的反应。在混合策略的范畴内,博弈方的决策内容为选择概率分布,反应函数就是一方对另一方的概率分布的反应。
掷硬币
-1,1
1,-1
反面
1,-1
-1,1
正面
反面
正面
1
2
支付
q 1-q
1-p
p
p
q
0
1/2
1
1
1/2
p1=f(q)
q2=f(p)
当2出正面的概率q1/2,1出正面的概率为1,因为他出正面得到的预期收益大于他出反面;当2出正面的概率q1/2,1出正面的概率为0,因为他出反面的期望收益大于他出正面。
第五节 纳什均衡的存在性与多重性
混合战略纳什均衡
纯战略纳什均衡
重复剔除占优均衡
占优均衡
不同均衡概念之间的关系
纳什均衡的存在性
每个有限战略式博弈(参与人与战略数目均为有限)都有纳什均衡存在,这均衡有可能是混合战略均衡
纳什均衡的多重性
纳什均衡不唯一,如性别战
案例 性别战
1,3
0,0
足球
0,0
2,1
时装
足球
时装
妻子
支付
p 1-p
q
1-q
丈夫
性别战:混合策略均衡
给定妻子分别以q,1-q的概率选择时装、足球,则丈夫选择时装、足球的期望收益相等,即+0.(1-q)=+3.(1-q),解得妻子选择时装、足球的概率分别为(3/4,1/4)
给定丈夫分别以p,1-p的概率选择时装、足球,则妻子选择时装、足球的期望收益相等,即+0.(1-p)=+1.(1-p),解得妻子选择时装、足球的概率分别为(1/3,2/3)
性别战:混合策略均衡
当妻子以(3/4,1/4)的概率分布随机选择时装表演和足球,丈夫以(1/3,2/3)的概率随机选择时装表演和足球时,双方都无法通过单独改变策略,即单独改变随机选择纯策略的概率分布而提高利益,因此双方的上述概率分布的组合构成一个混合策略纳什均衡。
该混合策略纳什均衡给妻子和丈夫各自带来的期望收益分别为:
+q.(1-p).0+(1-q).+(1-q).(1-p).1=2/3;
+q.(1-p).0+(1-q).+(1-q).(1-p).3=3/4
双方的期望收益均小于纯策略时的期望收益。
q
p
0
1/3
1
1
3/4
q1=f(p)
p2=f(q)
夫妻之争两博弈方的反应函数
如果p1/3,则妻子选择时装的期望得益小于选择足球,因此妻子应选择足球,即q=0;如果p1/3,则妻子选择时装的期望得益为大于选择足球的得益,因此选时装,即p=1
焦点均衡(focal point)
当一个博弈有多个纳什均衡时,博弈论并没有一个一般的理论来证明纳什均衡结果一定会出现。
在现实生活中,参与人可能使用某些被博弈模型抽象掉的信息来达到一个“焦点”均衡。这些信息可能与社会文化习惯、参与人过去博弈的历史有关。
例,在性别战中,如果今天是丈夫的生日,(足球、足球)可能是一个焦点均衡;而如果是妻子的生日,(时装、时装)可能是一个焦点均衡。
还有分蛋糕等。
课堂练习:求纳什均衡
2,4
0,0
音乐会
1,1
4,2
足球
音乐会
足球
男方
女方
支付
p 1-p
q
1-q
市场进入阻挠
0,300
0,300
不进入
-10,0
40,50
进入
斗争
默许
进入者
在位者
支付
威胁是可置信的吗?
作业1
春节前夕,某小镇上两个商铺主甲和乙同时看到一个赚钱机会:去城里贩一批鞭炮回来零售,购货款加上运输费用共5000元,如果没有竞争对手,这批货在小镇上能卖6000元;但如果另一家商铺同时在小镇上卖鞭炮,价格下跌使得这批鞭炮只能卖4000元。请用战略式表示支付矩阵;请找出纳什均衡。
作业二
3,0
0,2
1,3
2,3
1,2
3,4
4,2
1,1
2,0
乙
左 中 右
上
中
下
甲
一个两人同时博弈的支付竞争如下所示,试求纳什均衡。是否存在重复剔除占优战略均衡?
第二章 完全信息动态博弈
博弈的扩展式表述
子博弈精炼纳什均衡
子博弈精炼纳什均衡举例
重复博弈和无名氏定理
第一节 博弈的扩展式表述
完全信息动态博弈
一般以扩展型式来表示:G=(N,H,P,I,U),包括5要素:
(1)局中人N;
(2)历史H:博弈树是一个多环节与枝干的集合,从单一的起始环节,直到终结环节,代表博弈历史;
(3)对每个环节的分配法则P:将每个环节(除终结环节外)分配给不同的局中人,并赋予行动时可选的策略;
(4)局中人行动时的信息集合I;
(5)对应局中人可能选择策略,各局中人在终结环节所得到的报酬U。
1
2
2
L
L
S
S
L
S
(2,2)
(-1,-1)
(-1,-1)
(1,1)
战略式表述(strategic form representation)多用矩阵
1,1
-1,-1
-1,-1
2,2
2
L S
L
S
1
扩展式表述(extensive form representation)多用博弈树
战略式与扩展式
0 ,1
1 ,0
0 ,0
-3 ,-3
0 ,0
0 ,1
1 ,0
-3 ,-3
A
B
(进入,进入)
进入
不进入
(进入,不进入)
(不进入,进入)
(不进入,不进入)
市场进入博弈的标准式
进入
不进入
A
B
B
进入
不进入
不进入
进入
收益:
A B
-3 ,-3
1 ,0
0 ,1
0 ,0
市场进入的扩展式
在市场进入博弈中:A有两个行动:“进入”、“不进入”。
由于是先行动者,只有两个战略:选择“进入”或“不进入”。
B有两个行动:“进入”、“不进入”。
但是,有4个战略:
(1)若A选择“进入”,B选择“进入”,若A选择“不进入”,B选择“进入”,即
(进入,进入)
(2)若A选择“进入”,B选择“进入”,若A选择“不进入”,B选择“不进入”,即
(进入,不进入)
(3)若A选择“进入”,B选择“不进入”,若A选择“不进入”,B选择“不进入”,即 (不进入,进入)
(4)若A选择“进入”,B选择“不进入”,若A选择“不进入”,B选择“不进入”,即 (不进入,不进入)
博弈树的构成
1.结(nodes):结包括决策结(decition nodes)和终点结(terminal nodes)两类。决策结是参与人采取行动的时点,终点结是博弈行动路径的终点。
在博弈树中,“谁在什么时候行动”用在决策结旁边标注参与人的办法来表示。参与人的支付标注在博弈树终点结处。
2.枝(branches):在博弈树上,枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择。
3.信息集(information sets):博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集。该子集包括所有满足下列条件的决策结:(1)每一个决策结都是同一参与人的决策结;(2)该参与人知道博弈进入该集合的的某个决策结,但不知道自己究竟处于哪一个决策结。
1
2
2
L
L
S
S
L
S
(2,2)
(-1,-1)
(-1,-1)
(1,1)
结nodes
信息集分单节信息集和多节信息集;如果用虚线匡起来表示2知道自己位于信息集内,但不知道是哪一点,因为他没能观察到对手的行动;如果博弈树的所有信息集都是单结的,称为完美信息博弈
1
2
2
L
L
S
S
L
S
(2,2)
(-1,-1)
(-1,-1)
(1,1)
完美信息(perfect information)与
不完美信息(imperfect information)
1
2
2
L
L
S
S
L
S
(2,2)
(-1,-1)
(-1,-1)
(1,1)
不完美信息:2不能区分1是采用了L还是S
完美信息:2能区分1是选择了L还是S
第二节
子博弈精炼纳什均衡
子博弈
子博弈精炼纳什均衡
求解方法:逆向归纳法
承诺行动与子博弈精炼纳什均衡
一、子博弈(sub-game)
子博弈定义:在一个扩展型博弈中,如果一个博弈由它的一个决策结及其所有后续结构成,并满足(1)起始结是一个单结的信息结;(2)子博弈保留了原博弈的所有结构,则称它为原博弈的一个子博弈(子博弈)。
(1)起始结是一个单结的信息结
1
2
2
L
L
S
S
L
S
(2,2)
(-1,-1)
(-1,-1)
(1,1)
1
2
2
L
L
S
S
L
S
(2,2)
(-1,-1)
(-1,-1)
(1,1)
x1
x2
(2)子博弈保留了原博弈的所有结构:子博弈的信息集和支付向量都直接继承自原博弈
1
2
2
L
L
S
S
L
S
x1
x2
3
3
3
3
进入
不进入
A
B
B
进入
不进入
不进入
进入
收益:
A B
-3 ,-3
1 ,0
0 ,1
0 ,0
抵赖
坦白
A
B
B
抵赖
坦白
坦白
抵赖
-1 ,-1
-9 ,0
0 ,-9
-6 ,-6
在市场进入博弈中,包含3个子博弈(包括原博弈)。而在囚徒博弈中,只有一个子博弈(?)
二、子博弈精炼纳什均衡
子博弈精炼纳什均衡定义:
在博弈G中,如果s*=(s1,…,sn)是G的一个纳什均衡,并且对所有可能的子博弈而言仍是一个纳什均衡,则称s*=(s1,…,sn)为一个子博弈精炼纳什均衡
市场进入博弈的纳什均衡
进入
不进入
A
B
B
进入
不进入
不进入
进入
收益:
A B
-3 ,-3
1 ,0
0 ,1
0 ,0
0 ,1
1 ,0
0 ,0
-3 ,-3
0 ,0
0 ,1
1 ,0
-3 ,-3
A
B
(进入,进入)
进入
不进入
(进入,不进入)
(不进入,进入)
(不进入,不进入)
该博弈中有三个纳什均衡:
不进入,(进入,进入)
进入,(不进入,进入)
进入,(不进入,不进入)
前两个均衡的结果(进入,不进入),即A进入,B不进入;第二个均衡结果是(不进入,进入),即A不进入,B进入
如果理论得到这样的结果,无助于预测博弈参与人的行为。此外,纳什均衡假定,每一个参与人选择的最优战略是在所有其他参与人的战略选择给定时的最优反应,即参与人并不考虑自己的选择对其他人选择的影响,因而纳什均衡很难说是动态博弈的合理解。
必须在多个纳什均衡中剔除不合理的均衡解,即所谓“不可置信威胁”。子博弈精炼纳什均衡是对纳什均衡概念的最重要的改进。它的目的是把动态博弈中的“合理纳什均衡”与“不合理纳什均衡”分开。正如纳什均衡是完全信息静态博弈解的基本慨念一样,子博弈精炼纳什均衡是完全信息动态博弈解的基本概念。
①{不进入,(进入,进入)}
② {进入,(不进入,进入)}③{进入,(不进入,不进入)}
进入
不进入
A
B
B
进入
不进入
不进入
进入
收益:
A B
-3 ,-3
1 ,0
0 ,1
0 ,0
前边得到的三个纳什均衡中,均衡①意味着当A不进入时,B选择进入;而当A选择进入时,B仍选择进入(B威胁无论如何都要进入市场)。
显然,当A选择进入时,B仍选择进入是不合理的,如果A进入市场,B选择“不进入”比选择“进入”收益要更大,理性的B不会选择进入,而A知道B是理性的,因此也不会把该战略视为B会选择的战略。因此,B的战略(进入,进入)是不可置信威胁。
均衡③意味着当A进入时,B选择不进入;而当A选择不进入时,B仍选择进入(B威胁无论如何都不进入市场)。显然,当A选择不进入时,B仍选择不进入是不合理的,B的战略是不可置信的。
①{不进入,(进入,进入)}
② {进入,(不进入,进入)}
③{进入,(不进入,不进入)}
只有均衡②是合理的:如果A进入,B不进入;如果A不进入,B进入。因为A是先行动者,理性的A会选择“进入”(他知道B是理性的,B不会选择“进入”),而理性的B选择“不进入”。
观察博弈树上的三个均衡中,B的不可置信战略中的反应,在第二阶段B开始行动的两个子博弈中不是最优;而合理的纳什均衡中,B的战略在所有子博弈中都是最优的,与A的第一阶段可能选择的行动构成该子博弈的纳什均衡。
进入
不进入
A
B
B
进入
不进入
不进入
进入
收益:
A B
-3 ,-3
1 ,0
0 ,1
0 ,0
①
②
③
①
②
③
只有当一个战略规定的行动规则在所有可能的情况下都是最优的时,它才是一个合理的、可置信的战略。子博弈精炼纳什均衡就是要剔除掉那些只在特定情况下是合理的而在其他情况下并不合理的行动规则。
子博弈精炼纳什均衡: 如果参与者的战略在每一个子博弈中都构成了纳什均衡,则称纳什均衡是子博弈精练的(泽尔滕,1965) 。
为简单起见,假定博弈有两个阶段,第一阶段参与人1行动,第2阶段参与人2行动,并且2在行动前观测到1的选择。令A1是参与人1的行动空间,A2是参与人2的行动空间。当博弈进入第二阶段,给定参与人1在第一阶段的选择为a1∈ A1 ,参与人2面临的问题是:
显然参与人2的最优选择a2*依赖于参与人1的选择a1。用a2*=R(a1)代表上述最优化问题的解(即2的反应函数)。因为参与人1应该预测到参与人2在博弈的第二阶段将按a2*=R(a1)的规则行动,参与人1在第一阶段面临的问题是:
令上述问题的最优解为a1*。那么,这个博弈的子博弈精炼纳什均衡为{a1*,R2(a1)},均衡结果为{a1*,R2(a1*)}。(a1*,R2(a1*))是一个精炼均衡,因为a2*=R2(a1)在博弈的第二阶段是最优的。除a2*=R2(a1)之外,任何其他的行为规则都不满足精练均衡的要求。
上述思路就是逆向归纳法寻找子博弈精炼纳是均衡的基本思路。
甲
乙
(2,2)
(1,0)
(3,1)
上
下
左
右
乙
(2,1)
左
右
乙
{左,左} {左,右} {右,左} {右,右}
3,1
1,0
3,1
1,0
2,1
2,1
2,2
2,2
上下
甲
纳什均衡子博弈精炼纳什均衡
三个纳什均衡:
(上,{左,左})
(下,{左,右})
(下,{右,右})
排除(上,{左,左}),(下,{右,右}),只有(下{左,右})
是子博弈精炼纳什均衡
三、求解方法:逆推法
逆向归纳法求解子博弈精炼纳什均衡的过程,实质是重复剔除劣战略过程在扩展式博弈上的扩展:从最后一个决策结开始依次剔除掉每个子博弈的劣战略,最后生存下来的战略构成精炼纳什均衡。如同重复剔除的占优均衡要求“所有参与人是理性的”是共同知识一样,用逆向归纳法求解均衡也要求“所行参与人是理性的”是共同知识。
1
2
2
软
软
脆
脆
软
脆
(0,0)
(10,20)
(20,10)
(0,0)
逆推法:例1
甲
丙
乙
上
东
下
西
左
右
(4,2,3)
(1,7,8)
(5,3,4)
(7,6,6)
丙
丙
(2,1,9)
(0,4,2)
逆推法:例2
进入者
在位者
(0,300)
(40,50)
(-10,0)
不进入
进入
默许
斗争
0,300
0,300
不进入
-10,0
40,50
进入
斗争
默许
进入者
在位者
支付
逆推法:例3
四、承诺行动(commitment)与
子博弈精炼纳什均衡
纳什均衡之所以不是精炼均衡,是因为不可置信的威胁存在,如父母与子女之间的博弈。
如果参与人在博弈前采取措施改变行动空间或支付函数,原来不可置信威胁就变得可置信,博弈的精炼均衡就会改变;将改变博弈结果而采取的措施称为“承诺行动”
完全承诺,如破釜沉舟、军事博弈
不完全承诺,增加行动成本
承诺行动与博弈结果
春节前夕,某小镇上两个商铺主甲和乙同时看到一个赚钱机会:去城里贩一批鞭炮回来零售,购货款加上运输费用共5000元,如果没有竞争对手,这批货在小镇上能卖6000元;但如果另一家商铺同时在小镇上卖鞭炮,价格下跌使得这批鞭炮只能卖4000元。纳什均衡是什么?
假设甲先行动,商铺乙看到对方的选择后再决定是否进货,子博弈精炼纳什均衡是什么?
承诺行动与博弈结果
如果甲先行动,但在博弈开始前商铺主乙有一次行动A的机会,利用子博弈精炼均衡概念分析下述两种情况下的博弈结果:
(1)A:商铺主乙逢人便说自己一定要进货,无论对方如何行动他都不会改变这个决定;
(2)A:商铺主乙与某个嘲笑他说大话的第三者丙打赌:如果自己到时不进货,向丙支付1500元;如果自己到时候进货,丙向他支付100元。并且,乙将这个赌局通知甲。
甲
乙
乙
进
进
不进
不进
进
不进
(-1000,-1000)
(1000,0)
(0,1000)
(0,0)
甲
乙
乙
进
进
不进
不进
进
不进
(-1000,-900)
(1000,-1500)
(0,1100)
(0,-1500)
开金矿博弈的基本问题:甲在开采一价值4万元的金矿时缺1万元资金,而乙正好有1万元资金可以投资。设甲想说服乙将这1万元资金借给自己用于开矿,并许诺在采到金子后与乙对半分成,乙是否该将钱借给甲呢?
假设金矿的价值是经过权威部门探测确认的,没必要怀疑。
乙
甲
(0,4)
(2,2)
(1,0)
不借
借
分
不分
开金矿博弈
不借
乙
甲
乙
借
不分
分
(1,0)
不打
打
(0,4)
(1,0)
(2,2)
有法律保障的开金矿博弈
——分钱打官司都可信
在一个重视自身利益的成员组成的社会中,完善公正的法律制度不但能保障社会的公平,而且还能提高社会经济活动效率,是实现最有效率的社会分工合作的重要保障
乙
甲
乙
打
(2,2)
不分
分
不借
借
(0,4)
(-1,0)
不打
(1,0)
法律保障不足的开金矿博弈
——分钱打官司都不可信
由于法制建设不完善,司法机构执法能力存在问题,并且也存在司法腐败和“执行难”的问题,因此,有理不一定能打赢官司,赢了官司却反而输了钱的事情在一些国家普遍存在
第三节 子博弈精炼纳什均衡举例
斯塔克尔伯格(Stackelberg)寡头竞争模型
劳资(工会与厂商)博弈模型
罗宾斯泰英(Rubinstein)轮流出价的讨价还价模型
委托人—代理人理论
一、斯塔克尔伯格模型
产量领导模型:行动顺序为,第一家厂商首先选择产量;第二家厂商再选择产量,得到反应函数;将反应函数代入第一家厂商的利润函数求出y1*;然后求y2。
追随者max 2 =p(y1+y2)y2-c(y2) ,得到反应函数y2=f2(y1) 领导者 max 1=p(y1+y2)y1-c(y1)= p(y1+f2(y1) )y1-c(y1),可以求出均衡产量y1*,跟随者依照反应函数求出y2*,进一步解出p。
斯塔克尔伯格模型求解
设p=1-(y1+y2),MC=0,则厂商2根据利润最大化得到反应函数y2=f2(y1)=(1-y1)/2,
代入厂商1的利润函数
1=p(y1+y2)y1-c1(y1),
一阶条件得到y1=1/2,
代入厂商2的反应函数得到y2=1/4,
(1/2,1/4)为均衡解,
(1/8,1/16)为其相应的支付。
斯塔克尔伯格模型
y1
y2
f1(y2)
f2(y1)
1/2
1/4
二、劳资博弈模型
里昂惕夫1946年提出,分别代表劳资双方的工会与厂商之间的博弈模型。
该模型假设工资完全由工会决定,而厂商则根据工会要求的工资高低决定雇用工人的数量。
工会代表的劳方效用u=u(W,L)。
厂商的利润函数为=(W,L)=R(L)-WL。
行动顺序为:先由工会决定工资率,然后厂商根据工会提出的工资率决定雇用多少劳动。
劳资博弈模型
采用逆推法求解
先分析第二阶段厂商的选择。厂商对工会选择的工资率W的反应函数为L=L(W),则:max (W,L)=max[R(L)-WL],解得R’(L)=W,求得L*(W)为在给定工会选择W时厂商的最优雇佣数量。
然后分析第一阶段工会的选择。工会清楚厂商对应每一个W所选择的L*,工会需要决定的是选择W*,使得max u=u(W,L*(W)),求得符合工会最大利益的W*。
劳资博弈模型
先由工会决定工资率,再由厂商决定雇用多少劳动力
R
L
0
W L
厂商的反应函数
R(L)
斜率为W
L
W
0
工会的无差异曲线
三、罗宾斯泰林讨价还价模型
讨价还价模型简述:
甲、乙两人协商分配上级下拨的1000元钱。在给定的3天协商时间内,第一天甲提出一个分配方案,乙若同意的话就按此分配,乙若不同意他可在第二天提出自己的方案,甲可选择接受或在第三天再提出一个方案,乙对此可以接受或拒绝;如果3天内两人不能达成协议,上级将收回这1000元钱;甲和乙分别按天贴现率和贴现自己的未来收益, 0 、1。简化条件:如果自己不能从拒绝对方提案中获取更多的收益,局中人都会接受对方提案。
Rubinstein讨价还价模型
第一天
第二天
第三天
甲
乙
提案
拒绝并提案
甲
拒绝并提案
乙
拒绝
(a3,b3) (a2,b2) (a1,b1)
接受
接受
接受
(0,0)
Rubinstein讨价还价模型解析:逆推法
第三天:只要甲的提案满足b10,乙总会接受,甲的目标是利益最大化,因而提案为(a1,b1)=(1,0)(单位为千元)
第二天:乙预料到第三天(1,0)的结果,所以尽可能让甲接受自己的提案,提案中给甲的金额不小于1的贴现,因而有方案(a2,b2)=(,1-)
第一天:甲清楚如果自己的提案被否决,对方第二天的提案将是(,1-),自己会接受它。甲的问题是保证第一天乙得到(1-)的前提下自己尽可能多得一些。他的最佳选择将是(a3,b3)=(1-(1-),(1-)),乙接受,博弈于第一天即告结束
无穷次讨价还价模型
无穷次讨价还价模型不能采用逆推法
Rubinstein曾经对其进行证明,得到结果:甲在第一阶段提出
((1-)/(1-),1-(1-)/(1-)),乙接受
四、委托人—代理人理论
委托人——代理人关系
经济活动和社会活动中有很多委托人——代理人关系,有明显的,也有隐蔽的。工厂和工人、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等都是。
委托人——代理人关系的关键特征:不能直接控制,监督不完全,信息不完全,利益的相关性
委托人——代理人涉及问题:激励机制设计、机制设计理论,委托合同设计问题等
无不确定性的委托人—代理人模型
[R(E)-w(E), w(E)-E]
[R(S)-w(S), w(S)-S]
[R(0),0]
[R(0),0]
1
2
2
偷懒
努力
拒绝
接受
不委托
委托
代理人的选择
激励相容约束:
w(E)-E> w(S)-S
w(E)> w(S)+E-S
参与约束:
2
2
[R(E)-w(E), w(E)-E]
拒绝
接受
拒绝
接受
[R(0),0]
[R(S)-w(S), w(S)-S]
[R(0),0]
接受:w(E)-E>0
接受:w(S)-S>0
参与约束
委托人的选择
1
1
不委托
委托
委托
[R(S)-w(S), w(S)-S]
[R(0),0]
[R(E)-w(E), w(E)-E]
不委托
[R(0),0]
委托: R(E)-w(E) > R(0)
不委托: R(E)-w(E) < R(0)
委托: R(S)-w(S) > R(0)
不委托: R(S)-w(S) < R(0)
数值例子
[12, 2]
[0,0]
[0,0]
1
2
2
偷懒
努力
拒绝
接受
不委托
委托
[7,1]
E=2, S=1,
W(E)=4, w(S)=2
有不确定性但可监督的委托人—代理人博弈
努力
委托:
*[20-w(E)]+*[10-w(E)]>0
不委托:
*[20-w(E)]+*[10-w(E)]<0
1
0
0
2
2
[0,0]
[0,0]
[10-w(S), w(S)-S]
[20-w(S), w(S)-S]
[10-w(E), w(E)-E]
[20-w(E), w(E)-E]
不委托
高产
()
低产
()
低产
()
高产
()
努力
偷懒
接受
拒绝
委托
偷懒:
委托:
*[20-w(S)] +*[10-w(S)]>0
不委托:
*[20-w(S)] +*[10-w(S)]<0
因为可监督,因此代理人报酬与成果无关,只与努力情况有关。不确定性风险由委托人承担。代理人选择同无不确定性情况。
有不确定性且不可监督的委托人—代理人博弈
1
2
2
[0,0]
[0,0]
[10-w(10), w(10)-S]
[20-w(20), w(20)-S]
[10-w(10), w(10)-E]
[20-w(20), w(20)-E]
不委托
高产
()
低产
()
低产
()
高产
()
努力
偷懒
接受
拒绝
委托
0
只能根据成果付酬,w是成果函数,而非努力程度函数。不确定性对代理人利益、选择有影响。
激励相容约束
努力:
*[w(20)-E]+*[w(10)-E]
>*[w(20)-S]+*[w(10-S)]
接受:
*[w(20)-E]+*[w(10)-E]>0
委托:
*[20-w(20)]+*[10-w(10)]>0
促使代理人努力的激励相容约束、参与约束,以及委托人选择委托的条件
参与约束
对于委托人来说,就是要根据上述两个条件,以及 E、S的值,选择最佳的工资水平w(20)和w(10),或者它们的差额w(20)-w(10)
第四节
重复博弈和无名氏定理
有限次重复博弈:连锁店悖论
无限次重复博弈和无名氏定理
一、有限次重复博弈
有限次重复博弈
令G为阶段性博弈,G(T)是G重复T次的重复博弈(T<)。如果G有唯一的纳什均衡解,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次,如囚犯困境。
有限次重复博弈:连锁店悖论
连锁店悖论
假定同样的市场有20个(可以理解为在位者有20个连锁店),进入者每次进入一个市场,博弈就变成了20次重复博弈。
子博弈精炼纳什均衡为,在位者在每一个市场选择默许,进入者在每一个市场选择进入。
连锁店悖论—市场进入博弈
0,300
0,300
不进入
-10,0
40,50
进入
斗争
默许
进入者
支付
在位者
3,3
0,4
利他
4,0
1,1
利己
利他
利己
甲
乙
支付
n次重复博弈
讨论
“信息完备”是重复博弈的一个必要条件,事实证明,如果局中人的博弈环境存在不完备信息,或者存在不确定性,类似于“连锁店悖论”这样的问题多半会消失。
假定连锁店有高成本、低成本两种情况,就但其博弈看,面对新厂商进入,高成本厂商最佳反应为容忍,低成本厂商最佳反应为斗争,那么高成本厂商在博弈的前期阶段选择斗争,仍是可信的威胁。
二、无限次重复博弈与无名氏定理
无限次重复博弈
假设囚徒困境是一个阶段性博弈,并且是无限次重复博弈,那么任一个囚徒选择抵赖的条件是:0+(-6)+2(-6)+…-1+(-1)+2(-1)+…( 为贴现因子)或者-6/(1-)-1/(1-),即 1/6(即局中人具有足够的耐心),(抵赖、抵赖)是无限次囚徒博弈的一个子博弈精炼纳什均衡。
冷酷战略(grim strategies)
也称触发战略(trigger stratigies)
以囚徒困境为例:开始选择抵赖,选择抵赖直到有一方选择了坦白,然后永远选择坦白。
一旦哪个参与人选择了坦白,就触发了惩罚的扳机。。
无名氏定理
在无限次重复博弈中,如果参与人具有足够的耐心(即足够大),那么任何满足个人理性的可行的支付向量都可以通过一个特定的子博弈精炼均衡得到。
无名氏定理举例
以“利己、利他”为例,其博弈中唯一的纳什均衡为(利己,利己),两个局中人在此均衡下所的支付都是1;所以,只要无穷重复博弈中局中人可行的平均单期支付不小于1,这样的支付就是一个可能的均衡支付。
无穷重复博弈能够导致帕雷托改进。
寡头市场上古诺均衡的
无限次重复博弈
合作:生产垄断产量的一半(1/4,1/4),获取超额利润(1/8,1/8)
不合作:生产纳什均衡产量(1/3,1/3),获取超额利润(1/9,1/9)
给定企业坚持冷酷战略,企业一开始生产1/4,中途只要有企业偏离合作产量,生产短期最优产量3/8,则对方选择1/3。
寡头市场上古诺均衡的
无限次重复博弈
证明冷酷战略是子博弈精炼纳什均衡
如果下列条件满足,则任一企业没有积极性偏离合作均衡: 9/64+/9+2/9+…1/8+ /8 +2/8+…
即如果9/17,默契合作就会是一个精炼均衡结果。
寡头市场上古诺均衡的
无限次重复博弈
如果有n个寡头企业,默契合作要求(1+4n/(n+1)2)-1,当n时,1,即企业越多,默契合作越困难。
解释了为什么小团体的合作靠非正式规则就可以维持,而大团体就必须依赖于正式的规则与合约。
作业1:请找出此博弈的子博弈精炼纳什均衡
(-6,-6)
E
I
E
进
L
不进
S
L
S
(-3,-3)
(-1,1)
(1,-1)
E
L
S
(0,2)
作业2
一个建筑公司每到有工程合同才雇用临时工人。考虑某项工程中公司与工人的劳动-工资博弈;工人受雇于该公司的机会成本是0;工人可以老实地干活,为公司创造利润y,但这需要付出劳动成本l,y>l>0;工人也可以受雇后不干活,这不需任何劳动成本,同时创造的利润也是0。假设公司与工人在工程结束之前没有任何工资合同,它只是在雇用期满后才决定付给每个工人的工资额w。
作业2
如果该建筑公司在未来的10年内每年有一项相同的工程,证明:无论公司的利润贴现因子是多少,唯一的子博弈完美均衡是:在每一项工程中,无论工人是否干活,公司向工人付的工资额w都是0;工人不干活。
如果该建筑公司依次有无穷多个工程,而下一期工人又能看到以前的工资政策。证明:只要充分接近1,每一期工人都努力干获将是一个子博弈完美均衡战略。
在所有子博弈完美均衡中,对公司最有利的是什么样的均衡?
第三章 不完全信息静态博弈
不完全信息博弈和贝叶斯纳什均衡
贝叶斯均衡的应用举例
贝叶斯博弈与混合战略均衡
机制设计理论与显示原理
第一节
不完全信息博弈
和贝叶斯均衡
一、不完全信息博弈
完全信息(complete information)
每个局中人对其他局中人的特征(或类型)和支付函数有准确的了解;否则,为不完全信息(incomplete information )。
完美信息(perfect information)
在博弈过程的任何时点每个局中人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息(imperfect information )
0,400
0,400
0,300
0,300
-10,100
30,80
-10,0
40,50
高成本情况 低成本情况
默许 斗争 默许 斗争
进入
不进入
进入者
在位者
市场进入博弈:不完全信息
二、海萨尼(Harsanyi)转换
在位者存在不同类型,类似于与n个参与人博弈;海萨尼(1967-1968)提出,引入虚拟参与人——自然,自然先决定参与人的特征,不完全信息博弈转换为不完美信息博弈
不完全信息意味着至少有一个人有多个类型(type),即个人所拥有的非共同信息,用i表示参与人i的一个类型,分布函数p(1,…,n)为共同知识。
自然
进入者
进入者
在位者
在位者
高
低
不进入
进入
不进入
进入
合作
斗争 合作
斗争
(40,50) (-10,0) (30,80) (-10,100)
(0,300)
(0,400)
[p]
[1-p]
海萨尼转换后的市场进入博弈
二、海萨尼转换
假设自然N按照一个先验的分布函数p(1,…,n)来选择各个局中人的类型,并且假设这是共同知识。记-i=(1,…,i-1,i+1,…n)-i
局中人i不知道N对-i的选择结果,但由于他知道自己的类型i,它可以利用贝叶斯法则计算出条件分布函数,对其他局中人的类型进行估计:
称pi(-ii)为局中人i对别的局中人类型的信念(belief)。在许多场合下,局中人的类型是彼此无关的,此时pi(-ii)就简化为pi(-i)。
三、不完全信息静态博弈的
战略式表述
n人贝叶斯博弈的战略式表述为:
G={N,S,,P,U},其中参与人的
类型空间为:1,… n;
条件概率为:p1,…pn;
类型依存战略为:S1(1) ,…S(n);
类型依存支付函数为:u1(s1,…sn; 1),… un(s1,…sn; n)
给定参与人i知道自己的类型ii,条件概率pi=pi(-ii)描述给定自己属于i的情况下,参与人i有关其他参与人类型-i-i的不确定性。
静态贝叶斯博弈的时间顺序
自然选择类型向量=(1,…,n),其中ii,参与人i观测到i,但参与人j只知道pj(-jj),观测不到i
N个参与人同时选择行动s=(s1,…,sn),其中siSi(j)
参与人i得到ui(s1,…,sn;j)。
自然
进入者
进入者
在位者
在位者
高
低
不进入
进入
不进入
进入
合作
斗争 合作
斗争
(40,50) (-10,0) (30,80) (-10,100)
(0,300)
(0,400)
[p]
[1-p]
海萨尼转换后的市场进入博弈
市场进入博弈均衡求解
当进入者选择进入的期望收益大于选择不进入的期望收益时,进入者选择进入
进入的期望收益:p*40+(1-p)*(-10)>0,解得:p>1/5,进入;p<1/5,不进入;p=1/5,进入与不进入是无差异的。
当p>1/5时,s1*=进入,s2*(高成本)=默许
当p<1/5时,s1*=不进入,s2*(低成本)=斗争
四、贝叶斯纳什均衡(BNE)
定义:如果有一组与局中人类型相关的战略{si*(i)ii}ni=1,对每个局中人i和每种局中人i的类型iI,si*(i)是问题
的解,则称{si*(i)ii}ni=1是一个贝叶斯纳什均衡。换句话说,贝叶斯纳什均衡下,每个局中人都在其他局中人(无论他属于哪种类型)不改变当前战略的情况下达到了他的最大期望支付。
4,1
2,1
4,0
2,0
0,0
0,1
3,0
3,1
左 右
左 右
类型2/
类型2
上 下
甲
乙
静态贝叶斯博弈均衡举例:
表中甲、乙同时行动,甲只有一种类型,但乙有两种类型:2={2,2/};甲不了解对方是哪一类,但他相信对方为2,2/的概率各为1/2。求解均衡。
静态贝叶斯博弈均衡举例求解
乙:如果为2,有占优战略为“左”;如果为2/,有占优战略为“右”
甲:由于甲相信对方为两种类型的可能性各为1/2,故甲计算选“上”或“下”,分别给他带来的期望收益,结果选“上”,期望支付为5/2,选“下”,期望支付为2,因而甲的最佳选择是“上”。
均衡为s1*=上;s2*(2)=左,s2*(2/)=右
第二节
贝叶斯均衡的应用举例
一、不完全信息古诺模型
在不完全信息古诺模型中,参与人的类型是成本函数
假定逆需求函数是P=2-q1-q2,每个企业都有不变的单位成本ci(i=1,2),企业i的利润函数为:i=qi(2-q1-q2-ci)。
假定企业1的单位成本c1=1是共同知识,企业2的单位成本可能是c2h=5/4,也可能是c2l=3/4,两者的可能性各为p=1/2,1-p=1/2
不完全信息古诺模型求解(一)
求企业2的反应函数
高成本时,2h=q2h(2-q1-q2h-c2)=q2h(3/4-q1-q2h);低成本时,2l=q2(5/4-q1-q2l),求最优化的一阶导数,得到反应函数:q2h=1/2(3/4-q1),q2l=1/2(5/4-q1)
求企业1的反应函数
企业1不知道企业2的真实成本,因而不知道企业2的最优反应是q2h,还是q2l,因此将选择q1最大化利润函数:E1=1/2q1(2-q1-q2h-c1)+1/2q1(2-q1-q2l-c1),求最优化的一阶导数,得到反应函数:q1=1/2(1-1/2q2h-1/2q2l)=1/2(1-Eq2)
不完全信息古诺模型求解(二)
企业2的反应函数
q2h=1/2(3/4-q1) (1)
q2l=1/2(5/4-q1) (2)
企业1的反应函数
q1=1/2(1-1/2q2h-1/2q2l) (3)
解方程(1)、(2)、(3)得到:q1*=1/3,q2l*=11/24,q2h*=5/24
完全信息与不完全信息情况下古诺模型比较
假设企业2的成本为3/4,得到均衡产量为q1=1/41/3,q2=1/21/3
如果企业2的成本为5/4,得到均衡产量为q1=5/121/3,q2=1/61/3
与完全信息相比,不完全信息情况下,企业1面对低成本企业选择的产量相对较低,面对高成本企业选择的产量相对较高,其原因在于:企业1生产预期的最优产量,高于完全信息下面对低成本竞争对手时的产量,低于完全信息下,面对高成本竞争对手时的产量,企业2对此做出反应。
古诺模型:完全信息和不完全信息
1/4 1/3 5/12
1/2
11/24
5/24
1/6
q1(q2)
q2l(q1)
q2h(q1)
q1
q2
二、不完全信息情况下
公共产品的提供
鲍弗瑞和罗森塞尔(Palfrey and Rosenthal,1989)模型
两个参与人同时决定是否提供公共产品,提供或不提供,如果至少有一个人提供,每人得到一单位好处;如果没有人提供,每人得到0单位支付,参与人i提供公共产品的成本是ci。
公共产品的收益是共同知识,提供的成本只有自己知道,假定c1,c2具有相同的定义在 上的分布函数P(.),其中 , 。
不完全信息公共产品博弈
0,0
1,1-c1
1-c1,1
1-c1,1-c2
参与人2
提供 不提供
提供
不提供
参与人1
0 ci* 2
P(0)=0 P(ci*)=ci*/2 P(2)=1
不完全信息公共产品提供的解
最大化行为意味着,只有当参与人i预期对方j不提供时,参与人才会考虑自己是否提供。
假设对方提供公共产品的概率为zj,则参与人i提供公共产品的条件为:1-ci>zj+(1-zj)0=zj,即只有1-zj>ci,参与人才会提供。存在一个分割点(cutoff),使得ci[c,ci*]时,参与人才会提供。
求解ci*:1-ci*=cj*/2,1-cj*=ci*/2,求得ci*=cj*=2/3,即当只当cic*,参与人i提供。
三、一级密封价格拍卖
(the first-price sealed auction)
当一件物品对买者的价值买者比卖者更清楚时,卖者一般不愿意首先提出价格,而常常采用拍卖的方式获得可能的最高价格。
一级密封价格拍卖是许多拍卖方式的一种,在这种拍卖中,投标人同时将自己的出价写下来转入一个信封,密封后交给拍卖人,拍卖人打开信封,出价最高者是赢者,按他的出价支付价格,拿走被拍卖的物品。
一级密封价格拍卖(一)
以两个人为例
两个人对拍卖品分别有自己的主观判断,称其为对拍卖品的保留价格v,假设两人都不清楚对方的保留价格,只知道对方的保留价格为一均匀分布于[0,1]上的随机值。记局中人的最佳叫价为b(v),由经验常识,假设函数b(v)严格单增是合适的,在此假设下,其反函数存在,记为V(b),反映的是叫价为b的局中人真实的保留价格。
一级密封价格拍卖(二)
当某人叫价b时,获胜的概率当然是对方叫价低于b的概率,或者等价地说,是对方的保留价格低于V(b)的概率——由于局中人对该物品的保留价格是闭区间[0,1]上的均匀分布,这一概率就等于V(b)。所以,一个具有保留价格v、叫价b的竞价者的期望支付为:
V(b)(v-b)+(1-V(b))0
从而他的目标是: max V(b)(v-b)
其一阶条件为:V(b)/(v-b)-V(b)=0,
即V(b)/(V(b)-b)-V(b)=0
一级密封价格拍卖(三)
等价于:[V2(b)/2]/=[bV(b)]/
恒等式两端对b求不定积分得到:V2(b)/2=bV(b)+c
显然当某人对一个物品的保留价格是0时,它最优的叫价也是0,即V(0)=0,将这一初始条件带入上式可求得c=0。
从而V(b)=2b,或b=v/2
竞价者的最优战略是以自己保留价格的一半作为叫价。
一级密封价格拍卖(四)
如果有n人参与竞标,则b=(n-1)v/n,即b随n的增加而增加,特别地,当n时,bv,就是说,投标人越多,卖者能得到的价格就越高;当投标人趋于无穷时,卖者几乎得到买者价值的全部。因此,让更多的人加入竞标是卖者的利益所在。
第三节
贝叶斯均衡与混合战略均衡
贝叶斯均衡与混合战略
有不少人认为完全信息博弈中的混合战略均衡仅仅只是理论上的概念,但在现实生活中确实难以理解的。针对这一点,海萨尼(1973)对混合战略提出了另一种解释。
其思想是,只要在原来的博弈中加入少许不完全信息因素,得到(单纯战略)贝叶斯均衡就与完全信息下的混合战略均衡相似。
性别战
2,4+2
0,0
音乐会
1,1
4+1,2
足球
音乐会
足球
男方
女方
支付
b/ 1-b/
a/
0 a(b)
p=a/或者p=b/
1-a/
“性别战”的重新构造
完全信息情况下的“性别战”加上不完全信息,想象两人还不十分了解,当双方都去看足球赛时男士得到的支付是4+1,双方都去听音乐会时女士得到的支付为4+2。两人知道自己的类型,但不清楚对方值的大小,只知道对方的值是均匀地分布在区间[0,]上的随机变量。
如果男士的类型1不小于某一临界值a,他选择“足球”,否则选择“音乐会”;如果女士的类型2不小于某一临界值,她选择“音乐会”,否则选择“足球”。
“性别战”求解
男士选择足球的条件:
b/(4+1)+(-b)/1>b/0+(-b)/2
整理后得到男士选“足球”的充要条件:
1>/b-5=a
女士选择“音乐会”的充要条件是:
2>/a-5=b
联立两个条件中的等式,解得
a=b=
在上述贝叶斯均衡中,两个局中人使用的都是单纯战略,因为不知道对方的类型,感觉面对的像是混合战略的博弈对手。如果令为0,男士选足球的概率(-a)/趋于4/5。但不完全信息消失时,贝叶斯均衡趋向于完全信息下的混合均衡。
第四节
机制设计原理与显示原理
一、机制设计(mechanism design)
机制设计是一种特殊的不完全信息博弈,委托人(principal)选择设计机制,给代理人足够的激励,促使代理人(agent)说实话(获取真实信息),也可以最大化委托人的期望效用。
委托人设计机制面临两个约束:
(1)参与约束(participation constraint)或称个人理性约束(individual rationality constraint):代理人在该机制下得到的期望效用不小于他在不接受这个机制时得到的最大期望效用。
(2)激励相容约束(incentive-compatibility constraint):代理人在所设计的机制下必须有积极性选择委托人希望他选择的的行动。
机制设计
满足参与约束的机制称为可行机制,满足激励相容约束的机制称为可实施机制,满足两个约束条件的机制称为可行的可实施机制。委托人的目的是选择一个可行的可实施机制以最大化他的期望效用。
典型的机制设计是一个三阶段不完全信息博弈:第一阶段:委托人设计机制,即博弈规则,代理人根据规则发出信号(message),实现的信号决定配置结果(allocation);第二阶段:代理人同时选择接受或不接受委托人设计的机制;第三阶段:接受机制的代理人根据机制的规定进行博弈。
机制设计案例
机制设计的案例有很多:拍卖、垄断企业定价、政府税收政策的制定、政府对垄断企业的规制、公共产品的供给、雇主对雇员职位的安排、保险公司的收费和赔偿政策等。
机制设计案例分析(一)
《圣经》上索罗门国王对孩子所有权的判定:
两个代理人:A、B
私人信息:孩子对于A、B两人的价值分别为CA,CB
索罗门国王的处置方式:将孩子切成两半
A、B两个人按照所罗门国王设计的机制采取行动:私人信息配置结果
存在问题:代理人可以模仿其他人的反应。
机制设计案例分析(二)
King Econ’ game
采取处罚措施:让A先行动,如果放弃得0,如果向B挑战需要付出F。B如果接受A的选择,放弃孩子则得0,如果不放弃,向A挑战,则需要付出E。A再进入下一个迎接挑战的循环。
A
B
A
(0,CB)
(CA,0)
(-F,CB-E)
(CA-E-F,-F)
Give up
Assert
Accept
Challege, bide E and A pays F
Don’t match
Challege, match E and B pays F
King Econ’ game
King Econ’ game
假设A是孩子的亲生母亲,则有CA>CB,B知道她如果要得到孩子,必须付出足够的E使得A放弃,即有-F>CA-E-F,即E>CA,则有CB<CA<E,B的收益为负,即CB-E<0,得到均衡A will assert and B will。
假设B是孩子的亲生母亲,则有CA<CB,B想要A放弃,必然有-F>CA-E-F,即E>CA,这样就能找到E,使得CB>E>CA,得到A will give up in the 1st stage。
二、显示原理(revelation principal)
假定以Mi为信号空间和以ym(.)为配置函数的机制的贝叶斯均衡是:*(.)={1*(1),…,n*(n)},i*Mi,i i
那么存在以Mi= I为信号空间的直接显示机制 ,该机制的贝叶斯均衡是,所有代理人在第二阶段接受机制,在第三阶段同时报告自己的真实类型=(1,…, n)。直接机制的均衡配置结果与原机制的均衡配置结果相同。
显示原理
显示原理肯定了对任何贝叶斯博弈的任何贝叶斯纳什均衡,都能设计出一种促使各博弈方“揭示”自己真实类型的直接机制来实现它。
以暗标拍卖为例。设只有两个投标人,他们的估价类型V1,V2都是[0,1]上的标准分布。说实话的直接机制是这样设计的:(1)两投标人同时声明V1/,V2/;(2)投标人中中标的概率为qi=V1//2,中标的价格为pi=V1//。由于Vi[0,1],因此Vi/[0,1],q1+q21。其中为代定参数,是决定投标人都说实话是否能成为贝叶斯纳什均衡的关键。
显示原理
假定两投标人的声明是线性齐次的,具有:Vi/=aiVi的形式,则投标人i声明Vi/的期望收益为:
对投标人i来讲,均衡条件是找出ai使期望收益最大
其一阶条件为ai=/2
所谓说实话,即ai=1,Vi/=Vi
因此,当=2时,也就是中标价格为中标人声明估价(也是真实股价)的一半时,上述直接机制使得两投标人都讲真话是贝叶斯纳什均衡
0,0
0,1
B
1,0
-1,-1
A
B
A
厂商1
厂商2
支付
作业1
请用下面这个两市场博弈验证海萨尼关于混合策略和不完全信息博弈关系的结论。
0,0
v1,v2-1
v1-1, v2
v1-1,v2-1
参与人2
提供 不提供
提供
不提供
参与人1
作业2:公共物品的提供支付如下所示,成本为1,收益为私人信息,分别为v1,v2,其中v1,v2分别均匀分布于[,],[1,2]区间上,求贝叶斯纳什均衡。
第四章 不完全信息动态博弈
精炼贝叶斯纳什均衡
信号传递博弈及其应用举例
KMRW声誉模型
第一节
精炼贝叶斯纳什均衡
一、不完全信息动态博弈特点
“自然”首先选择参与人的类型,参与人自己知道,其他参与人不知道;
参与人开始行动,后行动者能观测到先行动者的行动,但不能观测到先行动者的类型;
后行动者通过观察先行动者所选择的行动来推断类型或修正对其类型的先验信念(概率分布),然后选择自己的最优行动;
先行动者预测到自己的行动将被后行动者所利用,就会设法选择传递对自己最有利的信息,避免传递对自己不利的信息。
二、贝叶斯法则
先验概率(prior probability):修正之前的判断;后验概率(posterior probability):修正之后的判断
贝叶斯法则:假定参与人i有K个类型,有H个行动,用k和sh分别代表一个特定的类型和战略,假定i属于k的先验概率是p(k)0,p(k)=1,i选择sh的条件概率为p(shk),p(shk)=1。
假如观测到i选择了sh,i属于类型k的后验概率Prob(ksh)有以下公式存在:
贝叶斯法则举例
假定现实中分为好人(1)和坏人(2)(type),所有的事分为好事(s1)和坏事(s2)(strategy),那么一个人干好事的概率p{s1}就等于他是好人的概率p(1)(先验概率)乘以好人干好事的概率p(s11),加上他是坏人的概率p(2)乘以坏人干好事p(s12)的概率,即p{s1}=p(s11)p(1)+p(s12)p(2)(边缘概率)。
假定观测到一个人干了一件好事,那么这个人是好人的后验概率为:
贝叶斯法则举例
假设认为这个人是好人的先验概率为1/2,那么在观测到他干了好事之后来修正他是好人的先验概率依赖于这件事好到什么程度。
假设这件事非常好,好人一定干,坏人一定不干,则有p(s11)=1, p(s12)=0,那么后验概率Prob(1s1)=(1*1/2)/(1*1/2+0*1/2)=1
假设这是一件非常一般的好事,好人会干,坏人也会干,则有p(s11)=1, p(s12)=1,后验概率Prob(1s1)=(1*1/2)/(1*1/2+1*1/2)=1/2
假设介于上述两种之间,好人肯定会做,坏人可能做也可能不做,则有p(s11)=1, p(s12)=1/2,后验概率Prob(1s1)=(1*1/2)/(1*1/2+1/2*1/2)=2/3
三、精炼贝叶斯均衡(PBNE)
PBNE是不完全信息动态均衡的基本均衡概念,是泽尔腾的完全信息动态博弈子博弈精炼纳什均衡(SPNE)和海萨尼的不完全信息静态博弈贝叶斯均衡(BNE)的结合。
BNE中,参与人的信念是事前给定的,均衡概念没有规定参与人如何修正自己的信念。
SPNE要求均衡战略不仅在整个博弈上构成纳什均衡,而且要求在每个子博弈上构成纳什均衡,剔除了那些包含不可置信威胁的战略。
PBNE要求,给定每一个参与人有关其他参与人类型的后验信念,参与人的战略组合在每一个后续博弈(continuation game,每一个信息集开始的博弈的剩余部分,不同于开始于单结信息集的子博弈)上构成贝叶斯均衡。
三、精炼贝叶斯均衡(PBNE)
精炼贝叶斯均衡( PBNE )是贝叶斯均衡、子博弈精炼均衡和贝叶斯推断的结合。
PBNE要求:(1)在每一个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念);(2)给定该信息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;(3)每一个参与人根据贝叶斯法则和均衡战略修正后验概率。
精炼贝叶斯均衡的定义
精炼贝叶斯均衡是一个战略组合s*()=(s1*(1),…,sn*(n))和一个后验概率组合 ,满足:
(P)对于所有的参与人i,在每一个信息集h,存在 ,或者说,参与人的战略是序贯理性的,即在每个参与人的信息集中,给定这个人的信念以及其他参与人的战略,他在该信息集中的选择以及之后的行动是他在这些前提下的最优行动。
(B) 是使用贝叶斯法则从先验概率pi(-ii),观测到的最优战略s*得到的。
精炼贝叶斯均衡定义的阐释
精炼贝叶斯均衡是均衡战略和均衡信念的结合:
给定信念 ,战略s*=(s1*,…,sn*)是最优的;给定战略s*=(s1*,…,sn*),信念 是使用贝叶斯法则从均衡战略和所观测到的行动得到的。
四、精炼贝叶斯均衡求解
SPNE的缺点:有不完全信息、不完美信息时无法检验决策情境。
在均衡中加入信念的好处:给定均衡状态,可检验每一种情境。
求解方法:
(1)确定均衡型态(s1,s2…p1,p2…)
(2)给定信念,选择均衡
1
2
3
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
L
R
R
L
D
d
A
a
(3,3,0)
1-p
p
例一:有哪些均衡? 哪些均衡有问题?
4,4,4
4,4,4
5,5,0
3,3,0
1,1,1
1,1,1
2,2,2
3,3,0
A
D
A
D
a d a d
L R
纳什均衡(D,a,L)、(A,a,R)
1
2
3
(4,4,4) (1,1,1) (5,5,0) (2,2,2)
L
R
R
L
D
d
A
a
(3,3,0)
1-p
p
检验纳什均衡(D,a,L)、(A,a,R)
当3选择L时,2的理性选择是d,而非a,排除(D,a,L)
L: 4P+(1-P)0=4P
R: P+(1-P)2=2-P
If: p2/5,3选R
PBE:(A,a,R)+p 2/5
1
2
3
(-1,0,1) (3,0,2) (0,3,2) (0,-1,1)
u
d
d
u
u
u
d
d
(,,4)
1-p
p
练习:有哪些均衡? 哪些均衡有问题?
,,4
0,3,2
-1,0,1
-1,0,1
,,4
0,-1,1
3,0,2
3,0,2
u
d
u
d
u d u d
u d
纳什均衡(d,u,u)、(u,u,d)、(u,d,d)
1
2
3
(-1,0,1) (3,0,2) (0,3,2) (0,-1,1)
u
d
d
u
u
u
d
d
(,,4)
1-p
p
检验(d,u,u)、(u,u,d)、(u,d,d)
如果3选d,2的最佳选择是d,排除(u,u,d)
PBE: (u,d,d)+p1/2
PBE: (d,u,u)+p<1/2
第二节
信号传递博弈及其应用举例
一、信号传递博弈(signaling games)
是一种比较简单但有广泛应用意义的不完全信息动态博弈(斯宾塞,1974)
博弈中有两个参与人,1的类型是私人信息,为信号发送者;2的类型是公共信息,为信号接收者。
博弈顺序
(1)“自然”首先选择1的类型,2只知道1属于的先验概率p=p();
(2)1在观测到类型后选择发出信号mM,M={m1,…,mJ}是信号空间;
(3)2观测到m(而非)使用贝叶斯法则从先验概率p得到后验概率 ,然后选择战略s;
(4)支付函数分别为u1(m,s,),u2(m,s,)。
信号传递博弈的精炼贝叶斯均衡
信号传递博弈的精炼贝叶斯均衡是战略组合(m*(),s*(m))和后验概率 的结合,它满足:
(P1)s*(m)极大化 u2(m,s,)
(P2)m*()极大化u1(m,s*(m),);
(B) 是参与人2使用贝叶斯法则从先验概率p=p()、观测到的信号m和参与人1的最优战略m* ()得到的。
分离均衡(Separating equilibrium)
不同类型发送者以1的概率选择不同信号,或者说,没有任何类型选择与其他类型相同的信号。在分离均衡下,信号准确地揭示出类型。
如果m1是类型1的最优选择,m1就不可能是2的最优选择,并且,m2一定是类型2的最优选择,即:u1(m1,s*(m), 1)>u1(m2,s*(m), 1)
u1(m2,s*(m), 2)>u1(m1,s*(m), 2)
后验概率为:
混同均衡(pooling equilibrium)
不同类型的发送者选择相同的信号,或者说,没有任何类型选择与其他类型不同的信号,因此,接收者不修正先验概率。
假定mj是均衡战略,那么:
u1(mj,s*(m), 1)u1(m,s*(m), 1)
u1(mj,s*(m), 2) u1(m,s*(m), 2)
例一:市场进入博弈
假定有两个时期,市场上一个垄断企业在生产,潜在的进入者考虑是否进入。如果进入,两个企业进行古诺博弈,否则在位者仍是一个垄断者。
在位者有两个类型,高成本与低成本,其概率分别为q,1-q(先验信念)。
进入者只有一个类型,进入成本为2。如果进入,生产成本函数与高成本的在位者相同。
如果是高成本,单阶段最优价格为p=6;如果是低成本,单阶段最优价格为p=5。
市场进入博弈
N
在位者
在位者
进入者
进入者
高
低
P=4 P=5 P=6 P=4 P=5 P=6
进 不 进 不 进 不 进 不 进 不 进 不
第一阶段
(2,0) (2,0) (6,0) (6,,0)(7,0)(7,0) (6,0)(6,0)(9,0)(9,0)(8,0)(8,0)
第二阶段
(3,1) (7,0) (3,1) (7,0)(3,1)(7,0) (5,-1)(9,0)(5,-1)(9,0)(5,-1)(9,0)
q
1-q
市场进入博弈求解(一)
单阶段最优垄断价格p=6(高成本)或p=5(低成本),不是精炼贝叶斯均衡。如果进入者这样选择,则后验概率q~(6)=1(选择p=6证明在位者是高成本),q~(5)=0(选择p=5证明在位者是低成本)
给定后验概率,当观测到在位者选择p=6,进入者选择进入,在位者两期利润=7+3=10;而如果模仿低成本企业,选择p=5,则得到两期利润=6+7=13。因此p=6不是高成本在位者的最优选择
市场进入博弈求解(二)
假定q1/2,得到混同均衡,两类在位者选择相同的价格
给定进入者的后验概率和战略,如果高成本选择p=6,进入者进入,u1=7+3=10,如果选择p=5,进入者不进入,u1=6+7=13,p=5是高成本的最优选择;如果低成本选择p=5,u1=9+9=18,大于选择其他任何价格时的利润,p=5是低成本的最优选择。
给定两类在位者都选择p=5,进入者不能从观测到的价格中得到任何新的信息,即后验概率q~=1*q/(1*q+1*(1-q))=q1/2,(式中的1分别为高成本、低成本时在位者选择p=5的概率)进入的期望利润q*1+(1-q)*(-1)0,不进入的期望利润为0,因此不进入是最优的。
市场进入博弈求解(三)
假定q1/2,得到分离均衡,两类在位者选择不同价格
如果不同类型在位者选择相同的价格,进入者得不到新的信息,将选择进入,因为q*1+(1-q)*(-1)=2q-10。给定进入者一定会进入,在位者的最优选择是p=6(高成本)或p=5(低成本),前面已经证明不是一个均衡。
给定进入者的后验概率和战略,低成本在位者选择p=6(认为他是高成本,进入),u1=8+5=13;选择p=5,进入者进入,u1=9+5=14;选择p=4,进入者不进入, u1=6+9=15,最优战略为p=4,进入者不进入。
给定进入者的后验概率和战略,高成本在位者选择p=4,进入者不进入,u1=2+7=9;选择p=5,进入者进入, u1=6+3=9;选择p=6,进入者进入,u1=7+3=10,因此p=6是最优的。
二、Education game
工人:U(e,w;)=w-e/,e为信息,w为工资,为劳动者的素质,其中高生产率者H的概率为P,低生产率者L的概率为1-P,=E[]
雇主:U(w,)=-w,(e):给定教育程度时能力的概率分布,如果雇主完全竞争,则工资就等于劳动者的期望工作能力,即w(e)=(He)* H+ (Le)* L
行动顺序为工人先选择e,雇主根据e支付w,
PBE为何?
Education game的解法(一)
均衡定义与分类: (eH,eL,(•e))
(1)Pooling: eH=eL;(2)Separating: eHeL(3)Hybrid
Pooling: eH=eL=eP,,
信念:(HeP) =P, (HeeP)=0
=w(e=eP)=p* H+(1-p)* L
H: -ep/H L
L: -ep/L L
当ep p L( H-L)时均衡成立。
Education game的解法(二)
Separating: eH eL,eL=0
信念:(HeH) =1, (HeL)=0,
假设:(HeeHoreL)=0
如果不等式左边代表e=eH,,
不等式右边e=eL=0,则有
H: H-eH/H L(高生产率者选择eH)
L: H-ep/L L (低生产率者选择eL)
当L( H-L) eHH( H-L)时均衡成立。
Education game的解法(三)
Hybrid
(1) H: eH ; L: eH or eL(eL=0)
当pL( H-L) eHL( H-L)时可成立
(2) H: eH or eL (eL=0); L: eL=0
当(1-p)H( H-L) eHH( H-L)时可成立
讨论:顺序的重要性
可能有多重均衡
如果改成由公司先行动:只有一个可能的均衡
经验:拥有信息的人先行动,均衡多;处于信息劣势的一方先行动,均衡唯一。
第三节
KMRW(Kreps-Milgrom-Roberts-Wilson,1982)声誉模型
简化的KMRW声誉模型
市场上有大小两个厂商1,2,博弈分两个阶段,在第1阶段,厂商1降低产品价格挑起价格战(战),也可以选择和平相处(和),厂商2在第二阶段选择“退出” 和“留下”。
厂商1有“强”、“弱”两种类型,其概率分别为p,1-p,假设“强”厂商始终选择“战”。
厂商1选择“战”,厂商2在每期的支付为F2(第二期退出支付为0);如果对方选“和”,厂商2在每个阶段的支付为A2,满足F20A2。
厂商1选“战”、“和”时每期的利润分别是F1、A1,如果第二阶段厂商2退出,厂商1获得垄断利润M1,三者的关系是F1A1M1,假设跨时贴现因子为[0,1]。
N
厂商1
厂商1
厂
商
2
厂
商
2
强 p
弱 1-p
战 和
战 和
留下
退出
留下
退出
留下
退出
留下
退出
声誉模型
声誉模型的解题思路
“强”厂商1的战略已经假设总选择“战”,模型的重点是“弱”厂商会选择什么样的战略。
从单期看,因为F1<A1,他当然会选“和”;但由于有A1<M1,“弱”厂商自然希望厂商2在第二阶段退出市场,让自己获得垄断利润。要达到这一目的,在第一阶段选“和”显然不行。
如果在第一阶段佯装“强”厂商使用“战”,对方相信并退出市场,后期得到的额外利润贴现后还超过前期损失的话,即使厂商1是“弱”的也会有“战”的动机。
概括地说,“弱”厂商可能希望通过前期的行动为自己建立一个“强”的形象和声誉,让厂商2在后期知难而退。
声誉模型:分离均衡
分离均衡的特点:不同类型的参与人使用不同的战略,从而一个参与人一旦作出行动就相当于向所有人宣布了自己的类型。
分离均衡的条件:“弱”厂商1决定“和”,对手看到后调整自己的信念:p{1=弱和}=1;厂商2必然决定留在市场,厂商1的总利润(1+)A1; “弱”厂商确定可以吓退对手,决定“战”,总利润F1+M1,,因而存在分离均衡的条件是:(1+)A1F1+M1。
如果不等式成立,下述战略和信念构成一个完美贝叶斯均衡:“强”厂商1选“战”,“弱”厂商1选“和”;厂商2观察到对手战略后修正自己的信念:p{1=强战}=1, p{1=弱和}=1。
声誉模型:混同均衡
混同均衡的特点:不同类型的参与人选择相同的均衡战略,此时,参与人的行动不会暴露他的真实类型。
混同均衡的条件:如果两种厂商1都选“战”,没有给厂商2任何辨别的信息,厂商2看到对方行动后的信念等于先验概率:p{1=强战}=p;“弱”厂商1确定可以吓退对手,才值得选“战”,即厂商2在第二阶段期望支付小于零:
pF2+(1-p)A2<0,如果这个不等式成立,并且有:(1+)A1<F1+M1,那么下述战略和信念构成一个完美贝叶斯均衡:两种厂商1都选“战”,厂商2观察到对手战略后的信念:p{1=强战}=p,在该信念下,厂商2决定退出市场。
第五章 委托-代理理论
信息经济学引论
委托-代理理论的基本分析框架
最优激励合同
多阶段博弈动态模型
第一节 信息经济学引论
基本概念
基本分类及应用举例
一、基本概念
信息经济学是研究与信息不对称有关的经济行为及其相应的制度设计问题,是非对称信息博弈论在经济学上的应用。
博弈论是方法导向:给定信息结构,什么是可能的均衡结果。
信息经济学是问题导向:给定信息结构,什么是最优的契约安排。
二、基本分类及应用举例
信息经济学的分类:一是依据非对称发生的时间,二是依据非对称信息的内容,分类如下:
隐藏信号的道德风险模型
隐藏行动的道德风险模型
事后
逆向选择模型
信号传递模型
信息筛选模型
事前
隐藏信息
隐藏行动
逆向选择与道德风险
逆向选择:在鉴定交易契约前,进行市场交易的一方可能因为占据信息优势,做出对自己有利,对另一方有害的事情,从而降低了市场效率,甚至可能导致这一市场的萎缩。
道德风险:是指交易双方签订契约后,处于信息优势的一方在使自己利益最大化的同时,损害了处于信息劣势一方的利益,而且不承担由此造成的全部后果。
委托—代理问题
委托人(principal)与代理人(agent)的概念来自法律,经济学上的委托—代理关系泛指任何一种涉及非对称信息的交易,交易中有信息优势的一方称为代理人;不具有信息优势的一方称为委托人。
存在原因:保险与信用是暂时的;代理人试图从委托人那里获得更多的收益。
隐藏行动的道德风险模型
(moral hazard with hidden action)
签约时信息是对称的;签约后,代理人选择行动,自然选择状态;代理人的行动和自然状态一起决定某些可观测的结果;委托人只能观测到结果,而不能直接观测到代理人的行动本身和自然本身状态。
委托人的问题是设计一个激励合同以诱使代理人从自身利益出发选择对委托人最有利的行动。
例如:雇主与雇员的关系;保险公司与投保人;员工与经理;房东与住户;公民与政府官员等。
隐藏信息的道德风险模型
(moral hazard with hidden information)
签约时信息是对称的;签约后,自然选择状态;代理人观测到自然的选择,然后选择行动;委托人观测到代理人的行动,但不能观测到自然的选择。
委托人的问题是设计一个激励合同以诱使代理人在给定自然状态下选择对委托人最有利的行动。
例如:企业经理与销售人员的关系;股东与经理;债权人与债务人;原告(或被告)与代理律师等。
逆向选择模型(adverse selection)
自然选择代理人的类型;代理人知道自己的类型,委托人不知道;委托人和代理人签订合同。
例如:卖者和买者的关系;保险公司和投保人;雇主与雇员;债权人与债务人等。
信号传递模型(signaling model)
自然选择代理人的类型;代理人知道自己的类型,委托人不知道;为了显示自己的类型,代理人选择某种信号;委托人在观测到信号之后与代理人签订合同。
例如:雇主与雇员的关系;买者与卖者。
信息甄别模型(screening model)
自然选择代理人的类型;代理人知道自己的类型,委托人不知道;委托人提供多个合同供代理人选择,代理人根据自己的类型选择一个最适合自己的合同,并根据合同选择行动。
例如:雇主与雇员的关系;垄断者与消费者;保险公司与投保人。
说明
习惯上委托-代理理论是指隐藏行动道德风险模型。
逆向选择理论包括了信号传递模型与信息甄别模型
第二节
委托-代理理论的基本分析框架
保险市场与道德风险
激励机制设计的基本思想
委托-代理论的基本分析框架
一、保险市场与道德风险
消费者购买保险后,如果意外损失可以得到全部保险,即全部保险,那么他会放弃一些预防意外事故发生的措施,引起意外事件发生的概率提高;如果保险金额小于意外损失,即部分保险,与完全信息条件相比,投保人倾向于减少预防不测事件发生费用的支出。
二、激励机制设计的基本思想
委托人想使代理人按照前者的利益行动,但不能直接观察到代理人的行动,能观察到的另一些变量,是由代理人的行动与其他外生的随机因素共同决定的。委托人的问题是如何根据观测到的变量奖惩代理人,以激励选择对委托人最有利的行动。
激励机制设计分析
如表所示:如果委托人确定w=10,那么代理人选择不努力工作;如果委托人按利润支付工资,在利润为10、20,w=10,在利润为40,w=20,代理人选择不努力工作的收入为10,选择努力工作的预期收益为13,代理人选择努力工作。
激励机制设计分析
40
20
工作努力(a=1,c=2)
20
10
工作不努力(a=0,c=0)
运气好(=1)
运气坏(=0)
利润
经理表现
外在环境
三、委托—代理理论分析的基本框架
委托人设计契约,预期效用最大:
Ev=v(a,w,)g()d,v(a,w,)=(a,)-w()](1)
代理人接受契约,使自身效用最大:
Eu=u(a,w,)g()d,u(a,w,)=h(w)-c(a)
委托人面临的第一个约束,预期效用大于机会效用:Eu=u(a,w,)g()du*(2)(IR);
面临的第二个约束为激励相容条件,即代理人能够按照委托人设计的努力程度工作,Eu(a,w)Eu(a’,w)(3)(IC)
最优激励机制设计可以概括为:(1)、(2)、(3)
最优激励合同
如果代理人选择了某一契约,那么就可以根据激励机制方程计算出相应的w*,根据w*,确定代理人努力程度a。
委托人根据代理人创造的利润与付出的努力制定相应的工资,并通过观察代理人的行为,相应调整工资水平,促使代理人努力工作,使代理人承担了更多的风险。
第三节 最优激励合同
对称信息下的最优风险分担合同
对称信息下的最优激励合同
不对称信息下的最优激励合同
一、对称信息下的最优风险分担合同
如果委托人和代理人都是严格风险规避的,最优风险分担要求每一方都承担一定的风险;
如果委托人是风险中性者而代理人是严格风险规避者,那么代理人得到固定收入,委托人承担所有风险;
如果委托人是严格风险规避者而代理人是风险中性者,委托人得到固定收入,代理人承担全部风险。
二、对称信息下的最优激励合同
当委托人可以观测到代理人的努力水平时,怕累托最优风险分担和帕累托最优努力水平可以同时实现:委托人要求代理人选择最优努力程度a*,委托人根据努力程度支付代理人;否则,代理人得到最低支付。
如果委托人不能观测到代理人的努力水平和外生变量,而代理人是风险规避的,帕累托最优是无法实现的,最优激励合同要求代理人承担比对称信息情况下更大的风险。
如果代理人的行动不可观察,而代理人是风险中性的,帕累托最优可以实现。
三、不对称信息下的最优激励合同
如果委托人是风险中性的,在对称信息下,帕累托最优风险意味着代理人得到固定收入,不承担任何风险;在非对称信息下,代理人必须承担一些风险。
给定产出,如果代理人不努力时的概率大于努力的概率,w将减小;如果在代理人努力时的概率大于不努力时的概率,w将增加。
在合同中增加其他不需要成本的变量:如相对业绩比较,例如,同一行业不同企业的经营业绩除了受每个企业经营者的行为和特有的外生因素影响外,也受到行业性共同因素影响。
第四节 多阶段博弈动态模型
显性激励机制
代理人市场-声誉模型
棘轮效应(鞭打快牛)
一、显性激励机制
在静态模型中,委托人不能观测代理人的行动,为了诱使代理人选择委托人所希望的行动,委托人必须根据可观测的行动结果来奖惩代理人。这样的激励机制称为显性激励机制。
二、代理人市场-声誉模型
主要观点:在竞争的经理市场,经历的市场价值从而收入决定于其过去的经营业绩,从长期看,经理必须对自己的行为负完全的责任;因此,即使没有显性激励机制合同,经理也有积极性努力工作,因为这样做可以改进自己在经理市场上的声誉,从而提高未来的收入。
三、棘轮效应
如果用代理人过去的业绩作为现在业绩的评价标准,那么会出现以下情况:代理人越努力,好业绩出现的可能性越大,评价“标准”也就越高;当代理人预测到他的努力将提高评价“标准”时,他努力的积极性也就下降了。这种标准随业绩上升的趋向被称为“棘轮效应”。
两种模型的比较
声誉模型:根据代理人过去的业绩推段经理的经营能力将强化激励机制;传递的信息是有关经理的经营能力的信息,经营能力的所有权属于经理;经营业绩越好,市场所认为的经营能力越高,经理的报酬也越高。
棘轮效应模型:根据代理人过去的业绩推断企业的内在生产率将弱化激励机制;过去的业绩传递的是有关企业内在生产能力的信息,企业内在生产能力的所有权属于委托人;经营业绩越好,委托人认为的企业的内在生产能力越高,经理给委托人上缴的份额越高,因此,经理努力工作的积极性下降。
第六章 逆向选择与信号传递
逆向选择:旧车市场
保险市场上的逆向选择问题
逆向选择与信贷市场的配给制
信号传递:斯宾塞劳动力市场模型
第一节
逆向选择:旧车市场
逆向选择的定义
在鉴定交易契约前,进行市场交易的一方可能因为占据信息优势,做出对自己有利,对另一方有害的事情,从而降低了市场效率,甚至可能导致这一市场的萎缩。
旧车市场简述
在旧车市场,卖者拥有信息,买者缺乏信息,买者以平均质量的价格购买旧商品,将质量较高的旧商品逐出市场,质量较差的旧商品留在市场。在均衡的情况下,只有低质量的车成交,在极端情况下,市场可能根本不存在,交易的帕累托改进不能实现
Akerlof:the market for lemons
旧车市场有多个潜在的买者与卖者,卖者知道自己出售的车的质量,买者不知道,但知道的分布函数F(),买者与卖者均为风险中性。
买者出价P,卖者决定接受或不接受,如果接受,买者、卖者的效用分别为:B=V()-P、S=P-U(),且有V()U(),如果不接受,双方的效用均为0。
一、买卖双方有相同的偏好,只有两类卖主
两类卖主:=6000(高质量)或=2000(低质量),每一种的概率各为1/2;买卖双方有相同的偏好且对车的评价等于车的质量:V()=U()=
当买者不知道车的质量时,当两类车都进入市场,车的平均质量E=4000,买者愿意出的最高价格为P=4000;高质量的车退出市场,平均质量再次下降,唯一的均衡是P=2000,只有低质量的车成交,高质量的车逐步退出市场。
o
x
p
SH
SL
pH
pL
PL’
旧车市场与逆向选择
二、买卖双方偏好相同,但卖主的类型连续分布
假定车的质量在[2000,6000]区间上均匀分布,密度函数为1/4000。
如果所有的车都在市场出售,消费者愿意购买的价格为车的预期质量E=4000P=4000E=3000P=3000E=2500P=2500…P=2000,唯一的均衡价格是P=2000。
二、买卖双方偏好相同,但卖主的类型连续分布
如果用需求曲线表示买者愿意支付的最高价格与市场上车的平均质量的关系,则有P=E;供给曲线表示市场上车的平均质量与价格的关系,则有
区间是动态的,因而密度函数为1/(P-2000)。
供求均衡意味着P=E,唯一的交点和均衡点。
E
P
需求曲线
供给曲线
市场不存在
三、买者对车的评价高于卖者
假定买者对旧车的评价高于卖者,即存在V()=b>U()=(b1),旧车的交易就会出现。
交易带来的净剩余为(b-1),买卖双方的讨价还价决定净剩余的分配。
卖者的供给曲线仍为E=P/2+1000。
买者的需求曲线为P(E)=bE。
均衡价格与均衡质量分别为:P=2000b/(2-b),(b),E=min{2000/(2-b),4000}
三、买者对车的评价高于卖者
如果b=1,回到分析二。
如果b1,均衡价格和均衡质量均高于上例;均衡价格和均衡质量都是b的增函数,买者与卖者的评价差距越大,均衡价格越高,交易量越大。
当b=时,均衡价格等于3000,所有3000的车都进入交易,所有3000的车都退出交易,市场上出售的车的平均价格E=2500。
当b时,所有的车都成交,所有的车都成交,平均质量为=4000,均衡价格为P=4000b。
四、卖者的评价不同
在现实中,不同的卖者对同样质量的车的评价一般也是不相同的,假定U()=(1+),(是一个均值为0的随机变量);当(1+)P,卖者才会卖车。给定,市场上出售的车的平均质量为:E(P,)=P/2(1+)+1000,如果买者知道,他就可以知道市场上出售的车的质量。
均衡交易量取决于买者评价参数b以及卖者评价参数的共同作用。
第二节
保险市场上的逆向选择问题
保险市场
假设一家保险公司想提供汽车失窃保险,经调查发现,不同社区失窃情况差别很大,有的社区失窃率高,有的失窃率低,保险公司根据平均失窃率提供保险,结果如何?
假设n个人投保,投保价格p=P/x,汽车失窃率为,则保险公司的预期利益为:=-n(x-P)+n(1-)P=-n(1-p)x+n(1-)px,如果保险市场是完全竞争市场,则有=0,=p,即投保价格等于汽车失窃率。
保险市场
对应而言,失窃率高,投保价格高;失窃率低,投保价格低;如果采用平均失窃率,那么投保价格会高于失窃率低的社区,并将这一部分低风险的消费者挤出保险市场,保险公司利益受损,为逆向选择。
第三节
逆向选择与信贷市场的配给制
信贷配给
信贷配给是信贷市场上存在的一种典型现象,原因在于逆向选择现象存在,高风险的项目驱赶了低风险的项目。
信贷市场
信贷市场中,一般高风险与高收益成正比,银行不了解贷款者的类型,厂商知道自己的信息。导致贷款利率与银行期望收益之间的变化如图所示,利率上升的(直接的)收益效应大于(间接的)风险效应,随r上升而上升;当r>r*时,利率上升的(间接的)风险效应超过(直接的)收益效应,随r的上升而下降,银行期望收益最大化的利率为r*。
关于信贷市场的实例
例:两类项目其收益分别为:R1=,成功的概率p=;R2=,p=,其中高风险项目占1/4,低风险占3/4。
银行每单位贷款的期望收益:
=(1+r)(r);
=(1+r) (<r)
当r=略微上升时,低风险项目退出,银行单位贷款的期望收益急剧下降。
信贷配给市场均衡
r* rm r
DS
D*
S*
D(r)
S(r)
第四节
信号传递:
斯宾塞劳动力市场模型
一、信号传递与信息筛选模型
非对称信息导致帕累托最优交换经济不能实现,拥有私人信息的一方设法将信号传递给没有私人信息的一方,交易的帕累托改进就可以实现。
一、信号传递与信息筛选模型
信号传递模型:是指在交易前为了解决逆向选择问题,暂居信息优势的一方,会通过某种方式向处于信息劣势的人发出信号,把自己的某些物品或自身优秀的特征显示出来,以表明自己与众不同。
信息筛选模型:是指在交易之前,处于信息劣势一方,以某种方式给出区分不同类型的市场信号,以求获得自己所取信息,以此解决在交易中所处的信息劣势地位。
二、斯宾塞劳动力市场模型
斯宾塞劳动力市场模型:雇员的教育程度向雇主传递有关雇员能力的信息,原因在于,接受教育的成本与能力成反比,不同能力的人最优教育程度是不相同的。
二、斯宾塞劳动力市场模型
假定教育不影响劳动生产率,
受教育程度e=0(不接受教育)、1(接受教育);
高生产率者(H)MRH=ARH=3,低生产率者(L)MRL=ARL=1,二者受教育成本分别为cH=1,cl=3;
厂商支付工资WH=MR(e=1)=3,WL=MR(e=0)=1
二、斯宾塞劳动力市场模型
H:如果接受教育,净收益为WH-cH=2;如果不接受教育,净收益为WH-cH=1,H选择接受教育。
L:如果接受教育,净收益为WL-cL=0;如果不接受教育,净收益为WL-cL=1,L选择不接受教育;
通过受教育传递了高、低生产率差别信息,得到均衡。
二、斯宾塞劳动力市场模型
存在问题:(1)假设教育是连续的,教育水平如何确定,过高,H与L均选择不接受教育,过低,选择接受教育;(2)对于受教育者工资的制定,过高,都接受教育,过低,均不接受教育,以至教育无法起到传递生产率的作用。均衡是不唯一的,有分离均衡与混同均衡。
三、信息筛选模型
雇主先行动,提出合同菜单{w,e}(假定教育是连续的),雇员选择其中一个与雇主签约,根据合约接受教育e,得到w。
均衡是指存在一组合同和一个选择规则,使得(1)每一类型雇员在所有可选择的合同中选择一个最适合自己的合同(即能力的雇员选择(w,s) ,当只当对于所有的(w,s),U(w,s)U(w,s) );(2)雇主的利润不为负;(3)不存在新的合同使得选择提供该合同的雇主得到严格正的利润。
均衡是唯一的。