你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。
生活中的博弈
博弈(论):
(对策论,游戏论,Game Theory)
谋略(运筹谋划、老谋深算、PK、博与弈、 )
决策理论(考虑直接的对手存在、假想敌等情况下)
策略选择理论(冲突与合作情况下——哲学)
源于游戏,广泛存在于商贸、法律、政治、体育竞技和军事等社会经济活动中。
博弈思想
相互影响,利益相关;
设身处地,换位思考;
策略行为,互动双赢;
竞争合作,演进学习;
博弈论的应用
经贸活动
市场营销、国际贸易、股票投资、劳资关系;委托代理、合同理论、公司治理、机制设计;拍卖竞标、商务谈判、企业协作和政企关系等竞争合作
政治、法律、社会、军事和外交
博弈生存:无处、无时、无人不博弈
发展动因与局限性:知己知彼、交互性、与传统方法的联系和区别
中国古代的智慧
1、齐威王田忌赛马
古代齐威王与大将田忌赛马,田忌的谋士孙膑运用计谋帮助田忌以弱胜强。
比赛规则:田忌与齐威王各出三匹马,一对一比赛三场,每一场的输方要赔1000斤铜给赢方。双方的马按实力都可以分为上、中、下,但齐威王的上、中、下均优于田忌的上、中、下。实际上,田忌的上马、中马要优于齐威王的中马、下马。
比赛结果:田忌连输三场;后孙膑建议,以上对中、以中对下、以下对上,结果以2:1赢得比赛。
田忌赛马
3,-3
1,-1
1,-1
1,-1
-1,1
1,-1
1,-1
3,-3
1,-1
1,-1
1,-1
-1,1
1,-1
-1,1
3,-3
1,-1
1,-1
1,-1
-1,1
1,-1,
1,-1
3,-3
1,-1
1,-1
1,-1
1,-1
1,-1
-1,1
3,-3
1,-1
1,-1
1,-1
-1,1
1,-1
1,-1
3,-3
上中下
上下中
中上下
中下上
下上中
下中上
上
中
下
上
下
中
中
上
下
中
下
上
下
上
中
下
中
上
田忌
齐
威
王
得益矩阵
取胜关键:不让对方猜到自己策略,尽可能猜出对方策略
2、运筹帷幄
3、《孙子兵法》---“上兵伐谋、其次伐交、其次伐兵、其下攻城”
首先是用谋略挫败敌方的战略意图或战争行为。
其次是瓦解敌人的联盟
再次是选择与敌人正面决战,
最不聪明的办法是攻击敌人的城池。
也就是我们说的,不战而屈人之兵!
用谋略,而不是武力战胜别人是最高的!
从游戏到博弈
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技
游戏和经济等决策竞争较量的共同特征:规则、结果、策略选择,策略和利益相互依存,策略的关键作用
游戏——下棋、猜大小
经济——寡头产量决策、市场阻入、投标拍卖
政治、军事——美国和伊拉克、以色列和巴勒斯坦
博弈的概念——一个非技术性定义
定义:博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
四个核心方面
博弈的参加者(Player)——博弈方
各博弈方的策略(Strategies)或行为(Actions)
博弈的次序(Order)
博弈方的得益(Payoffs)
例1 情侣博弈
大海和小丽正在热恋,难得的周未又到了,安排什么节目去度周未呀?恰好在周未晚上,中国国家对世界杯外围赛的关键时刻,大海是超级球迷,而当晚有俄罗斯芭蕾舞在该市演出,小丽是喜欢艺术、芭蕾舞的,如果分开去,那就没有问题了,现在是热恋而又不想分开过周未,他门就面临一场温情笼罩下的博弈。
表
小丽
足球 芭蕾舞
大 足球
海 芭蕾舞
1,2
0,0
0,0
2,1
策略:
情景:
纽约城市中的一男一女,各自在城市中拥有一套廉租房,但他们的关系已经可以使他们只需要其中的一套。
女孩建议他们放弃其中的一套。
男方(经济学家)坚持拥有更多的(住房)选择,即使认为他们分手的可能性很小。
女孩建议放弃一套公寓,是一种筛选策略,让男孩放弃公寓(表示很爱她),要么反对(显示缺乏真心)
在这样的博弈中,真正的策略是信息的操纵(披露)。
传递自己好的信息的策略是“信号”
诱使他人采取行动,以可靠地显示其私人信息(好或坏),这样的策略是筛选。
人生是永不停息的博弈过程,博弈意味着通过选择合适策略达到合意结果。作为博弈者,最佳策略是最大程度地利用游戏规则;作为社会的最佳策略,是通过规则引导社会整体福利的增加。
博弈论的历史和发展
博弈论(game theory)是由美国数学家冯·诺依曼(Von. Neumann)和经济学家摩根斯坦(Morgenstern)于1944年创立的带有方法论性质的学科,它被广泛应用于经济学、人工智能、生物学、火箭工程技术、军事及政治科学等。
博弈论和经济行为(The Theory of Games and Economic Behavior)。标志着博弈理论的初步形成
在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响 。
约翰·纳什, 1928年生于美国 1994年Nobel 经济学奖得主
鲜花为何插在了牛粪上:成本?
牛粪与帅哥的博弈
帅哥
追 不追
牛 追
粪 不追
0,10
0, 12-C2
1000,10
0,12-C1
在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响 。
约翰·海萨尼,1920年生于美国
1994年Nobel 经济学奖得主
经济学家海萨尼(Harsanyi)
不完全信息博弈理论的奠基者,主要研究成果有:1)在合作博弈论研究上,给出 了合作博弈的通解----N人议价模型,建立了一个合作博弈论的非合作博弈的方法。2)在不完全信息博弈的研究上提出了以类型为基础的不完全信息博弈建摸方法,引入了贝叶斯技术求解方法。
3)在均衡选择研究上,与泽尔腾合作完成了《博弈论均衡选择的一般理论》
他提的不完全信息博弈思想及贝叶斯均衡概念,对博弈论和经济学产生了重大的影响。
泽尔滕(Selten)是动态博弈理论的开创者
主要贡献在纳什均衡的基础上研究了动态博弈问题,提出了子博弈完美均衡,颤抖手完美均衡,他提出的纳什均衡的“精练”概念,在扩展型博弈分析方面取得了重大的成果。
1996年,两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)、以及2001年三位经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学所取得的成就而成为这两个年度的诺贝尔经济学奖得主。
阿克尔洛夫最大的贡献是解释了在发展中国家里,信贷市场信息的不对称导致了这些国家信贷市场的过高利息。此外,阿克尔洛夫还把信息不对称运用于解释各种社会问题,比如因为信息不对称,医疗保险市场上,老年人、个体劳动者的医疗保险利益得不到保障。
2005年的诺贝尔经济学奖授予以色列希伯莱大学的罗伯特·奥曼(Robert )和美国马里兰大学的托马斯·谢林(Thomas ),以表彰他们“通过博弈论分析,促进了人们对冲突和合作的理解”。
托马斯·谢林()
1921年生于美国加利福尼亚州的奥克兰,1951年获得哈佛大学经济学博士学位。他曾就职于美国财政部,为杜鲁门政府做过顾问,在哈佛和耶鲁教过多年书,并获得了哈佛大学退休名誉教授的称号。谢林是西方非主流经济学家的代表人物之一,他的思想主张超越了传统经济学的经济理性假设,突破了经济学理论数学表示的传统方法,开创并发展了“非数理博弈理论”。
囚徒的困境是图克(Tucker)1950年提出的
该博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题,可以揭示市场经济的根本缺陷
1 问题:
两个小偷甲和乙联手作案,被警方逮住但未获证据。警方将两人分别置于两间房间分开审讯,政策是若一人招供但另一人未招,则招者立即被释放,未招者判入狱10年;若二人都招则两人各判刑8年;若两人都不招则未获证据但会以较轻的罪名各判1年。
小偷甲的选择:招或不招
小偷乙的选择:招或不招
甲或乙可以作出的选择被称为“策略”,如“招”或“不招”都是策略。
2 两小偷的最后选择是什么?
3 博弈的表达
表1 囚徒困境博弈
乙
招 不招
招
甲
不招
(问题1:甲、乙如何选择?)
-1,-1
-10,0
0,-10
-8,-8
局中人所选择的策略构成的组合(招,招)被称为博弈均衡。这个组合中前后两个策略分别表示甲和乙所选择的策略。
纳什均衡对权威的挑战
纳什均衡首先对亚当•斯密的“看不见的手”的原理提出挑战。
按照亚当•斯密的理论,在市场经济中,每个人都从利己目的出发,而最终全社会达到利他效果。
<国富论>中的名言:通过追求自身利益,他常常会比其实际想做的那样更有效的促进社会利益。
从纳什均衡我们引出“看不见的手”的一个悖论:从利己目的出发,结果损人不利己。
囚徒的困境通常被看着个人理性和集体理性的经典情形。
合作是有利的“利己策略”但它必须符合以下的黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样的方式来行事才行。
这就是“己所不欲施于人”,前提是“人所不欲施于我”
我们可以利用这个道理来分析日常生活中的许多不合作现象。
例子1 商家价格战
出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都赚不到钱
当一些商家共谋将价格抬高,消费者实际上不用着急,因为商家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩溃,价格就会掉下来。
譬如,2000年我国几家生产彩电的大厂商合谋将彩电价格维持高位,他们搞了一个“彩电厂家价格自律联盟”,并在深圳举行了由多家彩电厂商首脑参加的“彩电厂商自律联盟高峰会议”。
当时,国家有关部门还未出台相关的反垄断法律,对于这种在发达国家明显属于违法行为的所谓“自律联盟”,国家在法律上暂时还是无能为力的。寡头厂商在光天化日之下进行价格合谋,并且还通过媒体大肆炒作,这在发达国家是不可思议的。
但是,尽管政府当时无力制止这种事情,公众也不必担心彩电价格会上涨。这是因为,“彩电厂商自律联盟”只不过是一种“囚徒困境”,彩电价格不会上涨。在高峰会议之后不到二周,国内彩电价格不是上涨而是一路下跌。这是因为厂商们都有这样一种心态:无论其他厂商是否降价,我自己降价是有利于自己的市场份额扩 大的。
表1 价格博弈
百事可乐公司
高价 低价
可口 高价
公司 低价
2,2
9, 1
1,9
8,8
例子2 为什么在城市中心道路上禁止汽 车鸣喇叭?
禁鸣喇叭一方面是为了控制城市噪声污染,另一方面是基于以下的博弈论原因。见表2,当汽车司机可以鸣喇叭时,可能为汽车超速抢行提供条件。但当大家都抢行时,城市交通拥挤加重,反而都难以顺利通行,获得低支付(2,2)
表2 交通博弈
司机2
缓行 抢行
缓行
司机1
抢行
2,2
9, 1
1,9
8,8
但当对方缓行时,自己抢行会占便宜,获得支付9。
这个博弈中,“缓行”是劣战略,剔除后得到“剔除劣战略后的占优战略均衡”(抢行,抢行),这不是一个好的均衡。当禁止鸣喇叭时,司机为了避免造成交通事故,只得缓行,从而得到好的结果(缓行,缓行)。
例子3 为什么政府要负责修建公共设施,因为私人没有积极性出资修建公共设施
,做做 试试?
设想有两户相居为邻的农家,十分需要有一条好路从居住地通往公路。修一条路的成本为4,每个农家从修好的好路上获得的好处为3。如果两户居民共同出资联合修路,并平均分摊修路成本,则每户居民获得净的好处(支付)为3-4/2=1;当只有一户人家单独出资修路时,修路的居民获得的支付为3-4=-1(亏损), “搭便车”不出资但仍然可以使用修好的路的另一户人家获得支付3-0=3,见表2。
表2 修路博弈
乙
修 不修
修
甲
不修
0,0
3,-1
-1,3
1,1
我们看到,对甲和乙两家居民来说,“修路”都是劣策略,因而他们都不会出资修路。
这里,为了解决这条新路的建设问题,需要政府强制性地分别向每家征税2单位,然后投入4单位资金修好这条对大家都有好处的路,并使两家居民的生活水平都得到改善。
价格博弈
成本价格
古典经济学价格理论(原材料、能源、资本、劳动)
市场价格
新古典价格理论(效用决定、供求关系)
博弈价格—当代经济学
酒好也怕巷子深吗?
(博弈定价:既要产品好,又要卖得好,讨价还价能力)
企业博弈决策
通过上面的例子,我们对博弈的概念重新理解一下:
博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
四个核心方面
博弈的参加者(Player)——博弈方
各博弈方的策略(Strategies)或行为(Actions)
博弈的次序(Order)
博弈方的得益(Payoffs)
一个博弈需要设定下列四个方面:
(1) 博弈的参加者:是博弈的决策主体。是指博弈中独立决策、独立承担后果,以自身利益最大化来选择行动的主体(可以是个人,团体如厂家、政府、国家)。局中人以实现自身利益的最大化为目标。都可以作为博弈中的参加者。
判断博弈参与者的根本标志是他是否是博弈的利害关系者。只有在博弈中存在利害关系的决策主体才被看作是博弈的参与者。
那些不作决策或虽做决策但不直接承担决策后果的被动主体不是参与人,而只能当做环境参数来处理。如指手划脚的看牌人、看棋人,企业的顾问等。
天塌下来关我啥事
(2) 各博弈方各自可选择的全部策略或行为的集合。
可以是有限的,也可以是无限的
谈到博弈策略问题,可以说在我国传统文化中,包含有许多精妙的博弈策略。许多成语及成语典故,就是对博弈策略的令人叫绝的运用和归纳。如围魏救赵、背水一战、暗渡陈仓、釜底抽薪、狡兔三窟、先发制人、借鸡生蛋等等。
当然,博弈策略的成功运用须依赖一定的环境、条件,在一定的博弈框架中进行。
(3) 进行博弈的次序
(4) 博弈方的得益或支付
对应于各个博弈方的每一组可能的决策选择,都应有一个结果表示该策略组合下各博弈方的所得或所失。
如:利润、损失、个人效用和社会福利、经济福利等
博弈结构和博弈的分类
一、博弈的结构
1 博弈的博弈方
独立决策、独立承担博弈结果的个人或组织
博弈规则面前博弈方之间平等,不因博弈方之间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响
根据博弈方数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈,单人博弈是退化的博弈
(1).单人博弈:例:运输路线
-7000
-16000
-10000
-10000
好天气(75%)
坏天气(25%)
自 然
商
人
水 路
陆 路
运输路线得益矩阵
0
1
-7000
-10000
-16000
-10000
运输路线扩展形
好天气
(75%)
坏天气
(25%)
单人博弈实质
个体最优化问题
(2).两人博弈
1)两人博弈中,两个博弈方之间并不是总是对抗的,有时候会出现两博弈方利益方向一致的情况。如生产电视机和生产录象机的企业,采用相同的制式,各自的机器会配套,给双方带来互补性收益。
2)在两人博弈中,掌握信息较多的并不能保证利益也一定多。例如掌握信息多的博弈方常常更清楚过度竞争的危险,常采用保守的策略,从而得到较少的利益。
3)在一囚徒的困境博弈中,我们己证实,个人追求最大自身利益的行为,常常并不能导至实现社会的最大利益,也不能真正实现个人的最大利益。
.(3)多人博弈
存在所谓的“破坏者”
比如有三个城市争夺奥运会的主办权,如一个城市放弃,就可能改变争夺的情况。
课堂游戏:三方对决,弱者的 生存之道
假设有A、B、C 三个人决斗,每人有两粒子弹,每次可发射一抢。
A:射中概率为20%
B:射中概率为60%
C:射中概率为90%
如果按此顺序发射,两论后对决结束,那么,A的 策略是什么?
三个火枪手
你 会选择?
A的选择:
1 射B
2 射C
3 对空发射
结论:
放空枪!以弱胜强:鹬蚌相争,渔翁得利
这揭示了一个非常重要的博弈思想:
一个人,在社会上的生存不仅取决于其能力的大小,还要看其是否威胁到别的人。
”功高震主”
“木秀于林,风必摧之”,这是强者的悲哀。
有道是:惟其如此,大智者才需要表现出大愚,无他耳,自保而已。
三国风云:历史的解说
例2:曹操、孙权、刘备的博弈
三国的曹、刘、孙三家关系,就是“枪手博弈”很典型、也很有趣的例子。
“赤壁之战”中,曹操C实力最强,孙权次之,刘备最弱。孙、刘都无法单独对抗曹操。为了抵挡最强大的曹操,孙刘必须联合起来。孙权拥有六个郡的地盘和数万军队,而刘备没有地盘,只有不足两万人马。用前面的例子来比,孙权是B,刘备是A。
你可能已经发现:B和A似乎达成了某种默契:在C被干掉之前,他们相互不是敌人。
这不难理解,毕竟人总要优先考虑对付最大的威胁,同时这个威胁还为他们找到了共同利益,联手打倒这个人,他们的生存机会都上升。而且,从悲观的角度看,他们恐怕也活不到需要相互拼个你死我活的时候。
但这个“同盟”也是很不牢固的,两个人都在时时权衡利弊,一旦背叛的好处大于默契的好处,他们马上就会翻脸。
在这个“同盟”里,最忠诚的是B——只要c不死,他就不会背叛;A就要滑头多了,在前面轮流开枪的例子中,他不朝C开枪,从同盟者的角度说,就是没有履行义务,而把盟友送上危险的境地,这不是因为道德水平不同,而是处境不同。B是C的头号目标,这个敌人一定要向他开枪的,完全没有回旋的余地;而A不同,他随时愿意牺牲B换取下次自己的先手之利。
我们已经知道,B是这个“暂时联盟”中较肯卖力的一方,所以孙权不但“火烧赤壁”打败曹操,更在此后还长期承担了对抗曹操的主要任务。而刘备虽在赤壁之战中也出了力,但此后几年未与曹操打过大仗(也就是没有尽联盟义务)。倒是趁此机会扫荡地方势力,扩充地盘,直至占据两川,将曹操赶出汉中,又派关羽北伐,水淹七军,不但取代了孙权原来的老二地位,甚至有可能击败曹操,成为新的老大。孙权地位跌落到老三,他的策略也随之改变。
于是孙权趁关羽北伐后方空虚之机,与曹操合谋,夺取了荆州,杀死关羽。结果是同盟破裂,刘备兴兵报仇,又被孙权打败。蜀汉从此衰落,东吴也面临了两面作战的不利局面。
如果分析一下孙权的心理,我们可能对他的背信弃义有更多同情。赤壁之战尽管符合他的利益,但到底是他出力挽救了刘备,此后他不但把荆州长期借给刘备,还把妹妹嫁给了这个老头子。他尽了同盟的义务,曾与曹操大战数次,不仅损兵折将(他的大将太史慈、董袭、陈武等都在战斗中阵亡),而且他自己也险些在逍遥津送命。可是从收益上说,他与刘备是“牛打江山马坐殿”,感到不平衡是正常的。
可是从对策论来看,孙权却犯了一个大错误,由于嫉妒,他过早和刘备翻脸,致使两败俱伤。这就好比枪手A突然翻脸向B开火。坐收渔利的当然是C。虽然曹操的继任者曹丕没能抓住机会夹攻孙权,一举消灭这两个敌手,但蜀和吴此后已经没有可能打败魏国了。
那么,孙权的最优策略是什么?
回想上面的枪手决斗就明白了。既然已经落到丙的地位,就该以丙的策略行事。让刘备去和曹操恶斗,自己扩充势力,养精蓄锐,随机应变。无论两者胜负,自己都能从中渔利。
赤壁大战,曹操“樯橹灰飞烟灭”而败走华容道,诸葛亮料事如神,却用关羽把守最后一道关口,导致煮熟的鸭子飞掉。
诸葛亮料事如神,却用关羽把守最后一道关口,导致煮熟的鸭子飞掉,这令许多古人今人扼腕叹息——然而另有说辞却是:诸葛亮放走了曹操。
例3:是谁华容道放走了曹操
曹操、刘备、孙权三雄之中,刘备势力最为薄弱而曹操最强;并且曹操还“挟天子以令诸侯”,具有政治上的“正宗”优势。曹操一除,孙权自可用全部力量绞杀刘备,而此时的刘皇叔无丝毫还手之力,只能引颈待戮。因而唯有曹操才能牵制孙权,使孙有所顾忌而不得不联刘抗曹——对于刘备而言,此时的曹操可败而绝对不可死。
然而出于政治上的需要却不能不给世人演出一出戏,要让戏逼真又不出丝毫破绽,就必须连自己人也要蒙在鼓里。于是,神机妙算的孔明自然选择了关羽——只可惜了关羽至死都没明就里,认为欠军师的不杀之恩——这却也成就了关羽的义薄云天之名。
我们就能很容易地理解,枪战决斗可能类似于政治或经济的竞争。按照纽约大学政治学教授斯蒂温•布拉姆斯的看法:枪战决斗的知识可以扩展到多位候选人的政治竞选上,布拉姆斯说道:“看来这些候选人的最佳战略,莫过于在他的部分政治势力范围内追随最强的对手。如果你是一个自由主义者,而且另外还有两位自由主义者,那么你就要追随最强的一位。于是所发生的情况将是两位最强的对手就会彼此攻击,而且最弱者就会存留下来了。”这时,如果所发生的情况全面出现,那么最弱的候选人就会在其政治势力范围内幸存下来。
历史总是惊人的相似,更富颠覆性的说辞是诸葛孔明同样被人放了一马,而这却是源于孔明妖魅思维般的“空城计”。
如果情景又变了。你会怎样?
A:射中概率为100%,
B:射中概率为100%,
C:射中概率为100%
最优结果:
次优结果:
三优结果:
最差结果:
说完,学生们毫不犹豫拿起枪瞄相互着对方的一个。
问题:当他向空中开枪,后两个枪手会预见到相互残杀的结果,会有个约定,一起向解除武装的的开枪.
但这个约定是无效的.一但对手向解除武装的人开枪,自己向对手开枪就是自己的最优策略了…
发展战略博弈
没有永远的敌人(朋友),只有永远的利益
分久必合,合久必分
竞争合作战略管理
战略合作伙伴
人格上诚实守信
商业行为惟利是图
企业博弈决策
(2)博弈方的能力和理性问题
博弈方最主要的行为逻辑包括两个方面:
一是博弈方决策行为的根本目标
二是博弈方追求目标的能力
一般我们认为博弈方都是以个体利益最大化为目标,且有准确的判断选择能力,也不会“犯错误”。
以个体利益最大化为目标被称为“个体理性”
有完全美的分析判断能力和不会犯选择行错误称为“完全理性”
也可以说博弈论就是研究理性人行为选择的理论。
完全理性和有限理性
完全理性包括(追求最大利益的)理性意识、分析推理能力、识别判断能力、记忆能力和准确行为能力等多方面的完美性要求。其中任一方面的不完美就属于有限理性
因此,搏弈论既要研究“完全理性”的博弈问题,又要研究“有限理性”即博弈方的判断选择能力有缺馅情况下的博弈问题。
“旅行者困境”
博弈论也为我们提供了警示世人别太“理性聪明”的例子:
两个旅行者从一个以出产细瓷花瓶著名的地方旅行回来,他们都买了花瓶。提取行李的时候,发现花瓶被摔坏了。他们向航空公司索赔。航空公司知道花瓶的价格总在八九十元的价位浮动,但是不知道两位旅客买的时候的确切价格是多少。于是,航空公司请两位旅客在100元以内自己写下花瓶的价格。如果两人写的一样,航空公司将认为他们讲真话,于是按照他们写的数额赔偿;如果两人写的不一样,航空公司就论定写得低的旅客讲的是真话,并且原则上照这个低的价格赔偿,但是对讲真话的旅客奖励2元钱,对讲假话的旅客罚款2元。
哈佛大学巴罗教授提出的著名的“旅行者困境”。一方面,它有启示人们在为私利考虑的时候不要太“精明”,告诫人们精明不等于高明,太精明往往会坏事;但是另一方面,它对于理性行为假设的适用性提出了警告。
大家知道,理性行为假设是讨论消费者和企业这些经济主体人的行为的基本假设。所以经济学在理性行为假设之下得到的结论是否符合实际,还要进行另外的分析。在这个意义上,“旅行者困境”是所有博弈论学者甚至所有经济学者必须面对的困境。
(3)博弈方的个体理性和集体理性。
以个体利益最大为目标被称为“个体理性”
存在以集体(团体)利益为目标,追求集体利益最大化称为“集体理性”
囚徒的困境揭示了个体理性和集体理性之间的矛盾。
一般情况,集体利益最大化本身不是博弈方的根本目标,人们在博弈中的行为准则是个体理性而不是集体理性。
如果在博弈中存在“有约束力的协议”,使得博弈方采取符合集体利益最大化而不符合个体利益最大化的行为时,能够得到有效的补偿,从而使博弈方按照集体理性决策和行动成为可能。
我门将允许存在有约束力协议的博弈方称为“合作博弈”
不允许存在有约束力协议的博弈则称为“非合作博弈”
合作的 基础 :
(1)存有共同的利益
(2)必要的信息交流,消除各方的参与者的信息不对称,才 能使参与者对 合作有一个较为稳定的预期。
(3)自愿、平等和互利
(4)强制性的契约
所以,合作博弈论允许博弈各方通过谈判与沟通来树立合作意识
合作研发
商业伙伴与商机
可信承诺(威胁)
竞争还是合作
守信还是违约
企业博弈决策
1,1
3,2
留一手
2,3
5,5
投 入
留一手
投 入
中 方
外
企
2 、博弈中的策略
策略:博弈中各博弈方的选择内容
策略有定性定量、简单复杂之分
不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同
有限博弈:每个博弈方的策略数都是有限的
无限博弈:至少有某些博弈方的策略有无限多个
例 古诺模型 (双寡头垄断模型)
一个行业有两个寡头垄断企业垄断,两寡头生产完全同质,令q1,q2分别表示企业1 和企业2 生产的产品,市场中该产品的总供给为Q= q1+q2,令
P(Q)=a — Q 为需求曲线(如果Q> a
那么, P(Q)=0)
设企业生产qi的总成本Ci(qi)= C qi,即企业不存在固定成本,且生产每单位产品的边际成本为常数C,假定C<a
3、 博弈中的得益 (支付)P29
得益:各博弈方从博弈中所获得的利益
得益对应博弈的结果,也就是各博弈方策略的组合
得益是各博弈方追求的根本目标及行为和判断的主要依据
根据得益的博弈分类:零和博弈、常和博弈、变和博弈
1)零和博弈:
也称“严格竞争博弈”。博弈方之间利益始终对立.即一方的得益必定是另一方的损失。
指的是所有博弈方的得益总和为零,各种赌博就属于零和博弈。例如4个人参与一场赌博,其中3个人输了总共1000元,那么另外一个人必然赢了1000元。期货交易市场的参与者之间的关系也属于零和博弈。人们平常所说的“损人利己”实际上也包含有零和博弈的意思。
例如: —猜硬币,田忌赛马,石头-剪刀-布
2)常和博弈:
博弈方之间利益的总和为常数。博弈方之间的利益是对立的且是竞争关系
如在几个人或几个方面之间分配固定数额的奖金、财产或利润的讨价还价,就是这种博弈问题。
在同一个股票市场,面对同样的大盘走势,伴随着投资者的投资策略不同,有可能大部分人赚钱而小部分人亏钱,也有可能小部分人赚而大部分人亏,甚至还有可能所有人都赚或都亏。
—分配固定数额的奖金、利润,遗产官司
3)变和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问题的重要性.
变和博弈是指在不同的策略组合下各博弈方的利益之和往往是不一样的。
—囚徒困境、产量博弈、制式问题等
4 、博弈的过程 P31
博弈过程:博弈方选择、行为的次序,包括是否多次重复选择、行为。
博弈过程对博弈结果也有重要影响。
根据博弈的过程,博弈可分为静态博弈、动态博弈、重复博弈。
(1)静态博弈
博弈的参与者同时作出决策(或者虽然决策有先后,但是没有人在决策之前看到了其他参与者的决策行为),一旦决策做出之后,就只能等待结果,对博弈的发展再也不能产生任何影响,这种博弈叫做静态博弈。
譬如,在投标活动中,投标人投出标书一般虽有先后,但因为所有投标人在开标前都不知道其他投标人的标价,因此可看作同时选择策略,采取行动。体育竞赛中,双方出场阵容的选择也属于静态博弈。
(2)动态博弈
动态博弈则是指博弈方的选择和行动有先后之分,后行者可以根据先行者的策略选择来决定自己的策略。
如A企业降价后,B企业也跟着降价;足球比赛中,一方换上一名攻击性前卫后,另一方针对性地换上一名后卫;如此等等。
(3)重复博弈:
实际上就是同一个博弈反复进行所构成的博弈过程。
提供了实现更有效略博弈结果的新可能—长期客户、长期合同、信誉问题
如果你去菜场买菜,当你对某种菜的质量、口味等有疑虑时,卖菜的阿姨常会讲:
例:艾克斯罗德
“重复囚徒困境”的游戏
参与人1
合作 背叛
合作
参与人2
背叛
1,1
5, 0
0,5
3,3
艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。
艾克斯罗德做了一个实验,邀请多人来参加游戏,得分规则与前面的矩阵相同,什么时候结束游戏是未知的。他要求每个参赛者把追求得分最多的策略写成计算机程序,然后用单循环赛的方式将参赛程序两两博弈,以找出什么样的策略得分最高。
有“善良的”、“邪恶的”、“随意的”三类
胜出的是:“一报还一报”策略
特点是:
1 清晰性:一牙还牙,一眼还眼。一合作还合作,以背叛还背叛
2 善良性:开始善意的合作,不先背叛
3 报复性:
4 宽容性:
第一轮游戏有14个程序参加,再加上艾克斯罗德自己的一个随机程序(即以50%的概率选取合作或不合作),运转了300次。结果得分最高的程序是加拿大学者罗伯布写的“一报还一报”(tit for tat)。这个程序的特点是,第一次对局采用合作的策略,以后每一步都跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。
艾克斯罗德还发现,得分排在前面的程序有三个特点:第一,从不首先背叛,即"善良的";第二,对于对方的背叛行为一定要报复,不能总是合作,即" 可激怒的";第三,不能人家一次背叛,你就没完没了的报复,以后人家只要改为合作,你也要合作,即"宽容性"。
为了进一步验证上述结论,艾氏决定邀请更多的人再做一次游戏,并把第一次的结果公开发表。第二次征集到了62个程序,加上他自己的随机程序,又进行了一次竞赛。结果,第一名的仍是"一报还一报"。艾氏总结这次游戏的结论是:第一,"一报还一报"仍是最优策略。第二,前面提到的三个特点仍然有效
在一个极端自私者所组成的不合作者的群体中,“一报还一报”能否生存呢?
艾氏发现,只要群体的5%或更多成员是“一报还一报”的,这些合作者就能生存,而且,只要他们的得分超过群体的总平均分,这个合作的群体就会越来越大,最后蔓延到整个群体。反之,无论不合作者在一个合作者占多数的群体中有多大比例,不合作者都是不可能自下而上的。
这就说明,社会向合作进化的棘轮是不可逆转的,群体的合作性越来越大。艾克斯罗德正是以这样一个鼓舞人心的结论,突破了"囚犯困境"的研究困境。
在研究中发现,合作的必要条件是:第一、关系要持续,一次性的或有限次的博弈中,对策者是没有合作动机的;第二、对对方的行为要做出回报,一个永远合作的对策者是不会有人跟他合作的。
艾克斯罗德在《合作的进化》一书结尾提出几个结论。
第一、友谊不是合作的必要条件,即使是敌人,只要满足了关系持续,互相回报的条件,也有可能合作。比如,第一次世界大战期间,德英两军在战壕战中遇上了三个月的雨季,双方在这三个月中达成了默契,互相不攻击对方的粮车给养,到大反攻时再你死我活地打。这个例子说明,友谊不是合作的前提。
第二、预见性也不是合作的前提,当有预见性的人类了解了合作的规律之后,合作进化的过程就会加快。这时,预见性是有用的,学习也是有用的。
那么,如何提高合作性呢?
首先,要建立持久的关系,即使是爱情也需要建立婚姻契约以维持双方的合作。(火车站的小贩为什么要骗人?为什么工作中要形成小组制度?)
第二、要增强识别对方行动的能力,如果不清楚对方是合作还是不合作,就没法回报他了。
第三、要维持声誉,说要报复就一定要做到,人家才知道你是不好欺负的,才不敢不与你合作。
第四、能够分步完成的对局不要一次完成,以维持长久关系,比如,贸易、谈判都要分步进行,以促使对方采取合作态度。
第五、不要嫉妒人家的成功,“一报还一报”正是这样的典范。
第六、不要首先背叛,以免担上罪魁祸首的道德压力。
第七、不仅对背叛要回报,对合作也要作出回报。
第八、不要耍小聪明,占人家便宜。
艾克斯罗德的一些结论在中国古典文化道德传统中可以很容易地找到对应,“投桃报李”、“人不犯我,我不犯人”都体现了这种思想。但这些东西并不是最优的,因为“一报还一报”在充满了随机性的现实社会生活里是有缺陷的。
对此,孔子在几千年前就说出了"以德报德,以直报怨"这样精彩的修正策略,是一种修正了的"一报还一报",修正的是报复的程度,本来会让你损失5分,现在只让你损失3分,从而以一种公正审判来结束代代相续的报复,形成文明。
重复博弈在现实中是很难完全实现的。一次性博弈的大量存在,引发了很多不合作的行为,而且,对策的一方在遭到对方背叛之后,往往没有机会也没有还手之力去进行报复。
在这些情况下,社会要使交易能够进行,并且防止不合作行为,必须通过法制手段,以法律的惩罚代替个人之间的"一报还一报",规范社会行为。
爱情博弈
女孩
变心 不变心
变心
男孩
不变心
8,8
0, 10
10,0
5,5
在这场爱情的游戏中
恋人最得意的选择是
另觅新欢
最天真的选择是
天荒地老
最理性的选择是
分道扬镳
最糟糕的选择是
被另有新欢的对方无情抛弃。
问题是最得意的结局
过于缺德
最天真的结局
过于虚幻
最理性的结局
过于残酷
最糟糕的结局
又(让一方)过于心痛。
但是,现实中的恋人,大都希望天荒地老,没有谁愿意回头是岸,甚至被对方抛弃了也不死心。为什么会这样呢?
恋人们被爱情抓住以后,一般并不是隔离的,而是整天泡在一起。泡在一起干什么呢?除了发誓,还是发誓!人生发誓最多的时期,大概就是恋爱期。
我如果没有愁过你的愁,没有思虑过你的思虑,我就不配说我爱你
所以,要想在恋爱中成为赢家,你最好是不遵守爱的诺言,如此才能走出“囚徒困境”。
不过我们不要忘了,如果是一次性的博弈,“囚徒困境”必然发生。就是说背叛是必然的
原因就在于这是一次性的博弈。
所以,获得幸福爱情的博弈原则是:
第一,善意而不是恶意的对待恋人。
第二,宽容而不是尖刻的对待恋人。
第三,强硬而不是软弱的对待恋人。就是要在我永远爱你的善意的前提下,做到有爱必报,有恨也必报,以眼还眼,以牙还牙,以其人之道,还治其人之身。这其中,当然是要有限度和分寸的。
第四,简单明了而不是山环水绕的对待恋人。
5 博弈的信息结构 P35
(1)得益的信息
我们将各个博弈方都完全了解所有博弈方各种情况下得益的博弈称为“完全信息”
至少部分各博弈方不完全了解其它博弈方的得益情况,称为“不完全信息(Incomplete Information)博弈”。又称“不对称信息(Asymmetric Information)博弈”。
其中不完全了解其它博弈方的得益情况的博弈方称为“具有不完全信息的博弈方”。
是否了解所有博弈方的得益情况,显然会影响对其他博弈方行为的判断,并最终影响各博弈方自己的决策和行为。
(2) 博弈的过程信息
动态博弈中在轮到行为时对博弈的进程完全了解的博弈方,称为具有“完美信息”(Perfect Informati on)的博弈方,如果动态博弈的所有博弈方都有完美信息,则称为“完美信息的动态博弈”。
动态博弈中轮到行为的博弈方不完全了解此前全部博弈的进程时,称为具有“不完美信息”(Imperfect Information) 的博奔方,有这种博弈方的动态博弈则称为“不完美信息的动态博弈”。
在动态博弈中各博弈方是否具有完美信息对博弈方的决策、行为和博弈结果也有很大的影响。没有完美信息,意味着决策和行为必然有一定的盲目性。
对称信息:没有参与人在行动时或在终点处有其他参与人不同的信息。
不对称信息:存在参与人在行动时或在终点处有其他参与人不同的信息。
总结:博弈的信息结构
完全信息博弈:各博弈方都完全了解所有博弈方各种情况下的得益
不完全信息博弈:至少部分博弈方不完全了解其他博弈方得益的情况的博弈,也称为“不对称信息博弈”
完美信息博弈:每个轮到行为的博弈方对博弈的进程完全了解的博弈
不完美信息博弈:至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈
总结:博弈方的能力和理性
完全理性和有限理性
完全理性:有完美的分析判断能力和不会犯选择行为的错误
有限理性:博弈方的判断选择能力有缺陷
个体理性和集体理性
个体理性:一个体利益最大为目标
集体理性:追求集体利益最大化
合作博弈:允许存在有约束力协议的博弈
非合作博弈:不允许存在有约束力协议的博弈
二、博弈的分类:
我们可以从不同角度对博弈进行分类
1、是分为合作博弈与非合作博弈。
如果各博弈方能达成某种有约束力的契约或默契,以选择共同的策略,此种博弈就是合作博弈。反之,就属于非合作博弈。企业之间的联合定价就属于合作博弈,而经常挑起价格战的企业采用的便主要是非合作博弈。在合作博弈中往往包含着非合作博弈,如石油输出国组织是合作博弈的产物,但其中为了各自利益的超产和争吵又属于非合作博弈。
合作博弈——研究人们达成合作时如何分配合作得到的收益,即收益分配问题。
非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。
2、是分为静态博弈与动态博弈。
3、是分为完全信息博弈与不完全信息博弈。在前一种博弈中,每一个参与者都拥有全部的相关信息,只拥有部分相关信息的便属于后一种博弈。
总结: 博弈的分类和博弈理论的结构
非合作博弈和合作博弈
非合作博弈范围内:完全理性博弈和有限理性博弈(进化博弈)
静态博弈,动态博弈,重复博弈
完全信息静态博弈,不完全信息静态博弈,完全且完美信息动态博弈,完全但不完美信息动态博弈,不完全信息动态博弈
零和博弈和非零和博弈,单人博弈和多人博弈
总结:
1、根据博弈方的数量可分为单人博弈、两人博弈和多人博弈;
2、根据博弈方策略的数量可分为有限博弈和无限博弈;
3、根据得益情况可分为零和博弈、常和博弈及变和博弈;
4、根据博弈过程可分为静态博弈、动态博弈和重复博弈;
5、根据信息结构可分为完全信息博弈和不完全信息博弈,以及完美信息动态博弈和不完美信息动态博弈;
6、根据博弈方的理性和行为逻辑差别分为完全理性博弈和有限理性博弈,非合作博弈和合作博弈。
经济博弈论的理论结构
不完全信息动态博弈
完美贝叶斯纳什均衡
塞尔腾等(75年)
不完全信息静态博弈
贝叶斯纳什均衡
海萨尼(67、68年)
不完全
完全信息动态博弈
子博弈完美纳什均衡
塞尔腾(65年)
完全信息静态博弈
纳什均衡
纳什(1950、51年)
完全
动态
静态
决策
信息
进一步还可分为完美信息与不完美信息。
不完全信息博弈
知己知彼、百战不殆
非对称信息
从南京到北京,买主没有卖主精
忽悠盛行
柠檬问题
二手车市场的低效率(劣币驱逐良币)
私有信息
信息分布、信号甄别、信号发送
企业博弈决策
谈判博弈
准确判断对手
制胜关键
过高估计对手
信心不足;得不偿失
过低估计对手
轻敌--被动--失败
企业博弈决策
竞标博弈
如何参与竞标
对手情况分析
合理确定竞标价格
影响因素分析
投标价格、方案策略的制定方法
案例分析
中央电视台黄金时段广告拍卖
企业博弈决策
企业忠诚与职业忠诚的对决
激励相容、充分调动员工积极性
机制设计,激励相容:
企业让员工干的事,正是员工自己愿干的事
分类管理、个性化设计
混合均衡、分离均衡
把握临界点
企业文化与软环境建设
企业博弈决策
雇佣关系中的互惠原则
博弈实验
互利互惠
感情投资、行为动机
知恩图报
滴水之恩,涌泉相报
针锋相对
即以其人之道,还治其人之身
报复惩罚策略:以血还血,以牙还牙
企业博弈决策
在博弈论不断取得进展的同时,经济学家们在一些应用领域分别独立地提出了后来被发现与博弈论有关的许多模型。这些来自不同的应用领域所产生的经济学问题,尽管几乎都是相互独立地被发现的,但后来被认为具有相同的理论背景,即几乎都是因为信息不对称导致局中人在不完全信息条件下进行博弈的结果。从经济分析的方法论角度看,这些模型实际上是博弈论在不完全信息条件下的应用。于是,人们就将这些原本是独立做出的模型集合成一个经济学的分支体系,这就是现在被人们所熟知的“信息经济学”体系
委托—代理关系:不对称信息
当你委托你的律师为你处理某件事务时,你与律师之间的委托—代理关系就发生了。在法律上,当某A授权于某B代表A从事某种活动时,就发生了“委托—代理”关系。其中A是“委托人”,B是“代理人”。
所以,人们根据其不同的特征方面,也还给它取了其它的一些不同于“信息经济学”的名称,如委托—代理理论,合约理论(契约理论、合同理论)等等
信息经济学:从本质上讲,信息经济学是非对称信息博弈论在经济学上的应用。
博弈中不拥有私人信息的参与人
交易中没有信息优势的一方
博弈中拥有私人信息的参与人
交易中有信息优势的一方
委托人
代理人
法律上,当A授权B代表A从事某种活动时,委托-代理关系就产生了,A为委托人,B为代理人。
经济学上的委托-代理关系泛指任何一种涉及非对称信息的交易,交易中有信息优势的一方称为代理人,另一方称为委托人。
这样的定义背后隐含的假设是:知情者的私人信息影响不知情者的利益,或者,不知情者不得不为知情者的行为承担风险。
委托-代理理论
委托人
代理人
提供合同
代理人
接受
不接受
选择行动
努力或不努力
自然
高
低
某些可
观测的
结果
代理人:代理人的行动和自然状态一起决定某些可观测的结果。
委托人:不能观测到代理人行动本身和自然本身,只能观测到结果。
委托人的问题是:设计一个激励合同以诱使代理人从自身利
益出发选择对委托人最有利的行动。
签约时信息是对称的
在委托—代理关系的两个人之间,代理人的行为或代理人拥有的某些信息或知识不为委托人所能观察到或所知道,至少,委托人不能不花成本地观察到代理人的行为或掌握代理人拥有的某些信息。
譬如,你的律师或许没有尽心尽力地为你工作。这样,代理人就可能为了其自身的利益选择其行动而损害委托人的利益,称这种行为为代理人对委托人造成的“道德风险(Moral Hazard)。
对于委托人来说,如果不是直接监督代理人的行为(这种监督是要花费成本的),就存在一个如何对代理人选择符合委托人利益的行动进行激励的问题。
委托人可以与代理人签署合约,约定根据他们都能观察到的某些指标由委托人向代理人支付报酬或奖励的规则。委托人如何设计并挑选对其最有利的这类合约是委托—代理理论的核心问题,因而,委托—代理理论又被称为“合约(合同,契约)理论”。
更为一般性的提法是,博弈的一个局中人如何设计对其最有利的博弈规划(如果这个局中人有能力支配其他局中人对其所设计的博弈规则的接受的话),也是一个更为广义的合约问题,称为“机制设计”问题。所以,合约理论、委托—代理理论、信息经济学、机制设计等等,这些不同的名称通常说的是一回事。
在你委托律师为你工作的例子里,不能无成本地观察到的行动或掌握的信息发生在你与律师发生“委托—代理关系”之后,称为“事后”的信息不对称。
与之相对应,发生在“事前”的信息不对称。
包括诸如招聘、投保、商品销售和银行贷款的过程中。当一家公司招聘员工或经理时,对于应聘者的真实能力的信息,公司是不清楚的。投保人向保险公司投保时,如果是人身保险或寿险,保险公司也拿不准投保人身体健康状况的真实情况。消费者在购买商品时,不能掌握有关商品质量的全部信息。商业银行在为一个项目贷款时,也一般不能对项目的风险有完全准确的估计。
类似地,发生在“事前”的信息不对称还包括信息本身的不对称,称为“知识”的不对称。这是指一个局中人所掌握的某些知识不被另外的局中人在事前所知。
为了将众多的信息不对称例子加以归类,我们将分别发生在事前和事后,以及是关于行动还是关于信息或知识的信息不对称分为以下几种:
2、隐藏信息的道德风险模型
1、隐藏行动的道德风险模型
事后
3、逆向选择模型
4、信号传递模型
5、信息甄别模型
事前
隐藏信息
隐藏行动
非对称信息发生的内容
非 对称信息发生的时间
非对称发生在事前(签约前),逆向选择模型;
非对称发生在事后(签约后),道德风险模型。
研究不可观测行动的模型称为隐藏行动模型;
研究不可观测信息的模型称为隐藏信息(或知识)模型
委托-代理理论应用模型
技能和教育
产品质量和保修
工人
卖方
雇主
买方投资
信号传递和信息甄别
工作技能
感染爱滋病病毒
雇员
投保人
雇主
保险公司
逆向选择风险
任务的难易/工作努力
市场需求/投资决策
赢的概率/办案努力
雇员
经理
代理律师
雇主
股东
原告/被告
隐藏信息的道德风险
耕作努力
工作努力
房屋修缮
廉洁或贪污
偷盗的次数
佃农
经理
房东
政府官员
犯罪
地主
股东
住户
公民
社会
隐藏行动的道德风险
行动、类型或信号
代理人
委托人
模型
信息经济学的基本分类
隐藏行动的道德风险
隐藏信息的道德风险
逆向选择模型
信号传递模型
信息甄别模型
需要说明:
1、 信号传递模型和信息甄别模型是逆向选择模型的特例,或者说,信号传递模型和信息甄别模型是解决逆向选择问题的两种不同的方法。
2、习惯上,委托代理理论只是“隐藏行动道德风险”的别称,一般说的委托-代理理论仅指这类模型。
3、故将模型简化为两类:委托代理模型和逆向选择模型。
逆向选择模型
委托代理模型
1 隐藏信息的道德风险
委托人
代理人
提供合同
代理人
接受
不接受
消息
行动努力
自然
状态
状态
代理人:自然选择状态(可能是代理人的类型),代理人观测到自然的选择,然后选择行动(如向代理人报告自然的状态)。
委托人:能观测到代理人的行动,但不能观测自然的选择。
委托人的问题是:设计一个激励合同以诱使代理人在给定自然状态下选择对委托人最有利的行动(如真实报告自然的状态)。
签约时信息是对称的
事前的隐藏信息博弈
这类博弈包括逆向选择、信号传递、信息甄别
信息甄别是一种解决事前信息不对称的机制设计,它是通过分离均衡而达到将不同类型局中人加以识别开来的目的。
在这类不对称信息博弈中,还包括保险市场、金融市场、垄断者价格岐视、公司内部持股比例、公司资本结构等模型。在保险公司与投保人之间签订保险合约时,保险公司不是很清楚投保人的健康状况。商业银行在贷款给企业时,对企业或项目的还款能力也不是很清楚的。垄断者在销售其产品时,不是很清楚顾客的需求强度,因而设计一些岐视性价格来揭示出顾客的需求强度类型,此时博弈表现为信息甄别。公司内部持股比例愈高,说明公司愈好,因为内部人比外部投资者更清楚公司的实力,这也是一种信号传递博弈。
逆向选择模型
委托人
代理人
提供合同
自然
代理人、委托人:自然选择状态-可能是代理人的类型,代理人观测到自然的选择,知道自己的类型,委托人不知道,委托人和代理人签定合同。
接受
不接受
逆向选择:是由于信息不对称导致对自己不利的选择
例子:卖者和卖者-买的没有卖的精
卖者对产品的质量、进价等信息比买者知道得多。
委托人:买者
代理人:卖者
逆向选择问题
4、二手车市场为何难火起来
5、价格离散
6、雇佣中的逆向选择
7、信贷配给
8、穷人借款为何难
9、金融市场上的逆向选择
10、送上门的没好货
11、有的东西在卖时为什么不允许选择
12、婚姻中的逆向选择-王子与灰姑娘、门当户对
有时候选择离开是表示真爱的一个信号
道德风险的例子
道德风险是由于信息不对称而采取的损人利己的行为
1、他搞垮了巴林银行
巴林 银行的倒闭,固然有其管理的问题,但员工里森的道德风险加剧了管理问题。
为什么里森会放弃没有风险的操作方案,而去采取风险极大的操作方案,在于银行的报酬制度。
2、汽车事故与安全带
3、管理层的不当行为
(1)努力不足
(2)过度投资
(3)防御策略
(4)自利行为
信号传递例子:
疾风知劲草,危难显忠诚
当披露私有信息可以给个人带来好处时,人们就会试向对手披露自己的信息,向对手披露私有信息的这种行为,就是信号传递。
有效的信号之所以能够成功,其原因在于拥有不同私人信息的(即不同类型)的参与人能够承受的发送相同信号的代价是不同的,如果这种承受相同信号之代价的能力差异足够大,那么信号接受一方就可以通过信号判断发送者的类型。
好人与坏人的例子
1、好人和坏人通过做好事和做坏事,推断出他们的类型(好人、坏人),即无论做好事还是坏事,都传递参与人类型的有效信号,这就是 分离均衡。
2、更多的是信号部分有效,好人之做好事,做不了坏事。坏人做坏事有时为了需要也做好事,这样,做好事这个信号并没有传递有效的信号,而做坏事则传递了有效的信号,这种情况称做半分离均衡。
3、无论好人和 坏人,都做好事或坏事。这时,做好事与做坏事就都不能成为传递有效的信号,这叫混同均衡。
信号传递模型
委托人
代理人
提供合同
接受
不接受
消息
自然
状态
状态
代理人:知道自己类型,为了显示自己的类型,代理人选择某种信号传递自己的类型给委托人。
委托人:不知道代理人的类型,但能观测到代理人传递的信号,在观测到信号后与代理人签定合同。
代理人
发送信号
信号传递模型
例子:雇主与雇员
雇员知道自己的能力,雇主不知道;为了显示自己的能力,雇员选择接受教育水平;雇主根据教育水平支付工资。
例子:垄断厂商的低价销售:信号传递博弈
有许多垄断厂商并未如人们所料想的那样给商品定出一个很高的价格,而是以较低的价格长期销售某种产品。譬如,发达国家的私营铁路、航空、海运码头等的价格都远低于按照其垄断定价方法定出的价格。这是什么原因呢?
记得有一个电视剧,其中有一个情节是一位武林豪杰在交通要道边开了一个酒馆。生产十分兴隆,引起另一位武林高手的垂涎。这位武林高手决定打败那位豪杰然后霸占酒馆。两强相遇,武林豪杰和武林高手相互之间不知对方底细,于是来一番比试。本来,他们俩可以通过打斗来解决问题,但打斗一场双方都会有所损伤,不如通过其他方式比较武功高低。豪杰拿来5块砖,一掌将其击碎,高手也不示弱,照样击碎5块砖。于是,豪杰又拿来十块砖,同样是一掌击个粉碎,高手见之,心中没底,于是明白自己武功较豪杰还差一截。于是,这位武林高手甘拜下风,放弃了原来的计划,弃剑而去。
这个电视剧情节在博弈论中被称为“信号传递博弈”。豪杰身怀绝技、天下无敌。但其他人不一定会相信他是武林第一高手,除非亲自与之交手并败于他。交战虽然可以决出高下,但对双方都会有损失,打个头破血流对谁都不是好事。当然,豪杰可以对外宣布他的武功非凡,其他人不是他的对手,但即使豪杰没有什么本事,也可以如此对外宣布。所以,仅凭口头宣布是难以令人信服的。
俗话说,是骡子是马,拉出去蹓蹓。豪杰用过人武功劈掉别人难以模仿的十块砖,就向别人发出一个信号。这个信号向外传递的信息是:我的武功高强,你们不可匹敌。这样,不用打斗就决出高下,避免了打斗带来的更大损失。现在,我们用这个“信号传递博弈”的原理,来解释为何一些垄断厂商长期在低价格水平上经营。如果这个垄断厂商是一个低生产成本的厂商,当其它较高生产成本厂商也进入这个厂商所经营的行业与之进行竞争时,原先的那个垄断厂商可以通过降价将进入者赶出这个行业,从而继续维持垄断经营。
由于垄断厂商有更低的生产成本,所以,它能够将产品价格降到比进入厂商的生产成本还要低的水平上,这就造成进入者或者高价格经营导致顾客流失,或者同样也降价但价格低于成本,两种情形进入者都会亏损,最后不得不退出行业。但是,这种“打斗”行为尽管可以击退进入者,但由于一段时间的降价经营可能对垄断者带来较大损失。垄断者为了避免这种损失,可以向外宣布它是低成本的,别的厂商休想进来与它竞争。但仅凭口头宣布人家是不会相信的,因为即使垄断者不是低成本的厂商,它也会如此宣布。
一种方法就是,正如电视剧中的故事那样,垄断者向外发送一个信号,向外界传递它真是低成本的信息。它可以长期在一个较低价格水平上经营。如果它的价格足够低,高成本厂商不敢模仿,行内厂商会据此判定它确是低成本的。同时,它的价格也不能太低,以致于较之与进入者进行降价竞争,其损失为小一些。这样,垄断者才会采取如此策略。潜在的高成本进入者不敢进入,垄断者得以保持长期的垄断地位。
例 为什么有的商品广告既无商品的价格信息又无售货地点信息,只有明星的表演?
通常认为,商业广告的功能是向消费者提供必要的购货信息,如散布商品的价格,质量功能,出售地点等信息。再者,人们还认为有些广告可能是为了引导消费,特别是新产品出现时,消费者还不知道不熟悉它,商业广告中通过一些电影明星使用新产品的图象,利用公众的“追星”心理打造市场。这种关于新产品市场引导的广告在国外的电视广告中特别常见,通常是一位当红明星在电视上用新产品表演一番,既无价格,也无售货地点的介绍,除了显示一下商标外,完全没有对产品性能的说明。不过,对于这类广告,博弈论还有一种“信号传递”的解释呢?
所以,企业A通过请当红明星打广告而清除掉了潜在的市场模仿者,它向公众传递自己是生产好产品的信号,这种信号的价值在于其所请来的当红明星有着较高的出场价格,而不在乎明星在广告节目中说了什么,表演了什么,当然更无所谓广告节目是否介绍产品价格等信息了。企业A请当红明星打广告就为公众传递了它是生产好产品的企业的一个信号。
例子 为什么许多实力雄厚的公司还要向银行借很多钱?
在国外,一些资金实力雄厚的公司通常也会向银行贷款。更加令人感到奇怪的是,一些好的公司,一方面自己借钱给别的公司,同时,另一方面又向银行借钱。博弈论运用“信号传递”原理可以对此现象作出解释。
对于一家公司来说,负债增加会增大公司破产的可能性;但是,对于实力雄厚的公司,在同样负债比例下,其破产可能性要小一些。每个公司都会向社会吹嘘自己是好的公司,实力雄厚,但公众不会仅凭口头宣传就相信的。于是,真正好的公司通过向银行借钱来增大自己破产的可能性,令其它实际上不好的公司难以模仿。这种负债比例的增加要做到恰到好处,它既可令其它实力稍弱的公司难以模仿,又使自己能够承受。
这样,公众就能识别出谁是好的公司,从而竞相购买好的公司的股票,导致公司股票价格上涨,结果这家负债公司会因其股价上涨而获资本增值,破产的可能性反而下降了。
当然,公司通过增加负债来向投资者传递公司信息的代价可能太高,因而有时公司十分乐意向投资者直接披露内部信息,只要这种信息足以使投资者相信其真实性,就会为公司减少信息传递成本。
信号博弈
例 美国西部早餐博弈
考虑两个对抗的部落的个体1和2,在某个早上在美国西部的一个小镇酒吧相遇,虽然部落1中的每个人爱好和平并且不喜欢暴力,但是部落2的所有人都是好斗的,而且如果能够赢的话,他们还是喜欢和别的部落的人决斗的。假定这一决斗是否赢取决于个体1是强的还是弱的,而个体2是观察不到这一信息的,后者唯一能知道的先验得信息是部落1中90%的个体是强的,10%是弱的,以及当天他们中的任何一个人到这个酒吧的概率是相同的。
早餐有两个选择,牛排和蛋饼 。假定强的个体更喜欢牛排,弱的个体偏好蛋饼。
问题:在 什么情况下,个体2能够从个体1的早餐中推断出个体1的类型?
美国西部早餐博弈
W(p=
S(p=
(1,1)
()
(0,-1)
()
(0,1)
(2,0)
(1,-1)
(3,0)
0
2
2
1
2
2
1
D
N
D
N
Q
B
Q
B
例:声明的信息传递作用
声明:消费者偏好,企业新闻发布会,国家间威胁恐吓。
声明不直接影响事物、利益,但往往影响接受声明者行为,通过接受声明者行为对利益产生影响。
声明无或几乎无成本,接受者不一定采取有利于声明者的行为,因为双方利益往往不一致,因此声明的真实性没有保证。接受者不会轻易相信声明。
声明的影响取决于接受者的理解、判断和反应。
当声明者和接受者利益一致或没有冲突时,声明会使接受者相信。房客声明不喜欢暖气太足房东会相信;工人提出有恐高症不适合高空作业雇主会相信;顾客喜欢甜或咸厨师会相信。工人声明自己高素质雇主并不会轻易相信。
商业中的信号
1 质量保证
2 豪华的装修
3 管理层的浪费
4 价格作为质量的信号
5 股利政策与内部信息:公司向外部传递公司内部信息的常见信号有三种:利润宣告、股利宣告、融资宣告
6罢工
生活中的信号
1、情人节的玫瑰
2、大庭广众之下,该不该表达你的爱
3、大学生的起薪为何下降
4、我很忙。。。
5 、送礼的学问
6、讲究名牌时髦,并非仅仅是虚荣。
7、把柄与腐败
格罗斯曼分离定理
经济学家格罗斯曼曾提过一种解释。
假设三个人,其能力值为 100、80、60 ,平均能力为80,所以能力为100的就有动机以某种信号表明自己是突出于其它二人的,当能力为100的人被分离出来后,剩下两人的平均能力为70,此时能力为80的就有动力将自己与能力为60的人区分开来,因此,如果具有隐蔽特征的代理人能够提供有关隐蔽特征的信息,那么所有隐蔽特征在一段时间之后就会被人们了解。
定理表明:人们有动力披露个人的私有信息。
所以,许多学校披露有几个院士;教授会公布自己在重要的期刊上发表过多少论文;漂亮的女士一定会穿上显露身材的服装;公司公布对其有利的排名结果。
武力展示和军事演习:传递军事实力的信号。
其它信号策略
1、信号阻止
考虑性别战博弈,丈夫喜欢看足球,妻子喜欢听音乐会。
2、信号干扰
扑克牌游戏、“兵不厌咋”,日常生活中说假话的人,坏人做点好事。
3、选择性披露
日常生活中常说的“报喜不报优”
4、避免传递错误的信号
通过质量认证,企业一定会将这个信号传递给消费者。
如果一个人第一份工作的薪水越高,那么,在他职业生涯中他就更可能获得高的工资。
5、信息隐藏
如果我发现了一个计算方法可以在股市上赚钱,我就决不 会把这个方法拿出来与你分享,明白了这个道理,大家就不要相信那些兜售股票投资的神仙方法的大师了
友好提示:P156
1、通过有代价的行动向对方披露你的私有信息,即信号传递。
2、厂家敢于提供信号保证,是因为其产品质量好。
3、高等教育信号由于扩招而日益模糊,大学毕业生起薪不断下降也就不奇怪了。
4、不 能 保证情人节买玫瑰的男孩一定爱你,但 至少,一个在 情人节不愿意为你买玫瑰的男孩,说明他不是真的爱你。
5、沉默,也是一种强有力的声音。
6、有时候,接受信号对我们并没有好处,保留一点无知反而对自己更有利,此时,应阻止对方的信号传递。
7、为了防止对手看穿我们的类型,我们可以故意采取真真假假混淆视听的行动,干扰对手的判断即信号干扰。
8、人们总是会选择性披露信息,披露对自己有利,而掩盖对自己不利的信息。
9、薪水是传递个人能力的信号,所以有能力的人不应该随便接受一份低薪水的工作,就象不能随便找个人结婚一样。
10、求职的时间越长,找到 高薪的可能性越大,但求职的时间过长,也可能向雇主传递出自己缺乏竞争力的信号。
信息甄别:患难与共才是真正的朋友
我们生活越来越安稳,但同时我们也失去了检验友谊的机会,难以知道谁是真正的朋友,这就是生活在现代社会的我们,从来不缺少朋友,却又常常难以摆脱孤独和茫然感的原因。。。
在现实中,掌握信息优势的一方不仅可以为自己的利益传递信号,也可以为自己的利益隐藏信息。
在这种情况下 ,处于信息弱势的一方可以奋起反击。可以设计出一些信息甄别的机制来迫使信息优势方显示他们的真实类型。
信息甄别模型
委托人
提供合同
接受
不接受
消息
自然
状态
状态
代理人:知道自己类型,委托人不知道。
委托人:不知道代理人的类型,委托人提供多个合同供代理人选择,代理人根据自己的类型选择一个最适合自己的合同,并根据合同选择行动。
代理人
代理人
发送信号
信息甄别模型
例子:保险公司与投保人
投保人知道自己的风险,保险公司不知道;因此保险公司针对不同类型的潜在投保人制定了不同的保险合同,投保人根据自己的风险特征选择一个保险合同。
委托人:
保险公司
代理人:
投保人
例子 飞机、轮船等设立头等舱、经济舱的道理是什么?
无论是买票乘飞机、火车还是轮船,不同的人所愿意支付的价格实际上是不一样的。有的人收入高一些,或对花钱看得比较松一些,就可以支付较高的价格,相反,收入低的人或对花钱看得比较紧一些的人,就只愿支付较低的价格。但是,如果你问他们愿意支付什么样的价格,他们都必定说愿支付较低的价格,因为既使有钱人有也会在同样服务下以低价购买划算一些。
飞机或轮船公司为了将这些在经济学中被称为具有不同支付意愿的人区分开来,让能支付较高价格的人支付较高价格,就设计了一种“信息甄别”的机制,这种机制就是设立头等舱、二等舱、三等舱,……,等等。这种机制发挥作用的道理是这样的,我们可以用著名的“所罗门王断案”的故事来说明。所罗门王是古代以色列国的一位以智慧著称的君主。
尽管所罗门王不知道两位妇人中谁是婴儿的母亲,但他知道婴儿真正的母亲是宁愿失去孩子也不会让孩子被劈成两半的。所罗门王正是利用这一点,一下就识别出谁是婴儿的真正的母亲了。所罗门王的这种方法在博弈论中被称为“机制设计”,即设计一套博弈的规则,令不同类型的人作出不同的选择,尽管每个人的类型可能是隐藏的,别人观察不到,但他们所作出的不同选择却是可以观察到的。观察者可以通过观察不同人的选择而反过来推演出他们的真实类型。
当飞机或轮船的舱位条件和价格完全一样时,不同支付意愿的人都会以最低价格买票,不会有人愿支付比别人更多的钱去买相同的舱位的票。于是,航空公司或轮船公司将舱位分成头等舱、二等舱,……,等等,价格稍有不同,当然服务也不同,就将不同支付意愿的顾客区分开了。
这里,支付能力是旅客的类型,选择舱位等级是他们的选择。支付能力无法观察,但买什么舱位的票却能够观察,航空或轮船公司因此而识别出可以支付更高价格的顾客而赚取更多利润。
譬如,有两位旅客甲和乙乘飞机。甲的最高支付能力为1000元,乙的最高支付能力为1500元。经济舱的服务成本为800元,头等舱的服务成本为1200元。
经济舱带给甲和乙的消费满足感(经济学中称为效用)为1000元,头等舱带给甲和乙的效用为1800元。如果没有头等舱,航空公司最多把票价定到1000元,利润为2×(1000-800)=400元。
因为票价一旦高于1000元,甲和乙就不会买票了。但当设立头等舱后,航空公司将经济舱票价定为1000元,将头等舱票价定为1500元。此时,甲以1000元买经济舱。
乙如果买经济舱,则其净效用(经济学称为消费者剩余)为1000-800=200,但当乙买头等舱票时的消费者剩余为1800-1500=300元,所以乙会买头等舱。甲的支付能力只有1000元,所以甲只有买经济舱。这时,航空公司的利润增大为(1000-800)+(1500-1200)=500元>400元。
通过机制设计增大了公司利润。
类似的还有,酒店的星级分类,五星级、四星级、三星级,……酒店,冰棍的不同品种与价格,影剧院的不同座位价格表,手机的收费方式,某些产品的精装版和普通版,最低消费等等,都是实现信息甄别的机制设计。
例子
1 招工的试用期
2 激励报酬的筛选作用
主要一是对付道德风险,二是筛选出高能力的员工.
3 合同菜单
很多公司,为员工提供一个福利菜单选择.不同的福利可能吸引不同的特定人群.
为员工提供健康保险,就会更吸引那些小孩体弱多病的员工,为员工提供教育发展保险,就会更吸引那些注重陪训和进修的员工,为员工配偶提供福利和保险,就会吸引己婚的员工,特定的福利,会产生特定的筛选效果,保持一个多元化偏好的员工队伍,可能比单一偏好的员工更好.
4 让贫困生到艰苦地方去
可以令贫困生自我选择显示其类型的机制
5 拨款博弈中的拖延
上级通常不知道下级有没有财力实施项目,显然下级有钱,上级最好不拨款,下级没有钱,上级最好拨款,可不管有没有钱,下级总是希望得到上级的拨款。
政府拨款过程中有 拖延行为 ,通过拖延 拨款甄别出哪些下级有钱,哪些下级没钱。
6、罚款促进“垄断”利润
毒品市场、审计市场
“撑死胆大的,饿死胆小的”就是一个写照。
7 摸钟辨盗
有 一户人家被盗,案子报上后,抓到了4个嫌疑犯,但不知道那个是正真的盗窃犯,审讯陷入了困境。
8 爱 的谎言
男孩追女孩,免不了会说些谎言。
谎言有两种,比如已婚男子蒙骗无知少女时常常说 自己不幸福。另一种谎言是对方明知自己在说谎但还要说的谎言。
对于第二种,一个合理的解释是女孩不喜欢任何谎言,但有些谎言她确实是希望听到。
只有精心构思过的谎言才能正真的讨好女孩。
一个女孩正面不漂亮,你就夸他的侧面,或者其它角度。 如果360度都不漂亮;
你就费心的找找她的某个表情、某个瞬间的漂亮;如果实在是找不出;
就不能夸她漂亮,就可以她的穿着衣服上夸她漂亮;
谎言越是精心选择,就越能显示出男孩对于女孩的关注和关心程度。
女孩常常会用谎言作为机制来甄别男孩的真心。
9 约会迟到的女孩
约会迟到,常常是女孩甄别男孩的一种机制。
恋爱中骄蛮任性的女孩,婚姻后往往比哪些乖乖女的婚姻美满的比例要高。
10 酒精考验干部
信息甄别理论也可以解释生活中某些看起来不合理的现象。
“能喝半斤喝八量,这样干部要培养,能喝八量喝一斤,这样的干部最放心。”
人在官场走,不能不喝酒
11 细节暴露真相
通过细节甄别对手的类型,有的人认为:
判断一个企业状态的可靠而又容易得到的信号是办公楼普通卫生间的状况。
有的书写到:
看一个男人的品位,要看他的袜子;
看一个女人是否养尊处优,要看她的手
看一个人的气血,要看他的头发;
看一个人的心术,要看他的眼神;
看一个人的身价,要看他的对手;
看一个人的底牌,要看他身边的好友;
看一个人的性格,要看他字写的怎样
看一个人是否快乐,不要看笑容,要看清晨梦醒的那一刹那的表情
看一个人的胸襟,要看他如何面对失败及被人出卖
看两人的关系,要看发生意外时,另一个的紧张程度。
一个信息甄别机制所以能够产生甄别功效,其原因在于这个甄别机制对不同的类型人提供了选择不同行动的激励,诱发了个人的自选择行为。
自选择是指人们为了自己的利益而自动分类的现象。
信息传递与信号甄别是同一个问题的两个方面;
信号传递是信息优势的一方主动发送信号,信息优势一方主动承担了信号发送的成本;
信息甄别则是信息优势方主动抽取信息,抽取信息成本有时由信息优势方承担,有时候需要由信息劣势方承担。
2 、事后的隐藏信息博弈和事后的隐藏行动博弈
这是一种道德风险模型所表达的情形。
事后的隐藏信息博弈:
在这类博弈中,有股东与经理之间、债权人与债务人之间、经理与销售人员之间、雇主与雇员之间、原告或被告与代理律师之间的委托—代理关系。经理作为股东的代理人,可能会做出利己但损害股东利益的道德风险行为。债务人可能将债权人借给他的钱用于高风险项目,从而损害债权人利益。销售人员可能未尽心尽力推销企业产品,但又将不良的销售业绩归咎于市场需求不足等等。
事后的隐藏行动博弈:
当投保人在取得保险合约之后,不保重身体(不良生活习惯如饮酒、吸烟等),或不注意防盗、不注意汽车保养、佃农不努力劳作、经理不努力经营、雇员不努力工作、债务人不控制项目风险、房东不加强房屋修缮、房客不注意房屋维护、议员不真正代表选民利益、政府官员不廉洁奉公、律师不努力办案时,事后隐藏行动的道德风险就出现了。
总的看来,非对称信息可按时间在“事前”和“事后”发生的可能性分为事前非对称和事后非对称,也可按内容上的非对称分为“行动上的非对称”和“知识上的非对称”,分别称为“隐藏行动”和“隐藏信息”的博弈。
《三国演义》中的空城计与信息不对称的博弈
《三国演义》中到处都充满着“计”,什么是“计”?也就是策略;用计,即用策略赢对方。 现在让我们看《三国演义》中一个著名的“空城计”:街亭失守,司马懿引大军蜂拥而来。当时孔明身边只有一班文官,5000军士已分一半运粮草去了,只剩2500军士在城中。众官听得这个消息,尽皆失色。孔明登城望之,果然尘土冲天,魏兵分两路杀来。孔明传令众将旌旗尽皆藏匿,打开城门,每一门用20军士,扮作百姓,洒扫街道。而孔明羽扇纶巾,引二小童携琴一张,于城上敌楼前凭栏而坐,焚香操琴。司马懿自马上远远望之,见诸葛亮神态自若,顿时心生疑忌,犹豫再三,难下决断。
信息经济学与博弈论之间的关系是,前者是后者在信息不对称环境下的应用,但从特点上看,博弈论更注重于方法论,而信息经济学注重于问题的解析。博弈论研究的是给定信息结构下的均衡是什么,而信息经济学研究的是给定信息结构下,什么是最优的合约安排。
信息经济学主要研究非对称信息环境中的最优合约,故又称为合约(契约,合同)理论或机制设计理论。
又接到远山中可能埋伏敌军的情报,于是叫后军作前军,前军作后军,急速退去。司马懿之子司马昭问:“莫非诸葛亮无军,故作此态,父亲何故便退兵?”司马懿说:“亮平生谨慎,不曾弄险。今大开城门,必有埋伏。我兵若进,中其计也。” 孔明见魏军退去,抚掌而笑。众官无不骇然。诸葛亮说,司马懿“料吾生平谨慎,必不弄险;见如此模样,疑有伏兵,所以退去。吾非行险,盖因不得已而用之,若弃城而去,必为之所擒”。这就是为后人广为传诵的空城计。
雇佣关系中的互惠原则
博弈实验
互利互惠
感情投资、行为动机
知恩图报
滴水之恩,涌泉相报
针锋相对
即以其人之道,还治其人之身
报复惩罚策略:以血还血,以牙还牙
练习
1、在公司制企业中,股东、经理、债权人、工人、顾客、供货商称为“利益相关者”分析不同利益相关者之间的委托-代理关系。特别地,解释在什么意义下可以说“工人是委托人,经理是代理人?”
2、同一交易可能涉及多个模型的讨论,如雇主和雇员的关系中,如果雇主知道雇员的能力但不知道其努力水平,是( )问题;如果雇主和雇员本人签约时都不知道雇员的能力,而雇员在工作中发现了自己的能力(而雇主仍不知道),是( )问题;如果雇员一开始就知道自己的能力而雇主不知道,是( )问题;如果雇员一开始就知道自己的能力而雇主不知道,并且,如果雇员在签约之前就获得教育证书,是( )问题;相反,如果雇员在签约后根据工资合同要求去接受教育,是( )问题。
博弈的分类和博弈理论的结构
根据博弈方的数量可分为单人博弈、两人博弈和多人博弈;
根据博弈方策略的数量可分为有限博弈和无限博弈;
根据得益情况可分为零和博弈、常和博弈及变和博弈;
根据博弈过程可分为静态博弈、动态博弈和重复博弈;
根据信息结构可分为完全信息博弈和不完全信息博弈,以及完美信息动态博弈和不完美信息动态博弈;
根据博弈方的理性和行为逻辑差别分为完全理性博弈和有限理性博弈,非合作博弈和合作博弈。
博弈论的理论结构
完全信息
不完全信息
动态
静态
不完全信息动态博精炼贝叶斯弈纳什均衡
塞尔腾等(75年)
不完全信息静态博贝叶斯弈纳什均衡
海萨尼(67、68年)
完全信息动态子博弈精炼纳什均衡
塞尔腾(65年)
完全信息静态博弈
纳什均衡
纳什(1950、51年)
夫妻吵架博弈的艺术
一位小伙子看上了一位漂亮的女孩,向女孩表白的心思,女孩回答应他吗?
求爱博弈:贝叶斯纳什均衡
女孩
接受 不接受
求爱
男孩
不求爱
?,?
?,?
?, ?
?,?
接受
0,0
0,0
-5, 0
10,10
0,0
0,0
-5, 0
10,-10
不接受
求爱者是好人
求爱者是坏人
求爱
不求爱
女孩
不求爱
求爱
假设求爱者是好人的概率是P,那么P是多少?
显然,女孩接受求爱的期望收益只有在:
即:
贝叶斯概率:
在日常生活中,当面临不确定时,在任何一个时点上,我们对某件事情发生的可能性有一个判断,然后,我门会根据新的信息来修正这个判断。统计学上,修正之前的判断称为“先验概率”,修正之后的判断称为“后验概率”,贝叶斯概率正是人们根据新的信息从先验概率得到后验概率的基本方法。
贝叶斯概率:
所以,你要成功的追求到理想的女孩,你就要成为“好人”,要成为“好人”,你就要不断的做“好事”
毛泽东:一个人做点好事不难,难的是一辈子做好事不做坏事
不完全信息的动态博弈:精炼贝叶斯均衡
例:黔驴技穷的故事
精练贝叶斯均衡的一个重要应用是“信号传递模型”
信号博弈已经被广泛地应用于理解信息经济学的一些核心策略的问题。
理论框架是:
有两个个体序贯(先后)的行动,第一个人 (比如说,一个提供给定质量物品的销售员——Alerlof(1970), 或者一个具有一定技能的工人——Spence(1973))具有私人信息(她卖的产品或她的工作能力),该信息与第二个行动者(一个感兴趣的买家或一个潜在的雇主相关。
首先,由有信息的一方选择一个行动(一个出价或者一个确切的教育水平),假定这个行动能够被没有信息的、随后行动的另一个个体完全地观察到。这个第二个根据他的观察,可以间接地推断出他最初没有得到的潜在知识,根据这个改进的知识,第二个参与人做出他的选择,显然,在这个博弈中每个参与人得到的支付依赖于两个参与人所选择的行动,以及第一个参与人手中掌握的私人信息。
总结:博弈论的基本概念
基本概念有:
(1)参与人:即局中人(player)——指参与博弈的成员,可以是作为自然人的个人,也可以是企业、团体、组织机构、国家甚至国际联盟组织等。
(2)策略空间(strategy space):每一个局中人可以选择的战略所构成的集合。
策略(strategy)是指局中人选择行动的规则,而行动是指局中人的决策变量。一个战略告诉局中人在什么时候选择什么行动。
毛泽东在制订中国与其他国家之间的军事战略时就通过十六个字简明扼要地概括出其主要思想:“人不犯我,我不犯人,人若犯我,我必犯人”。在这个战略中,“犯”与“不犯”是两种不同的行动,该战略规定了什么时候选择“犯”,什么时候选择“不犯”。
(3)信息(information)——指一个博弈中参与人有关该博弈的知识,如关于N的选择、其他参与人的策略集、支付函数、行动时间等.博弈论中关于信息的具体概念有:
1。信息集(information set)—主要出现在动态博弈中,可理解为参与人在特定时刻上对有关变量的值的知识;一个参与人无法准确知道的变量的全体属于一个信息集。买古董。
2 完美信息(perfect information):指一个参与人对其他参与人(包括N)的行动选择有准确了解的情况,即一个信息集只包含一个值。动态博弈的概念。
3 完全信息(complete information):指不首先行动或初始行动被所有的参与人准确观察到的情况,即没有事前的不确定性。完全信息意味着各个参与人的支付函数是共同知识。
显然,不完全(incomplete)信息意味着不完美(imperfect)信息。
4 共同知识(common knowledge) 是与信息有关的一个重要概念。
如听过某个老师的课,学生认识老师,但老师不一定就记住该学生,路上碰在一块了,学生会不会叫老师呢?
也许学生会以为老师不认识他,打招呼会把老师弄得莫名其妙,所以有时就不叫也没事。
解释一:共同知识指“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道…”。
解释二:如果每个参与人都知道某个事实,每个参与人都知道每个参与人都知道它,如此等等,从而形如“(每个参与人都知道)k每个参与人都知道它”的语句对k=0,1,2,…都是正确的,那我们就称这个事实为参与人中间的共同知识。
共同知识,则从任何一个个体出发,他对这件事的理解等等都已达到了完全的统一,不再有任何层面的不确定性(奥曼,1976)。
在博弈论中,一般假定参与人的行动空间Ai
和行动顺序是共同知识。
*为了说明共同知识的重要性,引用一个故事。
经典推理:P先生、Q先生都具有足够的推理能力
P先生、Q先生都具有足够的推理能力。这天,他们正在接受推理面试。
他们知道桌子的抽屉里有如下16张扑克牌:
红桃 A、Q、4
黑桃 J、8、4、2、7、3
草花 K、Q、5、4、6
方块 A、5
教授从这16张牌中挑出一张牌来,并把这张牌的点数告诉P先生,把这张牌 的花色告诉Q先生。
这时,约翰教授问P先生和Q先生:你们能从已知的点数或花色中推知这张牌是什么牌吗?
P先生:“我不知道这张牌。”
Q先生:“我知道你不知道这张牌。”
P先生:“现在我知道这张牌了。”
Q先生:“我也知道了。”
请问:这张牌是什么牌?
由第一句话“P先生:我不知道这张牌。”可知,此牌必有两种或两种以上花色,即可能是A、Q、4、5。
如果此牌只有一种花色,P先生知道这张牌的点数,P先生肯定知道这张牌。
由第二句话“Q先生:我知道你不知道这张牌。”可知,此花色牌的点数只能包括A、Q、4、5,符合此条件的只有红桃和方块。
Q先生知道此牌花色,只有红桃和方块花色包括A、Q、4、5,Q先生才能作此断言。
由第三句话“P先生:现在我知道这张牌了。”可知,P先生通过“Q先生:我知道你不知道这张牌。”判断出花色为红桃和方块,P先生又知道这张牌的点数,P先生便知道这张牌。
据此,排除A,此牌可能是Q、4、5。如果此牌点数为A,P先生还是无法判断。 由第四句话“Q先生:我也知道了。”可知,花色只能是方块。如果是红桃,Q先生排除A后,还是无法判断是Q还是4。综上所述,这张牌是方块5。
(4) 支付函数(paypff)——也称得益。指局中人策略实施后。根据我们在前面给出的说明,无论是什么样形式的支付函数,它们一般都是以效用函数作为其基础的。
(5)结果(outcome):——这是一个内容较为广泛的概念,通常指研究者对博弈结束时所带来的各种感兴趣的效应或要素的集合。
如均衡战略组合、均衡行动组合
均衡(equilibrium)——所有局中人都选择的最优策略或行动的组合。在博弈论中,有不同的均衡概念,但基础性的均衡概念指的是“纳什均衡”。
我们一般将局中人、行动、结果统称为博弈规则,一个具体的博弈规则将决定相应的博弈均衡(但均衡不一定是唯一的)。
一农户在杀鸡前的晚上喂鸡,不经意地说:快吃吧,这是你最后一顿!
第二日,见鸡已躺倒并留遗书:爷已吃老鼠药,你们别想吃爷了,爷也不是好惹的。
点评:
当对手知道了你的决定之后,就能做出对自己最有利的决定——纳什均衡理论
博弈论在我国的应用
企业经营者的决策思路和工具。
政府的政策和管理思路,与个人、企业和地方博弈的意识。
社会经济问题的理论分析工具,解释经济中许多低效率现象的根源,找出各种经济问题的制度性、环境性原因,揭示各种经济行为和政策的效率意义等。
第二章 完全信息的静态博弈
静态博弈:
博弈的参与者同时作出决策(或者虽然决策有先后,但是没有人在决策之前看到了其他参与者的决策行为),一旦决策做出之后,就只能等待结果,对博弈的发展再也不能产生任何影响,这种博弈叫做静态博弈。
本章分六节
基本分析思路和方法
纳什均衡
无限策略博弈分析和反应函数
混合策略和混合策略纳什均衡
纳什均衡的存在性
纳什均衡的选择和分析方法扩展
基本分析思路和方法
上策均衡
严格下策反复消去法
划线法
箭头法
上策均衡(上策均衡)
在博弈中,如果不管其它博弈方选择什么策略,一博弈方的某个策略带来的得益始终高于自己的其它策略或至少不低于其它策略获得的得益。
上策均衡
上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略
囚徒的困境中的“坦白”;双寡头削价中“低价”。
上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果
上策均衡不是普遍存在的
例:新闻大战与博弈策略
势者,因利而制权也。——《孙子兵法》
所谓(有利的)形势,即根据对我有利的情况采取措施和行动。
当你身处类似“囚徒困境”这样的同时行动的博弈。
你的最佳策略是什么?
决定胜负的因素又是什么?
双方的策略选择往往是有迹可循的,并形成某种“定式”——即均衡。
《时代》与《新闻周刊》封面博弈
本周有两大新闻:
一是国会就预算问题辩论
二是关于艾滋病特效药的 新闻
在读者中,假设30%对预算问题感兴趣,有70%的人对艾滋病新闻兴趣。
如果用一 种封面,读者平分。
写出博弈矩阵
时代
艾滋病 预算
艾滋病
新闻
预算
?,?
?,?
?, ?
?,?
假如两个杂志选择同样的新闻做封面故事,喜欢这个新闻的潜在买主当中有60%的人选择《时代》,40%的人选择《新闻周刊》。
他们会怎样选择?
现在让我们想像一下《时代》和《新闻周刊》之间爆发了一场价格战。
假设每本杂志的制作成本是l美元,且售价只有两个可能的价位选择,分别是3美元(意味着每本利润为2美元)和2美元(意味着每本利润为l美元)。
假设顾客永远倾向于选择价格较低的杂志,且在杂志价格相同的时候两种杂志各得一半读者。杂志定价3美元的时候,读者总数是500万;杂志价格降到2美元,读者总数将升到800万。
时代
3美元 2美元
3美元
新闻
2美元
?,?
?,?
?, ?
?,?
怎样选择上(优势)策略:以不变应万变
我们可以把这些例子归纳为一个指导同时行动的博弈的法则。
(1)假如你有一个优势策略,请照办。
不要担心你的对手会怎么做。假如你没有一个优势策略,但你的对手有,那么就当他会采用这个优势策略,相应选择你自己最好的做法。
“优势策略”的优势是指你的这个策略对你的其他策略占有优势,而不是对你的对手的策略占有优势,无论对手采用什么策略。
俗语:已不变应万变
上策略(优势策略)
(2)假如你有一个劣势策略,你应改避免采用,并且知道你对手若是有劣势策略,他也会回避。——“理性的参与人不会选择严格劣策略”
当所有局中人都选择了各自的强占优战略时,根据理性人假定,我们可预测任何一个局中人都不会改变其已有的战略选择,因而这种已有的战略组合是一种均衡。
也将这种均衡称为“上策均衡”。
严格下策反复消去法——得到均衡
在其它任何博弈中,只要我们发现哪个博弈方的某些策略是相对于其它策略的严格下策,同样也可以吧他们消去。只要各博弈方还有严格下策,就可以继续消去,直到找不到任何严格的下策为止。
严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略
严格下策反复消去:
1,0
1,3
0,1
0,4
0,2
2,0
左
中
右
上
下
1,0
1,3
0,4
0,2
左
中
1,0
1,3
左
中
“重复剔除严格下策策略(的思路:
首先,找出某个参与人的严格劣策略,并
把它从他的策略空间中剔除,重新构造一个已
不包含该严格劣策略的博弈;
其次,剔除新博弈中某个参与人的严格劣
策略;
重复上述过程,直到只剩下唯一的策略组
合。
——我们认为这个唯一所剩的策略组合是稳定
的。
参与人2
左 中 右
上 1,0 1,2 0,1
参与人1
下 0,3 0,1 2,0
策略组合(上,中)是均衡结局,将实现支付
(1,2)。
第一
第二
第三
请找出均衡
左
中
右
上
中
下
3,10
2,12
2,11
1,11
1,8
2,13
4,12
0,12
3,12
路径依赖:我们将结果依赖于路径的现象称为路径依赖。
例:美国航天飞机火箭助推器的宽度。
有一匹战马,它的马掌上掉了一枚铁钉,这铁钉一掉,马掌就松动了,不多久,马掌也掉了。马掌一掉,马蹄没了保护,在战场上就等于失掉一匹战马。凑巧的是这匹战马上刚好坐着一位将军,由于战马的原因将军丢掉了性命,而将军又恰好是这场战争的主帅,于是这场战争也输掉了,因为这场战争对这个国家非常关键,所以最终这个国家也灭亡了
谈谈你遇到的路径依赖现象?
一旦人们做了某种选择,就好比走上了 一条不归之路,惯性的力量会使这一选择不段自我强化,并让你 轻易走不出去,这就是“路径依赖”。
任何事情,在你做之前,一定要三思而后行
这是光滑斜坡的又一个例子。一旦你开始向下滑,你就很难回头。最好不要迈出第一步,除非你知道自己会去到哪里。
我们所要找的是路径依赖的机会——也就是用一致的标准对绝大多数的消费者都有好处的机会。
——比尔。盖茨
第一个使路径“路径依赖”理论扬名的是道格拉斯。诺思,他成功地用“路径依赖”理论解释了经济制度的演进,并获得1993年诺贝尔经济学奖。
问:为什么有些夫妻明明没有感情了,却还能继续维持婚姻,而不是选择离婚?
答:这是典型的路径依赖。简单说就是你在一条路上走了太久,即使发现这条路走起来不舒服,也不愿意退出来重新选一条路。走的越远,退出来的成本越高,惰性越强,最后也就演变成了得过且过。路径依赖告诉我们,选择一条正确的道路是多么重要,套用股市里警示投资者的一句话――围城有风险,进城需谨慎。
问:为什么夫妻的互相猜疑能导致婚姻破灭?
答:博弈论中的囚徒困境告诉我们,如果你以为对方会做出不利于自己的选择,于是你的选择也以自身利益最大化为出发点,这样,最终的结果一定是两败俱伤。友情提示:对于围城里的路径依赖症患者,活学活用博弈论,是一条破解之道。
参与人2
左 中 右
上 0,4 4, 0 5, 3
参与人1 中 4, 0 0, 4 5, 3
下 3, 5 3, 5 6, 6
每个参与人都不存在严格劣策略
划线法:——得到均衡
请找出下面均衡
左
中
右
上
中
下
3,10
2,12
2,11
1,11
1,8
2,13
4,12
0,12
3,12
划线法
1, 0
1, 3
0, 1
0, 4
0, 2
2, 0
-5, -5
0, -8
-8, 0
-1, -1
囚
徒
困
境
-1, 1
1, -1
1, -1
-1, 1
猜
硬
币
2, 1
0, 0
0, 0
1, 3
夫
妻
之
争
习题:
纳什均衡
纳什均衡的定义
纳什均衡的一致预测性质
纳什均衡与严格下策反复消去法
存在纳什均衡的博弈
乙
L M R
U
甲
D
(问题2:甲和乙分别会选择什么战略?)
2,1
1,2
2,3
1,3
4,2
1,1
诺贝尔经济学奖获得者萨缪尔森有一句话:你可以将一只鹦鹉训练成一个经济学家,因为它只需要学习两个词:供给和需求。
博弈论专家坎多瑞引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,就是“纳什均衡”。
纳什均衡有什么用?
在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能将商品卖出去,此时我们就说,该商品的供求达到了均衡。此时的价格可称之为均衡价格,产量称之为均衡产量。均衡分析是经济学中的重要分析。
所谓博弈均衡,它是一稳定的博弈结果。均衡是博弈的一结果,但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,因而是可以预测的。
纳什均衡是一最常见的均衡。它的含义是:在对方策略确定的情况下,每个参与者的策略都是最好的,此时没有人愿意先改变自己的策略。
即双方在对方给定的策略下不愿意调整自己的策略。
你聪明、别人也不傻
你想赢、别人也不愿输
纳什均衡:对手不改变策略的情况下,单方面改变策略不可能再提高收益;纯策略、混合策略,最佳反应
纳什均衡的一致预测性质
一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果
只有纳什均衡才具有一致预测的性质
一致预测性是纳什均衡的本质属性
一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能
纳什均衡的存在性问题
每一个有限博弈至少存在一个纳什均衡(纯战略或混合战略);
如果一个博弈存在两个纯战略纳什均衡,那么,一定存在第三个混合战略纳什均衡。
理解纳什均衡:
例:最后的归宿的博弈
2, 2
2, 3
2, 0
3, 2
2, 2
1, 3
0, 2
3, 1
2, 2
A
B
C
a
b
c
例:智猪博弈
笼子里面有两只猪,一只比较大,一只比较小。笼子很长,一头有一个按钮,另一头是饲料的出口和食槽。按一下按钮,将有相当于10份的猪食进槽,但是按按钮以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。问题是按钮和食槽分置笼子的两端,按按钮的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。如果大猪先到,大猪呼啦啦吃到9份,小猪只能吃到1份;如果同时到达,大猪吃到7份,小猪吃到3份;如果小猪先到,小猪可以吃到4份,而大猪吃到6份。
0,0
9, -1
4 , 4
5, 1
大猪
按钮
等待
小猪
按钮
等待
那么,两只猪各会采取什么策略?
答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于按钮和食槽之间。
(按钮,等待)成为均衡
原因何在?因为,小猪按按钮将一无所获,不按按钮反而能吃上食物。对小猪而言,无论大猪是否按按钮,不按按钮总是好的选择。反观大猪,已明知小猪是不会去按按钮的,自己亲自去按按钮总比不按按钮强吧,所以只好亲力亲为了。
“智猪博弈”博弈有许多应用:
(1)小猪的无为而治
两头猪的博弈实现了集体利益的最大化,其原因是参与人实力的差异,这种差异决定了小猪的占优策略,同时决定了大猪的最优选择,应该说,是小猪决定了纳什均衡,大猪推动了纳什均衡
有人觉得大猪劳动了半天才得到4,小猪不劳,也得到了4,看来大猪是蠢猪,小猪是智猪了。
从另方面说,大猪抛开了任何情绪化的东西,老实按理性的原则行事,选择自己的最优策略,从这个意义上说,这是头理性的猪,是高尚的猪。
启示:这个例子描述了走出囚徒困境的另一个途径:找出一个大慈善家,让它遵守合作协议,并容忍其他人作弊。
同样的事情见之于许多联盟。在许多国家,一个大政党和一个或多个小政党必须组成一个联合政府。大政党一般愿意扮演负责合作的一方,委曲求全,确保联盟不会瓦解,而小政党则坚持它们自己的特殊要求,而选择通常可能偏向极端的道路。又如在北约内部,美国承担了防务开支很大比例的份额,大大便宜了西欧和日本。美国经济学家曼库尔•奥尔森将这一现象非常简洁地称为“小国对大国的剥削”。
老子:“无为而无不为”
在智猪博弈中,我门可以体会到老子的这一深刻命题。
小猪由于自身的劣势,选择了“无为”,最终达到“无不为”的效果。“无为”是小猪的理性选择。
“为”是大猪的理性选择。
(2)智猪博弈的纳什均衡说明了“示弱”并不是坏事,弱小反而为自己赢得战略的主动,兵法讲的“示弱”就是这个道理。
纳什均衡与严格下策反复消去法(P71)
上策均衡肯定是纳什均衡,但纳什均衡不一定是上策均衡
命题:在n个博弈方的博弈 中,如果严格下策反复消去法排除了除 之外的所有策略组合,那么 一定是该博弈的唯一的纳什均衡
命题:在n个博弈方的博弈中 中,如果
是 的一个纳什均衡,那么严格下策反复消去法一定不会将它消去
上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的
纳什均衡所揭示出的深刻经济学道理也唤醒了沉迷于新古典经济学的经济学家们,因为各个局中人根据自己的最优战略行事,同时估计其他局中人也按照他们的最优战略行事,从这一组局中人的观点来看,不一定就是最优的解决方案。譬如,“囚徒困境”就与经济学中斯密的“看不见的手”的隐喻互相矛盾。处于博弈中的各个局中人都在追求自己的个人利益,但他们不一定会增进整个集体的利益。
现代经济学由此开始注意到个人理性和集体理性的矛盾与冲突,但是解决这个问题的办法并不是像传统经济学主张的那样通过政府干预来避免市场失灵所导致的无效状态,而是认为,如果一种制度安排不能满足个人理性的话,就不可能实行下去。所以解决个人理性与集体理性之间冲突的办法不是否认个人理性,而是设计一种机制,在满足个人理性的前提下达到集体理性。认识到个人理性与集体理性的冲突对于认识制度安排是非常重要的。
例子 股市博弈
在股票市场上,大户是大猪,他们要进行技术分析,收集信息、预测股价走势,但大量散户就是小猪。
他们不会花成本去进行技术分析,而是跟着大户的投资战略进行股票买卖,即所谓“散户跟大户”的现象。
例子:为何股份公司中的大股东才有投票权?
在股份公司中,大股东是大猪,他们要收集信息监督经理,因而拥有决定经理任免的投票权,而小股东是小猪,不会直接花精力去监督经理,因而没有投票权。
例子: 为什么中小企业不会花钱去开发新产品?
在技术创新市场上,大企业是大猪,它们投入大量资金进行技术创新,开发新产品,而中小企业是小猪,不会进行大规模技术创新,而是等待大企业的新产品形成新的市场后生产模仿大企业的新产品的产品去销售。
例子为什么只有大企业才会花巨额金
钱打广告?
大企业是大猪,中小企
业是小猪。大企业投入大量
资金为产品打广告,中小企
业等大企业的广告为产品打开销路形成市场后才生产类似产品进行销售。
练习:某市风景宜人,远离城区山角上新建了一 个小区,小区呈现长条状,两边均匀分布着住宅,有两个投资者想在这开超市,请你和你的伙伴分别作为其中的一位投资者,各自决定你要在什么位置开办超市。
纳什均衡与商业中心区的形成
在城市街道上,我们常见到一些地段上的商店十分拥挤,构成一个繁荣的商业中心区,但另一些地段却十分冷僻,没什么商店。对于这种现象,我们可以运用纳什均衡的概念来加以解释。
甲乙
1/2
图 商业位置博弈
·
·
当乙在甲的右边紧靠甲设店时,其右边街道上的顾客都是乙的顾客;如果乙不是紧靠甲而是远离甲设店,则其顾客只是其右边街道的居民,不如它紧靠甲设店时多,因而在远离甲的位置设店是劣战略。所以给定甲在1/2处设店,乙在紧靠甲的左边或右边设店是最优的。反过来,给定乙在接近1/2处设店,甲的最优选择也是在1/2附近设店。这样,甲和乙挤在1/2处设店就是纳什均衡,这就是商业中心区的形成原理。
无限策略分析和反应函数(P75)
古诺的寡头模型
反应函数
伯特兰德寡头模型
公共资源问题
反应函数的问题和局限性
无限策略博弈的博弈分析和反应函数
——经典的博弈模型
现代市场竞争特点
市场竞争态势和格局、博弈性突出
大寡头垄断、中小企业竞争共存
我国企业的国内外竞争环境
企业的策略型行为
交互行为、相互影响
反应函数:你一招、我一式
决策函数:你中有我、我中有你
按竞争程度划分的市场类型(就卖方来说;对于买方而言,市场是竞争的,且每一单个买者对市场价格影响程度小):
A 完全竞争市场
B 寡头竞争市场
C 独家垄断市场
市场类型不同,厂商之间行为特怔不同,A与C类型中,厂商的决策都是个体优化决策,而B类型中寡头垄断竞争的本质就构成博弈,他们都是理性的决策者,他们的行为既影响自身,又影响对方。尽管两寡头由于垄断能给他们带来一些共同的利益,但是他们的根本利益并不是完全一致的。如果两寡头之间可以签定有约束力的协议,彼此之间达成合作,形成完全垄断,此时的博弈是一种合作博弈。然而在大多数情况下,彼此之间很难达成有约束力的协议,这样就是非合作博弈。
最早研究两寡头垄断竞争,并作出巨大贡献的当推法国经济学家Cournot(《财富理论的数学原理研究》,1838),他对寡头市场的极端形式——两寡头垄断市场作了分析,研究了在静态条件下,完全相同产品市场中两家厂商的竞争行为、反应函数和均衡结果,得出结论:
Cournot通过模型研究得出:两寡头市场产量比垄断市场高、价格比垄断市场价格低、利润比垄断市场低。这是典型的囚徒困境问题,导致个人理性和集体理性的冲突。
类似的寡头垄断在实际经济活动中,在某些地区、某段时期、对于某种商品来说并不鲜见,如电力业、电信业等。
反应函数
古诺模型的纳什均衡也可以通过对划线法思路的推广来求,划线法的思路是先找出每个博弈方针对其他博弈方所有策略(或策略组合)的最佳对策,然后再找出相互构成最佳对策的各博弈方策略组成的策略组合,也就是博弈的纳什均衡。
在无限策略的古诺博弈模型中这样的思路实际上也是可行的,只是其他博弈方的策略现在有无限多种,因此各个博弈方的最佳对策也有无限种,它们之间往往构成一种连续函数关系。
在上面讨论的两寡头古诺模型中,对厂商2的任意产量q2 ,厂商1的最佳对策产量q1 ,就是使白己在厂商2生产产量q2的情况下利润最大化的产量,即q1是最大化问题:
的解。上式对q1求导并令导数等于0:
由此得:
这样我们得到了对于厂商2的每—个可能的产量,厂商1的最佳对策产量的计算公式,它是厂商2产量的一个连续函数,我们称这个连续函数为厂商1对厂商2产量的一个“反应函数” (Reaction Function)。同样的方法,我们可再求出厂商2对厂商1产量q1的反应函数:
q2
6
3
6
3
q1
由于这两个反应函数都是连续的线性函数,因此可以用坐标平面上的两条直线表示它们,如图:
(2,2)
理性局限和古诺调整
从图中可以看出,当一方的产量选择为0时,另一方的最佳反应为3。这正是实现市场总利润最大的产量,因为这时候等于由一个厂商垄断市场,市场总体利润就是该厂商的利益;当一方的产量达到6时,另一方被迫选择0,因为这时后者坚持生产已经无利可图。
在两个反应函数对应的两条直线上,只有它们的交点(2,2)代表的产量组合,才是由相互对对方的最佳反应产量构成的。
R1(q2)上的其他所有点(q1,q2)只有q1是对q2的最佳反应,q2 不是对q1的最佳反应,而R2(q1)上的点则刚好相反。
桔农弃桔
美国1933年5月颁布的《农业调整法》是罗斯福上台后实施“新政”所颁布的一系列法令之一。旨在控制农业生产规模,减少农产品供给,以提高农产品价格。具体措施是,政府与农民签订限产合同,对自愿限产的农民实行直接津贴补助。
习题:
现在我们把反应函数法应用到伯特兰德模型的分析。伯持兰德1883年提出了另一种形式的寡占模型。这种模型与选择产量的古诺模型的区别在于,伯特兰德模型中各厂商所选择的是价格而不是产量。我们用简单的两寡头且产品有一定差别的伯特兰德价格博弈模型进行分析。
伯特兰德寡头模型
上述产品有一定差别是指两个厂商生产的是同类产品,但在品牌、质量和包装等方面有所不同,因此伯特兰德模型中厂商的产品之间有很强的替代性.但又不是完全可替代,即价格不同时,价格较高的不会完全销不出去。当厂商1和厂商2价格分别为P1和P2时,它们各自的需求函数为:
和
从上式可以看出产品之间是有差别的,其中d1,d2>0即两厂商产品的替代系数。我们也假设两厂商无固定成本,假设边际生产成本分别为c1和c2 。
随着社会经济的不断发展,我们越来越无法回避公共资源利用、公共设施提供和公共环境保护等方面的间题。而在这些问题中,也包含了众多的博弈关系。我们以人们对公共资源利用方面的博弈关系为例来作一些讨论。
在经济学中,所谓公共资源是指具有(1)没有哪个个人、企业或组织拥有所有权;(2)大家都可以自由利用,这样两个特征的自然资源或人类生产的供大众免费使用的设施和财货。
公共资源问题
例如大家都可以开采使用的地下水,可自由放牧的草地,可自由排放废水的公共河道(假设政府未予限制),以及公共道路、楼道的照明灯等。
由于公共资源有上述两个特征,因而利用这些资源时不支付任何代价,除非政府将这些资源收归国有,并对使用者征收资源税或收取类似的费用。
最晚是从休漠1739年开始,政治经济学者们就己经开始认识到,在人们完全从自利动机出发自由利用公共资源时,公共资源倾向于被过度利用、低效率使用和浪费,并且过度利用会达到任何利用它们的人都无法得到实际好处的程度。
我们用下面这个公共草地的放牧习题为例来论证这个结论。
设某村庄有n个农户,该村有一片大家都可以自由放牧羊群的公共草地。出于这片草地的面积有限,因此只能让不超过某一数量的羊群吃饱,如果在这片草地上放牧羊只的实际数量超过这个限度,则每只羊都无法吃饱,从而每只羊的产出(毛、皮、肉的总价值)就会减少,甚至只能勉强存活或要饿死。
假设这些农户在夏天才到公共草地放羊,而每年春天就要决定养羊的数量,因此可看作各农户在决定自己的养羊数量时是不知道其他农户养羊数的,即各农户决定养羊数的决策是同时作出的。
再假设所有农户都清楚这片公共草地最多能养多少只羊和在羊只总数的不同水平下每只羊的产出。这就构成了n个农户之间关于养羊数的一个博弈问题,并且是一个静态博弈。
在此博弈中,博弈方就是n个农户;他们各自的策略空间就是他们可能选择的养羊数目qi(i=1,2, …,n)的取值范围。
当各农户养羊数为q1、q2、… 、qn时,在公共草地上放牧羊只的总数为Q=q1+q2+…+qn ,根据前面的介绍,每只羊的产出应是羊群总数Q的减函数V=V(Q)=V(q1、q2、… 、qn)。假设购买和照料每只羊的成本对每个农户都是相同的不变常数c,则农户i养qi只羊的得益函数为:
为了使讨论比较简单和能得到直观的结论,我们进—步设定下列具体数值。假设n=3,即只有三个农户,每只羊的产出函数为V=100—Q=100一(q1+q2+qn),而成本c=4。这时,三农户的得益函数分别为:
由于羊的数量不是连续可分的,田此上述函数不是连续函数。但我们在技术上也可以把羊的数量看作连续可分的,因此上述得益函数仍然可当作连续函数来处理。
分别求三农户各自对其他两农户策略(养羊数)的反应函数,得:
三个反应函数的交点 (q1*,q2*,q3*)就是博弈的纳什均衡。我们将q1*,q2*,q3*代入上述应函数,并解此联立方程组,即得q1*=q2*=q3*=24,再将其代入三农户的得益函数,则可得u1*=u2*=u3*= 576,此即三农户独立同时决定在公共草地放羊数量时所能得到的利益。
为了对公共资源的利用效率作出评价,我们同样也可讨论总体利益最大的最佳羊只数量。设在该草地上羊只的总数为Q。则总得益为:
使总得益u最大的养羊数Q*必使总得益函数的导数为0,容易求得: Q* =48,总得益值u* =2304。该结果比三农户各自独自决定自己的养羊数量时三农产得益的总和1728大了许多。而此时的养羊数Q * =48则比三农户独立决策时草地上的羊只总数3×24=72小,因此,三农户独立决策时实际上使草地处于过度放牧的情况,浪费了资源,农户也没有获到最好的效益。
如果各农户能将养羊数自觉限制在48/3=16只,则他们都能得到更多的利益。但问题是他们面临的也是—种囚徒的困境局面,因此很难实现这种理想的合作的结果。这个例子再一次证明了纳什均衡,或者说非合作博弈的结果有可能是低效率的。
在本例中,如果利用上述草地资源的农户数进一步增加,则纳什均衡的效率会更低;如允许外来者任意加入利用该公共资源的行列,则所有利用该资源的人的利益很决都会消失,即羊只总数会随着放牧农户数的增加而增加到刚好不至于亏损的水平,各农户将完全不能从在公共草地上养羊得到任何好处,公共资源等于完全被浪费掉。
公共资源利用方面常会出现这样的悲剧,原因是每个可以利用公共资源的人都相当于面临着 一种囚徒的困境;在总体上有加大利用资源可能(至少加大利用者白身还能增加得益)时,自己加大利用而他人不加大利用则自己得利。自己加大利用但其他人也加大利用则自己不至于吃亏,最终是所有人都加大利用资源直至再加大只会减少利益的纳什均衡水平,而这个水平肯定比实现资源最佳利用效率,同时也是个人最佳效率的水平要高。
F5
公共设施问题也是类似的问题。在许多需要人类生产、提供的公共设施的问题上,做搭便车者(Free Rider)总是比做提供者合算。因此许多必需的公共设施,如楼道里的电灯等就总是没人提供。这些公共资源博弈问题的结果说明了在公共资源的利用、公共设施的提供方面,政府的组织、协调和制约是非常必要的,这也可以说是政府之所以有必要存在的主要理由之一。
习题:
4.豪泰林(Hotelling,1929)的价格竞争模型
在该模型中,产品在物质形态上无差异,但
在空间上处于不同的位置。
●标准式表述
(1)、参与人:商店1与商店2。他们分别位于一线
性城市的两端,出售同质的商品;
(2)、他们要决定的是各自商品的售价pi,
Si={pi: pi≥0};
令该线性城市的长度为1,消费者均匀地分布
(3) 他们的支付函数就是利润函数:
u1=D1p1-D1c
u2=D2p2-D2c
注:设两家商店商品的单位成本相同为c。
设消费者购买商品的旅行成本为t,并且每个消
费者都具有单位需求,即每个消费者只要认为
价格“足够低”就会(也仅仅)购买一个单位的
商品,这意味着如果商店i的价格“不太高”,对
商店i的需求等于发现从商店i购买更为便宜的顾
客的数量。
在[0,1]的区间里,分布密度为1;商店1位于
0处,商店2位于1处。x为[0,1]上的任意一点。
0
1
商店1
商店2
x
住在x的消费者到商店1购买的旅行成本是tx,
到商店2购买的成本是t(1-x);如果住在x的消费
者在两个商店之间购买的成本是无差异的,那
么所有住在x左边的消费者在商店1购买,所有
住在x右边的消费者在商店2购买,即有:
D1=x, D2=1-x。这里x满足:
P1+ tx = P2+ t(1-x)
x = (P2- P1+t)/2t
所以有需求函数:
D1=x= (P2- P1+t)/2t ; D2=1-x= (P1- P2+t)/2t
u1=D1p1-D1c
=(p1-c)[((P2- P1+t)/2t ]
u2=D2p2-D2c
= (p2-c)[((P1- P2+t)/2t ]
反应函数:
R1(p2)=(c+t+ p2)
R2(p1)=(c+t+ p1)
解两个反应函数组成的方程组,得:
p1*=p2*= c+t
u1*=u2*= t / 2
商店的利润与消费者的旅行成本成正比。
思考:“冰激凌问题” 夏季某海滨浴场有两个冰激凌销售商,冰激凌是由同一个工厂供应(产品无差异),价格由厂家统一确定。那么消费者会就近购买。问:两个销售商将选址何处?
习题
反应函数的问题和局限性
在许多博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导函数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡。
即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点。
混合策略和混合策略纳什均衡
严格竞争博弈和混合策略的引进
多重均衡博弈和混合策略
、混合策略纳什均衡和混合策略纳什均衡
(一) 严格竞争博弈和混合策略的引进
猜硬币方
正面 反面
正面 -1,1 1,-1
盖硬币方
反面 1,-1 -1,1
Matching Pennies
不存在纯策略意义上的NE。
那么,他们的合理选择是什么?
混合策略
这个博弈“不存在”我们前面所讲的纳什均衡
在这个游戏中,重要的是猜测对方的出牌规律,同时避免对方猜到自己的出牌规律。也就是说,要尽量让对手迷失。这种随机化自己可选策略的做法,就是采取“混合策略”的思想。
局中人以一定的概率p选择红,以一定的概率1-p选择黑,则(p,1-p)概括了某个局中人所有的混合策略。可知这样的混合策略有无穷多个。两个局中人的策略组合有无穷多个
混合策略
混合策略:把不确定性引入纯战略,即参与者以一定的概率选择他的战略,比如网球比赛中,运动员以60%的概率发正手球,40%的概率发反手球。
混合策略
正 p
正
q
反
1-q
反1-p
-1,1
1,-1
-1,1
1,-1
乙
甲
混合策略
当参与人可以选择的策略比较多时(3个,4个,…),用一个字母就不够用了,需要用多个字母表示其混合策略
可以想象,混合策略情况下,参与人的支付不再是确定性的。需要用期望支付的概念
(二)、混合策略、混合策略博弈
和混合策略纳什均衡
混合策略:在博弈 中,博弈方 的策略空间为 ,则博弈方以 概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且
混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。
混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。
(三)、例子(1)
该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析
2, 3
5, 2
3, 1
1, 5
C
D
A
B
博弈方2
博
弈
方
1
策略 得益
博弈方1 (,)
博弈方2 (,)
博弈方1的混合策略
博弈方2的混合策略
例子(2)
a1
b1
a2
b2
3,2
-1, 3
0, 0
-1, 1
社会福利博弈
q
(1-q)
p
(1-p)
期望效用
政府
流浪汉
0
1
1
反应函数
BR1(q)
BR2(p)
不救济
混合策略
救济
q
p
找工作
混合策略
不找工作
混合战略纳什均衡
反应对应
反应对应
例子(3)
硬币博弈
a1
b1
a2
b2
1,-1
-1, 1
1, -1
-1, 1
p
(1-p)
q
(1-q)
期望效用
BR1(q)
BR2(p)
反应函数
0
1
1
p(a1)
q(a2)
混合战略纳什均衡
反应对应
反应对应
忠告:如果你与某人合作,通常还是让行动有规律可循比较好些。但 在有竞争的情况下,最佳策略常常涉及到随机的不 可测的行为。
乙接受这样的打赌是明智的吗?不,他的上述推理是完全错误的。
为了弄清三枚硬币落地时情况完全相同或不完全相同的几率,我们必须首先列出三枚硬币落地时的所有可能性。简单说,一共有八种情况,而只有两种情况是三枚硬币完全相同。这意味着三枚硬币情况完全相同的可能性是1/4,三枚硬币落地时情况不完全相同的式样有六种。因此其可能性是3/4。
三张卡片
在很多赌博游戏中,如果你一味相信自己概率的直觉,就可能输得很惨。例如,有人请你玩以下游戏:在一个帽子里有三张卡片,一张两面都是黑的,一张两面都是白的,还有一张两面一黑一白,他从里面摸出一张(如果你怕他做手脚,也可以由你来摸),摊到桌面上,当然,朝上这一面可能是黑的,也可能是白的,现在他和你打赌背面的颜色与上面一致,你打不打这个赌?
看起来,这是个对等赌局,如果这一面是黑的,那就一定排除了两面都是白的那一张,因此,这张牌要么是两面黑,要么是一黑一白,所以你的机会是一半,对不对?
如果它真是公平的,对方怎么会那么容易赢了你的钱呢?其实这个赌局是2∶1对他有利。
关键在于:可能的情况是三种,而不像你以为的那样是两种:它可能是:黑(A面朝上)-黑、黑(B面朝上)-黑、黑-白,也就是说:对方有2/3的机会赢你。
例:美国普林斯顿大学“博弈论”课程中有这样一道练习题:如果给你两个师的兵力,你来当司令,任务是攻克“敌人”占据的一座城市。而敌人的守备是三个师,规定双方的兵力只可整师调动,通往城市的道路有甲、乙两条,当你发起攻击时,若你的兵力超过敌人你就获胜;若你的兵力比敌人守备部队兵力少或者相等,你就失败。你如何制定攻城方案?
其实,这次模拟“作战”,每一方取胜的概率都是50%,即谁胜谁负的可能性是一半对一半。能否指挥队伍克敌制胜,还得看双方的策略得失。
为什么说取胜的概率是一半对一半呢,让我们先学一点儿“纸上谈兵”。
敌军有三个师,它有四套作战方案:A.三个师均守在线路甲;B.两个师守甲线路,一个师守乙线路;C.一个师守甲线路,两个师守乙线路;D.三个师均驻守乙线路。同样,我军有两个师的攻击兵力,可以有三套作战方案:1.集中全部两个师的兵力从甲线路实施攻击行动;2.兵分两路,一个师从甲线路,一个师从乙线路进城;3.集中全部兵力从乙线路进城。战果如何?
敌人:四种部署方案
A 三个师都驻守甲方;
B 两个师驻守甲方,一个师驻守乙方
C 一个师驻守甲方,两个师驻守乙方
D 三个师都驻守乙方
我军:
a 集中全部兵力从甲方进攻
b 兵分两路,一个从甲方,一个从乙方,同时进攻
c 集中兵力从乙方进攻
敌人:四种部署方案
A 三个师都驻守甲方;
B 两个师驻守甲方,一个师驻守乙方
C 一个师驻守甲方,两个师驻守乙方
D 三个师都驻守乙方
我军:
a 集中全部兵力从甲方进攻
b 兵分两路,一个从甲方,一个从乙方,同时进攻
c 集中兵力从乙方进攻
A
B
C
D
a
b
c
- +
- +
+ -
+ -
+ -
- +
- +
+ -
+ -
+ -
- +
- +
A
B
C
D
a
b
c
敌军
我军
攻而必胜者,攻其所不守也;
守而必固者,守其所必攻也。
故善攻者,敌不知其所守;
善守者,敌不知所攻。
微乎微乎,至于无形;神乎神乎,至于无声,故能为敌之司命。
——孙子
《孙子兵法》中有一句“守则不足,攻则有余”,历来为人所歧解。一种意见认为:这句话的意思是,“(在战争中)采取守势,是因为实力不足;采取攻势,是因为实力有优势。”这一派的代表人物是三国时代最杰出的战略家之一曹操,他的注解是:“吾所以守者,力不足也;所以攻者,力有余也。”的确,从战略的角度看,进攻的一方通常是比较强大的。
但是也有另外一种意见认为:这句话的意思是,“(一定的兵力)用来防守则不足,用来进攻则有余。”因为这样解释不仅更符合古代汉语的语法规律,而且更符合孙子强调“善战者,制人而不制于人”的积极战术原则。
练习:
一只燕子为了筑巢,飞到羊身上去寻找少许的羊毛。羊愤怒地跳来跳去。“你允许牧人把你的毛通通剪光,却连一小撮毛都拒绝给我。这是为什么?”燕子说。羊愤怒地回答:“因为你不像牧人那样懂得用好的方法来取我的毛。”想挣钱和发财是现代人的基本愿望,可是许多人的挣钱方法太落后了。
友情提示:君子好财,取之有道
需要注意的是,由于α值与P无关,因此加大对小偷的处罚力度,不能降低小偷的偷窃概率。这就是我们想表达的意思了。为了更好地说明,试把这个博弈用于腐败问题。
从古到今,对腐败的惩治不可以不严,但是仍然不能消灭腐败,很多人仍然铤而走险,如果把小偷比作腐败分子,守卫就是监管部门,那么要打击腐败,降低腐败概率,所要立的规矩首先是制定一个严厉惩治监管部门的条例,这个监管部门比如是上级部门或上司或者类似于廉政公署的专门机构,这才抓住了问题的关键。
问题:如何杜绝考试作弊
混合策略的低效率
李四
不报 报
不报
张三
报
此诗铭刻于波士顿犹太人屠杀纪念碑
华容道博弈:曹操应该怎么走?
员工
努力 不努力
监督
经理
不监督
-1,1
1,0
1, -1
0,0
制造风险:亚弹战略
显然,经理监督,员工努力。
但经理的预期得益是0
经理以X的概率监督,则员工努力的预期得益为0,偷懒的预期得益为x(-1)+(1-x)(1),聪明的经理以大于X>的概率监督
偷懒的预期得益= x(-1)+(1-x)(1) =1-2x<0,员工的最佳选择是始终努力,经理的预期得益:
X(0)+(1-X)(1)=1-X>0
上述道理在 很多监管领域都有运用,比如公司财务审计,劳动行政监察,环境保护监察领域,完全监察成本太高,监管当局可以通过随机检查的策略配以高额处罚,有助于遏制不法行为,二监察成本又在可接受的范围。
例:上市公司虚假信息披露行为的博弈分析
0, 0
0, E-D
-C, E-D
未发现(1-θ)
-C, 0
F-C+E, -F-D
发现(θ)
证券
监管机构
上市公司
造假 不造假
检查
不检查
E:造假行为对上市公司的额外收益;
F:监管机构发现公司造假后的惩罚;
C:监管机构的检查成本;
D:上市公司造假的成本;
θ:监管机构成功查实公司造假行为之概率。
例:监督博弈
我们这里介绍的监督博弈实际上是刻画了诸如税务检查,质量检查,惩治犯罪,雇主监督雇员等许多现象的博弈论本质.
例: 社会福利博弈
政府在实行公共福利政策时,通常会遇到激励问题,譬如,当政府对失业者进行救济时,可能会激励失业者不再愿意努力寻找工作
该博弈至少存在一个混合战略博弈纳什均衡,我们现在的任务是将这样的均衡找出来。
社会福利博弈
0, 0
–1, 1
不救济
–1, 3
3, 2
救济
政府
游荡
寻找工作
失业者
政府通过引入混合战略,使得救济由确定性战略转为不确定性战略,因此,不确定性本身不是一件坏事。
启示:如果确定性战略难以凑效,果断引入不确定性
如果无法在多个纯纳什均衡中做出取舍,就试试混合均衡策略。
多重均衡博弈和混合策略
一、夫妻之争的混合策略纳什均衡
2, 1
0, 0
0, 0
1, 3
时 装
足 球
时装
足球
丈 夫
妻
子
夫妻之争
妻子的混合策略
丈夫的混合策略
夫妻之争博弈的混合策略纳什均衡
策略 得益
博弈方1 (,)
博弈方2 (1/3,2/3)
二、制式问题
制式问题混合策略纳什均衡
A B 得益
厂商1:
厂商2:
1, 3
0, 0
0, 0
2, 2
A
B
A
B
厂商2
厂
商
1
制式问题
三、市场机会博弈
进 不进 得益
厂商1: 2/3 1/3 0
厂商2: 2/3 1/3 0
-50,-50
100,0
0,100
0,0
进
不 进
进
不进
厂商2
厂
商
1
市场机会
纳什均衡的存在性
纳什定理:在一个由n个博弈方的博弈 中,如果n是有限的,且 都是有限集(对 ),则该博弈至少存在一个纳什均衡,但可能包含混合策略。
教材106页证明。主要根据是布鲁威尔和角谷的不动点定理。
纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。
多重纳什均衡博弈的分析
帕累托上策均衡
风险上策均衡
聚点均衡
相关均衡
A
A
B
B
9,9
-15,8
7,7
8,-15
参与人2
参与人1
课堂实验
所有同学分为两个团体,其中一个团体的同学扮演此协调博弈的参与人1,另一个团体的同学扮演参与人2;
请两个团体的每个同学分别独立作出自己的选择,不允许商议;
统计各团体选择两种策略的人数
分蛋糕博弈
x1
x2
1
1
任何满足x1+x2=1的点都是
纳什均衡。
1、帕累托上策均衡:
在经济学上,帕累托最优指的是:在给定现有资源条件下,不存在任何其他配置结果使某些人情况更好,而又不使任何其他人处境更坏。
低薪串谋博弈
2,2
3, 0
0, 3
9, 9
乙
受贿
不受贿
甲
受贿
不受贿
高薪养廉
7,7
8, 0
0, 8
9, 9
乙
受贿
不受贿
甲
受贿
不受贿
先动优势与后动优势
1,11
10,100 2,10
2,12
4,12 3,10
中 右
乙
甲
上
下
左
0
5,
100
10,
4
5,
0
10,
右
上
下
左
情侣博弈的均衡
情侣博弈的课堂实验
请两名同学协助统计
其他同学参与实验
男女生分开,男生为参与人1——男孩,女生为参与人2——女孩,请选择策略
设想你是参与人1——男孩,参与人2已经作出了自己的选择,但你观察不到她的选择。现在请你作出自己的选择。
3 聚点均衡
吉诺维斯谋杀案的思考
上面可以看出,混合策略均衡有可 能导致无效的状况。我们可以强行要求某些人承担起报警的责任来——现实中我们的法律对军人、警察以及政府官员见死不救都会追究责任,于是他们通常会在遇到违法行为时首先站出来。
例:关于约会博弈
聚点(focal points)
哪个均衡会出现?
利用博弈设定以外的信息和依据选择的均衡
参与人可能使用被博弈模型抽象掉的信息来达到一个特定的均衡——聚点
这些信息可能是社会文化习惯、公认的社会规范、参与人过去的博弈历史等,甚至有心理因素或者其他各种特征都可能是聚点均衡的依据
一致与冲突
先走
后走
先走
后走
-1,-1
2,1
1,2
-1,-1
进门博弈
文化既解决冲突又协调预期
尊老爱幼;
妇幼保护;
遵师重教;
先来后到;
社会分层与非对称权力(排位问题;黑社会组织);
公平观念(如分蛋糕博弈);
抓阄;
4、相关均衡
在博弈论中,如果参与人根据其共同观测到的信号选择行动,就可能出现”相关均衡”,而使所有参与人受益
相关均衡
5, 1
4, 4
0, 0
1, 5
L
R
博弈方2
U
D
博
弈
方
1
相关均衡例子
三个纳什均衡:
(U,L)、(D,R)
和混合策略均衡[(1/2,1/2),(1/2,1/2)]
结果都不理想,不如(D,L)。
可利用聚点均衡(天气,抛硬币),但仍不理想。
相关装置:
1、各1/3概率A、B、C
2、博弈方1看到是否A,博弈方2看到是否C
3、博弈方1见A采用U,否则D;博弈方2见C采用R,否则L。
相关均衡要点:
1、构成纳什均衡
2、有人忽略不造成问题
5 共谋和防共谋均衡
一、多人博弈中的共谋问题
本博弈的纯策略纳什均衡:(U,L,A)、(D,R,B)
前者帕累托优于后者。博弈的结果会是什么呢?
(U,L,A)有共谋 (Coalition)问题:博弈方1和2同时偏离。
0,0,10
-5,-5,0
-5,-5,0
1,1,-5
L
R
U
D
博弈方2
博
弈
方
1
博弈方3——A
-2,-2,0
-5,-5,0
-5,-5,0
-1,-1,5
L
R
U
D
博弈方2
博
弈
方
1
博弈方3——B
二、防共谋均衡
如果一个博弈的某个策略组合满足下列要求:
(1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图;
(2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果;
(3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。
称为“防共谋均衡”。
前面例子中:(D,R,B) 是防共谋均衡
(U,L,A)不是防共谋均衡
公元196年,曹操挟天子以令诸侯,东汉政权明存实亡;公元200元,官渡之战,曹操大败袁绍,羽翼渐丰;公元208年,曹操挥军南下,大治水军,想收取江东。但赤壁之战,曹军为孙权刘备联军所破。三分天下的形势从这时开始初步形成。
启示:几千年来,人类始终把一条黄金法则当成行为的准则。这项法则是:种什么因,收什么果,你如何对待别人,你种的善因或恶因,最后都会报应到你自己的身上。 返回