第十讲 策略性博弈与纳什均衡 第十讲 1 P Q=500−20pDMC=101 10• 8•MC=82 300340500Q在图中,黄色三角形面积为消费者剩余,绿色矩形面积为生产者剩余,系统损失为紫色面积;所以说,当两个边际成本不等的企业进行价格竞争时,会导致帕累托无效。 (1)当两企业进行价格竞争时,边际成本低的企业,即厂商2 会胜出,这时,厂商2只要出价稍低于厂商1的边际成本就可以迫使厂商1退出市场,所以当市场达到均衡时,其均衡价格为p*=10−∈,其中∈为任意小的一个增量; (2)厂商1的利润为零,厂商2的利润为π=[500−20(10−∈)−8]⋅(10−∈); 2(3)从直观而言,要判断均衡是否为帕累托有效,是要看看上图中需求曲线与供给曲线相交的右半部分的 “剩余”是否被消费者与生产者索取完。不言而喻,从图中,我们可看出厂商在价格竞争所达到的均衡是帕累托无效的。 2消费者的目标是获得支付水平最大,当A选择为下时,我们可知,d<c,知道B选择右时,我们可知b<1,答案为(3)。 3根据题意,构造收益矩阵: John1231 3, -3-1, 1-1, 12 -1, 13, -3-1, 1Smith 3 -1, 1-1, 13, -3 (1)当知道John出1时,Smith的最优战略为2或3;而当知道Smith出2时,John的最优战略为2;但如果Smith知道John出2时,他的最优战略则为1或3;……如此反复,以至无穷,仍不会有最终的均衡结果。 1(2)因为,对于Smith而言,John对1、2、3出牌的概率均为,则 311Smith出牌1的期望收益为:E=(3−1−1)= S13310-10-1 2/19/2006 5:28:21 PM
第十讲 策略性博弈与纳什均衡 11Smith出牌2的期望收益为:E=(3−1−1)= S23311Smith出牌3的期望收益为:E=(3−1−1)=,由此我们得出:E=E=E S3S1S2S333同理,我们也可得出: E=E=E J1J2J3111111⎛⎞⎛⎞综上所述,σ,,;σ,,为混合战略的纳什均衡。 ⎜⎟⎜⎟SJ333333⎝⎠⎝⎠ 为了彻底的了解混合战略的纳什均衡,我们再来玩玩课本上的性别冲突的例子: 首先,我们先要了解一下纳什均衡的概念: 如果局中人所选的战略处于这样一种状态:在其他的局中人不改变当前的战略前提下,任何一个局中人都无法单方通过改变自己的战略而获得更高的支付。( 蒋殿春 高级微观经济学 经济管理出版社 p262)这也是微观经济学十八讲p201上的定义。 而引入混合战略后,则局中人的目标需要修改为“最大化自己的期望支付”。 丈夫看拳击 看芭蕾 看拳击 4, 5 0, 0 妻子 看芭蕾 1, 1 5, 4 现在,我们设丈夫、妻子看拳击的概率分别为p、q,则丈夫的目标为: Max p[5q+(1−q)]+(1−p)[0⋅q+4(1−q)] 一阶条件: [5q+(1−q)]−[4(1−q)]=0 3q= 8而妻子的目标为: Max q[4p+0⋅(1−p)]+(1−q)[1⋅p+5(1−p)] 一阶条件: [4p]−[p+5(1−p)]=0 5p= 853所以,混合战略的纳什均衡为:丈夫以的概率来选择看拳击,以的概率来看8835芭蕾;而妻子以的概率来选择看拳击,以的概率来看芭蕾,即: 885335⎛⎞⎛⎞σ,;σ, ⎜⎟⎜⎟HW8888⎝⎠⎝⎠10-10-2 2/19/2006 5:28:21 PM
第十讲 策略性博弈与纳什均衡 而不是像某些同学(主要是前丈夫一段时间的我)所想的,当丈夫以5/8的概率来选择看拳击,以看拳击 看芭蕾 3/8的概率来看芭蕾;而妻子以35335/8的概率来选择看拳击,以3/8看拳击 ⋅4,⋅5⋅0,⋅08888的概率来看芭蕾时,矩阵为: 妻子 这矩阵中的混合战略的纳什5553看芭蕾 ⋅1,⋅1⋅5,⋅4均衡为:(丈夫看拳击,妻子看拳8888击)、(丈夫看芭蕾,妻子看芭蕾)。 这个答案是很凑巧的吗?我们再来以混合战略的纳什均衡的概念来检验一下其答案,当一个局中人依其均衡战略行为行事时,另一个局中人的战略选择问题:当3535⎛⎞σ,(妻子以的概率来选择看拳击,以的概率来看芭蕾)时,丈夫选择任⎜⎟W8888⎝⎠意一个概率p所得到的支付为: 3535202020⎡⎤⎡⎤p5⋅++(1−p)0⋅+4⋅=p+(1−p)= ⎢⎥⎢⎥8888888⎣⎦⎣⎦这时,注意这个支付与丈夫的战略p无关,同样可验证,如果丈夫选择其均衡战略时,妻子任意选择一个概率所得到的支付都是208,这样,我们就可验证混合战略的纳什均衡的概念了:当妻子(丈夫)不改变其均衡战略的前提下,无论丈夫(妻子)如何选择自己的战略,都不会使自己获得更高的支付。 5 2LMRU 4, 3 5, 1 6, 2 1 M 2, 1 8, 4 3, 6 D 3, 0 9, 6 2, 8 为了方便分析,我们从2开始,(因为1的战略中不存在明显的占优战略) 对于2而言,R优于M,所以2将会在R、L战略中进行选择,而对于1来说,知道了2是在L、R中选择,则他的U战略要优于M、D战略,他会选择U战略,当2知道1选择了U战略时,他则最终会选择L战略,所以,最终的占优均衡为(U,L); 6设S为棒子(stick),T为老虎(tiger),C为鸡(cock),W为虫子(worm),则其支付矩阵为: 10-10-3 2/19/2006 5:28:21 PM
第十讲 策略性博弈与纳什均衡 2S TCW S 0, 01, -10, 0-1, 1 T -1, 10, 01, -10, 0 1 C 0, 0-1, 10, 01, -1 W1, -10, 0-1, 10, 0 当1知道2出S时,1的最优的战略为W;而当2知道1出W时,2的最优战略则为C;当1知道2出C时,1的最优战略为T;而当2知道1出T时,2的最优战略为S……如此反复,以至无穷,仍不会有最终的均衡结果; 设1、2出S、T、C、W的概率分别为p,p,p,p和q,q,q,q,则矩阵达到均衡,123412342的期望收益必须满足: 0⋅p+1⋅p+0⋅p−1⋅p=−1⋅p+0⋅p+1⋅p+0⋅p 12341234=0⋅p−1⋅p+0⋅p+1⋅p=1⋅p+0⋅p−1⋅p+0⋅p 12341234整理为: −p+p=p−p=p−p=−p+p 24241313把前两项移项得:2p=2p;后两项移项得:2p=2p; 2413把之代入原式,我们就可以得到:p=p=p=p,又p+p+p+p=1,可得12341234出:p=p=p=p=14;同理,我们也可得出:q=q=q=q=14 12341234综上所述,混合战略的纳什均衡为: 11111111⎛⎞⎛⎞σ,,,; σ,,, ⎜⎟⎜⎟1244444444⎝⎠⎝⎠4(1)题目相当于:欧佩克组织是由20个国家组成的,每个国家的石油贮量为10000,它们从地里开采出的原油成本忽略不计,如果欧佩克的总产量太多的话,市场一下子不可能全部吸纳,从而会导致其价格的下降,欧佩克为了寻求总利润最大化,而合谋定价,这样会有: 1⎡⎤Max π=1−QQ ⎢⎥1000⎣⎦∂π1一阶条件: =1−Q=1 ∂Q5001QQ=500;p=;q==25 220(2)因为每个成员国都会考虑到如果其他成员国的产量不变的情况下,自己增加产量会使得自己的利润上升,所以,每个成员国都有增产的冲动,而当某个成员国开始增产,其他的成员国就会效仿,最终,市场会由于产量的增多而使得价格下降。所以,这种合谋定价是不稳定的。 (3)在通过改变产出和不存在成员国的超额利润的情况下所达到的均衡为:其价格为零,市场上的总供应量为1000,每个成员国的产量为50。 7(1)此收益矩阵有两个纳什均衡:(低,高);(高,低); 10-10-4 2/19/2006 5:28:21 PM
第十讲 策略性博弈与纳什均衡 (2)最大最小战略均衡为:(高,高); (3)如果选择合作的话,则以企业的总收益最大化为目标,其结果为(低,高); (4)在现存的两个纳什均衡中,如果厂商1选择低时,它会比选择高的收益要多出800,而厂商2选择高时,则收益会降低200,所以要厂商1说服厂商2选择高,厂商必须过渡给厂商2的收益要不少于200。 8为了更好的阐述,我们把课本上的条件写为: 如果所有的厂商都生产大型车,则所有的厂商的利润为r; 如果所有的厂商都生产小型车,则所有的厂商的利润为r; 如果一家厂商生产大型车,其它两家厂商生产小型车,则生产大型车的厂商的利润为α,而生产小型车的厂商的利润为β; 如果一家厂商生产小型车,其它两家厂商生产大型车,则生产小型车的厂商的利润为α,而生产大型车的厂商的利润为β; 根据题意,所得收益矩阵为: 当3生产大型车时: 当3生产小型车时: 2 2大 小 大 小 γ,γ,γ 大 β大 ,α,βα,β,β β,β,α1 1γ,γ,γ 小 α小 ,β,β β,β,αβ,α,β 为了使得我们的分析没有遗漏,让我们逐个验证(最后,我们将会得到:只要其中一个汽车生产厂商与其他厂商的生产决策不同,则均为纳什均衡的结论): (以下的右边的两个小矩阵是为了更好的让我们方便观察:当企业知道其它的厂商的生产决策时,自己应该如何达到自身的利润最大化;) (1)当α>β>γ时, γA:当3大,2大时,则1小; α当1小,3大时,则2随意; ββ当1小,2大时,则3随意; β β把三列图形重叠,所得到的蓝色重叠部分便为纳什均衡(小,大,大); 10-10-5 2/19/2006 5:28:21 PM
第十讲 策略性博弈与纳什均衡 B:当1大,3大时,则2小; γ α当1大,2小时,则3随意; β β当2小,3大时,则1随意; ββ把三列图形重叠,所得到的蓝色重叠部分便为纳什均衡(大,小,大); C: 当1小, 3小时,则2大; γ α当1小, 2大时,则3随意; β β当2大,3小时,则1随意; ββ把三列图形重叠,所得到的蓝色重叠部分便为纳什均衡(小,小,大); D: 当2大,1大时,则3小; γα 当1大,3小时,则2随意; ββ 当2大,3小时,则1随意; ββ把三列图形重叠,所得到的蓝色重叠部分便为纳什均衡(大,大,小); 10-10-6 2/19/2006 5:28:21 PM
第十讲 策略性博弈与纳什均衡 E: 当1小, 3小时,则2大; αγ 当1小, 2大时,则3随意; β β当2大,3小时,则1随意; ββ把三列图形重叠,所得到的蓝色重叠部分便为纳什均衡(小,大,小); F: 当2小, 3小时,则1大; α γ 当2小, 1大时,则3随意; β β当1大,3小时,则2随意; ββ 把三列图形重叠,所得到的蓝色重叠部分便为纳什均衡(大,小,小); β,β,α α,β,β β,α,β β,α,β α,β,ββ,β,α综上所述,当时,我们一共可以得出六个纳什均衡,分别为(小,大,大)、(大,小,α>β>γ大)、(小,小,大)与(大,大,小)、(小,大,小)、(大,小,小); (2)当时,从(1)中可知,在我们的分析中,只涉及到α、之间;α、γ之α>γ>ββ间的比较,而没有涉及γ、之间的比较,所以,我们可断定;(2)的分析过程与结β论和(1)是一致的。(这是我根据(2)的条件独立分析完毕所得出的结论) 10-10-7 2/19/2006 5:28:21 PM
第十讲 策略性博弈与纳什均衡 9 让我们先分析 这块区域,通过分析,我们会得出 的结果;当A出上时,B的最优战略为中;而当B出中时,A出中;当B出中时,B出左;当B出左时,A出上……如此反复,以至无穷,仍不会有最终的均衡结果。 而当A知道B会出右时,A会出下,当B知道A出下时,B会出右,所以,该博弈里只有一个纳什均衡。 10 2 2左 右 左 右 左 左 -5,-5,0-5,-5,0 0,0,10 -2,-2,01 1右 -5,-5,0 右 -5,-5,1,1,0-5-1,-1,5 (1)第一个矩阵得出(上,左)和(下,右)两个纳什均衡;第二个矩阵得出(上,左)和(下,右)两个纳什均衡;因为这时,在其他的局中人不改变当前的战略前提下,任何一个局中人都无法单方通过改变自己的战略而获得更高的支付; (2)因为游戏者3在两个矩阵的期望收益是一样的,但两个矩阵的方差不同:第一个大于第二个矩阵,而对于游戏者3更倾向于哪一个矩阵,则是要看他是哪一种风险类型; 当游戏者3为风险规避者时,他会更倾向于第二个矩阵;为风险中性者时,则是无所谓;而为风险爱好者时,他会选择第一个矩阵; 两个人结盟时是追求总收益最大,当游戏者1、2结盟时,会迫使游戏者3选择第一个矩阵(因为当游戏者3选择B矩阵时,游戏者1、2则会以放弃游戏来威胁),这时的纳什均衡为(下,右); 而只有当游戏者3为风险爱好者或风险中性者时,才会与游戏者1或者2结盟(因为当游戏者3为风险规避者时,他与其他准联盟的游戏者首先在自身同盟内部都不能达成一致的意见),游戏者1、3结盟时(这与游戏者2、3结盟时的决策一致)的纳什均衡为(上,左); 很遗憾,在这题中不存在这样的均衡,因为通过我们的以上分析,在两游戏者结盟时的最终达成的两个均衡是不一致的。这说明他们的决策目标是有差异的。 12(1)正确,因为占优均衡是纳什均衡的一个特例; (2)不正确,因为对于一个囚犯知道另一个囚犯不揭发时,他的最优的战略为揭发,每个囚犯都会有背叛自己同伴的冲动。 (3)因为系统中只存在一个行为者,这连博弈都称不上,何来的混合战略。 11 10-10-8 2/19/2006 5:28:21 PM
第十讲 策略性博弈与纳什均衡 游戏者Ⅱ左中右上 2, 0 1, 1 4, 2 游戏者Ⅰ 中 3, 4 1, 2 2, 3 下 1, 3 0, 2 3, 0 对于游戏者1而言,上是占优于下的,所以,游戏者1是不会选择下的,进而对于游戏者2而言,当他知道游戏者1的第一步选择后,他会确信右是占优于中的,所以,游戏者2是不会选择中的;在所剩的选择中存在两个纳什均衡(上,右),(中,左)。 13小镇上的居民的目标是追求自身的利润最大化,但自身的利润又是取决于自己和别人的行为,这相当于囚犯困境的问题。 我们先化简问题,而会更有利于我们得出一般性的结论;假设这个小镇只存在两个居民1、2,他们有两个选择:出100元或是不出钱,根据题目所提供的条件,我们可得出一个收益矩阵: 21000100100,100 0, 1001 0100, 0 0, 0如果大家都出100元的话,则大家的利润都将是100。但其中一人会想如果在对方出100的时候,自己不出钱一样的会获利100,换句话说,每人的最优的战略为不出钱。这就会出现帕累托无效的均衡。 当我们推广到小镇上有n个居民时,我们会发现如果某一居民出钱的话,有可能他会出现亏损,这更会使居民坚持不出钱的“最优”战略。最终,会达到每人都不出钱的一个无效的均衡。 有人会说,如果他们相互联合的话呢?我想其结果应是一样的。因为在相互联合的情况下,每个人都不可能清楚的知道其他人的真正行为。 一种更严密的证明: NN一个小镇上有N个人,第个人的捐赠为,捐赠总额为,记; iFF=FF=Fi∑i−i∑ji=1j=1i≠j2⋅(F+F)i−i第个人的净收入为: i(F)=−F∏iiiN′2 =−1∏N当N=2时,净收入不随捐赠数额的变化而变化; 当N>2时,净收入是随着捐赠数额的增多而减少;此时,他的最优选择为不捐赠; 10-10-9 2/19/2006 5:28:21 PM
第十讲 策略性博弈与纳什均衡 14 NancySunsetGulfSunset3, 2 0, 0 Frank 0, 0 2, 3 Gulf (1)因为两人都不知道对方的战略,所以有可能存在纯战略的纳什均衡(Sunset ,Sunset)、(Gulf, Gulf);我们可由以下的运算来看是否存在混合战略的纳什均衡: 设Frank、Nancy去Sunset的概率分别为p、q,则Frank的目标为: Max p[3q+0⋅(1−q)]+(1−p)[0⋅q+2(1−q)] 一阶条件: [3q]−[2(1−q)]=0 2q= 5而Nancy的目标为: Max q[2p+0⋅(1−p)]+(1−q)[0⋅p+3(1−p)] 一阶条件: [2p]−[3(1−p)]=0 3p= 53223⎛⎞⎛⎞σ,;σ, ⎜⎟⎜⎟FN5555⎝⎠⎝⎠(2)这一博弈不存在占优均衡。 10-10-10 2/19/2006 5:28:21 PM