第2章 完全信息动态博弈
完全信息动态博弈的表示法 2-1
由静态到动态博弈的范例 2-1
动态博弈扩展式的表示法 2-3
子博弈完美均衡与存在性 2-4
完全信息动态博弈之范例 2-6
完全信息重复博弈与无名氏定理 2-8
动态博弈在产业竞争的应用 2-11
可信承诺与吓阻进入 2-11
谈判 2-13
策略性贸易政策 2-14
实例与应用:掠夺式定价与连锁店悖论 2-16
实例与应用:品牌选择 2-18
实例与应用:原油市场 2-19
小结 2-21
练习题 2-22
参考文献 2-23
完全信息动态博弈的表示法
由静态到动态博弈的范例
考虑以下原为静态博弈的范例,但在允许参赛者可以先后出招后就成为动态的博弈:
创新(Innovation)
Zenith
推新产品
不推
Sony
推
10, 2*
15, 0
不推
3, 3
12, 5
如果Sony与Zenith同时出招,均衡为何?
如果Sony是产业领导者,先宣布它是否推出新产品,均衡是否会改变?
吓阻进入(Entry Deterrence)
旧公司
原价
低价
新公司
进
10, 50*
-10, 30
不进
0, 100
0, 100*
如果新、旧公司同时出招,均衡为何?
如果新公司决定进入此产业之后,旧公司是否会采低价之价格战策略?旧公司是否能吓阻新公司进入?
如果旧公司是连锁店(chain stores),是否在每个城市或区域都采价格战,以吓阻新集团进入?
(3) 出价策略(Bidding Strategy)
T公司进行中的投资计划可能成功或失败,外界认为每股T公司股票可能在0至20元之间,每点机率都相同,只有T公司自知其真实价值(信息不对称)。A公司考虑并购T公司,A公司经营绩效优异,有信心在入主T公司以后使其价值增为原来的倍。A公司为购并T公司,应向T公司出价每股多少元?
(4) 隐性勾结(Tacit Collusion)
乙
高价
低价
甲
高价
10, 10
5, 12
低价
12, 5
8, 8
两家厂商面临同样的单位成本每单位2元,无固定成本。两家均采高价(4元)则每家可销售5万个,若均采低价(3元)则每家可售8万个,若一家采高价,一家采低价,则采高价者售出万个而采低价者售出12万个。如果这二家厂商每月均需面对对方,长久以往,是否能达到每月(10, 10)的报酬?
(5) 协调博弈(Games of Coordination)
乙
L规格
S规格
甲
L规格
2, 2
-1, -1
S规格
-1, -1
1, 1
同时出招时有两个纳什均衡,究竟何者会成立?
在考虑动态调整后,允许一家先行,是否可以达成某一特定均衡?换言之,纳什均衡原本众多,但在动态博弈中是否得以精炼(refinement),使均衡数目减少?
动态博弈扩展式的表示法
动态博弈以扩展型式(Extensive Form)来表示
扩展型式博弈 (=(N, H, P, I, U)有五要素:
参赛者,i(N={1, 2, (, n}
历史H,h=(a1, (, ak) (H。博弈树(game tree)是一多个环节(nodes)与枝干(branches)的集合,从单一的起始环节,不经回转,直到终结环节(以Z表其集合)。博弈树就代表博弈历史(到某一环节止亦可)。
对每个环节的分配法则P:将每个环节(除终结环节外)分配给不同的参赛者并赋予行动时可选的策略。对h(H \ Z而言,P(h)是分配法则。
参赛者行动时的信息集合I (Information Set)。
对应参赛者可能选取策略,各参赛者在终结环节所得的报酬U。
以第5个范例(协调博弈)来说:
策略式
2
L
S
1
L
2, 2*
-1, -1
S
-1, -1
1, 1*
等值
如此信息集合表示2不能区分1是否采用了L或S。一旦改了信息集合(如下),就代表完全不同的博弈:
2’s strategies
(L, L)
(L, S)
(S, L)
(S, S)
1
L
2, 2*
2, 2*
-1, -1
-1, -1
S
-1, -1
1, 1
-1, -1
1, 1*
等值
2’ strategies例如(L, L)代表1采L后2采L,而且1采S后2采L。
藉以表示出2的策略因1策略而意义不同。
「策略」的涵义:表示出在各个信息集合观察到(1的行动)之下的相应行动,(L, L)代表是在二个信息集合下2所分别采取的策略。
如此扩展式表示2能区分1采用了L还是S。当2能观察到1的行动,因为2的信息集合中只有单一个元素(singleton),故称2有完美信息(perfect information)。
子博弈完美均衡(Subgame Perfect Equilibrium)与存在性
以上策略式博弈有三个纳什均衡策略组合:
x=(L, (L, L)),y=(L, (L, S)),z=(S, (S, S)),三者中有二个具同样报酬,但仍非同一均衡。这三个均衡中只有中间这个NE是合理的,其它两个NE不合理(理由可从以下所谈「逆推法」来看)。
定义:完美信息(Perfect Information):参赛者完全得知以前各参赛者所采行动。换言之,参赛者面对的信息集合都只有单一元素(singleton);若不满足此条件则为不完美信息(Imperfect Information)博弈。
定义:子博弈(Subgame)是原博弈的一部份(小树subtree),从单一元素的信息集合开始到终结环结,并且不会改变任何的信息集合。
定义:子博弈完美均衡(Subgame Perfect Nash Equilibrium, SPNE)是一策略组合,在原博弈中是纳什均衡,而且它相关的策略在每个子博弈中也都是该子博弈的纳什均衡。
在以上例子中,x不是子博弈完美均衡因为L不是纳什均衡策略(在1采用S后子博弈中),z不是子博弈完美均衡因为S不是纳什均衡策略(在1采用L后子博弈中)。
只有y是SPNE。如此结论也可用逆推法来看,从最后的小树(子博弈)来看,找到NE,再往前推(以箭头表示):
逆向归纳法(Backward Induction)
基于连续理性原则(参赛者在每一步骤上均追求效用极大)
SPNE是对原来NE的精炼(refinement),是完全信息动态博弈合理的均衡观念。
第1章中谈的Stackleberg Duopoly之解也是SPNE。也用逆推法,先给定某一q1,求出q2对的最适反应(子博弈),再找出q1的最适选择,1就是领导者。
Theorem :每个有限、完美信息博弈均有纯粹策略的子博弈完美均衡SPNE。(Selten, see MWG )
完全信息动态博弈之范例
(1)创新博弈
创新博弈的例子中NE是(推新产品,推新产品),但若允许该产业领导者Sony先宣布其策略,结果也会不同(已是不同博弈了!)。
( Sony应宣布不推,Zenith会跟随不推。
(2)吓阻进入博弈
吓阻进入博弈中有二个NE:(进,原价),(不进,低价)。但很重要信息是新公司常先采行动,新旧公司之间有行动之先后 ( 以扩展式博弈表示如下。
再以子博弈完美观念来求均衡,只得一个SPNE,就是E进而I采原价。换言之,旧公司(I)价格战的恐吓是不可信的(not credible)。
( 子博弈完美均衡的相应策略才是可信的威胁(credible threat)。
但对连锁店集团来说,若有K=50,从第50个市场开始,I不作价格战,到第49家亦然,(反推下去,连锁店的SPNE是对所有50个市场均不作价格战以吓阻新公司。由理论推导出的SPNE与实际观察到的价格战现象不符,是为Selten所称的连锁店悖论(Chain-Store Paradox)。关于这方面的发展,以后到不完全信息博弈再谈。
(3)出价策略
购并例子中,要考虑对手的反应(如下):
如出价P≦T公司的真实价值VT,T公司不会接受,A公司不赚不陪。
如出价P>T公司的真实价值VT,T公司才会接受,则可认为VT在[0,p]之间,每点机率都相同(Uniform Distribution)。
T公司接受后,A公司预期得到的E(VT)预期T公司价值=。
加上良好管理后,可获价值,低于成本P,赔了元。
所以,在考虑对手理性反应后的A公司策略是出价0元!
(4)(5)二个范例,我们在后面会再讨论到。
完全信息重复博弈
属于完全信息动态博弈之一种,此处特别考虑完美信息(Perfect Information),至于重复次数,则分为有限次重复与无限次重复。在重复博弈中的报酬是否是各阶段博弈(Stage game)报酬的折现总值。阶段博弈以G表示。
˙有限次重复博弈G(n,δ):
其中n为阶段博弈G所重复的次数,δ=1/(1+r)是折现率。
若吓阻进入博弈重复有限次数,(进入,原价)还是SPEN。对囚犯困境,隐
性勾结等博弈而言,推理亦同。
第一阶段 n-1 第n阶段
逆推法
˙无限次重次博弈G(∞, δ):
因为能观察到对手行动,策略变得更丰富,因可以因对手行动而改变策略。考虑触发策略(trigger strategy):一开始采合作策略H,对手一旦采取L行动,就从此采用惩罚策略L。
乙
H
L
不认
认罪
H高价
10 , 10
5 , 12
不认
-1 , -1
-8 , 0
阶段博弈 甲
L低价
12 , 5
8 , 8
认罪
0 , -8
-5 , -5
两者均采(H,H,H….)策略的报酬=10(1+δ+δ2+…)=10/(1-δ)
『重复无限多次』的另一诠释:G每次有机率P会继续下去,不需要确定一定会继续下去。
对G (∞, δ)报酬的算法=(1-δ)(各期报酬的折现和)
最大的极小策略(Max-Min strategy):
优势策略均衡是(D,R),也是Nash均衡(why?)
万一选错了,1的损失甚大。
1的保守作法是找出U的极小报酬(1)
和D中的极小报酬(-100),再在极小中求最大,
1选U。另一种诠释是1担心2会惩罚他,所以选U以求保留效用极大。同理,2会选R。(U,R)是双方的Max-Min strategies .
Theorem 重复博弈的无名氏定理(Folk Theorem of Repeated Games)
在无穷重复博弈G(∞, δ)中,V=(V1…Vn)是参赛者在G中所能达到的最大的极小策略报酬(max-min payoffs)考虑U=(U1…Un)是阶段博弈报酬,而且Ui≧Vi,对所有I均成立。则可找到一贴现率δ*<1使得对所有δ>δ*,U=(U1…Un)是G(∞, δ)博弈的子博弈完美均衡报酬(SPNE)。
在囚犯困境中,max-min报酬=(-5,-5)也就是阶段博弈中的纳计均衡。
在隐性勾结中,max-min报酬=(8,8)也就是阶段博弈中的纳计均衡。
(-5,-5)算法如右:(1-δ)[1+δ+δ2+…](-5)=-5
不合作博弈重复∞次,(合作解是可能的
隐性勾结可以发生,江湖道义可以维持下去,
其中参赛者采用的策略可相当丰富,
像触发策略或以牙还牙策略均可能用来得到合作解。→Implicit Collusion
Folk Theorem前提:
无穷期重复或无确切停止日期(长期关系)
知道对手做了什么,知道对手报酬,(对手数目不多,完全信息);
策略可因行动而改变,(可采动态奖惩策略);
δ(1,折现率大时较易成立,;
未说明使用何种策略。
如何达到均衡,必须考虑采用何种策略,可以互为最适反应:
在以上『隐性勾结』重复博弈中,任一参赛者可以考虑以下策略:
A. 好好先生策略:『永远与对手合作,采高价策略』。
触发策略(Trigger Strategy):『一开始采高价策略,只要对手采高价就继
续采高价,但一旦对手前期采低价,从此以后全部采低价。』
以牙还牙策略或跟随策略(tit-for-tat strategy):『一开始采高价,以后每期
都采对手前一期之策略。』
分析:A遇B:A 是对B的最适反应,但B不是对A的最适反应,不是Nash.
B遇B:乙 若采高价,则报酬是(10,10,10……)
若在任一期采低价,则必须承担惩罚,(12,8,8,8,8…)
所以乙对此状况的最适反应是一直合作下去,触发策略的惩罚
报复部分是『备而不用』,同理可知甲的策略。(隐性勾结是
SPNE .
假使每次博弈继续的机率是q,一年中定价的次数成为f,市场获利成长率(1+g),则:
也就是 δ q 够大时, 新的折现因子够大时才能达成合作解:
折现因子够大时才能达到合作解,也就是q 够大,f 够大,g 够大,i 够小时才容易达到合作解!
Note:合作在无穷重复博弈中可能成为均衡解,但不合作也可能是均衡。
达成隐藏性勾结的产业条件:
参赛者均有类似目标:求取最大报酬,可作为理性推论的基础。(例:低价的惩罚造成市场扩大,对他人可能不是惩罚)
可观察对手行为:是否可迅速发现任何偏离均衡之行为(没有噪声noise),并可立即予以惩罚。(例:石油卡特尔组织)
能否有效排除其它进入者:entrants进入是否会造成勾结利益的下跌?在稳定市场中才能达勾结(回想例1)
达成协议的参与家数:太多家数,是否难以执行协议?
产品需求弹性:弹性高时,P↓TR↑,偏离的诱因较高。
生产成本与产品的相似性:成本或产品差异越大,越难勾结。
7.不合作的短期利益(G)有限,小于长期损失(L)总和:
是否现在有某种策略,可以一举打垮对手?(例:划时代的新技术,q小)
是否未来的合作可带来足够的利益? (例:夕阳工业,q小)
8. 产品需求稳定性:需求稳定成长时(g大),较易执行勾结解。
9.生产技术与产品的相似性:成本差异越大,越难勾结。
10. 是否经常接触?若定价频率提高或在多市场接触(multimarket contact),则f上升,较易勾结。
成立前提:(无穷期重复或并无确切停止日期(长期关系)
(完全信息(知道对手在各情况下之成本、收益)
(可观察对手以前各期行为(对手数目不多)
( Reciprocity 互惠(或互害):长期关系下的策略相当丰富,可从对手过去作为而采不同策略,予以对手善意响应或报复。
可参看Axelrod的讨论。
动态博弈在产业竞争的应用
可信承诺(Credible Commitment)与吓阻进入
Strategic Move 是经由行动改变未来可选择的策略集合,进而影响博弈均衡。
上下游关联博弈
A. 引擎厂的产品大多卖给汽车厂,
汽车厂
Small cars
Big cars
引擎厂
Small engines
3,6*
3,0
Big engines
1,1
8,3*
报酬如下:
静态博弈:纳什均衡解NE(3,6),(8,3)
动态博弈:引擎厂受制于汽车厂,
汽车厂成为主导者,有first mover advantage:子博弈完美均衡解SPNE(3,6)
B. 引擎厂事先可宣称将只生产大引擎,若汽车厂相信引擎厂宣言,因为汽车厂不易找到其它供应厂商,则会选产大车,均衡成为(8,3)。 但是此宣言未必可信(Empty threats),一旦汽车厂决定生产小车,引擎厂还是会配合生产小引擎。
在Entry Deterrence Game内,也有类似情况。Incumbant 事先可宣示说Entrant 进入后必将面临价格战争,但Entrant进入后Incumbant 为了自利考量并不会进行价格战。Entrant 也察觉此点,因而会进入,原先的宣示也就不可信了(Empty threats)。
C. 引擎厂如何使其宣言成为可信?
引擎厂采取行动,使其生产小车的利润大幅降低(卖掉或毁损部份生产小引擎的产能)。目的在让汽车厂了解当它选择生产小车时,引擎厂还是只会生产大引擎。
汽车厂
Small cars
Big cars
引擎厂
Small engines
0,6
0,0
Big engines
1,1
8,3
静态博弈:纳什均衡 NE(8,3)
动态博弈:子博弈完美均衡 SPNE(8,3)
引擎厂毁损部份产能表面上似乎不利其营运,但能促使汽车厂相信它的
commitment只会生产大引擎,增强此宣言可信度。
吓阻进入博弈(Entry Deterrence Game)
在双方均为理性的前提下,NE均衡解(10,50)
Commitment:Incumbent 可投资扩厂,拥有 excess capacity,以便未来进行价格战(高产量、低价格),投资花费 30 million,也改变所获报酬:
实例:Dupont的扩厂策略
在1960年代生产二氧化钛染料的厂商有Dupont及其它六家较小厂商。其中 Dupont特有技术使用的原料较便宜,所以成本比竞争者低了20%左右,也较符环保要求,因此财务状况也较好。在1971年Dupont成立规划小组,小组提出两个选择:一是「维持」策略,从1972年的30%市占率稳健成长到45% ,另一个是「成长」策略,要在该产业取得领导地位,从1972年的市占率30%,计划到1980年想达到市占率56%,到1985年想达到市占率65% 。Dupont估计对二氧化钛的短期需求弹性约为 ,总需求量的年成长率约为3 % ,Dupont的生产有学习效果(learning curve effect) 。 Dupont预期总需求可能增加53万吨,规划小组建议在1972年就先发制人增加50万吨的产量,并广为宣传,造成对手很大压力。
Dupont具先行者优势,所采的是Capacity Expansion,利用它原本在财务及成本上的优势,先行扩充产能,迫使其它各家离去。
谈判Bargaining
Bargaining
谈判博弈以 ( E , d ) 来表示,
E是效率前缘,d是威胁点
(threat point或disagreement point )
双方的外在选择 (outside options )
多寡影响威胁点位置。
Nash Bargaining Solution
谈判利得的分配:Max(U1-d1)(U2-d2)
也可考虑Rubinstein的动态谈判模型。
实例:MCI与British Telecommunication ( BT ) 于1993形成的策略联盟,经过三年之久的谈判。获利方面:BT买MCI 20% 股权,MCI获得 (出价$64-市价$)×100m shares ≈ $ billion,可在国内市场与AT&T竞争;BT获得MCI的20%未来利润并参与美国市场。威胁点方面:MCI的外在选择联盟对象较少,又面临AT&T压力(同时BT公司约为MCI的三倍),在新成立joint venture公司出资方面BT是MCI的三倍。
策略性贸易政策(Strategic Trade Policies)
两国,各有一独占公司 i=1, 2: i=1生产h1销售国内,
生产e1销售国外。
P1=10-Q1 Q1=h1+e2
P2=10-Q2 Q2=h2+e1
两国政府各自决定关税 ti,以求社会福利之最大,然后二家公司寻找最适
(hi, ei),具国家之间与公司之间的策略性互动。
第二阶段(倒推法):
1 给定t2,h2和e2
,
最适反应 ,
同理,最适反应 ,
此二最适反应求解:,
NE at the 2nd stage:;,
(,protecting home mkt.)
第一阶段(政府决策):
1
2
请求解 :
并找出下列「囚犯困境」报酬(社会福利):
t2=0
t2=
t1=0
?
t1=
?
FTA (Free Trade Agreement)「自由贸易协议」:
双方同时降税成可使双方获利,若无强制功能,则任一方均有诱因自FTA偏离!
实例与应用:掠夺式定价与连锁店悖论
A. 1991年在Arkansas三家药店控诉Wal-Mart试图以低价垄断市场,所卖商品价格均低于其进货成本,他们发现「Wal-Mart各地区经理无权定价比总部定价更高,但有权降价与敌对零售店竞争」是Wal-Mart的政策。他们控诉Wal-Mart采取的是「掠夺式定价」(Predatory Pricing) ,目的在摧毁竞争对手。Wal-Mart如此策略是否会造成短期利润的下降?Wal-Mart采低价在何种条件下可导致长期利润(动态考量)提高?
Standard Oil, Maxwell House Coffee, American Airline在某段时期都曾被其它公司作类似的指控。采低价目的在打败对手,在下期可享独占利润。但是,如果到下一期或在别地区又面临新对手,何时才能享受到独占利润?考虑Wal-Mart在20个区域都设有卖场,Wal-Mart的利润是20个市场的总和。而在20个区域都有对手考虑是否要进入市场,每个市场均可视为一个博弈
Wal mart
新公司
原价
低价
进入
2, 4*
-1, 3
不进入
0, 5
0, 5*
要留心以上表示方法有一缺点:尚未纳入新公司先出招,Wal-Mart再反应的重要信息。正确表示方法是以扩展式表示(见讲义更仔细的介绍):如此博弈重复多次下去,Wal-Mart是否能以低价获取高利润?
B. 新公司(1)先出招,旧公司(2)可观察到新公司行动,旧公司可采之价格战的威胁是否可信(credible)?
如此所得均衡为子博弈完美均衡(SPNE),只有此种SPNE均衡才是可信的(Credible)。子博弈完美均衡是原来同时出招博弈二个纳什均衡(NE)的子集合。价格战的策略在SPNE的检验下成了空洞的威胁(empty threat)。 疑问是经常提到的「掠夺式订价」策略是否可行?
C. 如何吓阻进入?先考虑短期架构的完全信息博弈。
在20处设有连锁店的Wal-Mart,一直要面对各处的竞争者。换言之,以上的博弈要重复20次。对第20次博弈而言,旧公司的最佳策略是维持原价,因为没有其它更为好的策略。倒推到第19次也看到「以低价作战」的宣言也不可信(non-credible)。……如此倒推到第1次博弈,旧公司还是维持原价。所以,是否可下结论:在进入障碍不高的产业内,掠夺式的定价难以获利?
这是诺贝尔奖得主提出的「连锁店矛盾」(Chain Store Paradox):「以低价作战」的策略不是「子博弈完美均衡」,在「短期架构」下是不可信的宣言。
矛盾是在实务上仍常被采用,是什么条件造成的?稍后考虑Kreps and Wilson的不完全信息博弈,可提供不同思考角度:信誉(Reputation)。注意信誉必须在一长期架构下才能建立。
D. 考虑原厂商有可能是强悍或软弱: (不完全信息)
‧若是一强悍厂商,则会选择价格战,新厂商则选择不进入。
‧软弱厂商也有诱因从事价格战,一旦获得强悍的信誉,就可依此吓退对手,虽然短期损失(由4到3),但因在长期(无限多期)能以信誉享受独占利润5。
结论是在不完全信息下,面临20家或20期的挑战,原厂商有诱因从事价格战,解决了Chain Store Paradox (见Kreps and Wilson, JET 1982) :在与第一期进入者竞争时,就要注意信誉,打价格战虽然不利,但可建立起信誉(有成本),在吓退对手之后,可长期享有独占利润。
E. 在博弈分析中可找到一定的条件,使掠夺式定价有可能会发生,而政府则藉反托拉斯法或公平交易法介入。
相关问题是:价格要低到多低才算是掠夺式定价?
‧Aveeda-Turner Criterion: 若原厂商 P < SMC 或 P < SAVC,则掠夺成立
‧在新厂商进入后不应增加产量,在新厂商退出后不应提高价格。
. Wal-Mart 1991年的诉讼就是在争议它的价格是否低于SAVC(Aveeda-Turner Criterion) 。Wal-Mart初审有罪,上诉再审结果无罪。
General Food’s Maxwell Houses Coffee vs P&G’s Folgers: 1976年FTC发现Maxwell在几个城市售价确实低于平均变动成本,但之后免除罚则,原因是认为在整个美国市场上它尚未具有独占和掠夺定价能力。
Standard Oil在1865到1911年之前大致采取掠夺式定价,伴随着低价收购对手炼油厂,到1879年占美国90%的炼油产能,到1911年才被高等法院要求解体。
实例与应用:品牌选择
在麦片(cereal)早餐市场上,有多种榖类、形状和口味,每种品牌平均只占市场2%左右。生产技术不是太复杂而且生产规模不必太大,但是几乎没有新的进入者,主要的几个参与厂商(Kellogg, Quaker Oats, General Food, etc)总合市占率达90% ,都能获得相当利润。新进者的抱怨是这几家提供过多的口味变化,造成了进入的困难?你是否同意?这样的产业可以如何分析?
早餐麦片市场所采的吓阻策略是产品多样化(product proliferation) 。假设创造一种新的产品需行销成本F ,每种新的产品都针对不同口味的消费者设计,但产品的价格相差甚小,假设均为。消费者口味可用[0,1]表示。
当原公司与新公司先后各自提供一种产品时,二者均会
选在 处,获得利润 。请检验这是否为一博弈均衡?若先后出招呢?
B.假设原公司(incumbent)可先提供二种产品来占据市场,(先行看优势) ,可选在1/4及3/4处。知名度较差的新公司很难一次提供多项产品,假使它只能提供一种产品,它的最佳选择是在1/2处,可得到 区间的顾客,利润为 。
假设 ,则新公司承受亏损,不会进入。原公司将占有整个市场并获利 (是原策略所获利润的两倍) 。检查这是否为一博弈均衡?原公司有何竞争优势?
提供多样化产品(product proliferation)以满足各类消费者不同的偏好,会造成新进者有进入障碍(如啤酒、 冷冻食品等)。以上的分析也适用于开联锁店位置的选择(location choices) ,像银行对开分行的选择,快餐店对分店的选择等-fill every product niche 。
C. 产业竞争造成品牌过度增加或分店开的过多(花费太多的F) 。像在以上分析中,如果原公司生产两种口味不足以吓阻进入,则可能要生产更多种口味才能吓阻进入。在进入的技术门坎不高时,可能观察到过多的品牌(或分店) :均衡品牌的数目并非最有效率的品牌数目。
以上分析有一定的假设和条件 (像价格相同等) ,在应用时不可忘记!
实例与应用:原油市场
世界原油价格在1973及1979二次大涨,1980以后也非常不稳定。不但需求不稳定,而且,受到新发现油田及OPEC等产油国决策的影响,石油产量也不稳定。在需求高且稳定的期间较易维持OPEC决议,还是在需求不稳定的期间较易维持OPEC的决议?石油价格又会呈现何种型态?
目前考虑两个国家代表OPEC成员,举一大一小的Saudi Arab (SA)和Venezuela(VA)为例。SA生产QH=10和QL=8(mb)二个水准, VA生产qH=7和qL=5二个水准。当需求高时对应高产量17,中产量15和低产量13之石油价格分别为每桶$19, $22, $25。当需求低时以上三产量则分别对应每桶$14, $15, $16三种油价。此外,生产的边际成本是每桶5元,需求高的概率为p。
先以策略形式博弈来表示OPEC会员国每一年对峙型态:
高需求(概率p)
VA
qH
qL
QH
140,98
170,85
QL
136,119
160,100
低需求(概率1-p)
VA
qH
qL
QH
90,63
100,50
QL
80,70
88,55
A. 在需求确定强劲的年代(1973-1979) :
纳许均衡或优势均衡都是(QH, qH) ,但若双方形成有强制力的卡特尔(Cartel) ,选择(QL, qL)则使双方同时获利,OPEC经常集会决定限制产量。假设双方的折现率为 δS与δV。
如果VA偏离,生产高量QH,短期获利119,但下期便可能遭受报复(SA大量增产,造成价格下降)。
假使 ,则VA不会偏离。
以SA来看,SA遵从产量限制时得利
偏离时可能遭受VA报复,获利成为
假使 ,则 SA不愿偏离。
可见小国VA较易偏离勾结解(赚19,之后每期损失2),只有当他们的折现率(discount factor)较高时才在乎未来可能的损失,才会遵守OPEC的产量限制(production quota) 。
问题是:在需求疲软的年代(1960-1973年)及在需求变动时代(1980以后)什么是最佳策略?
B. 需求变动下的OPEC (1980以后的期间)
(1)需求疲软时,没有必要实行产量限制。
(2)需求不确定时,p的大小,决定是否要采产量限制。
OPEC的最适策略是在需求强的年份限制产量(QL, qL) ,在需求低的年份则不限制 (QH, qH) ,假使第一年是高需求,SA遵从OPEC法则降低产量。
若SA在第一年偏离,则VA予以连续报复(qH) ,获利成为
假使 ,亦即高需求概率越高时,SA越不愿偏离,同时高需求概率较高时,对SA折现率的要求较低也可造成SA不愿偏离。同理,可找到VA的条件,对VA折现率的要求必须较高才会造成VA不愿偏离。
C. OPEC在什么情况下会达成联合垄断?亦即产量限制的约定何时能被切实执行?
(1)高需求的概率不低(p较高)时,或各生产者折现率δ不低(重视未来)之时。(在低需求情况下,产量限制反而可能造成利润下降。)
(2)在高需求情况下,各生产者均有诱因偏离产量限制,此时参与者必须要能察觉。(小生产者最有诱因偏离,像例中的VA)
(3)当发现某生产者偏离产量限制时,其它成员生产国必须采行报复手段(全采高产量)。(这段惩罚期间就造成价格波动,价格下降一段时候才能恢复正常。见例2)
(4)如果对产量的偏离行为难以察觉时,可藉观察市场价格的滑落而采报复手段。(看到$19就表示有生产者偏离了。)
参见Julio Rotemberg and Garth Saloner, “A Supergame Theoretic Model of Price Wars during Booms,” American Economic Review 1985, 390-407.
小结
第1章已有5点策略性思考原则,再加入:
6. 选择策略必须经过「均衡」的检验: 最佳策略是考虑对手最适反应后的最适反应。纳许均衡策略是一组互为最适反应的策略组合,随博弈的要素而变动。
7. 在动态博弈中,参赛者「何时可以行动」与「行动时拥有的信息」影响博弈之均衡。
8. 在动态博弈中,应采逆向归纳法(见第2点)的思考方式来消除不可信的威胁 (empty threat)。( 经得起考验的均衡称为「子博弈完美均衡」)。
9.在动态(吓阻进入)博弈中,能让对手相信为可信承诺(credible commitment)的策略,才可收到事先吓阻的效果。策略若要成为可信之承诺,应有具沈没成本或事后不易更动等特性。
10.在多期(重复)博弈中要重视长期利益,依对手行为而采敏感具动态奖惩效果的策略。在一定条件下,达成(长期)隐性勾结可能胜过短期竞争。
练习题
在出价策略博弈(节)中,在何种假设下,A公司会愿意出价购并T公司?
在协调博弈(节)中,若由甲先行,博弈均衡为何?若由乙先行呢?你所使用的是什么均衡观念?
隐性勾结博弈(节)与囚犯困境博弈有何相似之处?为何在重复博弈中可能达成勾结解?所需条件为何?
在两厂商的长期订价互动 (见节)中,尝试设计三种动态奖惩策略,并了解互相交手二十次后何者报酬较高。如果有可能发生错误 (店长把维持原价的指示误解为进行价格战)时,结果是否会改变?请归纳你分析的结果。
采扩充产能的吓阻进入策略,其成功条件为何?可能导致失败的风险有何?请考虑Dupont (见节)及半导体业为例。
策略性贸易政策(节)中,作出报酬矩阵并分析可否成为一个自发性的均衡。『自由贸易协议』在这样博弈架构下发挥何种功能?
为何掠夺式定价与限制竞争定价(见节)的策略在执行上常遇困难?要能吓阻对手的前提条件为何?请考虑Wal-Mart及航空业订价为例。
在麦片早餐市场 (见节) 中,若先行厂商可以建立三种口味品牌来占据市场 (其它不变),它的最适选择为何?与原先只建二个品牌比较,是否会使新厂商的获利机会降低?
苏
核武
让步
美
核武
-L, -L
-L, -L
让步
-L, -L
-8, -8
美苏在二次大战之后各自均拥有足以摧毁对方好几次的核武弹头,一旦遇到国际冲突(像古巴危机)时可能有以下的对峙状况,-L是发生核战的极端结果,而且只要有一方攻击,他方一定反击,双方一定同时毁灭,造成人类浩劫,此种吓阻策略称为MAD(Mutually Assured Destruction) 。作为决策者的双方首长该如何抉择?
参考文献
1. R. Selten, “Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games,” International Journal of Game Theory 1975, 25-55.
2. R. Selten, “The Chain Store Paradox,” Theory and Decision 1978,127-159.
3. J. Nash, “The Bargaining Problem,” Econometrica 1950, 155-162.
4. A. Rubinstein, “Perfect Equilibrium in a Bargaining Model,” Econometrica 1982, 97-109.
5. E. Green and R. Porter, “Noncooperative Collision Under Imperfect Information,” Econometrica 1984, 87-100.
6. J.-P. Benoit and V. Krishna, ”Finitely Repeated Games,” Econometrica 1985, 905-922.
7. Julio Rotemberg and Garth Saloner,“ A Supergame Theoretic Model of Price Wars during Booms,” American Economic Review 1985, 390-407.
8. R. Axelrod, The Evolution of Cooperation, Basic Books, 1984.
PAGE 1
2- PAGE 11