智库文档所有分类

第2章完全信息动态博弈.doc

下载

Davacy

23页 | 428KB | 1次下载 |

4.0

(1人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

第2章完全信息动态博弈完全信息动态博弈的表示法 2-1 由静态到动态博弈的范例 2-1 动态博弈扩展式的表示法 2-3 子博弈完美均衡与存在性 2-4 完全信息动态博弈之范例 2-6 完全信息重复博弈与无名氏定理 2-8 动态博弈在产业竞争的应用 2-11 可信承诺与吓阻进入 2-11 谈判 2-13 策略性贸易政策 2-14 实例与应用：掠夺式定价与连锁店悖论 2-16 实例与应用：品牌选择 2-18 实例与应用：原油市场 2-19 小结 2-21 练习题 2-22 参考文献 2-23 完全信息动态博弈的表示法由静态到动态博弈的范例考虑以下原为静态博弈的范例，但在允许参赛者可以先后出招后就成为动态的博弈：创新(Innovation) Zenith 推新产品不推 Sony 推 10, 2* 15, 0 不推 3, 3 12, 5 如果Sony与Zenith同时出招，均衡为何？如果Sony是产业领导者，先宣布它是否推出新产品，均衡是否会改变？吓阻进入(Entry Deterrence) 旧公司原价低价新公司进 10, 50* -10, 30 不进 0, 100 0, 100* 如果新、旧公司同时出招，均衡为何？如果新公司决定进入此产业之后，旧公司是否会采低价之价格战策略？旧公司是否能吓阻新公司进入？如果旧公司是连锁店(chain stores)，是否在每个城市或区域都采价格战，以吓阻新集团进入？ (3) 出价策略(Bidding Strategy) T公司进行中的投资计划可能成功或失败，外界认为每股T公司股票可能在0至20元之间，每点机率都相同，只有T公司自知其真实价值(信息不对称)。A公司考虑并购T公司，A公司经营绩效优异，有信心在入主T公司以后使其价值增为原来的倍。A公司为购并T公司，应向T公司出价每股多少元？ (4) 隐性勾结(Tacit Collusion) 乙高价低价甲高价 10, 10 5, 12 低价 12, 5 8, 8 两家厂商面临同样的单位成本每单位2元，无固定成本。两家均采高价(4元)则每家可销售5万个，若均采低价(3元)则每家可售8万个，若一家采高价，一家采低价，则采高价者售出万个而采低价者售出12万个。如果这二家厂商每月均需面对对方，长久以往，是否能达到每月(10, 10)的报酬？ (5) 协调博弈(Games of Coordination) 乙 L规格 S规格甲 L规格 2, 2 -1, -1 S规格 -1, -1 1, 1 同时出招时有两个纳什均衡，究竟何者会成立？在考虑动态调整后，允许一家先行，是否可以达成某一特定均衡？换言之，纳什均衡原本众多，但在动态博弈中是否得以精炼(refinement)，使均衡数目减少？动态博弈扩展式的表示法动态博弈以扩展型式(Extensive Form)来表示扩展型式博弈 (＝(N, H, P, I, U)有五要素：参赛者，i(N＝{1, 2, (, n} 历史H，h＝(a1, (, ak) (H。博弈树(game tree)是一多个环节(nodes)与枝干(branches)的集合，从单一的起始环节，不经回转，直到终结环节(以Z表其集合)。博弈树就代表博弈历史(到某一环节止亦可)。对每个环节的分配法则P：将每个环节(除终结环节外)分配给不同的参赛者并赋予行动时可选的策略。对h(H \ Z而言，P(h)是分配法则。参赛者行动时的信息集合I (Information Set)。对应参赛者可能选取策略，各参赛者在终结环节所得的报酬U。以第5个范例(协调博弈)来说：策略式 2 L S 1 L 2, 2* -1, -1 S -1, -1 1, 1* 等值如此信息集合表示2不能区分1是否采用了L或S。一旦改了信息集合(如下)，就代表完全不同的博弈： 2’s strategies (L, L) (L, S) (S, L) (S, S) 1 L 2, 2* 2, 2* -1, -1 -1, -1 S -1, -1 1, 1 -1, -1 1, 1* 等值 2’ strategies例如(L, L)代表1采L后2采L，而且1采S后2采L。藉以表示出2的策略因1策略而意义不同。「策略」的涵义：表示出在各个信息集合观察到(1的行动)之下的相应行动，(L, L)代表是在二个信息集合下2所分别采取的策略。如此扩展式表示2能区分1采用了L还是S。当2能观察到1的行动，因为2的信息集合中只有单一个元素(singleton)，故称2有完美信息(perfect information)。子博弈完美均衡(Subgame Perfect Equilibrium)与存在性以上策略式博弈有三个纳什均衡策略组合： x＝(L, (L, L))，y＝(L, (L, S))，z＝(S, (S, S))，三者中有二个具同样报酬，但仍非同一均衡。这三个均衡中只有中间这个NE是合理的，其它两个NE不合理(理由可从以下所谈「逆推法」来看)。定义：完美信息(Perfect Information)：参赛者完全得知以前各参赛者所采行动。换言之，参赛者面对的信息集合都只有单一元素(singleton)；若不满足此条件则为不完美信息(Imperfect Information)博弈。定义：子博弈(Subgame)是原博弈的一部份(小树subtree)，从单一元素的信息集合开始到终结环结，并且不会改变任何的信息集合。定义：子博弈完美均衡(Subgame Perfect Nash Equilibrium, SPNE)是一策略组合，在原博弈中是纳什均衡，而且它相关的策略在每个子博弈中也都是该子博弈的纳什均衡。在以上例子中，x不是子博弈完美均衡因为L不是纳什均衡策略(在1采用S后子博弈中)，z不是子博弈完美均衡因为S不是纳什均衡策略(在1采用L后子博弈中)。只有y是SPNE。如此结论也可用逆推法来看，从最后的小树(子博弈)来看，找到NE，再往前推(以箭头表示)：逆向归纳法(Backward Induction) 基于连续理性原则(参赛者在每一步骤上均追求效用极大) SPNE是对原来NE的精炼(refinement)，是完全信息动态博弈合理的均衡观念。第1章中谈的Stackleberg Duopoly之解也是SPNE。也用逆推法，先给定某一q1，求出q2对的最适反应(子博弈)，再找出q1的最适选择，1就是领导者。 Theorem ：每个有限、完美信息博弈均有纯粹策略的子博弈完美均衡SPNE。(Selten, see MWG ) 完全信息动态博弈之范例 (1)创新博弈创新博弈的例子中NE是(推新产品，推新产品)，但若允许该产业领导者Sony先宣布其策略，结果也会不同(已是不同博弈了！)。 ( Sony应宣布不推，Zenith会跟随不推。 (2)吓阻进入博弈吓阻进入博弈中有二个NE：(进，原价)，(不进，低价)。但很重要信息是新公司常先采行动，新旧公司之间有行动之先后 ( 以扩展式博弈表示如下。再以子博弈完美观念来求均衡，只得一个SPNE，就是E进而I采原价。换言之，旧公司(I)价格战的恐吓是不可信的(not credible)。 ( 子博弈完美均衡的相应策略才是可信的威胁(credible threat)。但对连锁店集团来说，若有K＝50，从第50个市场开始，I不作价格战，到第49家亦然，(反推下去，连锁店的SPNE是对所有50个市场均不作价格战以吓阻新公司。由理论推导出的SPNE与实际观察到的价格战现象不符，是为Selten所称的连锁店悖论(Chain-Store Paradox)。关于这方面的发展，以后到不完全信息博弈再谈。 (3)出价策略购并例子中，要考虑对手的反应(如下)：如出价P≦T公司的真实价值VT，T公司不会接受，A公司不赚不陪。如出价P＞T公司的真实价值VT，T公司才会接受，则可认为VT在[0,p]之间，每点机率都相同(Uniform Distribution)。 T公司接受后，A公司预期得到的E(VT)预期T公司价值＝。加上良好管理后，可获价值，低于成本P，赔了元。所以，在考虑对手理性反应后的A公司策略是出价0元！ (4)(5)二个范例，我们在后面会再讨论到。完全信息重复博弈属于完全信息动态博弈之一种，此处特别考虑完美信息（Perfect Information），至于重复次数，则分为有限次重复与无限次重复。在重复博弈中的报酬是否是各阶段博弈（Stage game）报酬的折现总值。阶段博弈以G表示。 ˙有限次重复博弈G(n,δ)：其中n为阶段博弈G所重复的次数，δ＝1/(1＋r)是折现率。若吓阻进入博弈重复有限次数，(进入,原价)还是SPEN。对囚犯困境，隐性勾结等博弈而言，推理亦同。第一阶段 n－1 第n阶段逆推法 ˙无限次重次博弈G(∞, δ)：因为能观察到对手行动，策略变得更丰富，因可以因对手行动而改变策略。考虑触发策略（trigger strategy）：一开始采合作策略H，对手一旦采取L行动，就从此采用惩罚策略L。乙 H L 不认认罪 H高价 10 , 10 5 , 12 不认 -1 , -1 -8 , 0 阶段博弈甲 L低价 12 , 5 8 , 8 认罪 0 , -8 -5 , -5 两者均采（H,H,H….）策略的报酬＝10(1＋δ＋δ2＋…)＝10/(1－δ) 『重复无限多次』的另一诠释：G每次有机率P会继续下去，不需要确定一定会继续下去。对G (∞, δ)报酬的算法＝(1－δ)(各期报酬的折现和) 最大的极小策略(Max-Min strategy)：优势策略均衡是(D,R)，也是Nash均衡(why？) 万一选错了，1的损失甚大。 1的保守作法是找出U的极小报酬（1）和D中的极小报酬(-100)，再在极小中求最大， 1选U。另一种诠释是1担心2会惩罚他，所以选U以求保留效用极大。同理，2会选R。(U,R)是双方的Max-Min strategies . Theorem 重复博弈的无名氏定理(Folk Theorem of Repeated Games) 在无穷重复博弈G(∞, δ)中，V＝(V1…Vn)是参赛者在G中所能达到的最大的极小策略报酬（max-min payoffs）考虑U＝(U1…Un)是阶段博弈报酬，而且Ui≧Vi，对所有I均成立。则可找到一贴现率δ*＜1使得对所有δ＞δ*,U＝(U1…Un)是G(∞, δ)博弈的子博弈完美均衡报酬(SPNE)。在囚犯困境中，max-min报酬＝(-5,-5)也就是阶段博弈中的纳计均衡。在隐性勾结中，max-min报酬＝(8,8)也就是阶段博弈中的纳计均衡。 (-5,-5)算法如右：(1－δ)[1＋δ＋δ2＋…](－5)＝－5 不合作博弈重复∞次，(合作解是可能的隐性勾结可以发生，江湖道义可以维持下去，其中参赛者采用的策略可相当丰富，像触发策略或以牙还牙策略均可能用来得到合作解。→Implicit Collusion Folk Theorem前提：无穷期重复或无确切停止日期(长期关系) 知道对手做了什么，知道对手报酬，(对手数目不多，完全信息)；策略可因行动而改变，(可采动态奖惩策略)； δ(1，折现率大时较易成立，；未说明使用何种策略。如何达到均衡，必须考虑采用何种策略，可以互为最适反应：在以上『隐性勾结』重复博弈中，任一参赛者可以考虑以下策略： A. 好好先生策略：『永远与对手合作，采高价策略』。触发策略（Trigger Strategy）：『一开始采高价策略，只要对手采高价就继续采高价，但一旦对手前期采低价，从此以后全部采低价。』以牙还牙策略或跟随策略(tit-for-tat strategy)：『一开始采高价，以后每期都采对手前一期之策略。』分析：A遇B：A 是对B的最适反应，但B不是对A的最适反应，不是Nash. B遇B：乙若采高价，则报酬是(10,10,10……) 若在任一期采低价，则必须承担惩罚，（12,8,8,8,8…）所以乙对此状况的最适反应是一直合作下去，触发策略的惩罚报复部分是『备而不用』，同理可知甲的策略。(隐性勾结是 SPNE . 假使每次博弈继续的机率是q，一年中定价的次数成为f，市场获利成长率(1+g)，则：也就是 δ q 够大时，新的折现因子够大时才能达成合作解：折现因子够大时才能达到合作解，也就是q 够大，f 够大，g 够大，i 够小时才容易达到合作解！ Note：合作在无穷重复博弈中可能成为均衡解，但不合作也可能是均衡。达成隐藏性勾结的产业条件：参赛者均有类似目标：求取最大报酬，可作为理性推论的基础。(例：低价的惩罚造成市场扩大，对他人可能不是惩罚) 可观察对手行为：是否可迅速发现任何偏离均衡之行为(没有噪声noise)，并可立即予以惩罚。(例：石油卡特尔组织) 能否有效排除其它进入者：entrants进入是否会造成勾结利益的下跌？在稳定市场中才能达勾结（回想例1）达成协议的参与家数：太多家数，是否难以执行协议？产品需求弹性：弹性高时，P↓TR↑，偏离的诱因较高。生产成本与产品的相似性：成本或产品差异越大，越难勾结。 7.不合作的短期利益(G)有限，小于长期损失(L)总和：是否现在有某种策略，可以一举打垮对手？(例：划时代的新技术，q小) 是否未来的合作可带来足够的利益? (例：夕阳工业，q小) 8. 产品需求稳定性：需求稳定成长时(g大)，较易执行勾结解。 9.生产技术与产品的相似性：成本差异越大，越难勾结。 10. 是否经常接触？若定价频率提高或在多市场接触(multimarket contact)，则f上升，较易勾结。成立前提：(无穷期重复或并无确切停止日期（长期关系） (完全信息（知道对手在各情况下之成本、收益） (可观察对手以前各期行为（对手数目不多） ( Reciprocity 互惠（或互害）：长期关系下的策略相当丰富，可从对手过去作为而采不同策略，予以对手善意响应或报复。可参看Axelrod的讨论。动态博弈在产业竞争的应用可信承诺(Credible Commitment)与吓阻进入 Strategic Move 是经由行动改变未来可选择的策略集合，进而影响博弈均衡。上下游关联博弈 A. 引擎厂的产品大多卖给汽车厂，汽车厂 Small cars Big cars 引擎厂 Small engines 3，6* 3，0 Big engines 1，1 8，3* 报酬如下：静态博弈：纳什均衡解NE（3，6），（8，3）动态博弈：引擎厂受制于汽车厂，汽车厂成为主导者，有first mover advantage：子博弈完美均衡解SPNE（3，6） B. 引擎厂事先可宣称将只生产大引擎，若汽车厂相信引擎厂宣言，因为汽车厂不易找到其它供应厂商，则会选产大车，均衡成为（8，3）。但是此宣言未必可信（Empty threats），一旦汽车厂决定生产小车，引擎厂还是会配合生产小引擎。在Entry Deterrence Game内，也有类似情况。Incumbant 事先可宣示说Entrant 进入后必将面临价格战争，但Entrant进入后Incumbant 为了自利考量并不会进行价格战。Entrant 也察觉此点，因而会进入，原先的宣示也就不可信了（Empty threats）。 C. 引擎厂如何使其宣言成为可信？引擎厂采取行动，使其生产小车的利润大幅降低（卖掉或毁损部份生产小引擎的产能）。目的在让汽车厂了解当它选择生产小车时，引擎厂还是只会生产大引擎。汽车厂 Small cars Big cars 引擎厂 Small engines 0，6 0，0 Big engines 1，1 8，3 静态博弈：纳什均衡 NE（8，3）动态博弈：子博弈完美均衡 SPNE（8，3）引擎厂毁损部份产能表面上似乎不利其营运，但能促使汽车厂相信它的 commitment只会生产大引擎，增强此宣言可信度。吓阻进入博弈(Entry Deterrence Game) 在双方均为理性的前提下，NE均衡解（10，50） Commitment：Incumbent 可投资扩厂，拥有 excess capacity，以便未来进行价格战（高产量、低价格），投资花费 30 million，也改变所获报酬：实例：Dupont的扩厂策略在1960年代生产二氧化钛染料的厂商有Dupont及其它六家较小厂商。其中 Dupont特有技术使用的原料较便宜，所以成本比竞争者低了20%左右，也较符环保要求，因此财务状况也较好。在1971年Dupont成立规划小组，小组提出两个选择：一是「维持」策略，从1972年的30%市占率稳健成长到45% ，另一个是「成长」策略，要在该产业取得领导地位，从1972年的市占率30%，计划到1980年想达到市占率56%，到1985年想达到市占率65% 。Dupont估计对二氧化钛的短期需求弹性约为，总需求量的年成长率约为3 % ，Dupont的生产有学习效果(learning curve effect) 。 Dupont预期总需求可能增加53万吨，规划小组建议在1972年就先发制人增加50万吨的产量，并广为宣传，造成对手很大压力。 Dupont具先行者优势，所采的是Capacity Expansion，利用它原本在财务及成本上的优势，先行扩充产能，迫使其它各家离去。谈判Bargaining Bargaining 谈判博弈以 ( E , d ) 来表示， E是效率前缘，d是威胁点 (threat point或disagreement point ) 双方的外在选择 (outside options ) 多寡影响威胁点位置。 Nash Bargaining Solution 谈判利得的分配：Max(U1-d1)(U2-d2) 也可考虑Rubinstein的动态谈判模型。实例：MCI与British Telecommunication ( BT ) 于1993形成的策略联盟，经过三年之久的谈判。获利方面：BT买MCI 20% 股权，MCI获得 (出价$64－市价＄)×100m shares ≈ $ billion，可在国内市场与AT&T竞争；BT获得MCI的20%未来利润并参与美国市场。威胁点方面：MCI的外在选择联盟对象较少，又面临AT&T压力（同时BT公司约为MCI的三倍），在新成立joint venture公司出资方面BT是MCI的三倍。策略性贸易政策(Strategic Trade Policies) 两国，各有一独占公司 i＝1, 2： i＝1生产h1销售国内，生产e1销售国外。 P1＝10－Q1 Q1＝h1＋e2 P2＝10－Q2 Q2＝h2＋e1 两国政府各自决定关税 ti，以求社会福利之最大，然后二家公司寻找最适 (hi, ei)，具国家之间与公司之间的策略性互动。第二阶段(倒推法)： 1 给定t2，h2和e2 ，最适反应，同理，最适反应，此二最适反应求解：， NE at the 2nd stage：；， (，protecting home mkt.) 第一阶段(政府决策)： 1 2 请求解：并找出下列「囚犯困境」报酬(社会福利)： t2＝0 t2＝ t1＝0 ？ t1＝？ FTA (Free Trade Agreement)「自由贸易协议」：双方同时降税成可使双方获利，若无强制功能，则任一方均有诱因自FTA偏离！实例与应用：掠夺式定价与连锁店悖论 A. 1991年在Arkansas三家药店控诉Wal-Mart试图以低价垄断市场，所卖商品价格均低于其进货成本，他们发现「Wal-Mart各地区经理无权定价比总部定价更高，但有权降价与敌对零售店竞争」是Wal-Mart的政策。他们控诉Wal-Mart采取的是「掠夺式定价」(Predatory Pricing) ，目的在摧毁竞争对手。Wal-Mart如此策略是否会造成短期利润的下降？Wal-Mart采低价在何种条件下可导致长期利润（动态考量）提高？ Standard Oil, Maxwell House Coffee, American Airline在某段时期都曾被其它公司作类似的指控。采低价目的在打败对手，在下期可享独占利润。但是，如果到下一期或在别地区又面临新对手，何时才能享受到独占利润？考虑Wal-Mart在20个区域都设有卖场，Wal-Mart的利润是20个市场的总和。而在20个区域都有对手考虑是否要进入市场，每个市场均可视为一个博弈 Wal mart 新公司原价低价进入 2, 4* -1, 3 不进入 0, 5 0, 5* 要留心以上表示方法有一缺点：尚未纳入新公司先出招，Wal-Mart再反应的重要信息。正确表示方法是以扩展式表示（见讲义更仔细的介绍）：如此博弈重复多次下去，Wal-Mart是否能以低价获取高利润？ B. 新公司(1)先出招，旧公司(2)可观察到新公司行动，旧公司可采之价格战的威胁是否可信(credible)？如此所得均衡为子博弈完美均衡(SPNE)，只有此种SPNE均衡才是可信的(Credible)。子博弈完美均衡是原来同时出招博弈二个纳什均衡(NE)的子集合。价格战的策略在SPNE的检验下成了空洞的威胁(empty threat)。疑问是经常提到的「掠夺式订价」策略是否可行？ C. 如何吓阻进入？先考虑短期架构的完全信息博弈。在20处设有连锁店的Wal-Mart，一直要面对各处的竞争者。换言之，以上的博弈要重复20次。对第20次博弈而言，旧公司的最佳策略是维持原价，因为没有其它更为好的策略。倒推到第19次也看到「以低价作战」的宣言也不可信(non-credible)。……如此倒推到第1次博弈，旧公司还是维持原价。所以，是否可下结论：在进入障碍不高的产业内，掠夺式的定价难以获利？这是诺贝尔奖得主提出的「连锁店矛盾」(Chain Store Paradox)：「以低价作战」的策略不是「子博弈完美均衡」，在「短期架构」下是不可信的宣言。矛盾是在实务上仍常被采用，是什么条件造成的？稍后考虑Kreps and Wilson的不完全信息博弈，可提供不同思考角度：信誉(Reputation)。注意信誉必须在一长期架构下才能建立。 D. 考虑原厂商有可能是强悍或软弱： (不完全信息) ‧若是一强悍厂商，则会选择价格战，新厂商则选择不进入。 ‧软弱厂商也有诱因从事价格战，一旦获得强悍的信誉，就可依此吓退对手，虽然短期损失（由4到3），但因在长期（无限多期）能以信誉享受独占利润5。结论是在不完全信息下，面临20家或20期的挑战，原厂商有诱因从事价格战，解决了Chain Store Paradox (见Kreps and Wilson, JET 1982) ：在与第一期进入者竞争时，就要注意信誉，打价格战虽然不利，但可建立起信誉（有成本），在吓退对手之后，可长期享有独占利润。 E. 在博弈分析中可找到一定的条件，使掠夺式定价有可能会发生，而政府则藉反托拉斯法或公平交易法介入。相关问题是：价格要低到多低才算是掠夺式定价？ ‧Aveeda-Turner Criterion: 若原厂商 P < SMC 或 P < SAVC，则掠夺成立 ‧在新厂商进入后不应增加产量，在新厂商退出后不应提高价格。 . Wal-Mart 1991年的诉讼就是在争议它的价格是否低于SAVC(Aveeda-Turner Criterion) 。Wal-Mart初审有罪，上诉再审结果无罪。 General Food’s Maxwell Houses Coffee vs P&G’s Folgers: 1976年FTC发现Maxwell在几个城市售价确实低于平均变动成本，但之后免除罚则，原因是认为在整个美国市场上它尚未具有独占和掠夺定价能力。 Standard Oil在1865到1911年之前大致采取掠夺式定价，伴随着低价收购对手炼油厂，到1879年占美国90%的炼油产能，到1911年才被高等法院要求解体。实例与应用：品牌选择在麦片(cereal)早餐市场上，有多种榖类、形状和口味，每种品牌平均只占市场2%左右。生产技术不是太复杂而且生产规模不必太大，但是几乎没有新的进入者，主要的几个参与厂商(Kellogg, Quaker Oats, General Food, etc)总合市占率达90% ，都能获得相当利润。新进者的抱怨是这几家提供过多的口味变化，造成了进入的困难？你是否同意？这样的产业可以如何分析？早餐麦片市场所采的吓阻策略是产品多样化(product proliferation) 。假设创造一种新的产品需行销成本F ，每种新的产品都针对不同口味的消费者设计，但产品的价格相差甚小，假设均为。消费者口味可用[0,1]表示。当原公司与新公司先后各自提供一种产品时，二者均会选在处，获得利润。请检验这是否为一博弈均衡？若先后出招呢？ B.假设原公司(incumbent)可先提供二种产品来占据市场，(先行看优势) ，可选在1/4及3/4处。知名度较差的新公司很难一次提供多项产品，假使它只能提供一种产品，它的最佳选择是在1/2处，可得到区间的顾客，利润为。假设，则新公司承受亏损，不会进入。原公司将占有整个市场并获利 (是原策略所获利润的两倍) 。检查这是否为一博弈均衡？原公司有何竞争优势？提供多样化产品(product proliferation)以满足各类消费者不同的偏好，会造成新进者有进入障碍(如啤酒、冷冻食品等)。以上的分析也适用于开联锁店位置的选择(location choices) ，像银行对开分行的选择，快餐店对分店的选择等-fill every product niche 。 C. 产业竞争造成品牌过度增加或分店开的过多(花费太多的F) 。像在以上分析中，如果原公司生产两种口味不足以吓阻进入，则可能要生产更多种口味才能吓阻进入。在进入的技术门坎不高时，可能观察到过多的品牌(或分店) ：均衡品牌的数目并非最有效率的品牌数目。以上分析有一定的假设和条件 (像价格相同等) ，在应用时不可忘记！实例与应用：原油市场世界原油价格在1973及1979二次大涨，1980以后也非常不稳定。不但需求不稳定，而且，受到新发现油田及OPEC等产油国决策的影响，石油产量也不稳定。在需求高且稳定的期间较易维持OPEC决议，还是在需求不稳定的期间较易维持OPEC的决议？石油价格又会呈现何种型态？目前考虑两个国家代表OPEC成员，举一大一小的Saudi Arab (SA)和Venezuela(VA)为例。SA生产QH=10和QL=8(mb)二个水准， VA生产qH=7和qL=5二个水准。当需求高时对应高产量17，中产量15和低产量13之石油价格分别为每桶$19, $22, $25。当需求低时以上三产量则分别对应每桶$14, $15, $16三种油价。此外，生产的边际成本是每桶5元，需求高的概率为p。先以策略形式博弈来表示OPEC会员国每一年对峙型态：高需求(概率p) VA qH qL QH 140,98 170,85 QL 136,119 160,100 低需求(概率1-p) VA qH qL QH 90,63 100,50 QL 80,70 88,55 A. 在需求确定强劲的年代(1973-1979) ：纳许均衡或优势均衡都是(QH, qH) ，但若双方形成有强制力的卡特尔(Cartel) ，选择(QL, qL)则使双方同时获利，OPEC经常集会决定限制产量。假设双方的折现率为 δS与δV。如果VA偏离，生产高量QH，短期获利119，但下期便可能遭受报复（SA大量增产，造成价格下降）。假使，则VA不会偏离。以SA来看，SA遵从产量限制时得利偏离时可能遭受VA报复，获利成为假使，则 SA不愿偏离。可见小国VA较易偏离勾结解（赚19，之后每期损失2），只有当他们的折现率(discount factor)较高时才在乎未来可能的损失，才会遵守OPEC的产量限制(production quota) 。问题是：在需求疲软的年代(1960-1973年)及在需求变动时代(1980以后)什么是最佳策略？ B. 需求变动下的OPEC (1980以后的期间) (1)需求疲软时，没有必要实行产量限制。 (2)需求不确定时，p的大小，决定是否要采产量限制。 OPEC的最适策略是在需求强的年份限制产量(QL, qL) ，在需求低的年份则不限制 (QH, qH) ，假使第一年是高需求，SA遵从OPEC法则降低产量。若SA在第一年偏离，则VA予以连续报复(qH) ，获利成为假使，亦即高需求概率越高时，SA越不愿偏离，同时高需求概率较高时，对SA折现率的要求较低也可造成SA不愿偏离。同理，可找到VA的条件，对VA折现率的要求必须较高才会造成VA不愿偏离。 C. OPEC在什么情况下会达成联合垄断？亦即产量限制的约定何时能被切实执行？ (1)高需求的概率不低（p较高）时，或各生产者折现率δ不低（重视未来）之时。（在低需求情况下，产量限制反而可能造成利润下降。） (2)在高需求情况下，各生产者均有诱因偏离产量限制，此时参与者必须要能察觉。（小生产者最有诱因偏离，像例中的VA） (3)当发现某生产者偏离产量限制时，其它成员生产国必须采行报复手段（全采高产量）。（这段惩罚期间就造成价格波动，价格下降一段时候才能恢复正常。见例2） (4)如果对产量的偏离行为难以察觉时，可藉观察市场价格的滑落而采报复手段。（看到$19就表示有生产者偏离了。）参见Julio Rotemberg and Garth Saloner, “A Supergame Theoretic Model of Price Wars during Booms,” American Economic Review 1985, 390-407. 小结第1章已有5点策略性思考原则，再加入: 6. 选择策略必须经过「均衡」的检验: 最佳策略是考虑对手最适反应后的最适反应。纳许均衡策略是一组互为最适反应的策略组合，随博弈的要素而变动。 7. 在动态博弈中，参赛者「何时可以行动」与「行动时拥有的信息」影响博弈之均衡。 8. 在动态博弈中，应采逆向归纳法(见第2点)的思考方式来消除不可信的威胁 (empty threat)。( 经得起考验的均衡称为「子博弈完美均衡」)。 9.在动态(吓阻进入)博弈中，能让对手相信为可信承诺(credible commitment)的策略，才可收到事先吓阻的效果。策略若要成为可信之承诺，应有具沈没成本或事后不易更动等特性。 10.在多期(重复)博弈中要重视长期利益，依对手行为而采敏感具动态奖惩效果的策略。在一定条件下，达成(长期)隐性勾结可能胜过短期竞争。练习题在出价策略博弈(节)中，在何种假设下，A公司会愿意出价购并T公司？在协调博弈(节)中，若由甲先行，博弈均衡为何？若由乙先行呢？你所使用的是什么均衡观念？隐性勾结博弈(节)与囚犯困境博弈有何相似之处？为何在重复博弈中可能达成勾结解？所需条件为何？在两厂商的长期订价互动 (见节)中，尝试设计三种动态奖惩策略，并了解互相交手二十次后何者报酬较高。如果有可能发生错误 (店长把维持原价的指示误解为进行价格战)时，结果是否会改变？请归纳你分析的结果。采扩充产能的吓阻进入策略，其成功条件为何？可能导致失败的风险有何？请考虑Dupont (见节)及半导体业为例。策略性贸易政策(节)中，作出报酬矩阵并分析可否成为一个自发性的均衡。『自由贸易协议』在这样博弈架构下发挥何种功能？为何掠夺式定价与限制竞争定价(见节)的策略在执行上常遇困难？要能吓阻对手的前提条件为何？请考虑Wal-Mart及航空业订价为例。在麦片早餐市场 (见节) 中，若先行厂商可以建立三种口味品牌来占据市场 (其它不变)，它的最适选择为何？与原先只建二个品牌比较，是否会使新厂商的获利机会降低？苏核武让步美核武 -L, -L -L, -L 让步 -L, -L -8, -8 美苏在二次大战之后各自均拥有足以摧毁对方好几次的核武弹头，一旦遇到国际冲突（像古巴危机）时可能有以下的对峙状况，－L是发生核战的极端结果，而且只要有一方攻击，他方一定反击，双方一定同时毁灭，造成人类浩劫，此种吓阻策略称为MAD(Mutually Assured Destruction) 。作为决策者的双方首长该如何抉择？参考文献 1. R. Selten, “Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games,” International Journal of Game Theory 1975, 25-55. 2. R. Selten, “The Chain Store Paradox,” Theory and Decision 1978,127-159. 3. J. Nash, “The Bargaining Problem,” Econometrica 1950, 155-162. 4. A. Rubinstein, “Perfect Equilibrium in a Bargaining Model,” Econometrica 1982, 97-109. 5. E. Green and R. Porter, “Noncooperative Collision Under Imperfect Information,” Econometrica 1984, 87-100. 6. J.-P. Benoit and V. Krishna, ”Finitely Repeated Games,” Econometrica 1985, 905-922. 7. Julio Rotemberg and Garth Saloner,“ A Supergame Theoretic Model of Price Wars during Booms,” American Economic Review 1985, 390-407. 8. R. Axelrod, The Evolution of Cooperation, Basic Books, 1984. PAGE 1 2- PAGE 11

联系我们

智库文档公众号

客服微信

第2章完全信息动态博弈.doc

下载

标签

联系我们

意见反馈