博弈论
(Game Theory)
在决策相互影响的环境中,每个企业都在努力预测其它企业的决策,经理们必须学会战略地思考,以做出“能做出”的最好决策
在战略决策时,经理们应该学会站在竞争对手的角度去预测或者推测对手的反应
而博弈论刚好提供了一个在相互依存的情况下如何进行战略决策的指导工具
博弈论帮助管理者注重竞争者、消费者和供应商的反应,并侧重如何通过影响他们的选择来提升长期利益
在确实应用博弈论之前,经理们必须了解自己的行业,如行业的进入成本、需求函数、收益结构和成本曲线等
主要内容
博弈的概念
博弈论的发展史
博弈问题的刻画与分类
静态博弈与均衡
动态博弈与策略行动
博弈的概念
一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,然后从中获得各自相应结果的过程
常见的博弈活动如桥牌、下棋、赌博等
博弈论的发展史
对具有策略依存特点的决策问题的研究可以上溯到18世纪以前,如古诺模型和伯川德模型
20世纪20年代,法国数学家Borel用最佳策略的概念研究了下棋等具体的决策问题,试图建立应用数学的一个分支,可惜没有完成博弈论的体系建设,但引起了其他数学家的注意
二战期间,博弈的思想方法被用于军事领域和战事活动中,初步显示了威力
1944年,数学家John von Neumann和经济学家Oskar Morgenstern合著《博弈论和经济行为》标志着博弈理论的初步形成
近几十年来,博弈论得到大发展。1994年,长期致力于博弈理论和应用研究的Nash, Harsanyi及Selten同时获得诺贝尔经济学奖,表明该学科的重要性;1996年,从信息经济学角度研究博弈论的J. Mirrlees也获得了经济学奖,博弈论已经成为西方经济理论的主流之一
理论上,由于新古典经济学围绕价格制度研究理性人行为时的基本缺陷是不考虑理性人之间的相互影响(如竞争市场和信息对称),博弈论才得以发展
博弈问题的刻画与分类
博弈问题的刻画
博弈问题通常有三个方面的内容:参与博弈的博弈者、每个博弈者可能采取的行动(或策略)、每一种行动(或策略)组合情况下每个博弈者所获得的支付
-2,-2
-8,-1
不坦白
-1,-8
-4,-4
坦白
不坦白
坦白
囚犯2
的
策略
囚犯1的策略
博弈问题的刻画与分类(续1)
博弈问题的分类
合作与非合作博弈 ----是否能通过谈判达成有约束的契约形成合作(团体理性)
静态与动态博弈 ----同时行动(独立决策)还是先后(或重复)行动
完全信息与不完全信息博弈 ----关于对手特征、策略和支付的知识是否完全
不完全信息动态博弈
不完全信息静态博弈
不完全信息
完全信息动态博弈
完全信息静态博弈
完全信息
动态
静态
博弈的分类
行动顺序
信息
博弈问题的刻画与分类(续2)
研究博弈论的目的
通过对博弈者行为的分析,预测博弈的结果(即博弈双方最终选择的行动)
博弈的表示形式
标准形式(Normal Form Game)
扩展形式(Extensive Form Game)
标准形博弈的定义
(1)N个博弈者(player),表示为I = {1, 2, …, N}
(2)第i个博弈者的行动action(或策略strategy)ai 组成自己的行动集(或策略集)Ai={ai1, ai2, …, aik },则a = (a1, a2, …, ai, …, aN)称为该博弈的行动组合(或策略组合)。简化讨论时用a = (ai, a-i)表示
(3)博弈者i的支付函数(payoff function)为πi(a)
Normal Form Game
A Normal Form Game consists of:
Players
Strategies or feasible actions
Payoffs
博弈问题的刻画与分类(续3)
标准形博弈的定义(续)
博弈者:国家1、国家2
每个博弈者的行动:战争、和平;
每个博弈者的行动集:{战争,和平}
博弈的行动组合:(和平,和平)、(和平、战争)、(战争,和平)、(战争,战争)
每个博弈者的支付: π1(和平,战争) = 3
-1,-1
3,-2
War
-2,3
2,2
Peace
War
Peace
战争与和平的博弈(或冷战博弈)
国家1
国家2
静态博弈与均衡
有关静态博弈中博弈者行为的假定
理性博弈者 ----追求支付最大化
完全信息 ----对策略、策略组合及相关支付完全了解
独立决策 ----无勾结(不管是明的还是暗的)
静态博弈(或同步决策)
在寡头市场,当经理们必须在无法知道竞争对手的决策的情况下做出自己的决策时,同步决策博弈发生。同步不必同时
问题:如何预测对手的行动?
静态博弈与均衡(续1)
优势行动与优势行动均衡(续)
(1)优势行动: 无论其他博弈者采取什么行动,博弈者i采取的行动aik总能获得最大支付,则行动aik称为该博弈者的优势行动(dominant action)
(2)优势行动均衡:所有博弈者优势行动组成的均衡(如果存在的话)
(3)如何寻找优势行动和优势行动均衡
双方均存在优势行动
10,2
6,8
不做广告
15,0
10,5
做广告
不做广告
做广告
广 告 博 弈
寡头1
寡头2
Dominant Strategy
Regardless of whether Player 2 chooses A, B, or C, Player 1 is better off choosing “a”!
“a” is Player 1’s Dominant Strategy!
Player 2
Player 1
12,11
11,12
14,13
11,10
10,11
12,12
10,15
10,13
13,14
静态博弈与均衡(续2)
优势行动与优势行动均衡(续)
(3)如何寻找优势行动和优势行动均衡(续1)
只有一方存在优势行动
0,0
9,-1
等待(不涨价)
4,4
5,1
按钮 (涨价)
等待(不涨价)
按钮(涨价)
Boxed Pigs(智猪博弈或价格博弈)
小猪
大猪
Putting Yourself in your Rival’s Shoes
What should player 2 do?
2 has no dominant strategy!
But 2 should reason that 1 will play “a”.
Therefore 2 should choose “C”.
Player 2
Player 1
12,11
11,12
14,13
11,10
10,11
12,12
10,15
10,13
13,14
连续排除劣势策略
两者都没有优势策略,怎么办?
Player 2
Player 1
100,100
90,110
50,120
110,40
80,80
45,50
120,30
50,35
40,40
连续排除劣势策略(续)
两者都没有优势策略,怎么办?
Player 2
Player 1
90,110
50,120
50,35
40,40
Key Insights
Look for dominant strategies
Put yourself in your rival’s shoes
寻找劣势策略并排除之
静态博弈与均衡(续3)
优势行动与优势行动均衡(续)
(3)如何寻找优势行动和优势行动均衡(续2)
双方都不存在优势行动或劣势 ----此时该怎么办?
1,2
0,0
ballet
0,0
2,1
soccer
ballet
soccer
Battle of the Sexes(性别大战)
女
男
静态博弈与均衡(续4)
纳什均衡(Nash Equilibrium)
给定对手策略选择的情况下,博弈者选择的最好行动所组成的均衡
A Market Share Game
Two managers want to maximize market share
Strategies are pricing decisions
Simultaneous moves
One-shot game
Market-Share Game Equilibrium
Manager 2
Manager 1
Nash Equilibrium
Key Insight
Game theory can be used to analyze situations where “payoffs” are non monetary!
We will, without loss of generality, focus on environments where businesses want to maximize profits.
Hence, payoffs are measured in monetary units.
静态博弈与均衡(续5)
纳什均衡(续)
如何预测Nash Equilibrium ?
1,2
0,0
ballet
0,0
2,1
soccer
ballet
soccer
Battle of the Sexes
女
男
静态博弈与均衡(续6)
纳什均衡(续)
如何预测Nash Equilibrium (续1)?
-4,-4
8,8
甜早点
8,8
-4,-4
咸早点
甜早点
咸早点
餐馆博弈
餐馆A
餐馆B
静态博弈与均衡(续7)
纳什均衡(续)
如何预测Nash Equilibrium (续2)?
0,0
0,2
退
2,0
-3,-3
进
退
进
Chicken Game(斗鸡博弈)
A
B
静态博弈与均衡(续8)
纳什均衡(续)
如何预测Nash Equilibrium (续3)?
0,300
0,300
不进入
-10,0
40,50
进入
斗争
默许
市场进入阻扰
在位者
进入者
A Coordination Problem:
Three Nash Equilibria!
Player 2
Player 1
Key Insights
Not all games are games of conflict.
Communication can help solve coordination problems.
Sequential moves can help solve coordination problems.
静态博弈与均衡(续9)
纳什均衡(续)
不存在纯策略纳什均衡的博弈
1,0
0,2
电影
0,3
2,0
足球
电影
足球
闹别扭的情人(性别大战)
女
男
静态博弈与均衡(续10)
最大最小策略
有限理性或不完全信息下的均衡
3,2
-500,1
进攻
2,2
2,1
退守
退守
进攻
攻防博弈
A
B
最大最小策略是一种保守的策略,而不是利润最大化策略
关键就在于B博弈者对A博弈者的理性了解不够
关于利润最大化前提下
静态博弈的小结
在同步决策的博弈中预测对手的行动时,战略思考的本质是站在对方立场上寻找稳定的行动组合
预测的具体思路是:优先寻找对方或自己的优势策略,其次排除自己或对方的劣势策略,再其次寻找纳什策略,通过这种方式获得的行动组合具有“战略稳定性”特征
纳什均衡之所以稳定,是因为双方都相信彼此都作了最好决策,没有一方可以通过改变行动以改善状况;非纳什行动之所以不被选择的原因是存在作弊动力:至少有一个企业可以仅仅改变自己的行动就会更好
如果存在多个纳什行动组合,那么,预测没有办法进行(即:虽然知道出现某一个结局后一定是稳定的,但是不知道哪个结局会出现),此时存在协调问题
在静态博弈中,囚徒困境反映了寡头市场合作的困难本质
动态博弈的扩展形式
12, 8
16,16
15,20
小规模扩大
0 , 0
19, 9
大规模扩大
8 ,12
20,15
小规模扩大
9 ,18
18,18
不扩大
大规模扩大
不扩大
同时行动的产能博弈中的纳什均衡
厂1
厂2
动态博弈的扩展形式
(序贯行动或先后的决策树)
厂2
厂1
厂1
厂1
不扩大
小规模扩大
大规模扩大
不扩大
小规模扩大
大规模扩大
不扩大
小规模扩大
大规模扩大
不扩大
小规模扩大
大规模扩大
18,18
9 ,18
20,15
16,16
8 ,12
18, 9
12, 8
0 ,0
15,20
Case 1:An Advertising Game
注意不同决策环境下决策结果的异同及其机理
Two firms (Kellogg’s & General Mills) managers want to maximize profits
Strategies consist of advertising campaigns
Simultaneous moves or One-shot interaction
Finitely Repeated interaction
Infinitely Repeated interaction
Equilibrium
to the One-Shot advertising Game
General Mills
Kellogg’s
Nash Equilibrium
Can collusion work
if the game is repeated 2 times?
General Mills
Kellogg’s
No
(by backwards induction).
In period 2, the game is a one-shot game, so equilibrium entails High Advertising in the last period.
This means period 1 is “really” the last period, since everyone knows what will happen in period 2.
Equilibrium entails High Advertising by each firm in both periods.
The same holds true if we repeat the game any known, finite number of times.
Can collusion work
if firms play the game each year, forever?
Consider the following “trigger strategy” by each firm:
“Don’t advertise, provided the rival has not advertised in the past. If the rival ever advertises, “punish” it by engaging in a high level of advertising forever after.”
In effect, each firm agrees to “cooperate” so long as the rival hasn’t “cheated” in the past. “Cheating” triggers punishment in all future periods.
Suppose General Mills adopts this trigger strategy.
Kellogg’s profits?
Cooperate = 12 +12/(1+i) + 12/(1+i)2 + 12/(1+i)3 + …
= 12 + 12/i
General Mills
Kellogg’s
Value of a perpetuity of $12 paid
at the end of every year
Cheat = 20 +2/(1+i) + 2/(1+i)2 + 2/(1+i)3 +
= 20 + 2/i
Kellogg’s Gain to Cheating
Cheat - Cooperate = 20 + 2/i - (12 + 12/i) = 8 - 10/i
Suppose i = .05
Cheat - Cooperate = 8 - 10/.05 = 8 - 200 = -192
It doesn’t pay to deviate.
Collusion is a Nash equilibrium in the infinitely repeated game!
Case 2: Bargaining
Simultaneous-Move
Management and a union are negotiating a wage increase.
Strategies are wage offers & wage demands
Successful negotiations lead to $600 million in surplus, which must be split among the parties
Failure to reach an agreement results in a loss to the firm of $100 million and a union loss of $3 million
Simultaneous moves, and time permits only one-shot at making a deal.
The Bargaining Game
in Normal Form
Union
Management
Three Nash Equilibria!
Union
Management
Fairness: The “Natural” Focal Point
----焦点解
Union
Management
Single Offer Bargaining
连续行动的博弈
Now suppose the game is sequential in nature, and management gets to make the union a “take-it-or-leave-it” offer.
Analysis Tool: Write the game in extensive form
Summarize the players
Their potential actions
Their information at each decision point
The sequence of moves and
Each player’s payoff
There are 3 Nash quilibrium Outcomes!
Firm
10
5
1
Union
Union
Union
Accept
Reject
100, 500
-100, -3
Accept
Accept
300, 300
-100, -3
Reject
Reject
500, 100
-100, -3
Only 1 Subgame-Perfect Nash Equilibrium Outcome!
Firm
10
5
1
Union
Union
Union
Accept
Reject
100, 500
-100, -3
Accept
Accept
300, 300
-100, -3
Reject
Reject
500, 100
-100, -3
Re-Cap
In take-it-or-leave-it bargaining, there is a first-mover advantage.
Management can gain by making a take-it or leave-it offer to the union. But...
Management should be careful, however, real world evidence suggests that people sometimes reject offers on the the basis of “principle” instead of cash considerations.
Case 3: Pricing to Prevent Entry
Two firms: an incumbent and potential entrant
The game in extensive form
Two Nash Equilibria
Entrant
Out
Enter
Incumbent
Hard
Soft
-1, 1
5, 5
0, 10
One Subgame Perfect Equilibrium
Entrant
Out
Enter
Incumbent
Hard
Soft
-1, 1
5, 5
0, 10
Insights
Establishing a reputation for being unkind to entrants can enhance long-term profits
It is costly to do so in the short-term, so much so that it isn’t optimal to do so in a one-shot game.
讨论
随着市场范围不断扩张,劳动分工管越来越细,因此,团队合作在企业的生存发展中扮演的角色越来越重要。
如何减少团队小组成员的搭便车行为(Free-riding)并增加合作?
动态博弈与策略行动
动态博弈与静态博弈的差异----个体理性能够和集体理性一致?
动态博弈不是一次性博弈,是一种先后(或重复)行动的博弈,可以产生静态博弈情况下不可能出现的结果(如合作),也可以采取各种策略以取得竞争的优势
32,32
8,40
定价为6
40,8
24,24
定价为4
定价为6
定价为4
寡头1的定价策略
寡头2
的
定价策略
(1)无限次重复博弈中,如果竞争者采取”tit-for-tat” strategy或触发战略,则可能获得
合作的结果
(2)在有限次重复博弈中,能否产生合作的结果取决于声誉效应和稳定的合作预期
(3)现实中,若寡头生产的产品生命周期比较长,产品的生产成本变化不大,竞争的
企业比较少,则容易在竞争者之间形成合作。否则合作很难形成
案例:第一次世界大战中的战壕斗争
沿着西部战线的安静战场所面临的历史形势是一种(重复的)囚徒困境。任何时候,两个相互对峙的小分队均可以做出的选择都是:射击打死对方,或者谨慎地设计以避免造成损伤。对于参战双方,削弱敌人的力量可以增大自己生存的可能性。因此,从短期看,不管敌人是否回射,最好现在就对他们展开进攻。
使战壕中的战斗与大多数其他战斗不同的地方在于:长期上,同样的小分队会在流动的战场上相互对峙。这就将一次性囚徒困境改变为重复的囚徒困境。根据理论预测的结果,伴随着持续的互动,最终得到的稳定结果是基于互惠基础上的双边合作,特别是在双方都奉行同样的战略----谁都不做第一个背叛的人;但是,如果有人背叛,另外一方会积极反应----的情况下。
结果如何?随着军队的严密防卫,沿着战线的许多地点都会同时发生一些非侵略性的战斗;上午8-9点是双方同时供应食物和用于个人事务的时间,这个时候战场上却一片沉寂;有些地方挂出旗子,目的是提醒对方阻击手不要冒犯这些地方。
战略是具有煽动性的,在双方相互制止的时间里,如果必要,敌人的士兵会费尽心机向对方表示他们确实会进行报复。例如,德国的阻击兵就曾经通过不断射击村庄的墙,直到打出一个大窟窿,以向英国士兵显示他们的力量。
关于重复行动或先后行动条件下
动态博弈的小结
与同时决策相比,有些决策过程要求一个企业先行决策,然后竞争对手在知道了第一个企业的行动后再做出自己的决策,这样的决策叫做顺序决策或先后行动的决策
顺序决策仍然包含战略相互依存:今天经理能够做的最好决策依赖于对手明天的反应。战略思维敏锐的经理必须站在对手的角度,提前预计对手的未来决策,以便自己做出最好的决策
是否存在先动优势理所当然地依赖于竞争对手的反应及其效果
有些决策是双方在不同的时间面临相同的决策问题(如每个月是否要做广告以及做什么水平的广告),相当于同一个决策问题被不断重复,这样的决策叫做重复行动的决策
经理们在动态的环境下作决策的一个合理的思维框架是:站在对手角度,运用逆向归纳法,注意战略稳定性
动态博弈中,合作的结果仍然难以维持,除非惩罚的力度足够大
如何促进寡头市场的合作?
在寡头市场做战略决策会导致相互最好的决策:每个企业都在给定它所预计对手要做的决策下,作出对自己最好的决策。这些决策形成纳什均衡。
这个时候,由于寡头追逐的是各自利益而不是共同利益,因此,最后出现的结果经常不是利润最大的。
虽然企业间往往存在一个所有企业都愿意的解决方案,但是,由于需要合作,这个“更好”的方案通常很难达到。
这就是“个体理性”和“团体理性”的冲突本质
合作在所有囚徒困境中都是可能的,不过,当决策是一次性时,合作是战略不稳定的。因为作弊对将来没有影响,于是,所以企业都预计对手会作弊,作弊就成为每个企业最好的反应,非合作战略是稳定的。因此,一次性同步决策中,经理们几乎没有机会达到合作的结果
在重复决策中,由于存在惩罚作弊者的机会,作弊对将来是有影响的,这就可能改变决策的结果。但其前提是:惩罚可信且有力度--结果,当作弊的成本大于其收益时,合作结局出现
还有没有其他的方式促进合作?
动态博弈与策略行动(续1)
动态博弈下的策略行动
竞争中的寡头不仅可以和对手默契配合以瓜分高额利润,而且可以采取其他一些策略获得优势。如:
(1)先动优势
(2)确实可信的威胁
(3)塑造形象(如价格报复者)
(4)阻止对手进入
动态博弈与策略行动(续2)
(1)先动优势(如何获得?生产总量、地理位置、产品特征在先动优势中的作用)
-4,-4
15,8
甜早点
8,15
-4,-4
咸早点
甜早点
咸早点
餐馆博弈
餐馆A
餐馆B
动态博弈与策略行动(续3)
(2)确实可信的威胁
主导企业寡头2希望出现什么结果?它能否对寡头1实施有效的低价威胁?
120,100
100,120
定高价
40,10
20,30
定低价
定高价
定低价
寡头1的定价策略
寡头2
的
定价策略
动态博弈与策略行动(续4)
(2)确实可信的威胁(续1)
案例:
两家大的寡头,一家生产彩电,一家生产显像管。显像管厂的产品大部分卖给彩电厂,因此显像管厂对彩电厂的依赖性很大。一般地,显像管厂必须在彩电厂生产计划的基础上进行生产决策(因此,彩电厂可以被看成是领导者)。二者的支付矩阵如下:
10,4
2,2
小显像管
4,0
4,8
大显像管
小屏幕
大屏幕
实施可置信威胁策略之前的支付
彩电厂
显像管厂
动态博弈与策略行动(续5)
(2)确实可信的威胁(续2)
案例:
有两个纳什均衡。对彩电厂来说,当然生产大屏幕彩电获利比较多,而显像管厂恰恰相反。
显像管厂如何促使彩电厂按照自己的愿望生产小彩电?此时,它还有没有优势策略?
10,4
2,2
小显像管
0,0
0,8
大显像管
小屏幕
大屏幕
实施可置信威胁策略之后的支付
彩电厂
显像管厂
动态博弈与策略行动(续6)
(4)阻止对手进入
垄断者有无优势策略?它能否设置障碍,阻止潜在竞争对手的进入?
50,4
40,-5
低价
110,0
60,15
高价
不进入
进入
垄断者存在优势策略下的支付
潜在对手
现行垄断者
动态博弈与策略行动(续7)
(4)阻止对手进入(续)
垄断者可以采取哪些手段来阻止潜在竞争对手的进入?----注意:垄断者的支付减少了30单位
50,4
40,-5
低价
80,0
30,15
高价
不进入
进入
垄断者不存在优势策略下的支付
潜在对手
现行垄断者
总结
博弈论为预测决策相互依存的经济主体的行为(或战略)提供了有力工具
运用博弈论关键是要分析相互之间的行为选择和对应行动组合产生的支付,支付不同,最终的均衡也不一样,因此,经理应该尽可能掌握生产技术、成本、利润等行业知识;如果存在改变博弈规则的可能性,则结果就可以改变
策略行动的本质是不让自己拥有优势行动(或优势策略)--遏制敌人的力量可能依赖于限制自己的力量
合作博弈的出现以重复博弈和稳定的合作预期为前提,团队小组应该保持稳定