产业经济学
Industrial Economics
16 博弈论与竞争战略
• 博弈规则与博弈的分类
• 博弈的表示方法
• 博弈均衡
• 博弈论在竞争战略中的应用
16 博弈论与竞争战略
16 博弈论与竞争战略
16 博弈论与竞争战略
• 博弈规则和博弈的分类
博弈规则
• All games have these elements
– players 参与人(理性人)
– action set 行动集
– static or dynamic 行动的先后顺序
– information structure 信息结构(private or common)
– strategy 战略
– payoffs 报酬
• 博弈规则和博弈的分类
博弈规则
• 规则、理性与最优
• 博弈规则和博弈的分类
博弈规则
• 规则、理性与最优
– 有权参与制定规则比参与博弈更重要
• 林毅夫为什么对中国经济持乐观态度?
• 博弈规则和博弈的分类
博弈规则
• 规则、理性与最优
– 改变规则:企业竞争策略
• 博弈规则和博弈的分类
博弈规则
• 规则、理性与最优
– 改变规则:企业竞争策略
• 博弈规则和博弈的分类
博弈的分类
• 合作博弈与非合作博弈
• Cooperative game 共同利益最大化
• Non-cooperative game 个体利益最大化
• 公地悲剧 the tragedy of the commons
• 博弈规则和博弈的分类
博弈的分类
• 博弈规则和博弈的分类
博弈的分类
• 博弈规则和博弈的分类
博弈的分类
奥斯特罗姆: 09年度诺
贝尔经济学奖
瑞士: Torbel
• 博弈规则和博弈的分类
博弈的分类
• 博弈规则和博弈的分类
博弈的分类
• 静态博弈与动态博弈
• Static games 同时行动
• Dynamic games 先后行动
• 拍卖 auction
• 博弈规则和博弈的分类
博弈的分类
• 拍卖的分类(Vickery )
• 英式(升价)——Dynamic
• 荷式(降价)——Dynamic
• 第一价格密封拍卖(密封竞价、价高者得)——Static
• 第二价格密封拍卖(密封竞价、价高者得、以第二高价格成交) ——
Static
• 博弈规则和博弈的分类
博弈的分类
• 拍卖定价的原则:
• 帕累托最优——卖给出价最高的人
• 利润最大化——卖方利润最大
• 在不确定买方效用评价的情况下,试比较各拍卖方式对上述原则的契合
程度?
• 博弈规则和博弈的分类
博弈的分类
• 拍卖定价的原则:
• 在符合独立私有估价、竞买人对称并且风险中性等假设条件下,无论采
用英格兰式拍卖、荷兰式拍卖、第一价格密封拍卖和第二价格密封拍卖
四种类型中的哪一种拍卖方式,期望拍卖价格是相同的,而且获胜者的
期望收益也是相同的。
• 现实中:
• 英式拍卖——不一定能实现利润最大化
• 荷式拍卖——可掠夺更多买方剩余
• 第一密封价格拍卖——易产生胜利者的诅咒,会导致资源配置扭曲
• 第二密封价格拍卖——可一定程度上缓解“胜利者的诅咒”
• 博弈规则和博弈的分类
博弈的分类
• 一次博弈与重复博弈
• Once game 短期利益
• Repeated game 长期利益
• 演绎推理 deduce & 逆向归纳法 backward induction
• 博弈规则和博弈的分类
博弈的分类
• 有个智者去找神仙,走到一个三岔路口,不知道往左走还是
往右。路口边站着两个天使,他俩一个永远说真话,另一个
永远说假话,现在要求这个智者只能向其中一位天使问一句
话,就确定神仙的方位。
• 请问:这个智者怎么问才能有结果?
• 博弈规则和博弈的分类
博弈的分类
• 由甲、乙两人依次从1开始报数,每次可以连续报数一个或
两个,谁抢到30就胜出。
• 博弈规则和博弈的分类
博弈的分类
• 如果要想抢到30,那么对手一定要留下1个或2个数,即留下30或留下29
、30
• 再往前追溯一步,应该给对手留下几个数呢?
• 如果留下1个数或2个数,那么对手直接获胜;
• 如果留下3个数,那么对手只能给我们留下1个或2个数,我方肯
定获胜;
• 如果留下4个数,对手可以留下3个数,只好输掉
• 结论:
• 要抢到30,必须抢到27,要抢到27,必须抢到24!
• 关键数30、27、24、21、……、3。
• 只要在报数过程中,一旦抢到3的倍数,就可以每次都抢到3的倍
数,直到最后获得胜利。
• 博弈规则和博弈的分类
博弈的分类
• 5个海盗抢来了100枚金币
• 分赃方式:
• 海盗1提出一种分配方案,如果同意这种方案的人达到半数,那
么该提议就通过并付诸实施;
• 若同意这种方案的人未达半数,则提议不能通过且提议人将被扔
进大海喂鲨鱼
• 然后由接下来的海盗继续重复提议过程
• 假设每个海盗都绝顶聪明,也不相互合作,并且每个海盗都想尽可能多
得到金币
• 第一个提议的海盗将怎样提议
• 既可以使得提议被通过
• 又可以最大限度得到金币呢
• 博弈规则和博弈的分类
博弈的分类
轮次 分配方案提出者 分配方案
最后一轮 海盗5 自己独吞全部100个金币
倒数第二轮 海盗4 自己独吞全部100个金币
倒数第三轮 海盗3
分配自己99个金币,第四个海盗0个
金币,第五个海盗1个金币。
倒数第四轮 海盗2
分配给自己98个金币,第三个海盗0
个金币,第四个海盗1个金币、第5个
海盗0个金币。
• 博弈的表达方式
矩阵博弈
• 博弈的表达方式
博弈树
• 博弈均衡
• 完全信息静态博弈——纳什均衡 NE
• 完全信息动态博弈——子博弈精炼纳什均衡 SPNE
• 不完全信息博弈——贝叶斯纳什均衡 BNE
• 不完全信息动态博弈——子博弈精炼贝叶斯均衡 PBNE
• 博弈均衡
纳什均衡
• 占优战略(dominant strategy):我所做的是不管你做什么
我所能做的最好的;你所做的是不管我做什么你所能做的最
好的
• 纳什均衡:我所做的是给定你所做的我所能做的最好的;你
所做的是给定我所做的你所能做的最好的
• 占优战略是纳什均衡的特例
• 博弈均衡
纳什均衡
• 占优战略的求解
• 画线法
• 适用于寻找最优解
• 方法:先寻找行的最优解,画线,再寻找列的最优解,画线
• 缺陷:只有少数博弈存在优势均衡解,多数博弈中不存在优势策略,但
不代表均衡不存在
• 典型:囚徒困境
• 现实:寡头定价、二级密封价格拍卖、军备竞赛、公地悲剧和团队生产
等
• 博弈均衡
纳什均衡
• 占优战略的求解
• 显然,此时的均衡解并非Pareto最优,还有改进的可能
• 但博弈双方却没有动力改变行为——个体理性与集体理性的
冲突
• 博弈均衡
纳什均衡(走出囚徒困境)
• 报复
• 抵押
• 文化、宗教和意识形态教育
• 声誉(重复博弈)
• 还有么?
• 博弈均衡
纳什均衡(现实中的囚徒困境)
• 博弈均衡
纳什均衡
• 占优战略的求解
• 画线法可能出现
• 多重解,但纳什均衡解唯一
• 无解,但却可能存在纳什均衡解
• 博弈均衡
纳什均衡
• 重复剔除严格劣策略(IESDS)
• 理由:理性人不会选择一个严格劣策略
• 要求:理性共识
• 方法:依次将严格劣策略划掉,最后剩下的是优势均衡
• 典型:智猪博弈
• 特征:一方存在严格劣策略,会有一方free ride,IESDS
均衡不保证pareto最优(外部性)
• 博弈均衡
纳什均衡
• 博弈均衡
纳什均衡
• 现实:
• 企业广告
• 研发行为
• 大股东与小股东
• 博弈均衡
纳什均衡
• 解决方案:
• 利益合并
• 界定或创造产权
• 制定法律
• 道德谴责
• 等
• 博弈均衡
纳什均衡
• Maxmin:寻找能在最坏处境下最好可能支付的行动方向。
• 极小极大定理(1928;约翰·冯·诺依曼) 对于每个两人零和博弈,
每个局中人都存在一个混合策略使得当局中人使用这些策略
时,双方有相同的支付期望。而且,这个期望值也是每个局
中人能指望从博弈的一局中得到的最优支付。因此,这些混
合策略是两个局中人所用的最优策略。
• 博弈均衡
纳什均衡
• 博弈均衡
纳什均衡
• 博弈均衡
纳什均衡(无解)
• 博弈均衡
纳什均衡(多重解)
• 博弈均衡
纳什均衡(混合策略解多重解)
• 博弈均衡
纳什均衡(混合策略解多重解)
• 博弈均衡
纳什均衡(混合策略解多重解)
• 博弈均衡
纳什均衡
• 博弈均衡
纳什均衡
• P329 Cournot Model 产量竞争
• 两个生产同样产品的厂商,他们都知道市场需求,并同时作
出决策
• 厂商一在假定厂商二产量为Q2时,它选择利润最大化产量Q1
,即Q1(Q2);厂商二也是假定在厂商一产量为Q1时,它选
择利润最大化产量Q2,即Q2(Q1)
• 均衡水平决定于Q1(Q2)和Q2(Q1)最优反应曲线的交点
• 这是一个纳什均衡点,各厂商采取了给定对手行为策略时,
它所能做的最好行为
• 博弈均衡
纳什均衡
• P329 Cournot Model 产量竞争
• 厂商1:
R1=PQ1=(30-Q)Q1=30 Q1 - Q1 Q
Q=Q1+Q2
R1= 30 Q1 - Q1 ( Q1+Q2 )=30 Q1 - Q1 2 - Q1 Q2
MR1= R1’=30-2Q1-Q2=MC1=0
Q1=15-(1/2)Q2为厂商1针对厂商2的最优反应曲线
例 双寡头,面临的市场需求曲线为P=30-Q,并且MC1=MC2=0,它们的
均衡产量为多少?
• 博弈均衡
纳什均衡
• P329 Cournot Model 产量竞争
• 厂商2 的最优反应曲线为:
Q2=15-(1/2)Q1
• 均衡点:
Q1=15-(1/2)Q2
Q2=15-(1/2)Q1
• 均衡产量:
– Q1=10
– Q2=10
• 均衡P=10
• 厂商1和2的利润为100
Q1
15
30
Q1=15-1/2Q2
Q2=15-1/2Q1
15
30
10
10
Q2
• 博弈均衡
纳什均衡
• P329 对照1:完全竞争
• P=30-Q为行业需求曲线
• 厂商的需求曲线为水平线,在均衡点P=MR=MC=0
• 30-Q=0
• Q=30
• Q1+Q2=30
• 势均力敌的两厂商平分Q,Q1=Q2=15
• 博弈均衡
纳什均衡
• P329 对照2:相互串通
• P=30-Q为市场需求曲线
• R=PQ=30Q-Q2
• R’=30-2Q=0
• Q=15时,总利润最大
• 两厂商平分,Q1=Q2=
• P=15
• 厂商1,厂商2的利润各为,利润最大
• 博弈均衡
纳什均衡
• P329 Cournot Model的推广
• 博弈均衡
子博弈精炼纳什均衡
• P330 动态博弈 Stackelberg Model
• 厂商2:它把厂商1产量看作既定时的反应:
• Q2=15-(1/2)Q1
• 厂商1:R1=PQ1=(30-Q)Q1=(30-Q1-Q2)Q1
• R1=30Q1-Q12-Q1Q2
• 厂商1知道厂商2会依据反应函数选择产量Q2,将Q2代入R1
例 P=30-Q为市场需求曲线,MC1=MC2=0,厂商1先决定产量,厂商2后
决定?
• 博弈均衡
子博弈精炼纳什均衡
• P330 动态博弈 Stackelberg Model
• R1=30Q1-Q12-Q1Q2
• R1=30Q1-Q12-Q1(15-1/2Q1)
• R1=15Q1-1/2Q12
• MR1=15-Q1=0
• 均衡点:
• Q1=15
• Q2=
• P=( P=30-Q )
• 厂商1的利润为202 .5,厂商2的利润为
• 先行者获利更多
• 博弈均衡
子博弈精炼纳什均衡
• 动态博弈与不可置信威胁
• 博弈均衡
子博弈精炼纳什均衡
• 动态博弈与不可置信威胁
• 博弈均衡
子博弈精炼纳什均衡
• 动态博弈与不可置信威胁
• 博弈均衡
子博弈精炼纳什均衡
• 动态博弈与不可置信威胁
• 纳什均衡解:(不进入,封杀)及(进入,容让)
• SPNE: (进入,容让)
• 博弈均衡
子博弈精炼纳什均衡
• 动态博弈与不可置信威胁
• 博弈均衡
子博弈精炼纳什均衡
• 动态博弈与不可置信威胁
P
D
P
(0,0)
不指控
指控(提出要求s>0)
拒绝 接受
起诉 放弃
(s-c,-s)
(γx-c-p,-γx-d) (-c,0)
两个参与人:原告P,被告D
C>0 —— 指控成本
S>0 —— 要求的支付
P>0 —— 原告的起诉成本
d>0 —— 被告的辩护成本
γX ——起诉后以γ的概率赢得X
• 博弈均衡
子博弈精炼纳什均衡
• 动态博弈与不可置信威胁
P
D
P
(0,0)
不指控 指控(提出要求s>0)
拒绝 接受
起诉 放弃
(s-c,-s)
(γx-c-p,-γx-d) (-c,0)
如果γX<p,
则指控成为一个不可置信威胁
均衡为:{(不指控,放弃),拒绝}
• 博弈均衡
子博弈精炼纳什均衡
• 动态博弈与不可置信威胁
• 问题:
• 如何让不可置信威胁成为可置信威胁?
• 对手可能会如何应付?
• 连锁店悖论(paradox of chain store,P304)
• 一次博弈
• 重复博弈:直觉与逆向归纳——悖论
• 解释:
• 实力不对等
• 信息不对称:垄断限制性定价(limit pricing,P305)
• 非理性行为
• 博弈均衡
子博弈精炼纳什均衡
• 动态博弈与合谋的可能性 P356
• 假设有两名博弈参与者:参与者 1 和参与者 2。
• 两名参与者轮流进行决策。在博弈的初始节点处,参与者 1 有两个策略
可以选择:T 和 C。
• 策略 T 表示结束博弈(Terminate),策略 C 表示继续(Continue)博弈。
• 在蜈蚣博弈中,包含初始节点在内,共有 198 个博弈节点。
• 博弈均衡
子博弈精炼纳什均衡
• 动态博弈与合谋的可能性 P356
• 问题:在有限次重复博弈中,双寡头厂商可能串谋吗?
• 答案:不能
• 方法:逆向归纳法
• 虽然合作可获得垄断利润,但任何一方都有增加产量(对方产量不变)
获得更高的总利润额的倾向
• 逆向归纳:
• 由于担心某一方会降低产量,最后一轮本方先降低
• 逆向推理到第一轮,不合作,以古诺均衡产出生产
• 博弈均衡
• 动态博弈与合谋的可能性 P356
• 问题:在无限次重复博弈中,双寡头厂商可能串谋吗?
• 答案:能
• 触发策略: 一旦对方某一轮选择不合作,则本方此后永远不与对方合作
• 因此:有一方背叛后,此后各自获得古诺均衡下的利润,低于垄断利润
• 贴现:如果贴现率足够高(代表未来利润越重要),会使得有背叛冲动
一方在权衡当期背叛和未来收益后,最终选择合作
• 所以:无限次重复古诺模型在满足一定条件下,是可能形成串谋,各自
获得垄断利润的。
子博弈精炼纳什均衡
• 博弈均衡
• 完全信息、对称信息与完美信息
• 不完全信息与风险决策
不完全信息静态博弈—贝叶斯纳什均衡
• 博弈均衡
• 不对称信息与风险决策
• 有个古老的王国,国王有个非常漂亮的女儿。
• 漂亮的女儿和英俊的宫廷侍卫相爱了。
• 国王发现后大发雷霆,将侍卫抓了起来。
• 在市中心召开市民大会,国王和公主坐在台上。
• 台上放了两个无窗的小木屋。将侍卫押上台,告诉他:
• 一个木屋里关的是残暴饥饿的猛虎
• 另一个木屋里是全国最美丽的少女。
• 侍卫必须当众打开其中一个木屋的门。
• 立刻被老虎吃掉。
• 或在他心爱的人前马上与陌生的美女结婚。
不完全信息静态博弈—贝叶斯纳什均衡
• 博弈均衡
• 不对称信息与逆向选择
• 假设银行要求必要收益率为10%。
• 经验显示(先验概率):
– 资质好的贷款客户坏账率平均为5%。
– 资质差的贷款客户坏账率平均为10%。
– 申请贷款的客户资质好与资质差的客户约各占50%。
• 若明确知道申请贷款客户的资质,应如何设定贷款利率?(分离均衡)
• 若银行无法判别贷款客户的资质,应如何设定贷款利率?(混同均衡)
• 在混同均衡下,会导致什么结果?
• 逆向选择是信息不对称导致的一种市场失灵。
不完全信息静态博弈—贝叶斯纳什均衡
• 博弈均衡
• 不对称信息与道德风险
• 若银行和贷款客户终于签订了贷款合同。
• 该笔资金的所有者为银行,但使用权却为贷款客户。
• 虽然银行会在合同内规定资金使用规范,但不一定会得到遵守。
• 贷款客户不遵守合同规定会造成的资金损失。
• 这一现象称为道德风险,企业理论中称为委托—代理问题。
• 道德风险是信息不对称导致的另一种市场失灵。
不完全信息静态博弈—贝叶斯纳什均衡
• 博弈均衡
不完全信息静态博弈—贝叶斯纳什均衡
• 博弈均衡
不完全信息静态博弈—贝叶斯纳什均衡
• 博弈均衡
• 先验概率与贝叶斯纳什均衡
• 在日常生活中,当面临不确定时,我们对某事件发生的可能
性有一个判断,然后,会根据新的信息来修正这个判断。
• 统计学上,修正之前的判断称为“先验概率”
• 修正后的判断称为“后验概率”
• 贝叶斯法则就是人们根据新的信息从先验概率得到后验概率
的基本方法。
不完全信息动态博弈—子博弈精炼贝叶斯纳什均衡
• 博弈均衡
• 人:好人(GP),坏人(BP)
• 事:好事(GT),坏事(BT)
• 一个好人干好事的概率等于:
• 他是好人的概率p(GP)乘以好人干好事的概率p(GT|GP)
• 加上他是坏人的概率p(BP)乘以坏人干好事的概率p(GT|BP)
• Prob{GT}= p(GT|GP)* p(GP)+ p(GT|BP)*
p(GT|BP)
• 假定观测到一个人干了一件好事,那么这个人的是好人的后
验概率是(贝叶斯法则):
不完全信息动态博弈—子博弈精炼贝叶斯纳什均衡