第五章 同时博弈与序贯博弈
第一节 信息集
博弈的信息集P164-167
博弈树上的所有决策结分割成不同的信息集。每个信息集是决策结集合的一个子集,该子集包括所有满足下列条件的决策结:
(1) 每个决策结都是同一个参与人的决策结
(2) 该参与人知道博弈进入该集合的某个决策结, 但不知道自己究竟处于哪一个决策结
例:房地产开发博弈
房地产开发博弈
该地的房地产需求状况是不确定的。N代表不受参与人控制的“自然”:以1/2的概率选择市场需求“大”,以1/2的概率选择市场需求“小”
博弈树有7个决策结点,分割成7个信息集h:一个(初始结)属于A,两个属于N,4个属于B
A
开发
不开发
N
N
大
小
大
小
B
B
B
B
开发
不开发
开发
不开发
开发
不开发
开发
不开发
(4,4)
(8,0)
(-3,-3)
(1,0)
(0,8)
(0,0)
(0,1)
(0,0)
hA
hN(1)
hN(2)
hB(1)
hB(2)
hB(3)
hB(4)
每个信息集只包含一个决策结,意味着所有参与人在决策时准确地知道自己处于哪一个决策结
房地产开发博弈
假设B决策时并不知道自然N的选择,则B的信息集由原来的4个变成2个,每个信息集包含两个决策结。将属于同一信息集的两个决策结用虚的椭圆圈起来。
A
开发
不开发
N
N
大
小
大
小
B
B
B
B
开发
不开发
开发
不开发
开发
不开发
开发
不开发
(4,4)
(8,0)
(-3,-3)
(1,0)
(0,8)
(0,0)
(0,1)
(0,0)
hA
hN(1)
hN(2)
hB(1)
hB(2)
参与人“自然”是知道博弈到达了哪个决策结的。但参与人B的知识在自然行动之后仍保持不变,B知道博弈已到达了由虚圈所定义的信息集内的某一个决策结,但并不知道到底到达了哪个结
房地产开发博弈
假设B决策时知道自然N的选择,但并不知道A的选择(可视作A、B同时决策):静态博弈·
A
开发
不开发
N
N
大
小
大
小
B
B
B
B
开发
不开发
开发
不开发
开发
不开发
开发
不开发
(4,4)
(8,0)
(-3,-3)
(1,0)
(0,8)
(0,0)
(0,1)
(0,0)
hA
hN(1)
hN(2)
hB(1)
hB(2)
第一节 信息集
博弈的信息集P164-167
信息集的标注规则P166-167:
(1)同参与人
(2)同一时点
(3)同行动选择
第一节 信息集
用博弈的展开式表示同时决策博弈
有了信息集的概念, 展开式表示也可以用来表 示静态博弈
例:囚徒困境
每一个参与人都在两个行动间选择。行动是“同时”的:让小偷甲先采取行动,但不让小偷乙知道他采取了何种行动。虚圈表示在小偷甲行动之后小偷乙的知识仍保持不变。小偷乙知道的仅是博弈已到达了由虚圈所定义的信息集内的某一个决策结,但并不知道到底到达了哪个结
如果去掉虚圈,则为动态博弈
小偷甲
坦白
抵赖
坦白
抵赖
小偷乙
小偷乙
(-3, -3)
(0, -5)
坦白
抵赖
(-5, 0)
(-1, -1)
第一节 信息集
完美信息博弈&不完美信息博弈:信息集角度定义
一个信息集可能包含多个决策结,也可能只包含一个决策结。只包含一个决策结的信息集称为单结信息集
定义(P167):如果博弈树的所有信息集都是单结的,该博弈称为完美信息博弈(Game of perfect information) ;否则就是不完美信息博弈
完美信息意味着没有任何两个决策结用 虚圈围起来
虚拟参与人“自然”的信息集总是假定为单结的,因为自然是随机行动的,自然在参与人决策之后行动等价于自然在参与人决策之前行动但参与人不能观测到自然的行动
完全(complete)信息博弈是指得益函数和纯策略空间均为博弈各方的共同知识。
完全信息可以是完美的也可以是不完美的
第二节 混和博弈
混合博弈:既包含同时决策行动又包含序贯决策行动的博弈
存在条件:相当长一段时期的策略互动过程
案例:研发投入与定价博弈
(一)第一阶段:同时决策(不完全信息)——新产品的研发投入
(二)插曲:
产业年度交易展→互相观察对方产品性能→推测对方研发投入
(三)第二阶段:根据对方研发投入定价
第二节 混和博弈
案例:研发投入与定价博弈
(一)第一阶段:同时决策(不完全信息)——新产品的研发投入
联想
大投入 小投入
大投入
方正
小投入
第二节 混和博弈
案例:研发投入与定价博弈
(二)插曲
产业年度交易展→
互相观察对方产品性能→
推测对方研发投入
第二节 混和博弈
案例:研发投入与定价博弈
(三)第二阶段:根据对方研发投入定价
1.(大投入,大投入)
5,5
2,6
6,2
4,4
大投入
大投入
高价
低价
高价
低价
第二节 混和博弈
案例:研发投入与定价博弈
(三)第二阶段:根据对方研发投入定价
2.(高投入,低投入)
低投入
高投入
高价
低价
高价
低价
4,3
3,4
2,1
1,2
第二节 混和博弈
案例:研发投入与定价博弈
(三)第二阶段:根据对方研发投入定价
3.(低投入,高投入)
高投入
低投入
高价
低价
高价
低价
3,4
1,2
4,3
2,1
第二节 混和博弈
案例:研发投入与定价博弈
(三)第二阶段:根据对方研发投入定价
4.(低投入,低投入)
低投入
低投入
高价
低价
高价
低价
6,6
3,7
7,3
5,5
第二节 混和博弈
案例:研发投入与定价博弈
(四)简化形式与纳什均衡
1. 简化表述
低价
低价
低价
4,4
高价
3,4
高价
低价
低价
4,3
低价
5,5
方正
高投入
低投入
联想
高投入
低投入
第二节 混和博弈
案例:研发投入与定价博弈
(四)简化形式与纳什均衡
2. 纳什均衡:按帕累托支付优势筛选
第一阶段:(低投入,低投入)
第二阶段:(低价,低价)
情侣博弈的疑问
三个纯策略纳什均衡
(进入, {进入, 芭蕾}) (进入, {进入, 进入} ) (芭蕾, {芭蕾, 芭蕾})
问题:哪一种均衡最有可能发生?
引入:子博弈精炼纳什均衡
男
进入
芭蕾
进入
芭蕾
女
女
(2, 1)
(0, 0)
进入
芭蕾
(-1, -1)
(1, 2)
第三节 序贯博弈多重纳什均衡:
子博弈精炼纳什均衡
子博弈的定义
动态博弈的子博弈是指能够自成一个博弈的某个动态博弈的从其某个阶段开始的后续阶段;它必须有一个初始信息集,并且具备进行博弈所需要的各种信息。
给定n人展开型博弈T(tree),如果博弈S(sub)满足以下三个条件:
1. S博弈树是T博弈树的一枝
2. S不能分割T的信息集:图表5-14
(1)S的根为T的单点信息集
(2)S的信息集不与T的其他信息集相交
3. S的末端节点处支付向量继承自T
则:S为T的子博弈
T:原博弈、母博弈
第三节 序贯博弈多重纳什均衡:
子博弈精炼纳什均衡
子博弈的便捷图示:用封闭的虚线圈住
例:情侣博弈
房地产开发博弈
男
进入
芭蕾
进入
芭蕾
女
女
( 2, 1)
( 0, 0)
进入
芭蕾
(-1, -1)
( 1, 2)
A
开发
不开发
N
N
大
小
大
小
B
B
B
B
开发
不开发
开发
不开发
开发
不开发
开发
不开发
(4,4)
(8,0)
(-3,-3)
(1,0)
(0,8)
(0,0)
(0,1)
(0,0)
hA
hN(1)
hN(2)
hB(1)
hB(2)
hB(3)
hB(4)
U D
L R L R
无子博弈
U D
L R L R
C D C D C D C D
参与人乙的信息集不能作为子博
弈的初始结, 否则将导致3的信息被分割
甲
乙
乙
甲
乙
乙
丙
丙
丙
丙
思考:真正的纳什均衡?
答:能够经得起双重考验的纳什均衡
(1)经得起原博弈的考验
(2)经得起子博弈的考验
——子博弈(完美)精炼纳什均衡
子博弈(完美)精炼纳什均衡的要求比纳什均衡严格多了,它是指在每一个由单个决策节点所组成的信息集上,策略组合都是无懈可击的、是周密的。如果这样,当然是完美的了。
第三节 子博弈精炼纳什均衡
例:情侣博弈
三个纳什均衡
(进入,{进入,进入})
(进入,{进入,芭蕾})
(芭蕾,{芭蕾,芭蕾})
男
进入
芭蕾
进入
芭蕾
女
女
( 2, 1)
( 0, 0)
进入
芭蕾
(-1, -1)
( 1, 2)
男
进入
芭蕾
进入
芭蕾
女
女
( 2, 1)
( 0, 0)
进入
芭蕾
(-1, -1)
( 1, 2)
男
进入
芭蕾
进入
芭蕾
女
女
( 2, 1)
( 0, 0)
进入
芭蕾
(-1, -1)
( 1, 2)
男
进入
芭蕾
进入
芭蕾
女
女
( 2, 1)
( 0, 0)
进入
芭蕾
(-1, -1)
( 1, 2)
第三节 子博弈精炼纳什均衡
例:情侣博弈
三个纳什均衡
(进入,{进入,进入})
男
进入
芭蕾
进入
芭蕾
女
女
( 2, 1)
( 0, 0)
进入
芭蕾
(-1, -1)
( 1, 2)
子博弈:指向(2,1)的策略组合——女方无单独偏离激励
子博弈:指向(-1,1)的策略组合——女方有单独偏离激励
不是子博弈精炼纳什均衡
第三节 子博弈精炼纳什均衡
例:情侣博弈
三个纳什均衡
(进入,{进入,芭蕾})
男
进入
芭蕾
进入
芭蕾
女
女
( 2, 1)
( 0, 0)
进入
芭蕾
(-1, -1)
( 1, 2)
子博弈:指向(2,1)的策略组合——女方无单独偏离激励
子博弈:指向(1,2)的策略组合——女方无单独偏离激励
是子博弈精炼纳什均衡
第三节 子博弈精炼纳什均衡
例:情侣博弈
三个纳什均衡
(芭蕾,{芭蕾,芭蕾})
男
进入
芭蕾
进入
芭蕾
女
女
( 2, 1)
( 0, 0)
进入
芭蕾
(-1, -1)
( 1, 2)
子博弈:指向(0,0)的策略组合——女方有单独偏离激励
子博弈:指向(-1,1)的策略组合——女方无单独偏离激励
不是子博弈精炼纳什均衡
第三节 子博弈精炼纳什均衡
子博弈精炼纳什均衡的定义
给定展开型博弈T的策略组合s*=(s1*,…,si*,…,sn*),如果:
(1) s*是T的纳什均衡
(2) s*是每一个子博弈的纳什均衡,则:
s*为子博弈精炼纳什均衡
第三节 子博弈精炼纳什均衡
子博弈精炼纳什均衡的定义
倒推法的巧合
子博弈精炼纳什均衡与用倒推法求出的结果相同
博弈结果:
(进入,进入)
男
进入
芭蕾
进入
芭蕾
女
女
(2, 1)
(0, 0)
进入
芭蕾
(-1, -1)
(1, 2)
男
进入
芭蕾
进入
女
女
(2, 1)
芭蕾
(1, 2)
对应的纳什均衡:
(进入,{进入,芭蕾})
*
博弈论第四章
第二讲子博弈精炼纳什均衡
*
第三节 子博弈精炼纳什均衡
三、纳什均衡的存在性:库恩定理
完全信息的有限序贯博弈都存在纳什均衡
博弈论第四章
第二讲子博弈精炼纳什均衡
第六节 连续支付情形的序贯博弈
复习:完全信息静态博弈
古诺模型:同质产品、产量竞争、合作博弈
两家企业
市场总需求:q=a-p,a>0
企业i的成本:cqi,c>0
企业i的利润:i(q1, q2)=pqi-cqi=(a-q1-q2-c)qi
行为原则:勾结起来象一个垄断企业一样决定市场总产量
max (q)=pq-cq=(a-q-c)q .
纳什均衡产量 均衡利润
双方在上述总产量的条件下通过讨价还价来决定各自生产多少,这是一个零和博弈的问题
不稳定的纳什均衡:双方都有提高产量的偏离激励
第六节 连续支付情形的序贯博弈
复习:完全信息静态博弈
古诺模型:同质产品、产量竞争、合作博弈
两家企业
市场总需求:q=a-p,a>0
企业i的成本:cqi,c>0
企业i的利润:i(q1, q2)=pqi-cqi=(a-q1-q2-c)qi
纳什均衡产量 均衡利润
以上称为垄断解。
如果市场结构为竞争,则必有:p=c
均衡产量 均衡利润
第六节 连续支付情形的序贯博弈
复习:完全信息静态博弈
古诺模型:同质产品、产量竞争、非合作博弈
两家企业
市场总需求:q=a-p,a>0
企业i的成本:cqi,c>0
企业i的利润:i(q1, q2)=pqi-cqi=(a-q1-q2-c)qi
行为原则:假定对方产量决策不变、最优化自己的产量
max i(q1, q2)=(a-q1-q2-c)qi .
纳什均衡产量 均衡利润
稳定的纳什均衡
第六节 连续支付情形的序贯博弈
复习:完全信息静态博弈
伯川德模型p76:同质产品、价格竞争、非合作博弈
两家企业
市场总需求:q=a-p,a>0
假定消费者从定价较低企业购买
商品。如果两家企业定价相同,
通常假定每家企业各分得总需求
量的一半
企业i的成本:cqi,c>0
企业i的利润:i(qi, qj)=piqi(qi, qj)-cqi(qi, qj)=(pi-c)qi(qi, qj)
行为原则:两家企业同时决定价格。每家企业都观察不到对手的定价,只是在自己定价的时候预期对手的定价
max (pi-c)qi(qi, qj)
第六节 连续支付情形的序贯博弈
复习:完全信息静态博弈
伯川德模型:同质产品、价格竞争、非合作博弈
行为原则:两家企业同时决定价格。每家企业都观察不到对手的定价,只是在自己定价的时候预期对手的定价
纳什均衡
p2
p1
0
(a+c)/2
(a+c)/2
p1=p2
p1=(a+c)/2
p1=(a+c)/2
第六节 连续支付情形的序贯博弈
复习:完全信息静态博弈
伯川德模型p76:同质产品、价格竞争、非合作博弈
两家企业
需求:q=a-p,a>0
企业i的成本:cqi,c>0
纳什均衡
不稳定的纳什均衡:不管一家企业如何定价,另一家企业只需要选择稍小一点的价格水平,总能获得占领整个市场带来的好处。则惟一均衡是发生在p1=p1=c,两家企业平分市场。
伯川德均衡产量 均衡利润
伯川德悖论:两个寡头居然找不到操纵价格而获得超额利润的方法
不过其他因素会产生经济利润:多期博弈、不完全信息、异质产品
第六节 连续支付情形的序贯博弈
复习:完全信息静态博弈
伯川德模型:差别产品、价格竞争、非合作博弈
两家企业
企业i的成本:cqi,c>0
企业i的需求:qi(pi, pj)=a-pi+bpj, a, b>0
企业i的利润: i(pi, pj)=piqi-cqi=(a-pi+bpj)(pi-c)
行为原则:两家企业同时决定价格。每家企业都观察不到对手的定价,只是在自己定价的时候预期对手的定价
max (a-pi+bpj)(pi-c) .
纳什均衡 均衡利润
第六节 连续支付情形的序贯博弈
完全且完美信息动态博弈
斯坦克尔伯格模型:同质产品、产量竞争、非合作博弈
两家企业。企业1实力较强,先决定产量(企业1称为领导者);企业2实力较弱,在观察到企业1的决策之后决定产量(企业2称为追随者)
市场总需求:q=a-p,a>0
企业i的成本:cqi,c>0
企业i的利润:i(q1, q2)=pqi-cqi=(a-q1-q2-c)qi
行为原则:采用倒推法。企业2在给定企业1的产量条件下q1,最优化自己的产量
max 2(q1, q2)=(a-q1-q2-c)q2 .
其实这是企业2的反应函数q2(q1)。企业1则以给定企业2的反应函数条件下最优化自己的产量
max 1(q1, q2(q1))=(a-q1-q2(q1)-c)q2(q1)=
第六节 连续支付情形的序贯博弈
完全且完美信息动态博弈
斯坦克尔伯格模型:同质产品、产量竞争、非合作博弈
得: 进而:
可见企业1产量大(利润高),这叫“先动优势”
企业1的产品一旦生产出来就变积淀下来无法改变,企业2不得不承认它的威胁是可置信的。而假如企业1只是宣布了它将生产(a-c) /2,企业2是不会相信它的威胁的
斯坦克尔伯格纳什均衡 产量 均衡利润
第六节 连续支付情形的序贯博弈
同质产品的市场博弈:一个比较
完全竞争:均衡产量 均衡利润
完全垄断:均衡产量 均衡利润
古诺模型:均衡产量 均衡利润
伯川德模型:均衡产量 均衡利润
斯坦克尔伯格模型:均衡产量 均衡利润
第六节 连续支付情形的序贯博弈
同质产品的市场博弈:一个比较
反应函数图
q1
q2
古诺解
斯坦克尔伯格解
竞争解
垄断解