社会福利博弈:无纳什均衡
流浪汉
寻找工作 游荡
救济
政府
不救济
3,2
-1,3
-1,1
0,0
你救济,他就游荡;你游荡,他就不救济
社会福利博弈的特征
不存在纳什均衡
类似:父母与啃老族
回望:另一个不正常的博弈
情侣博弈——两个纳什均衡
思考
如何分析“不存在”纳什均衡或存在多个纳什均衡的博弈?
第三章 混合策略纳什均衡
第一节 基本概念:混合策略与期望支付
第一节 混合策略与期望支付
一、混合策略
(一)案例:小偷与守卫的猫鼠博弈
守卫
睡 不睡
偷
小偷
不偷
无纳什均衡,如何分析?
这类博弈的特征:每一个参与人都想猜透对方的策略,而每-个参与人又都不想让对方猜透自己的策略,所以此类博弈中都不存在(纯策略)Nash均衡
(二)混合策略
8,-2
-2,0
0,8
0,0
第一节 混合策略与期望支付
一、混合策略
(二)混合策略
1、纯策略:偷,不偷;睡,不睡
小偷的 纯策略空间{偷,不偷}
守卫的 纯策略空间{睡,不睡}
2、混合策略
就一次游戏而言,猜测对方的策略,保密自己的策略。在多次反复游戏中,避免任何的倾向性和规律性
怎样才能让对方彻底猜不透?连自己也不知道即将会采用哪个策略;把对方搞糊涂!
随机地选择策略,即采用混合策略
参与人按照一定概率,随机从策略组合中选择一种策略作为实际行动
随机行动的目的:使自己的行为不被对手预测
第一节 混合策略与期望支付
一、混合策略
(二)混合策略
小偷的混合策略
以r的概率偷,(r,1-r)
守卫的混合策略
以q的概率睡,(q,1-q)
记:混合策略p小偷(偷,不偷)=(r, 1-r);
p守卫(睡,不睡)=(q, 1-q)
3、纯策略与混合策略
对纯策略空间来说,可延伸的混合策略很多
混合策略不过是纯策略概念的推广
混合策略包含纯策略
纯策略是每个参与人的非随机性选择,即纯粹行动计划:r=100%,1-r=0
小偷的混合策略
(5%,95%)
守卫的混合策略
(10%,90%)
第一节 混合策略与期望支付
第一节 混合策略与期望支付
二、期望支付
(一)分析
1.概率
(偷,睡)的概率:rq
(偷,不睡)的概率:r(1-q)
(不偷,睡)的概率:(1-r)q
(不偷,不睡)的概率:(1-r)(1-q)
2.期望支付
U小偷=8rq+(-2)r(1-q)+0 (1-r)q+0 (1-r)(1-q)=2r(5q-1)
U守卫= (-2)rq+0 r(1-q)+8(1-p)q+0 (1-p)(1-q)=2q(4-5r)
第一节 混合策略与期望支付
二、期望支付
3、数学刻画
博弈G={S1,…,Sn;u1,…,un}, 参与人i的纯策略空间为Si= {si1,…,sik}
混合策略pi=(pi1,…,pik) , pik=p(sik )表示参与人i选择纯策略sik的概率,0≤ pik ≤1,∑ pik=1
在纯策略情形下, 支付ui=ui(s),对任何一个给定纯策略组合s=(s1,s2,…sn), ui取-确定值
与混合策略相伴的是得益(支付)的不确定性。这时:
混合策略组合p=(p1,…,pi,…,pn)
对应混合策略组合的期望支付为:πi(p)=πi(pi, p-i)
4、两个局中人的期望支付
第一节 混合策略与期望支付
二、期望支付
4、两个局中人的期望支付:
局中人1的混合策略组合p=(p1,…, pn);局中人2的混合策略组合q=(q1,…, qn)
局中人1和2的期望支付分别为:
aij和bij分别代表当局中人1选择纯策略i而当局中人2选择纯策略j时局中人1和局中人2的支付
局中人1的纯策略i为p= (0,…,1, 0,…,0)
局中人2的纯策略i为q= (0,…,1, 0,…,0)
事实上:
第一节 混合策略与期望支付
二、期望支付
4、两个局中人的期望支付:
局中人1和2的期望支付分别为:
例:小偷与守卫的猫鼠博弈
π小偷=8rq+(-2)r(1-q)+0 (1-r)q+0 (1-r)(1-q)
=r[q8+(1-q)(-2)]+ (1-r)[q0+(1-q)0]
=2r(5q-1)
π守卫= (-2)rq+0 r(1-q)+8(1-p)q+0 (1-p)(1-q)
=q [r(-2)+(1-r)8]+ (1-q)[r0+(1-r)0]
=2q(4-5r)
第一节 混合策略与期望支付
三、混合策略纳什均衡
给定策略式博弈G={S1,…,Sn;u1,…,un}以及混合策略组合p*=(p1*,…,pi*,…pn*)
对于所有i和pi∈∑i, ∑i——i的混合策略空间
如果有:πi(pi*, p-i*) ≥ πi(pi’, p-i*)
则混合策略组合p*=(p1*,…,pi*,…pn*)为G的混合策略纳什均衡,它是一个包含概率分布(不确定性)的纳什均衡
每个参与人的战略都是给定对方混合战略时的最优战略
两人博弈的混合策略纳什均衡
混合策略纳什均衡是指两个参与人的最优混合策略组合
所谓最优混合策略是指使参与人的期望支付最大化的混合策略
一对混合策略( p1*,p2* )要成为纳什均衡, p1*与p2* 必须同时分别满足:
π (p1*,p2*) ≥ π (p1,p2*)
π (p1*,p2*) ≥ π (p1*,p2)
第二节 混合策略纳什均衡的求解方法
一、支付等值法
通过使对方选择各个纯策略的期望支付值相等来确定自己的策略空间上的最优概率分布
1、概率
(偷,睡)的概率:rq
(偷,不睡)的概率:r(1-q)
(不偷,睡)的概率:(1-r)q
(不偷,不睡)的概率:(1-r)(1-q)
2、期望支付等值法
假定最优混合战略存在,给定p小偷(偷,不偷)=(r, 1-r)
守卫选择纯策略“睡”的期望支付为:π(睡)=r(-2)+(1-r)8=8-10r
守卫选择纯策略“不睡” 的期望支付为: π(不睡)=r0+(1-r)0=0
如果一个混合策略(而不是纯策略)是守卫的最优选择,一定意味着守卫在“睡”与“不睡”之间是无差异的:
π(睡)= π(不睡) r*=4/5
第二节 混合策略纳什均衡的求解方法
纳什均衡:
p小偷*(偷,不偷)=(4/5,1/5)
p守卫*(睡,不睡)=(1/5,4/5)
第二节 混合策略纳什均衡的求解方法
第二节 混合策略纳什均衡的求解方法
第二节 混合策略纳什均衡的求解方法
二、支付最大化法
例:扑克牌对色游戏(p77)
无纯策略NE
给定混合策略p甲=(r,1-r); p乙=(q,1-q)
π甲(p甲, p乙)=r[q(-1)+(1-q) 1]+ (1-r)[q1+(1-q)(-1)]
= 2r(1-2q)+(2q-1)
π乙(p甲, p乙)=q [r1+(1-r)(-1)]+ (1-q)[r(-1)+(1-r)1]
=2q(2r-1)-(2r-1)
混合策略纳什均衡是甲在策略空间{红,黑}上以概率分布 p甲*=(1/2,1/2)进行选择,乙也在策略空间{红,黑}上以概率p乙*=(1/2,1/2)进行选择
解:Max π甲(p甲, p乙)
r
q*=1/2
. 1-2q=0
Max π乙(p甲, p乙)
q
r*=1/2
. 2r-1=0
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
无纯策略NE
给定混合策略p甲=(r,1-r); p乙=(q,1-q)
π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
整理原则:一项含r,一项不含r
π乙(p甲, p乙)= 2q(2r-1)-(2r-1)
整理原则:一项含q,一项不含q
按照NE的条件,一个策略组合如过是一个NE,那么其中的每一个策略都是参与人针对其他参与人策略组合的最优反应,在纯策略NE中,这个“最优反应”可能是一个具体的纯策略(离散情形),也可能是一个反应函数(reaction function,如连续情形、古诺模型)。而在一个混合策略NE中,这个“最优反应”将是一个概率或很多个概率——被称为“反应对应”(reaction correspondence)
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
先看甲的最优反应,记为r*=R(q):
观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
r
q
0
1
(红)
1
(红)
1/2
1/2
r*=R(q)
反应对应曲线
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
再看乙的最优反应,记为q*=R(r):
观察π乙(p甲, p乙)= 2q(2r-1)-(2r-1)
r
q
0
1
(红)
1
(红)
1/2
1/2
q*=R(r)
反应对应曲线
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
作为NE,各个参与人的反应应该同时为最优,只有两个反应对应的交点满足
NE:r*=1/2, q*=1/2
NE支付为: π甲(p甲, p乙)= 2r(1-2q)+(2q-1)=0
π乙(p甲, p乙)= 2q(2r-1)-(2r-1)=0
r
q
0
1
(红)
1
(红)
1/2
1/2
q*=R(r)
r*=R(q)
第二节 混合策略纳什均衡的求解方法
二、反应对应法
作业:社会福利博弈。使用反应对应法找到纳什均衡。
流浪汉
寻找工作 游荡
救济
政府
不救济
3,2
-1,3
-1,1
0,0
第三节 寻找多重纳什均衡
例:情侣博弈
两个(多个)纯策略纳什均衡
问题:纳什均衡找完了吗?有无混合策略纳什均衡?
一、支付最大化法
给定混合策略p陈明=(r,1-r); p钟信=(q,1-q)
Max π陈明(p陈明, p钟信)=r[3q+(1-q) ]+ (1-r)[0+2(1-q)] =r(4q-1)+2(1-q)
Max π钟信(p陈明, p钟信)=q (2r+0)+ (1-q)[r+3(1-r)] =q(4r-3)+(3-2r)
NE:(r*, q*)=(3/4, 1/4)
二、反应对应法
r
q
第三节 寻找多重纳什均衡
二、反应对应法:情侣博弈
先看陈明的最优反应,记为r*=R(q):
π陈明(p陈明, p钟信) =r(4q-1)+2(1-q)
r
q
0
1
(钟信德语)
1
(陈明德语)
1/4
r*=R(q)
第三节 寻找多重纳什均衡
二、反应对应法:情侣博弈
再看钟信的最优反应,记为q*=R(r):
π钟信(p陈明, p钟信)=q(4r-3)+(3-2r)
r
q
0
1
(钟信德语)
1
(陈明德语)
1/4
q*=R(r)
3/4
第三节 寻找多重纳什均衡
二、反应对应法:情侣博弈
反应对应曲线有三个交点:三个NE:
r*=0, q*=0 纯策略(确定性)
r*=3/4, q*=1/4 混合策略(不确定性)
r*=1, q*=1 纯策略(确定性)
r
q
0
1
(钟信德语)
1
(陈明德语)
1/4
3/4
r*=R(q)
q*=R(r)
第三节 寻找多重纳什均衡
二、反应对应法:情侣博弈
支付的帕累托优势:初步印象
π陈明=r(4q-1)+2(1-q),π钟信=q(4r-3)+(3-2r)
r*=0, q*=0 纯策略(确定性)
双方NE支付: π陈明*=3,π钟信*=2
r*=3/4, q*=1/4 混合策略(不确定性)
双方NE支付: π陈明*=3/2,π钟信*=3/2
r*=1, q*=1 纯策略(确定性)
双方NE支付: π陈明*=2,π钟信*=3
纯策略纳什均衡比混合策略纳什均衡具有支付优势,这称为帕累托优势
如果博弈同时存在纯策略纳什均衡和混合策略纳什均衡,前者往往得到优先考虑
第三节 寻找多重纳什均衡
二、反应对应法:情侣博弈
夫妻之争博弈
不同均衡概念的关系
第四节 纳什均衡的存在性
严格优势纳什均衡
纯策略纳什均衡
混合策略纳什均衡
弱优势纳什均衡
第四节 纳什均衡的存在性
问题:是否所有的博弈都存在NE(纯的或混合的)?
Nash在1950年证明:任何有限博弈,都至少存在一个NE。
纳什定理:在一个由n个博弈方的G={S1,…, Sn; u1,…, un}中,如果n是有限的,且 Si都是有限集,则该博弈至少存在一个纳什均衡,但可能包含混合策略
Wilson(1971)证明,几乎所有有限博弈,都存在有限奇数个NE,包括纯策略NE和混合策略NE。
(纯策略)纳什均衡的存在性定理(Debreu,1952;Glicksberg,1952;Fan,1952):
考虑一个n人策略式博弈,如果每个参与人的纯策略空间Si是欧氏空间中的非空、紧(闭而有界)的凸集,支付函数ui(s)连续且对si拟凹,则博弈存在一个纯策略Nash均衡。
第四节 纳什均衡的存在性
例:凹但不连续的支付函数
二人博弈:策略空间为S1=S2= (0, 1)
支付函数: 反应对应:
反应对应曲线:
s2
s1
1/3
1/3
s1=
s2=
无纳什均衡
第四节 纳什均衡的存在性
问题:是否所有的博弈都存在NE(纯的或混合的)?
(纯策略)纳什均衡的存在性定理(Debreu,1952;Glicksberg,1952;Fan,1952):
考虑一个n人策略式博弈,如果每个参与人的纯策略空间Si是欧氏空间中的非空、紧(闭而有界)的凸集,支付函数ui(s)连续且对si拟凹,则博弈存在一个纯策略Nash均衡。
(混合策略)纳什均衡的存在性定理 (Glicksberg,1952):
在n人策略式博弈中,如果每个参与人的纯粹策略空间Si是欧氏空间中的非空、紧(闭而有界)的凸集,如果支付函数ui(s)为连续函数,那么博弈至少存在一个混合策略Nash均衡.
第五节 多重纳什均衡的筛选
一个博弈可能有多个均衡,但仍然存在不稳定性——你预测出现这个纳什均衡,因而有相应选择,我却以为会出现另一个,乃有我的选择,此时的组合可能并不构成纳什均衡
博弈论并没有一个一般的理论证明纳什均衡结果一定能出现
如何保证纳什均衡出现?
一、帕累托优势标准:按照支付大小筛选纳什均衡
例:猎人博弈
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
二、风险优势标准:风险小的NE优先
假设概率,比较期望支付大小
例:虚拟博弈
两个纳什均衡,哪个更优?
假设 r=1/2, q=1/2
给定q=1/2:甲采用上策略的期望支付为:9/2+0/2=
甲采用下策略的期望支付为:8/2+7/2=
给定r=1/2:乙采用左策略的期望支付为:9/2+0/2=
乙采用右策略的期望支付为:8/2+7/2=
期望支付越大,风险越小:甲采用下策略,乙采用右策略
选择的纳什均衡为:(下策略,右策略)
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
二、风险优势标准:风险小的NE优先
风险偏离损失乘积比较法
1. 甲:单独偏离均衡的损失
(1)偏离A的损失:6-5=1 (2)偏离B的损失:4-0=4
2. 乙:单独偏离均衡的损失
(1)偏离A的损失:6-5=1 (2)偏离B的损失:4-0=4
3. 风险优势标准方法:偏离A的损失VS偏离B的损失 1×1<4×4
4. 结论
(1)偏离B的损失更大:16
(2)不偏离B
选择的纳什均衡偏离损失更大者为:B,即(下策略,右策略)
A
B
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
二、风险优势标准:风险小的NE优先
风险偏离损失乘积比较法
1. 甲:单独偏离均衡的损失
(1)偏离A的损失:6-5=1 (2)偏离B的损失:4-0=4
2. 乙:单独偏离均衡的损失
(1)偏离A的损失:6-5=1 (2)偏离B的损失:4-0=4
3. 风险偏离损失乘积比较法:
偏离A的损失 VS 偏离B的损失 1×1<4×4
4. 结论
(1)偏离B的损失更大:16
(2)不偏离B
选择的纳什均衡偏离损失更大者为:B,即(下策略,右策略)
A
B
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
二、风险优势标准:风险小的NE优先
5. 风险偏离损失乘积比较法的缺陷:
例:假设M远远大于m
1. 甲:单独偏离均衡的损失
(1)偏离A的损失: (M-m)-M/2=M/2-m (2)偏离B的损失:M-(M-m)=m
2. 乙:单独偏离均衡的损失
(1)偏离A的损失:0-0=0 (2)偏离B的损失:0-0=0
如果使用风险偏离损失乘积比较法:
偏离A的损失VS偏离B的损失 (M/2-m)×0=m×0
一种建议:甲偏离A的损失 VS 甲偏离B的损失 M/2-m>m
选择的纳什均衡为:A, 即(D,L)
A
B
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
二、帕累托优势标准和风险优势标准的关系
如果帕累托优势标准和风险优势标准的选择冲突?
例:
帕累托优势标准法:选择的纳什均衡为A
风险优势标准:
1. 甲:单独偏离均衡的损失
(1)偏离A的损失: 6-5=1 (2)偏离B的损失:4-(-1000)=1004
2. 乙:单独偏离均衡的损失
(1)偏离A的损失:6-5=1 (2)偏离B的损失:4-(-1000)=1004
风险偏离损失乘积比较法:
偏离A的损失 VS 偏离B的损失 1×1<1004×1004
选择的纳什均衡为:B
怎么办?
A
B
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
三、帕累托优势标准和风险优势标准的关系
如果帕累托优势标准和风险优势标准的选择冲突?
怎么办?
在帕累托优势标准和风险优势标准之间,理论给予帕累托优势标准以优先权,而风险优势只有在局中人面临不知道先哪个均衡好的不确定性时,才变得重要。当一个均衡具有帕累托优势时,局中人一定选择这个均衡,不确定性就不存在了。
理性假设与确定性环境
有限理性假设与不确定性环境
四、聚点均衡
A
B
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
四、聚点均衡与协调博弈
如果帕累托优势标准和风险优势标准都无法使用呢?
在现实生活中,参与人可能使用某些被博弈模型抽象掉的信息来达到一个“聚点(focal pount)”均衡。这些信息可能与社会文化习惯、参与人过去博弈的历史等有关。(Schelling, 1960)
性别战:某一方的生日;社会地位
提名博弈
交通博弈
协调博弈
存在多个能够进行帕累托排序纳什均衡的博弈(Arifovic,2000; Carlsson &Ganslandt,1998;Straub,1995)
参与人对不同策略组合有相同偏好,如果其他人能够正确地预期,那么在多个纳什均衡中会存在唯一解,即均衡选择依赖参与人之间对博弈进行有充分相似的信念(Crawford &Haller,1990;Crawford,1995)
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
四、聚点均衡与协调博弈
协调博弈
协调博弈是“信心博弈”:与囚徒困境相反,每个参与者选择策略A或B,仅仅需要确信对方也会相应地选择A或B。他们不像合作博弈那样需要一个有约束力的契约之类的东西,而是更需要在彼此之间确立一种相互信任的信心
行为人之间建立起某种行为或惯例的稳定的均衡模式,此后遇到类似问题都加以遵循,而不需要反复支付信息成本和交易成本
只要某种行为模式被广泛接受,并被自觉遵从,就会形成习俗或自发秩序,并且有助于包括参与者在内的所有群体成员,避免无效率的非均衡收益
协调博弈的一个问题在于,均衡解具有不确定性和多样性,因此哪种均衡的规则将被选择具有随机特征
廉价磋商(Cheap talk)
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
四、聚点均衡
廉价磋商(Cheap talk)
尽管无法保证磋商会达成一个协议,即使达成协议也不一定会被遵守,但在一些博弈中,事前磋商确实可以使某些均衡实际上出现。
例:虚拟博弈中的事前告知
例:两人同时给对方打电话
重复博弈与学习过程
9,9
0,0
0,0
1,1
R
乙
甲
U
D
L
9,9
0,8
8,0
7,7
R
乙
甲
U
D
L
聚点
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
四、聚点均衡
重复博弈与学习过程
假定博弈重复许多次,即使参与人最初难以协调行动,在博弈若干次后,某种特定的协调模式可能会形成,特别地,假定参与人每一轮根据其对手以前的“平均”战略来选择自己的最优战略,博弈可能收敛于一个纳什均衡。
以上情况并不保证必然出现纳什均衡
五、相关均衡
如果参与人可以根据某个共同观测到的信号选择策略,就可能出现使所有参与人受益的相关均衡(Aumann)
参与人可以主动设计某种形式的选择机制,形成制度安排,从而确定最终“好的”纳什均衡
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
五、相关均衡
例:虚拟博弈
纳什均衡:
不同概率间较好的妥协结果:(下,左) 支付(4,4) 非纳什均衡
有什么办法可以使博弈结果接近这个解?
合作机制之一:廉价磋商。双方事先一致同意,把决策建立在一个外在于博弈的随机事件的发生上,该事件发生概率为1/2。
例如:双方一致同意:甲先到,选择“(上,左) ”;乙先到,选择(下,右) 。双方的期望支付均为5/2+1/2=3,这明显比纳什均衡好。
合作机制之二:联合的公开声明
第一步:双方事先同时发布两条信息(不知道对方发布什么信息),比如说以1/2概率随机选择发布“是”或“否”。如果两条信息一致,甲选择“上”,否则选择“下”;两条信息一致,乙选择“左”,否则选择“右”
(上,左) 支付(5,1)
(下,右) 支付(1,5)
(1/2,1/2) 支付(,)
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
五、相关均衡
例:虚拟博弈
纳什均衡:
不同概率间较好的妥协结果:(下,左) 支付(4,4) 非纳什均衡
有什么办法可以使博弈结果接近这个解?
合作机制之二:联合的公开声明
第二步:原始博弈的进行。知道了对手公布的信息,决定个人策略
结果:双方的期望支付还是5/2+1/2=3
合作机制之三:双方可以私下观察到随机事件的某些方面(收到不公开的相关信号)。三个两两相互独立的事件被假定以等概率发生,例如A、B、C三种信号发生的可能性均为1/3
甲只能观察到A,此时选择“上”,观察到非A(包含B和C),选择“下”
乙只能观察到C,此时选择“右”,观察到非C(包含A和B),选择“左”
(上,左) 支付(5,1)
(下,右) 支付(1,5)
(1/2,1/2) 支付(,)
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
五、相关均衡
例:虚拟博弈
合作机制之三:不公开的相关信号
甲只能观察到A,此时选择“上”,观察到非A(包含B和C),选择“下”
乙只能观察到C,此时选择“右”,观察到非C(包含A和B),选择“左”
若信号A发生,为甲观察到,他选“上”;则甲知道C肯定不会发生,乙一定会选择“左”
若信号C发生,为乙观察到,他选“右”;则乙知道A肯定不会发生,甲一定会选择“上”
信号B发生,甲一定选择“下”,乙一定选择“左”
两人的期望支付均为:5/3+1/3+4/3=10/3,已经比较接近4了
虚拟博弈的支付区域
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
五、相关均衡
例:虚拟博弈
虚拟博弈的支付区域
思考:外在于博弈的信号是由谁发出的?
(1,5)
(4,4)
(10/3,10/3)
(5,1)
(,)
混合策略NE
纯策略NE
纯策略NE
相关均衡
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
五、相关均衡
某些变量即使与原始博弈无关,也可以影响参与者的决策,而这可能对参与者有利
在博弈前的串谋阶段,参与者可以交换信息,观察信号。这些信息和信号代表了那些并不改变原始博弈支付函数的变量,但可以调整参与者在不同策略间做出选择的方式方法
这一途径的好处在于它通过各种各样的合作机制而允许在非合作博弈框架下讨论参与者之间某种形式的合作
博弈前阶段的沟通机制越复杂,参与者接近最优结果的可能性越大。如果没有这种沟通,参与者只能实现纳什均衡,这实际类似得到了某种退化的“相关均衡”
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
五、抗共谋均衡
(一)多人博弈中的共谋问题
纯策略Nash均衡:(U, L, A) 与(D, R, B)
前者具有Pareto优势,后者具有风险优势
不考虑串谋,结果为(U, L, A)
考虑甲、乙串谋取(D, R), 结果为(D, R, A)
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
五、抗共谋均衡
(二)抗共谋均衡
甲、乙有集体偏离(U, L, A)的动机,
(U, L, A)是非抗共谋均衡
(D, R, B)缺乏集体偏离的激励, 是抗共谋均衡
(1)若甲、乙集体偏离,选(U,L,B)
-1→-2, -1→-2
(2)若甲、丙集体偏离,选(U,R,A)
-1→-5, 5→0
(3)若乙、丙集体偏离,选(D,L,A)
-1→-5, 5→0
(4)若甲、乙、丙集体偏离,选(U,L,A)
尽管三个支付都增加,但(U,L,A)又存在甲、乙共谋损害丙的利益,在完全信息假设下丙会考虑到这一点,因此不会与甲、乙共谋
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
五、抗共谋均衡
(三)抗共谋均衡的定义p119
单人无偏离激励
双人无共谋偏离激励
三人无共谋偏离激励
依次类推,直到所有参与人都无共谋偏离激励
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
五、抗共谋均衡
(三)抗共谋均衡的定义p119
抗共谋均衡定义;如果一个博弈的某个策略
组合满足下列 条件
⑴ 没有任何参与人的串谋会改变
博弈的结果;
⑵ 给定选择偏离的参与人有再次
偏离的自由时,没有任何两个
参与人的串谋会改变博弈的结果;
⑶ 依次类推,直到所有参与人都参加的串谋也不会改变博弈的结果。
则称该策略组合为一个抗共谋均衡。
第五节 多重纳什均衡的筛选
如何保证纳什均衡出现?
五、抗共谋均衡
(三)抗共谋均衡的定义
集体偏离
两种集体偏离情形:
能够利益维持的集体偏离
不能利益维持的集体偏离,会产生再度偏离
金无足赤,人无完人
人总是要犯错误的,所以要对别人宽容
经得起考验的纳什均衡
在其他参与人选择了错误策略的情况下,某参与人仍能实现纳什均衡
他人不犯错误,你能实现最优;他人犯错误,你仍能实现最优
第三节多重纳什均衡的选择标准
六、颤抖手精炼均衡
Trembling-hand perfect equilibrium
(一)颤抖手
某一参与人的非蓄意错误
博弈偏离均衡路径的原因
一个人用手抓东西时,手一颤抖,就可能抓不住他想抓的东西:非蓄意错误
第三节多重纳什均衡的选择标准
六、颤抖手精炼均衡
(二)颤抖手均衡
1.基本思想
给定所有参与人均可能犯错误的情况下,如果某一策略组合仍是每一个参与人的最优策略组合,则实现颤抖手均衡
如何理解?
第三节多重纳什均衡的选择标准
六、颤抖手精炼均衡
(二)颤抖手均衡
2.定义: m——mistake
n人博弈中,对于每一个博弈方i,存在严格混合策略序列 ,使下列条件得到满足:
(1)
尽管每一个博弈方可能犯错误,但错误收敛于零——总有一天能成功
穿针引线——功夫不负有心人
将一条线穿入针眼,手在不停颤抖,不大可能一下子穿进去
但如果试的次数足够大,总是能够成功
第三节多重纳什均衡的选择标准
六、颤抖手精炼均衡
(二)颤抖手均衡
2.定义:m——mistake
n人博弈中,对于每一个博弈方i,存在严格混合策略序列 ,使下列条件得到满足:
(2)对于任何可选择的混合策略
穿针引线——学会宽容
纳什均衡:每一个人都把线穿入针眼
宽容:某参与人不能因为其他参与人可能暂时无法把线穿进针眼而故意不把线穿进针眼
宽容是一种美德
练习:模型化下述划拳博弈:
两个老朋友在一起喝酒,每个人有四个纯战略:杠子、老虎、鸡和虫子,输赢规则是:杠子降鸡,鸡吃虫子,虫子降杠子,两人同时出令。如果一个打败另一个,赢的效用为1,输的效用为-1,否则效用为0,写出这个博弈的支付矩阵,这个博弈有纯战略均衡吗?计算其混合战略纳什均衡。
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*