MBA智库文档经济博弈论社会福利博弈：无纳什均衡.ppt

社会福利博弈：无纳什均衡.ppt

下载

西南大学李海明老师的博弈论讲义

李海明

63页 | 2.79MB | 3次下载 |

4.7

(3人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

社会福利博弈：无纳什均衡流浪汉寻找工作游荡救济政府不救济 3，2 -1，3 -1，1 0，0 你救济，他就游荡；你游荡，他就不救济社会福利博弈的特征不存在纳什均衡类似：父母与啃老族回望：另一个不正常的博弈情侣博弈——两个纳什均衡思考如何分析“不存在”纳什均衡或存在多个纳什均衡的博弈？第三章混合策略纳什均衡第一节基本概念：混合策略与期望支付第一节混合策略与期望支付一、混合策略（一）案例：小偷与守卫的猫鼠博弈守卫睡不睡偷小偷不偷无纳什均衡，如何分析？这类博弈的特征：每一个参与人都想猜透对方的策略，而每－个参与人又都不想让对方猜透自己的策略，所以此类博弈中都不存在(纯策略)Nash均衡（二）混合策略 8，-2 -2，0 0，8 0，0 第一节混合策略与期望支付一、混合策略（二）混合策略 1、纯策略：偷，不偷；睡，不睡小偷的纯策略空间｛偷，不偷｝守卫的纯策略空间｛睡，不睡｝ 2、混合策略就一次游戏而言，猜测对方的策略，保密自己的策略。在多次反复游戏中，避免任何的倾向性和规律性怎样才能让对方彻底猜不透？连自己也不知道即将会采用哪个策略；把对方搞糊涂！随机地选择策略，即采用混合策略参与人按照一定概率，随机从策略组合中选择一种策略作为实际行动随机行动的目的：使自己的行为不被对手预测第一节混合策略与期望支付一、混合策略（二）混合策略小偷的混合策略以r的概率偷，（r，1-r）守卫的混合策略以q的概率睡，（q，1-q）记：混合策略p小偷(偷,不偷)=(r, 1-r); p守卫(睡,不睡)=(q, 1-q) 3、纯策略与混合策略对纯策略空间来说，可延伸的混合策略很多混合策略不过是纯策略概念的推广混合策略包含纯策略纯策略是每个参与人的非随机性选择，即纯粹行动计划：r=100%,1-r=0 小偷的混合策略（5%，95%）守卫的混合策略（10%，90%）第一节混合策略与期望支付第一节混合策略与期望支付二、期望支付（一）分析 1.概率（偷，睡）的概率：rq （偷，不睡）的概率：r(1-q) （不偷，睡）的概率：(1-r)q （不偷，不睡）的概率：(1-r)(1-q) 2.期望支付 U小偷=8rq+(-2)r(1-q)+0 (1-r)q+0 (1-r)(1-q)=2r(5q-1) U守卫= (-2)rq+0 r(1-q)+8(1-p)q+0 (1-p)(1-q)=2q(4-5r) 第一节混合策略与期望支付二、期望支付 3、数学刻画博弈G={S1，…,Sn;u1,…,un}, 参与人i的纯策略空间为Si= {si1,…,sik} 混合策略pi=(pi1,…,pik) ， pik=p(sik )表示参与人i选择纯策略sik的概率，0≤ pik ≤1，∑ pik=1 在纯策略情形下, 支付ui=ui(s)，对任何一个给定纯策略组合s=(s1,s2,…sn), ui取－确定值与混合策略相伴的是得益(支付)的不确定性。这时: 混合策略组合p=（p1,…,pi,…,pn）对应混合策略组合的期望支付为：πi(p)=πi(pi, p-i) 4、两个局中人的期望支付第一节混合策略与期望支付二、期望支付 4、两个局中人的期望支付：局中人1的混合策略组合p=（p1,…, pn）；局中人2的混合策略组合q=（q1,…, qn）局中人1和2的期望支付分别为： aij和bij分别代表当局中人1选择纯策略i而当局中人2选择纯策略j时局中人1和局中人2的支付局中人1的纯策略i为p= （0,…,1, 0,…,0）局中人2的纯策略i为q= （0,…,1, 0,…,0）事实上：第一节混合策略与期望支付二、期望支付 4、两个局中人的期望支付：局中人1和2的期望支付分别为：例：小偷与守卫的猫鼠博弈 π小偷=8rq+(-2)r(1-q)+0 (1-r)q+0 (1-r)(1-q) =r[q8+(1-q)(-2)]+ (1-r)[q0+(1-q)0] =2r(5q-1) π守卫= (-2)rq+0 r(1-q)+8(1-p)q+0 (1-p)(1-q) =q [r(-2)+(1-r)8]+ (1-q)[r0+(1-r)0] =2q(4-5r) 第一节混合策略与期望支付三、混合策略纳什均衡给定策略式博弈G=｛S1，…,Sn;u1,…,un｝以及混合策略组合p*=（p1*,…,pi*,…pn*）对于所有i和pi∈∑i， ∑i——i的混合策略空间如果有：πi(pi*, p-i*) ≥ πi(pi’, p-i*) 则混合策略组合p*=(p1*,…,pi*,…pn*)为G的混合策略纳什均衡，它是一个包含概率分布（不确定性）的纳什均衡每个参与人的战略都是给定对方混合战略时的最优战略两人博弈的混合策略纳什均衡混合策略纳什均衡是指两个参与人的最优混合策略组合所谓最优混合策略是指使参与人的期望支付最大化的混合策略一对混合策略（ p1*，p2* ）要成为纳什均衡， p1*与p2* 必须同时分别满足： π (p1*，p2*) ≥ π (p1，p2*) π (p1*，p2*) ≥ π (p1*，p2) 第二节混合策略纳什均衡的求解方法一、支付等值法通过使对方选择各个纯策略的期望支付值相等来确定自己的策略空间上的最优概率分布 1、概率（偷，睡）的概率：rq （偷，不睡）的概率：r(1-q) （不偷，睡）的概率：(1-r)q （不偷，不睡）的概率：(1-r)(1-q) 2、期望支付等值法假定最优混合战略存在，给定p小偷(偷,不偷)=(r, 1-r) 守卫选择纯策略“睡”的期望支付为：π(睡)=r(-2)+(1-r)8=8-10r 守卫选择纯策略“不睡” 的期望支付为： π(不睡)=r0+(1-r)0=0 如果一个混合策略（而不是纯策略）是守卫的最优选择，一定意味着守卫在“睡”与“不睡”之间是无差异的： π(睡)= π(不睡)  r*=4/5 第二节混合策略纳什均衡的求解方法纳什均衡： p小偷*(偷，不偷)=（4/5，1/5） p守卫*(睡，不睡)=（1/5，4/5）第二节混合策略纳什均衡的求解方法第二节混合策略纳什均衡的求解方法第二节混合策略纳什均衡的求解方法二、支付最大化法例：扑克牌对色游戏(p77) 无纯策略NE 给定混合策略p甲=(r,1-r); p乙=(q,1-q) π甲(p甲, p乙)=r[q(-1)+(1-q) 1]+ (1-r)[q1+(1-q)(-1)] = 2r(1-2q)+(2q-1) π乙(p甲, p乙)=q [r1+(1-r)(-1)]+ (1-q)[r(-1)+(1-r)1] =2q(2r-1)-(2r-1) 混合策略纳什均衡是甲在策略空间{红，黑}上以概率分布 p甲*=（1/2，1/2）进行选择，乙也在策略空间{红，黑}上以概率p乙*=（1/2，1/2）进行选择解：Max π甲(p甲, p乙) r q*=1/2 . 1-2q=0 Max π乙(p甲, p乙) q r*=1/2 . 2r-1=0 第二节混合策略纳什均衡的求解方法二、反应对应法例：扑克牌对色游戏(p77) 无纯策略NE 给定混合策略p甲=(r,1-r); p乙=(q,1-q) π甲(p甲, p乙)= 2r(1-2q)+(2q-1) 整理原则：一项含r，一项不含r π乙(p甲, p乙)= 2q(2r-1)-(2r-1) 整理原则：一项含q，一项不含q 按照NE的条件，一个策略组合如过是一个NE，那么其中的每一个策略都是参与人针对其他参与人策略组合的最优反应，在纯策略NE中，这个“最优反应”可能是一个具体的纯策略(离散情形)，也可能是一个反应函数(reaction function,如连续情形、古诺模型)。而在一个混合策略NE中，这个“最优反应”将是一个概率或很多个概率——被称为“反应对应”(reaction correspondence) 第二节混合策略纳什均衡的求解方法二、反应对应法例：扑克牌对色游戏(p77) 先看甲的最优反应，记为r*=R(q)：观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1) r q 0 1 （红） 1 (红) 1/2 1/2 r*=R(q) 反应对应曲线第二节混合策略纳什均衡的求解方法二、反应对应法例：扑克牌对色游戏(p77) 再看乙的最优反应，记为q*=R(r)：观察π乙(p甲, p乙)= 2q(2r-1)-(2r-1) r q 0 1 （红） 1 (红) 1/2 1/2 q*=R(r) 反应对应曲线第二节混合策略纳什均衡的求解方法二、反应对应法例：扑克牌对色游戏(p77) 作为NE，各个参与人的反应应该同时为最优，只有两个反应对应的交点满足 NE：r*=1/2, q*=1/2 NE支付为： π甲(p甲, p乙)= 2r(1-2q)+(2q-1)=0 π乙(p甲, p乙)= 2q(2r-1)-(2r-1)=0 r q 0 1 （红） 1 (红) 1/2 1/2 q*=R(r) r*=R(q) 第二节混合策略纳什均衡的求解方法二、反应对应法作业：社会福利博弈。使用反应对应法找到纳什均衡。流浪汉寻找工作游荡救济政府不救济 3，2 -1，3 -1，1 0，0 第三节寻找多重纳什均衡例：情侣博弈两个（多个）纯策略纳什均衡问题：纳什均衡找完了吗？有无混合策略纳什均衡？一、支付最大化法给定混合策略p陈明=(r,1-r); p钟信=(q,1-q) Max π陈明(p陈明, p钟信)=r[3q+(1-q) ]+ (1-r)[0+2(1-q)] =r(4q-1)+2(1-q) Max π钟信(p陈明, p钟信)=q (2r+0)+ (1-q)[r+3(1-r)] =q(4r-3)+(3-2r) NE：(r*, q*)=(3/4, 1/4) 二、反应对应法 r q 第三节寻找多重纳什均衡二、反应对应法：情侣博弈先看陈明的最优反应，记为r*=R(q)： π陈明(p陈明, p钟信) =r(4q-1)+2(1-q) r q 0 1 （钟信德语） 1 (陈明德语) 1/4 r*=R(q) 第三节寻找多重纳什均衡二、反应对应法：情侣博弈再看钟信的最优反应，记为q*=R(r)： π钟信(p陈明, p钟信)=q(4r-3)+(3-2r) r q 0 1 （钟信德语） 1 (陈明德语) 1/4 q*=R(r) 3/4 第三节寻找多重纳什均衡二、反应对应法：情侣博弈反应对应曲线有三个交点：三个NE： r*=0, q*=0 纯策略（确定性） r*=3/4, q*=1/4 混合策略（不确定性） r*=1, q*=1 纯策略（确定性） r q 0 1 （钟信德语） 1 (陈明德语) 1/4 3/4 r*=R(q) q*=R(r) 第三节寻找多重纳什均衡二、反应对应法：情侣博弈支付的帕累托优势：初步印象 π陈明=r(4q-1)+2(1-q)，π钟信=q(4r-3)+(3-2r) r*=0, q*=0 纯策略（确定性）双方NE支付: π陈明*=3，π钟信*=2 r*=3/4, q*=1/4 混合策略（不确定性）双方NE支付: π陈明*=3/2，π钟信*=3/2 r*=1, q*=1 纯策略（确定性）双方NE支付: π陈明*=2，π钟信*=3 纯策略纳什均衡比混合策略纳什均衡具有支付优势，这称为帕累托优势如果博弈同时存在纯策略纳什均衡和混合策略纳什均衡，前者往往得到优先考虑第三节寻找多重纳什均衡二、反应对应法：情侣博弈夫妻之争博弈不同均衡概念的关系第四节纳什均衡的存在性严格优势纳什均衡纯策略纳什均衡混合策略纳什均衡弱优势纳什均衡第四节纳什均衡的存在性问题：是否所有的博弈都存在NE（纯的或混合的）？ Nash在1950年证明：任何有限博弈，都至少存在一个NE。纳什定理：在一个由n个博弈方的G=｛S1，…, Sn; u1,…, un｝中，如果n是有限的，且 Si都是有限集，则该博弈至少存在一个纳什均衡，但可能包含混合策略 Wilson（1971）证明，几乎所有有限博弈，都存在有限奇数个NE，包括纯策略NE和混合策略NE。（纯策略）纳什均衡的存在性定理(Debreu,1952；Glicksberg,1952；Fan,1952)：考虑一个n人策略式博弈,如果每个参与人的纯策略空间Si是欧氏空间中的非空、紧（闭而有界）的凸集,支付函数ui(s)连续且对si拟凹,则博弈存在一个纯策略Nash均衡。第四节纳什均衡的存在性例：凹但不连续的支付函数二人博弈：策略空间为S1=S2= (0, 1) 支付函数：反应对应：反应对应曲线： s2 s1 1/3 1/3 s1= s2= 无纳什均衡第四节纳什均衡的存在性问题：是否所有的博弈都存在NE（纯的或混合的）？（纯策略）纳什均衡的存在性定理(Debreu,1952；Glicksberg,1952；Fan,1952)：考虑一个n人策略式博弈,如果每个参与人的纯策略空间Si是欧氏空间中的非空、紧（闭而有界）的凸集,支付函数ui(s)连续且对si拟凹,则博弈存在一个纯策略Nash均衡。（混合策略）纳什均衡的存在性定理 (Glicksberg,1952)：在n人策略式博弈中,如果每个参与人的纯粹策略空间Si是欧氏空间中的非空、紧（闭而有界）的凸集,如果支付函数ui(s)为连续函数,那么博弈至少存在一个混合策略Nash均衡. 第五节多重纳什均衡的筛选一个博弈可能有多个均衡，但仍然存在不稳定性——你预测出现这个纳什均衡，因而有相应选择，我却以为会出现另一个，乃有我的选择，此时的组合可能并不构成纳什均衡博弈论并没有一个一般的理论证明纳什均衡结果一定能出现如何保证纳什均衡出现？一、帕累托优势标准：按照支付大小筛选纳什均衡例：猎人博弈第五节多重纳什均衡的筛选如何保证纳什均衡出现？二、风险优势标准：风险小的NE优先假设概率，比较期望支付大小例：虚拟博弈两个纳什均衡，哪个更优？假设 r=1/2, q=1/2 给定q=1/2：甲采用上策略的期望支付为：9/2+0/2= 甲采用下策略的期望支付为：8/2+7/2= 给定r=1/2：乙采用左策略的期望支付为：9/2+0/2= 乙采用右策略的期望支付为：8/2+7/2= 期望支付越大，风险越小：甲采用下策略，乙采用右策略选择的纳什均衡为：（下策略，右策略）第五节多重纳什均衡的筛选如何保证纳什均衡出现？二、风险优势标准：风险小的NE优先风险偏离损失乘积比较法 1. 甲：单独偏离均衡的损失（1）偏离A的损失：6-5=1 （2）偏离B的损失：4-0=4 2. 乙：单独偏离均衡的损失（1）偏离A的损失：6-5=1 （2）偏离B的损失：4-0=4 3. 风险优势标准方法：偏离A的损失VS偏离B的损失 1×1＜4×4 4. 结论（1）偏离B的损失更大：16 （2）不偏离B 选择的纳什均衡偏离损失更大者为：B,即(下策略，右策略) A B 第五节多重纳什均衡的筛选如何保证纳什均衡出现？二、风险优势标准：风险小的NE优先风险偏离损失乘积比较法 1. 甲：单独偏离均衡的损失（1）偏离A的损失：6-5=1 （2）偏离B的损失：4-0=4 2. 乙：单独偏离均衡的损失（1）偏离A的损失：6-5=1 （2）偏离B的损失：4-0=4 3. 风险偏离损失乘积比较法：偏离A的损失 VS 偏离B的损失 1×1＜4×4 4. 结论（1）偏离B的损失更大：16 （2）不偏离B 选择的纳什均衡偏离损失更大者为：B,即(下策略，右策略) A B 第五节多重纳什均衡的筛选如何保证纳什均衡出现？二、风险优势标准：风险小的NE优先 5. 风险偏离损失乘积比较法的缺陷：例：假设M远远大于m 1. 甲：单独偏离均衡的损失 (1)偏离A的损失： (M-m)-M/2=M/2-m (2)偏离B的损失：M-(M-m)=m 2. 乙：单独偏离均衡的损失 (1)偏离A的损失：0-0=0 (2)偏离B的损失：0-0=0 如果使用风险偏离损失乘积比较法：偏离A的损失VS偏离B的损失 (M/2-m)×0=m×0 一种建议：甲偏离A的损失 VS 甲偏离B的损失 M/2-m>m 选择的纳什均衡为：A, 即(D，L) A B 第五节多重纳什均衡的筛选如何保证纳什均衡出现？二、帕累托优势标准和风险优势标准的关系如果帕累托优势标准和风险优势标准的选择冲突？例：帕累托优势标准法：选择的纳什均衡为A 风险优势标准： 1. 甲：单独偏离均衡的损失 (1)偏离A的损失： 6-5=1 (2)偏离B的损失：4-(-1000)=1004 2. 乙：单独偏离均衡的损失 (1)偏离A的损失：6-5=1 (2)偏离B的损失：4-(-1000)=1004 风险偏离损失乘积比较法：偏离A的损失 VS 偏离B的损失 1×1＜1004×1004 选择的纳什均衡为：B 怎么办？ A B 第五节多重纳什均衡的筛选如何保证纳什均衡出现？三、帕累托优势标准和风险优势标准的关系如果帕累托优势标准和风险优势标准的选择冲突？怎么办？在帕累托优势标准和风险优势标准之间，理论给予帕累托优势标准以优先权，而风险优势只有在局中人面临不知道先哪个均衡好的不确定性时，才变得重要。当一个均衡具有帕累托优势时，局中人一定选择这个均衡，不确定性就不存在了。理性假设与确定性环境有限理性假设与不确定性环境四、聚点均衡 A B 第五节多重纳什均衡的筛选如何保证纳什均衡出现？四、聚点均衡与协调博弈如果帕累托优势标准和风险优势标准都无法使用呢？在现实生活中，参与人可能使用某些被博弈模型抽象掉的信息来达到一个“聚点(focal pount)”均衡。这些信息可能与社会文化习惯、参与人过去博弈的历史等有关。(Schelling, 1960) 性别战：某一方的生日；社会地位提名博弈交通博弈协调博弈存在多个能够进行帕累托排序纳什均衡的博弈(Arifovic,2000; Carlsson &Ganslandt,1998;Straub,1995) 参与人对不同策略组合有相同偏好，如果其他人能够正确地预期，那么在多个纳什均衡中会存在唯一解，即均衡选择依赖参与人之间对博弈进行有充分相似的信念(Crawford &Haller,1990;Crawford,1995）第五节多重纳什均衡的筛选如何保证纳什均衡出现？四、聚点均衡与协调博弈协调博弈协调博弈是“信心博弈”：与囚徒困境相反，每个参与者选择策略A或B，仅仅需要确信对方也会相应地选择A或B。他们不像合作博弈那样需要一个有约束力的契约之类的东西，而是更需要在彼此之间确立一种相互信任的信心行为人之间建立起某种行为或惯例的稳定的均衡模式，此后遇到类似问题都加以遵循，而不需要反复支付信息成本和交易成本只要某种行为模式被广泛接受，并被自觉遵从，就会形成习俗或自发秩序，并且有助于包括参与者在内的所有群体成员，避免无效率的非均衡收益协调博弈的一个问题在于，均衡解具有不确定性和多样性，因此哪种均衡的规则将被选择具有随机特征廉价磋商(Cheap talk) 第五节多重纳什均衡的筛选如何保证纳什均衡出现？四、聚点均衡廉价磋商(Cheap talk) 尽管无法保证磋商会达成一个协议，即使达成协议也不一定会被遵守，但在一些博弈中，事前磋商确实可以使某些均衡实际上出现。例：虚拟博弈中的事前告知例：两人同时给对方打电话重复博弈与学习过程 9，9 0，0 0，0 1，1 R 乙甲 U D L 9，9 0，8 8，0 7，7 R 乙甲 U D L 聚点第五节多重纳什均衡的筛选如何保证纳什均衡出现？四、聚点均衡重复博弈与学习过程假定博弈重复许多次，即使参与人最初难以协调行动，在博弈若干次后，某种特定的协调模式可能会形成，特别地，假定参与人每一轮根据其对手以前的“平均”战略来选择自己的最优战略，博弈可能收敛于一个纳什均衡。以上情况并不保证必然出现纳什均衡五、相关均衡如果参与人可以根据某个共同观测到的信号选择策略，就可能出现使所有参与人受益的相关均衡(Aumann) 参与人可以主动设计某种形式的选择机制，形成制度安排，从而确定最终“好的”纳什均衡第五节多重纳什均衡的筛选如何保证纳什均衡出现？五、相关均衡例：虚拟博弈纳什均衡：不同概率间较好的妥协结果：(下，左) 支付(4,4) 非纳什均衡有什么办法可以使博弈结果接近这个解？合作机制之一：廉价磋商。双方事先一致同意，把决策建立在一个外在于博弈的随机事件的发生上，该事件发生概率为1/2。例如：双方一致同意：甲先到，选择“(上，左) ”；乙先到，选择(下，右) 。双方的期望支付均为5/2+1/2=3，这明显比纳什均衡好。合作机制之二：联合的公开声明第一步：双方事先同时发布两条信息(不知道对方发布什么信息)，比如说以1/2概率随机选择发布“是”或“否”。如果两条信息一致，甲选择“上”，否则选择“下”；两条信息一致，乙选择“左”，否则选择“右” (上，左) 支付(5,1) (下，右) 支付(1,5) (1/2，1/2) 支付(,) 第五节多重纳什均衡的筛选如何保证纳什均衡出现？五、相关均衡例：虚拟博弈纳什均衡：不同概率间较好的妥协结果：(下，左) 支付(4,4) 非纳什均衡有什么办法可以使博弈结果接近这个解？合作机制之二：联合的公开声明第二步：原始博弈的进行。知道了对手公布的信息，决定个人策略结果：双方的期望支付还是5/2+1/2=3 合作机制之三：双方可以私下观察到随机事件的某些方面（收到不公开的相关信号）。三个两两相互独立的事件被假定以等概率发生，例如A、B、C三种信号发生的可能性均为1/3 甲只能观察到A，此时选择“上”，观察到非A（包含B和C），选择“下” 乙只能观察到C，此时选择“右”，观察到非C（包含A和B），选择“左” (上，左) 支付(5,1) (下，右) 支付(1,5) (1/2，1/2) 支付(,) 第五节多重纳什均衡的筛选如何保证纳什均衡出现？五、相关均衡例：虚拟博弈合作机制之三：不公开的相关信号甲只能观察到A，此时选择“上”，观察到非A（包含B和C），选择“下” 乙只能观察到C，此时选择“右”，观察到非C（包含A和B），选择“左” 若信号A发生，为甲观察到，他选“上”；则甲知道C肯定不会发生，乙一定会选择“左” 若信号C发生，为乙观察到，他选“右”；则乙知道A肯定不会发生，甲一定会选择“上” 信号B发生，甲一定选择“下”，乙一定选择“左” 两人的期望支付均为：5/3+1/3+4/3=10/3，已经比较接近4了虚拟博弈的支付区域第五节多重纳什均衡的筛选如何保证纳什均衡出现？五、相关均衡例：虚拟博弈虚拟博弈的支付区域思考：外在于博弈的信号是由谁发出的？ (1,5) (4,4) (10/3,10/3) (5,1) (,) 混合策略NE 纯策略NE 纯策略NE 相关均衡第五节多重纳什均衡的筛选如何保证纳什均衡出现？五、相关均衡某些变量即使与原始博弈无关，也可以影响参与者的决策，而这可能对参与者有利在博弈前的串谋阶段，参与者可以交换信息，观察信号。这些信息和信号代表了那些并不改变原始博弈支付函数的变量，但可以调整参与者在不同策略间做出选择的方式方法这一途径的好处在于它通过各种各样的合作机制而允许在非合作博弈框架下讨论参与者之间某种形式的合作博弈前阶段的沟通机制越复杂，参与者接近最优结果的可能性越大。如果没有这种沟通，参与者只能实现纳什均衡，这实际类似得到了某种退化的“相关均衡” 第五节多重纳什均衡的筛选如何保证纳什均衡出现？五、抗共谋均衡（一）多人博弈中的共谋问题纯策略Nash均衡：(U, L, A) 与(D, R, B) 前者具有Pareto优势，后者具有风险优势不考虑串谋，结果为(U, L, A) 考虑甲、乙串谋取(D, R), 结果为(D, R, A) 第五节多重纳什均衡的筛选如何保证纳什均衡出现？五、抗共谋均衡（二）抗共谋均衡甲、乙有集体偏离(U, L, A)的动机， (U, L, A)是非抗共谋均衡 (D, R, B)缺乏集体偏离的激励，是抗共谋均衡（1）若甲、乙集体偏离，选(U，L，B) -1→-2， -1→-2 （2）若甲、丙集体偏离，选(U，R，A) -1→-5， 5→0 （3）若乙、丙集体偏离，选(D，L，A) -1→-5， 5→0 (4）若甲、乙、丙集体偏离，选(U，L，A) 尽管三个支付都增加，但(U，L，A)又存在甲、乙共谋损害丙的利益，在完全信息假设下丙会考虑到这一点，因此不会与甲、乙共谋第五节多重纳什均衡的筛选如何保证纳什均衡出现？五、抗共谋均衡（三）抗共谋均衡的定义p119 单人无偏离激励双人无共谋偏离激励三人无共谋偏离激励依次类推，直到所有参与人都无共谋偏离激励第五节多重纳什均衡的筛选如何保证纳什均衡出现？五、抗共谋均衡（三）抗共谋均衡的定义p119 抗共谋均衡定义；如果一个博弈的某个策略组合满足下列条件 ⑴ 没有任何参与人的串谋会改变博弈的结果； ⑵ 给定选择偏离的参与人有再次偏离的自由时，没有任何两个参与人的串谋会改变博弈的结果； ⑶ 依次类推，直到所有参与人都参加的串谋也不会改变博弈的结果。则称该策略组合为一个抗共谋均衡。第五节多重纳什均衡的筛选如何保证纳什均衡出现？五、抗共谋均衡（三）抗共谋均衡的定义集体偏离两种集体偏离情形：能够利益维持的集体偏离不能利益维持的集体偏离，会产生再度偏离金无足赤，人无完人人总是要犯错误的，所以要对别人宽容经得起考验的纳什均衡在其他参与人选择了错误策略的情况下，某参与人仍能实现纳什均衡他人不犯错误，你能实现最优；他人犯错误，你仍能实现最优第三节多重纳什均衡的选择标准六、颤抖手精炼均衡 Trembling-hand perfect equilibrium （一）颤抖手某一参与人的非蓄意错误博弈偏离均衡路径的原因一个人用手抓东西时，手一颤抖，就可能抓不住他想抓的东西：非蓄意错误第三节多重纳什均衡的选择标准六、颤抖手精炼均衡（二）颤抖手均衡 1.基本思想给定所有参与人均可能犯错误的情况下，如果某一策略组合仍是每一个参与人的最优策略组合，则实现颤抖手均衡如何理解？第三节多重纳什均衡的选择标准六、颤抖手精炼均衡（二）颤抖手均衡 2.定义: m——mistake n人博弈中，对于每一个博弈方i，存在严格混合策略序列，使下列条件得到满足：（1）尽管每一个博弈方可能犯错误，但错误收敛于零——总有一天能成功穿针引线——功夫不负有心人将一条线穿入针眼，手在不停颤抖，不大可能一下子穿进去但如果试的次数足够大，总是能够成功第三节多重纳什均衡的选择标准六、颤抖手精炼均衡（二）颤抖手均衡 2.定义：m——mistake n人博弈中，对于每一个博弈方i，存在严格混合策略序列，使下列条件得到满足：（2）对于任何可选择的混合策略穿针引线——学会宽容纳什均衡：每一个人都把线穿入针眼宽容：某参与人不能因为其他参与人可能暂时无法把线穿进针眼而故意不把线穿进针眼宽容是一种美德练习：模型化下述划拳博弈：两个老朋友在一起喝酒，每个人有四个纯战略：杠子、老虎、鸡和虫子，输赢规则是：杠子降鸡，鸡吃虫子，虫子降杠子，两人同时出令。如果一个打败另一个，赢的效用为1，输的效用为-1，否则效用为0，写出这个博弈的支付矩阵，这个博弈有纯战略均衡吗？计算其混合战略纳什均衡。 * * * * * * * * * * * * * * * * * * * * * * * * * * * *

联系我们

智库文档公众号

客服微信

社会福利博弈：无纳什均衡.ppt

下载

标签

相关专题

联系我们

意见反馈