博弈论
第二章 同时决策博弈
——静态博弈
第一~二节 复习:博弈要素及表述
一、要素
(一)参与人/局中人/博弈方
i=1,2,…,n; N={1,2,…,n}为局中人集合
(二)策略/行动
1. 策略集:集合
Si={si},局中人i的所有策略
2. 策略组合:向量
s=(s1,…,si,…,sn),所有局中人的某一策略的组合
(三)支付(得益)
1.某人支付:取决于所有人的策略
ui= ui(s)=ui (s1,…,si,…,sn)
2.支付组合:所有人的支付
u=(u1,…,ui,…un)
案例:深更半夜去作案
深更半夜去作案
心惊又胆颤
没有星星和月亮
什么也看不见
偷了一些电脑主机
正在一边笑眯眯
不幸被警察看见了
被请进公安局
第一~二节 复习:博弈要素及表述
二、囚徒困境:经典模型的矩阵表述
要素
参与人:甲,乙
策略
策略集:Si={坦白,抵赖}
策略组合:s=(坦白,坦白);
或s=(坦白,抵赖);或s=(抵赖,抵赖) …
支付
支付:给定策略组合s=(坦白,坦白),u1(s)= u2(s)=-3
支付组合:给定策略组合s=(坦白,坦白),所有人的支付组合为u=(-3,-3)
三、三个局中人博弈的矩阵表述
-3
-3
-5
0
0
-5
-1
-1
坦 白
抵赖
坦 白
抵赖
乙
甲
第一~二节 复习:博弈要素及表述
三、三个局中人博弈的矩阵表述(p36)
如果局中人C选择1
如果局中人C选择2
如果局中人C选择3
3, 3, 3
3, 2, 3
3, 1, 3
2, 3, 3
3, 2, 3
3, 1, 3
1, 3, 3
1, 2, 3
1, 1, 3
局中人B
1 2 3
局中人A
1
2
3
3, 3, 2
3, 2, 2
3, 1, 2
2, 3, 2
6, 6, 6
6, 5, 6
1, 3, 2
5, 6, 6
5, 5, 6
局中人B
1 2 3
局中人A
1
2
3
3, 3, 1
3, 2, 1
3, 1, 1
2, 3, 1
6, 6, 5
6, 5, 5
1, 3, 1
5, 6, 5
9, 9, 9
局中人B
1 2 3
局中人A
1
2
3
第一~二节 复习:博弈要素及表述
四、矩阵型(正规型、策略型)博弈的数学描述
例:古诺竞争
Si={qi; qi ≥ 0}
哪个策略为最优?——诸多策略中的优势策略
第二章 同时决策博弈
第二~四节 优势策略与优势策略均衡
第二~四节 优势策略与优势策略均衡
一、优势策略:占优策略
无论其他参与人选择什么策略,某参与人的某策略产生的支付高于(至少不低于)自己的其他策略产生的支付——此策略为优势策略
严格优势策略
弱优势策略:ui(si*, s-i)至少不低于ui(si’, s-i)
二、寻找优势策略:定义法
第二~四节 优势策略与优势策略均衡
二、寻找优势策略:定义法
经典博弈:囚徒困境
比较甲的两种策略的支付: (-3,0) >(-5,-1)
坦白 抵赖
“坦白”是甲的(严格)优势策略
三、优势策略均衡
-3
-3
-5
0
0
-5
-1
-1
坦 白
抵赖
坦 白
抵赖
乙
甲
第二~四节 优势策略与优势策略均衡
三、优势策略均衡
优势策略组合:一个博弈中,某策略组合的所有策略都是各参与人各自的优势策略
特征:博弈中的稳定结果
优势策略均衡:由所有局中人优势策略组成的策略组合
四、寻找优势策略均衡:严格劣势策略逐次消去法
第二~四节 优势策略与优势策略均衡
四、寻找优势策略均衡:严格劣势策略逐次消去法
经典博弈:囚徒困境
对于甲, “抵赖”为劣势策略
对于乙, “抵赖”仍为劣势策略
优势策略均衡为: (坦白,坦白)
对囚徒困境的进一步讨论
-3
-3
-5
0
0
-5
-1
-1
坦 白
抵赖
坦 白
抵赖
乙
甲
-3
-3
-5
0
坦 白
抵赖
坦 白
乙
甲
-3
-3
坦 白
坦 白
乙
甲
第二~四节 优势策略与优势策略均衡
四、寻找优势策略均衡:严格劣势策略逐次消去法
经典博弈:囚徒困境
对囚徒困境的进一步讨论
囚徒困境的性质
对个人而言最优的策略(低价),对集体而言非最优
个人理性和集体理性的矛盾
个人的“最优策略”使整个“系统”处于不利的状态
思考:为什么会造成囚徒困境
是否由于“通讯”问题造成了囚徒困境?
“要害”是否在于“利己主义”即“个人理性”?
是否囚徒困境的结果就一定不利?
解决囚徒困境问题的“出路”
第二~四节 优势策略与优势策略均衡
四、寻找优势策略均衡:严格劣势策略逐次消去法
经典博弈:囚徒困境
对囚徒困境的进一步讨论
囚徒困境的性质
思考:为什么会造成囚徒困境
解决囚徒困境问题的“出路”
人类自私的天性,使他们陷入“囚徒困境”,难以自拔
解决个人理性和集体理性之间冲突的办法不是否认个人理性,而是设计一种机制,在满足个人理性的前提下达到集体理性
囚徒困境的效果在不同情况下对社会而言可能是“负面”的,也可能是“正面”的。
一个抽象案例
公明博弈
第二~四节 优势策略与优势策略均衡
四、寻找优势策略均衡:严格劣势策略逐次消去法
经典博弈:囚徒困境
一个抽象案例
公明博弈
局中人2
局
中
人
1
L
C
R
T
0
1
3
1
0
3
M
2
0
1
0
0
3
B
2
0
4
2
3
5
第五~十一节 纳什均衡
一、案例:情侣博弈
(一)矩阵
Candy
足球 芭蕾
足球
John
芭蕾
(二)划线法求解博弈的均衡
1.给定John看足球(第一行) 给定John看芭蕾(第二行)
Candy选择:足球(1>0) Candy选择:芭蕾(2>-1)
2.给定Candy看足球(第一列) 给定Candy看芭蕾(第二列)
John 选择:足球(2>-1) John 选择:芭蕾(1>0)
2,1
0,0
-1,-1
1,2
两情若是久长时,珍惜朝朝暮暮
第五~十一节 纳什均衡
一、案例:情侣博弈
(一)矩阵
(二)划线法求解博弈的均衡
(三)相对优势策略均衡:
(足球,足球)
(芭蕾,芭蕾)
第五~十一节 纳什均衡
(四)节外生枝:情人单独改变策略
1. 分析:(足球,足球)均衡
(1)John单独改变策略→(芭蕾,足球)
(2,1)→(-1,-1):不可取
(2)Candy单独改变策略→(足球,芭蕾)
(2,1)→(0,0):不可取
2. 分析:(芭蕾,芭蕾)均衡
(1)John单独改变策略→(足球,芭蕾)
(1,2)→(0,0):不可取
(2)Candy单独改变策略→(芭蕾,足球)
(1,2)→(-1,-1):不可取
第五~十一节 纳什均衡
二、情侣博弈的结论:纳什均衡
如果存在一个策略组合(足球,足球),当参与人单独改变策略后,支付下降,此策略组合为纳什均衡
——博弈各方相互作用的稳定结局
三、纳什均衡
(一)纳什均衡的含义:给定别人战略情况下,没有任何单个参与人有积极性选择其他战略,从而没有人有积极性打破这种均衡
给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略
(二)纳什均衡的形式化定义
第五~十一节 纳什均衡
三、纳什均衡
(二)纳什均衡的形式化定义
策略空间:S1, …,Sn
局中人i的策略:si∈Si; 博弈方i的优势策略:si*∈Si
局中人i的得益: ui (s)= ui (s1,…,sn)=ui(si,s-i) ,-i代表其他局中人
博弈:G={S1, …,Sn; u1,…,un}
定义:在博弈 G={S1, …,Sn; u1,…,un}中,如果由各个博弈方的各一个策略组成的某个策略组合s*= (s*1,…,s*n ) 中,任一局中人 i的策略s*i,都是对其余局中人策略组合 (s*1,…, s*i-1, s*i+1, …, s*n )的最佳对策,也即:
ui(s*1,…, s*i-1, s*i, s*i+1, …, s*n) ≥ ui(s*1,…, s*i-1, si, s*i+1, …, s*n )
或:ui(si*,s-i*) ≥ ui(si,s-i*)
对任意si∈Si都成立,则称s*=(s*1,…,sn*) 为博弈 G的一个纳什均衡
(三)纳什均衡的一致预测性质
第五~十一节 纳什均衡
三、纳什均衡
(三)纳什均衡的一致预测性质
一致预测性:如果所有局中人都预测一个特定的博弈结果会出现,那么所有局中人都不会利用该预测或这种预测能力选择与预测结果不一致的策略,即没有哪个局中人有偏离这个预测结果的愿望,因此这个预测结果会成为博弈的最终结果
只有纳什均衡才具有一致预测的性质
一致预测性是纳什均衡的本质属性
(四)寻找纳什均衡
1、(严格、弱)劣势策略逐次消去法
2、相对优势策略划线法 离散策略求解方法
3、箭头指向法
4、连续策略微分法 连续策略求解方法
第五~十一节 纳什均衡
三、纳什均衡
(四)寻找纳什均衡
1、(严格、弱)劣势策略逐次消去法
双方存在占优策略:囚徒困境
用于解释:军备竞赛
交通拥挤、公共资源滥用
彩电价格战
团队生产中的偷懒
小学生“减负”与各学校的高考加班补习
一方存在占优策略而另一方没有占优策略:智猪博弈
第五~十一节 纳什均衡
三、纳什均衡
(四)寻找纳什均衡
1、(严格、弱)劣势策略逐次消去法
一方存在占优策略而另一方没有占优策略:智猪博弈
猪圈里圈两头猪:大猪和小猪。猪圈的一头有一个猪食槽,另一头安装一个按钮控制着猪食的供应。按一下按钮会有10单位猪食进槽,但谁按按钮谁就需要付2单位成本。若大猪先到,大猪吃9单位,小猪只能吃1单位;若同时到,大猪吃7单位.小猪吃3单位;若小猪先到,大猪吃6单位,小猪吃4单位。
纳什均衡:(按,等待)
解释:
-大股东监督,小股东搭便车
-富人修路,穷人受益(公共品提供中的搭便车)
-大公司开发,小公司仿造(新产品开发中的搭便车)
-小酒馆开在大酒店旁边,小商场开在大商场旁边
第五~十一节 纳什均衡
三、纳什均衡
(四)寻找纳什均衡
1、(严格、弱)劣势策略逐次消去法
劣势策略逐次消去法的一个值得注意的问题
例:顺序一
顺序二
2,12
1,10
1,12
0,12
0,10
0,11
0,12
0,10
0,13
C2
R1
R2
C1
C3
R3
2,12
1,10
1,12
0,12
0,10
0,13
C2
R1
R3
C1
C3
2,12
1,12
C3
R1
C1
2,12
1,10
1,12
0,12
0,10
0,11
0,12
0,10
0,13
C2
R1
R2
C1
C3
R3
2,12
1,12
0,12
0,11
0,12
0,13
R1
R2
C1
C3
R3
2,12
1,12
0,12
0,13
R1
R3
C1
C3
1,12
0,13
R1
R3
C3
第五~十一节 纳什均衡
三、纳什均衡
(四)寻找纳什均衡
1、(严格、弱)劣势策略逐次消去法
劣势策略逐次消去法的一个值得注意的问题
优势策略均衡结果与劣势策略的剔除顺序是否有关取决于剔除的是否是严格劣势战略。会产生漏解的可能
因此,这种情况下使用下面第二个方法可能更有效
优势策略均衡必然是纳什均衡,纳什均衡未必是优势策略均衡
命题1:在n个博弈方的博弈 G={S1, …,Sn; u1,…,un}中,如果劣势策略逐次消去法排除了除s*= (s*1,…,s*n ) 之外的所有策略组合,那么s* 一定是该博弈的惟一纳什均衡
命题2:在n个博弈方的博弈中G={S1, …,Sn; u1,…,un}中,如果s*= (s*1,…,s*n )是G 的一个纳什均衡,那么劣势策略逐次消去法一定不会将它消去,但没有被消去的组合不一定是纳什均衡,除非它是唯一的(不适用于弱势劣战略的情况)
第五~十一节 纳什均衡
三、纳什均衡
(四)寻找纳什均衡
1、(严格、弱)劣势策略逐次消去法
2、相对优势策略划线法
双方都没有占优策略。划线法用于寻找各种可能情况下的最优策略反应
猜硬币:猜对,猜者赢一元,反之则反
无纯策略纳什均衡
博弈可能有几个纳什均衡,也可能没有纳什均衡
斗鸡博弈
第五~十一节 纳什均衡
三、纳什均衡
(四)寻找纳什均衡
2、相对优势策略划线法
斗鸡博弈:双方都进,则两败俱伤,均获得-2的支付 。一方退,另一方进,进方获胜,获得1的支付,退方很丢面子,获得-1的支付,但没有两者同进受到的损失大 。双方都退,均输掉面子,获得-1的支付。
两个纳什均衡:一方进,另一方退。但关键是谁进谁退?
有惟一的纳什均衡点的博弈是可预测的:事先就能知道惟一的博弈结果
多重纳什均衡点,无法预测结果
现实中的斗鸡博弈
第五~十一节 纳什均衡
三、纳什均衡
(四)寻找纳什均衡
2、相对优势策略划线法
斗鸡博弈
现实中的斗鸡博弈
成绩博弈:一方重视,另一方不在乎
游击战:敌进我退、敌退我进,打得赢就打、打不赢就跑
村子里有两户富户修路:一家修,另一家就不修;一家不修,另一家就得修。
冷战期间美苏抢占地盘:一方抢占一块地盘,另一方就占另一块。
夫妻吵架,一方厉害,另一方就出去躲躲
第五~十一节 纳什均衡
三、纳什均衡
(四)寻找纳什均衡
2、相对优势策略划线法
军备竞赛:
纳什均衡:(扩军,扩军)
里根总统的地位为什么高?
——“星球大战”计划拖垮苏联经济
2000:军费支出
-∞:丧失主权
8000:掠夺者赢利
0:军费支出为零,和平共处
第五~十一节 纳什均衡
三、纳什均衡
(四)寻找纳什均衡
2、相对优势策略划线法
找出下列两队夫妻的纳什均衡
2,2
-6,0
0,-6
0,0
死了
恩爱夫妻
活着
死了
活着
0,0
6,0
0,6
0,0
死了
妻子
相互仇恨夫妻
活着
死了
活着
妻子
丈夫
丈夫
第五~十一节 纳什均衡
三、纳什均衡
(四)寻找纳什均衡
3、箭头指向法(p53)
囚徒困境
(抵赖,抵赖)
给定乙不变,甲改变:-1→0(箭头向上)
给定甲不变,乙改变:-1→0(箭头向左)
(坦白,抵赖)
给定乙不变,甲也不变
给定甲不变,乙改变:-5→-3
要点:(1)箭头指向的支付大;(2)只有一方单独改变策略
第五~十一节 纳什均衡
三、纳什均衡
(四)寻找纳什均衡
3、箭头指向法
囚徒困境
(抵赖,坦白)
给定乙不变,甲改变:-5→-3(箭头向上)
给定甲不变,也乙改变
(坦白,坦白)
给定乙不变,甲也不变
给定甲不变,乙也不变
纳什均衡:(坦白,坦白)——只有箭头指向,没有箭尾指向
情侣博弈
第五~十一节 纳什均衡
第五~十一节 纳什均衡
三、纳什均衡
(四)寻找纳什均衡
3、箭头指向法
试一试:行路博弈
第五~十一节 纳什均衡
三、纳什均衡
(四)寻找纳什均衡
4、连续策略微分法(p58)
连续情形纳什均衡的一阶必要条件:
要求支付函数ui (s)= ui (s1,…,sn)=ui(si,s-i)是可微的多元函数
某个策略组合s*= (s*1,…,s*n )是纳什均衡
连续情形纳什均衡的二阶充分条件
某个策略组合s*= (s*1,…,s*n )是上式的惟一解,且满足
则s*是纳什均衡
例,
第五~十一节 纳什均衡
三、纳什均衡
(四)寻找纳什均衡
4、连续策略微分法(p58)
(1)找到支付函数
(2)使用一阶必要条件求出纳什均衡的“候选解”
(3)验证“候选解”是否满足纳什均衡的二阶微分充分条件
例(一个纳什均衡的“候选解”)
例(两个纳什均衡的“候选解”)
(五)纳什均衡在微观经济学中的应用
诺贝尔经济学奖获得者萨缪尔森有一句话:你可以将一只鹦鹉训练成一个经济学家,因为它只需要学习两个词:供给和需求。
博弈论专家坎多瑞引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,就是“纳什均衡”。
第五~十一节 纳什均衡
三、纳什均衡
(五)纳什均衡在微观经济学中的应用
1、古诺模型(p63):价格博弈
博弈三要素:
(1)参与人:企业1、企业2
(2)策略:q1≥0,q2≥0, q=q1+q2, q=a-p(a:市场总容量)
qi q p ui, 博弈
(3)支付:i(q1, q2)=pqi-ciqi=(a-q1-q2)qi-ciqi
企业i的目标:π1=?,π2=?
企业利润最大化的一阶、二阶条件
纳什均衡
q1
q2
R1(q2)
R2(q1)
NE
O
q1*
q2*
第五~十一节 纳什均衡
三、纳什均衡
(五)纳什均衡在微观经济学中的应用
1、古诺模型(p63):产量博弈
纳什均衡:解关于q1和q2的二元一次方程组
结论:囚徒困境
双寡头市场产量比垄断市场高、价格和利润比垄断市场价格低
电力业、电信业等
2、伯川德模型(p65):产量博弈
第五~十一节 纳什均衡
三、纳什均衡
(五)纳什均衡在微观经济学中的应用
2、伯川德模型(p65):价格博弈
博弈三要素:
(1)参与人:企业1、企业2
(2)策略:p1≥0,p2≥0, qi(pi, pj)=a-pi+bpj, a, b>0
(3)支付:i(pi, pj)=piqi-cqi=(a-pi+bpj)(pi-c)
企业i的目标:π1=?,π2=?
企业利润最大化的一阶、二阶条件
纳什均衡
第五~十一节 纳什均衡
三、纳什均衡
(五)纳什均衡在微观经济学中的应用
2、伯川德模型(p65):产量博弈
纳什均衡:解关于p1和p2的二元一次方程组
价格竞争结果
P1 > P2时,1得全部市场
P2 > P1时,2得全部市场
P1= P2时,两人平分市场