智库文档所有分类

策略型博弈概述.pptx.ppt

下载

文件跳动

74页 | 453KB | 0次下载 |

0.0

(0人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

博弈论与信息经济学 Game Theory and Information Economics 第二局部非合作博弈理论第二章策略型博弈第三章扩展型博弈第四章贝叶斯博弈第五章动态贝叶斯博弈主要内容第一节策略型博弈的表示第二节重复剔除严格劣策略均衡第三节纳什均衡第四节混合策略纳什均衡第五节纳什均衡的存在性第二章策略型博弈 ——同时行动，如何决策策略型(标准型〕表述 ——适合表示静态博弈扩展型表述 ——适合表示动态博弈博弈有两种表述方法一、策略型博弈的含义完全信息静态博弈又称为策略型博弈。完全信息是指局中人对自己与其他局中人的所有与博弈有关的事前信息〔策略空间、支付函数等〕有充分的了解(局中人的支付函数是共同知识)。静态博弈是指在博弈中，局中人同时采取行动，或者局中人的行动有先有后，但后行动者不能知道先行动者的行动选择。第一节策略型博弈的表示二、策略型博弈的三个要素： 1、局中人〔Players): 1, 2, …, n； 2、策略〔Strategies): ; 3、支付函数〔Payoff functions) 表示为：第一节策略型博弈的表示 1、有限博弈： (1) 博弈中局中人人数有限; (2) 每个局中人只有有限个策略。 2、零和博弈：博弈中局中人所获支付之和为零，即一方所得为另一方所失。三、两种特殊博弈类型、两种特殊博弈类型 1、局中人：甲，乙 2、策略： {坦白,不坦白} 3、支付函数——支付矩阵〔双人有限博弈〕每个位置上第一个数字表示局中人1在对应的策略组合中得到的支付，第二个数字表示局中人2的相应所获支付。例囚徒困境及其策略型表示囚徒困境及其策略型表示 (Tucker,1950)(Tucker,1950) 乙甲坦白不坦白坦白 -6，-6 -1，-8 不坦白 -8，-1 -2，-2 囚徒困境的支付矩阵乙甲石头剪刀布石头 0，0 1，-1 -1，1 剪刀 -1，1 0，0 1，-1 布 1，-1 -1，1 0，1 例例石头、剪刀、布的支付矩阵石头、剪刀、布的支付矩阵田忌齐王上中下上下中中上下中下上下上中下中上上中下 3，-3 1，-1 1，-1 1，-1 -1，1 1，-1 上下中 1，-1 3，-3 1，-1 1，-1 1，-1 -1，1 中上下 1，-1 -1，1 3，-3 1，-1 1，-1 1，-1 中下上 -1，1 1，-1 1，-1 3，-3 1，-1 1，-1 下上中 1，-1 1，-1 1，-1 -1，1 3，-3 1，-1 下中上 1，-1 1，-1 -1，1 1，-1 1，-1 3，-3 例例田忌赛马的支付矩阵田忌赛马的支付矩阵局中人：男，女策略：男：看足球，看芭蕾女：看足球，看芭蕾支付矩阵：见下一页例性别大战〔battle of the sexes) 女男足球芭蕾足球 3，2 1，1 芭蕾 -1，-1 2，3 性别大战的支付矩阵一、根本思想：如果一个局中人在任何情况下从某种策略中得到的支付均小于从另一种策略中得到的支付，那么显然对他而言，前一种策略劣于后一种策略。从个人利益出发，被剔除的策略不会被局中人采用。从而可以利用剔除严格劣策略的概念来简化博弈局势，可能会得到博弈的解。第二节重复剔除严格劣策略均衡 ,如果存在，对于所有的都有且其中至少有一个为严格不等式，那么称是第i个局中人的一个严格劣策略。二、严格劣策略的定义 1、根据理性的局中人不会选择严格劣策略这一原那么，可以通过重复剔除严格劣策略的方法对博弈进行求解。 2、其方法是：对每个局中人寻找严格劣策略，由于它不会被局中人选择实施，所以找到一种后就可以将其从博弈局势中剔除，从而得到一种新的缩减后的博弈局势，对这种新局势重复上述过程，直到无法找到新的严格劣策略为止。三、重复剔除严格劣策略对局中人甲而言，无论局中人乙采取何种策略，采用“不坦白〞策略得到的支付都小于采用“坦白〞策略。局中人甲的“不坦白〞策略严格劣于“坦白〞策略. “不坦白〞策略都是一种严格劣策略，从而可以剔除。博弈中局中人各自从自身利益出发的理性选择〔博弈均衡解〕就是〔坦白，坦白〕。四、囚徒困境的解、囚徒困境的解乙甲坦白不坦白坦白 -6，-6 -1，-8 不坦白 -8，-1 -2，-2 例囚徒困境的支付矩阵甲：“不坦白〞相对于“坦白〞是严格劣策略乙甲坦白不坦白坦白 -6，-6 -1，-8 乙：“不坦白〞相对于“坦白〞是严格劣策略乙甲坦白坦白 -6，-6 · 例利用重复剔除严格劣策略求解乙甲左中右上 1，0 1，2 0，1 下 0，3 0，1 2，0 · 乙：“右〞相对于“中〞是严格劣策略乙甲左中右上 1，0 1，2 0，1 下 0，3 0，1 2，0 · 甲：“下〞相对于“上〞是严格劣策略乙甲左中上 1，0 1，2 下 0，3 0，1 · 乙：“左〞相对于“中〞是严格劣策略乙甲左中上 1，0 1，2 · 重复剔除严格劣策略均衡是(上,中 ) 乙甲中上 1，2 1、每一步剔除需要局中人间相互了解的更进一步假定，如果我们把这一过程应用到任意多步，需要假定“局中人是理性的〞是共同知识。 2、这一方法对博弈结果的预测经常是不准确的. 五、重复剔除严格劣策略有两个缺陷乙甲石头剪刀布石头 0，0 1，-1 -1，1 剪刀 -1，1 0，0 1，-1 布 1，-1 -1，1 0，0 例例石头、剪刀、布的支付矩阵石头、剪刀、布的支付矩阵利用重复剔除严格劣策略无法求解例利用重复剔除严格劣策略无法求解乙甲左中右上 0，4 4，0 5，3 中 4，0 0，4 5，3 下 3，5 3，5 6，6 大多数的博弈局势中使用剔除严格劣策略的方法能够对博弈局势进行简化，但可能得不到博弈的均衡解。 需要引入非合作博弈理论中的核心概念 ——纳什均衡 (Nash Equilibrium)。六、注意一、纳什均衡的思想 “双赢〞或 “多赢〞第三节纳什均衡它是关于博弈结局的一致性预测如果所有局中人预测一个特定的纳什均衡会出现，那么这种均衡就会出现。只有纳什均衡才能使每个局中人均认可这种结局，而且他们均知道其他局中人也认可这种结局。二、纳什均衡的意义 1、博弈的纳什均衡是这样一种最优策略组合，是一种你好、我好大家都好的理性结局，其中每一个局中人均不能也不想单方面改变自己的策略而增加收益，每个局中人选择的策略是对其他局中人所选策略的最正确反响。三、纳什均衡的定义 2、数学定义：在策略型博弈中，如果对于每个局中人i，存在，都有或那么称策略组合是此博弈G的一个纳什均衡。三、纳什均衡的定义 1、双人有限博弈：双划线法首先对局中人2的每一个策略，局中人1寻找支付最大的策略，在其对应支付下划线；然后对局中人1进行相应的步骤；最后，但凡两个局中人支付下均被划线的结局就是纳什均衡。四、纳什均衡的求法用双划线法可以求出纳什均衡：〔坦白，坦白〕，〔-6，-6〕意义：揭示个人理性与集体理性之间的矛盾。例囚徒困境的纳什均衡乙甲坦白不坦白坦白 -6，-6 -1，-8 不坦白 -8，-1 -2，-2 乙甲坦白不坦白坦白 -6，-6 -1，-8 不坦白 -8，-1 -2，-2 乙甲坦白不坦白坦白 -6，-6 -1，-8 不坦白 -8，-1 -2，-2 局中人：大猪，小猪策略：大猪：按，等待小猪：按，等待支付矩阵：见下一页纳什均衡：〔按，等待〕例智猪博弈〔boxed pigs) 小猪大猪按等待按 5，1 4，4 等待 9，-1 0，0 例智猪博弈的支付矩阵小猪大猪按等待按 5，1 4，4 等待 9，-1 0，0 小猪大猪按等待按 5，1 4，4 等待 9，-1 0，0 女男足球芭蕾足球 3，2 1，1 芭蕾 -1，-1 2，3 例性别大战博弈的支付矩阵女男足球芭蕾足球 3，2 1，1 芭蕾 -1，-1 2，3 女男足球芭蕾足球 3，2 1，1 芭蕾 -1，-1 2，3 局中人：甲，乙策略：甲：放左手，放右手乙：猜左手，猜右手支付矩阵：见下一页没有纳什均衡例猜左右手游戏乙甲猜左手猜右手放左手 -1，1 1，-1 放右手 1，-1 -1，1 乙甲猜左手猜右手放左手 -1，1 1，-1 放右手 1，-1 -1，1 乙甲猜左手猜右手放左手 -1，1 1，-1 放右手 1，-1 -1，1 2、连续性博弈纳什均衡的求法首先求出每个局中人对其他局中人策略组合的反响函数——即在其他局中人策略组合给定时极大化自己的支付，得到的最正确反响策略表现为其他局中人策略组合的函数；然后将这些反响函数联立求解即得到博弈的纳什均衡解。四、纳什均衡的求法局中人：厂商1，厂商2 策略：厂商1：选择产量厂商2：选择产量假设：价格支付函数 (利润函数) ：例两寡头产量竞争Cournot〔1838〕模型 Cournot 模型求解反响函数: 纳什均衡： Cournot 模型求解假设两寡头可以串谋，共同确定产量Q使总利润最大化，利润函数为：(Q)=Q(a-Q-c) 总利润最大的产量为： ——称为契约曲线总利润为：比较及含义：两寡头产量串谋模型 Q1 厂商2的反响曲线纳什均衡契约曲线厂商1的反响曲线 O Q2 图1 反响曲线、纳什均衡与契约曲线局中人：厂商1，厂商2 策略：厂商1选择价格；厂商2选择价格假设: 两寡头固定本钱都为0，边际本钱为常数c, 消费者对厂商1和2生产产品的需求量分别为： ; 例两寡头价格竞争Bertrand〔1883〕模型支付〔利润〕函数：最优化的一阶条件是: Bertrand〔1883〕模型及求解反响函数：纳什均衡价格： Bertrand〔1883〕模型及求解在n个局中人的策略型博弈中， 1、如果重复剔除严格劣策略剔除掉除策略组合s以外的所有策略，那么这一策略组合s为该博弈的唯一的纳什均衡。 2、如果策略组合s是一个纳什均衡，那么它就不会被重复剔除严格劣策略所剔除。纳什均衡是比重复剔除严格劣策略更强的解概念。五、纳什均衡与重复剔除严格劣策略均衡一、举例说明混合策略纳什均衡例猜左右手游戏第四节混合策略纳什均衡乙甲（q）猜左手（1-q）猜右手（p）放左手 -1, 1 1, -1 （1-p）放右手 1, -1 -1, 1 在甲选，乙选这种策略时，他们的期望效用分别为：混合策略与期望效用甲和乙的目标是: 最优化的一阶条件是: 混合策略纳什均衡混合策略纳什均衡为：混合策略纳什均衡 1、混合策略〔mixed Strategy) 局中人 i 的一个混合策略是在其纯策略空间上的一个概率分布，其中是 i 选择策略的概率。局中人 i的混合策略空间是他的所有混合策略构成的集合。纯策略可以理解为混合策略的特例。如等价于二、混合策略纳什均衡在混合策略组合下，局中人 i的期望效用函数为：其中 2、期望效用函数在策略型博弈中，如果对于每个局中人 i，存在，都有或那么称是博弈G的一个混合策略纳什均衡。 3、混合策略纳什均衡奇数定理 (Wilson 1971) ：几乎所有的有限博弈都有奇数个纳什均衡。 4、奇数定理例社会保障博弈局中人：政府和下岗工人策略：政府：救济，不救济下岗工人：找工作，不找工作支付矩阵为：三、应用举例工人政府找工作不找救济 3，2 -1，3 不救济 -1，1 0，0 女男足球芭蕾足球 3，2 1，1 芭蕾 -1，-1 2，3 求出性别大战博弈的混合策略纳什均衡定理1：〔Nash, 1950〕每个有限策略型博弈至少存在一个纳什均衡〔纯策略的或混合策略的〕。第五节纳什均衡的存在性 Brouwer不动点定理：如果X是非空的有界闭凸集， f(x)是X到自身的连续映射，那么至少存在一个xX，使得 f(x)=x，x称为不动点。 Kakutani不动点定理：设f(X)是点集X上的一个集值映射，如果X是非空的有界闭凸集，并且对于所有的xX， f(x)是非空的、凸的且上半连续的，那么至少存在一个xX ，使得 xf(x)，x称为不动点。纳什均衡的存在性证明 1、集值映射：对于集合X上的任何一个点x，如果f(x)给出唯一的一个点yY，那么f(x)称为从X到Y的映射；如果f(x) 给出一个集合f(x)Y，那么f(x)称为从X到Y的集值映射。映射是集值映射的特例。 2、上半连续：设f(x)是X到自身的一个集值映射，如果对于所有的xX和包含f(x)的开集V，都存在x的一个邻域U，使得对于所有的xU，有f(x)V，那么称f(x)是上半连续的。注：集值映射和上半连续定理2：(Debreu, 1952 ; Glicksberg,1952 ; Fan, 1952) 在n人策略型博弈中，如果每个局中人的纯策略空间Si是欧氏空间中的一个非空的有界闭凸集，支付函数ui(s)是连续的且对si 是拟凹的，那么该博弈存在一个纯策略纳什均衡。定理3：(Glicksberg,1952) 在n人策略型博弈中，如果每个局中人的纯策略空间Si是欧氏空间中的一个非空的有界闭凸集，支付函数ui(s)是连续的，那么该博弈存在一个混合策略纳什均衡。定理1的推广：从有限到无限

合作伙伴

文件跳动

关注进入主页

联系我们

智库文档公众号

客服微信

策略型博弈概述.pptx.ppt

下载

合作伙伴

文件跳动

标签

联系我们

意见反馈