博弈论及其应用
第3章 纳什均衡的扩展与精炼
第3章 纳什均衡的扩展与精炼
主要内容:
§ 不完全信息的静态博弈
§ 完全且完美信息动态博弈
§ 重复博弈
§ 不完全信息的动态博弈
§ 不完全信息的静态博弈
§ 不完全信息博弈与海萨尼转换
§ 规范式表述和贝叶斯纳什均衡
§ 贝叶斯静态博弈的典型模型
§ 不完全信息博弈与海萨尼转换
不完全信息的含义与形式
海萨尼转换
例 不完全信息的行业博弈
不完全信息的含义
不完全信息博弈中的不完全信息具有特定含义,它专指一种博弈局势中局中人对其他局中人与该种博弈局势有关的事前信息了解不充分,而不是博弈中产生的与局中人实际策略选择有关的信息。这里所谓的事前信息是指关于在博弈实际开始之前局中人所处地位或者状态的信息,这种地位与状态对于博弈局势会产生影响。
不完全信息的形式
博弈中的不完全信息具有多种形式,如局中人对其他局中人(或自己)所掌握的自然资源、人力资源、商业经验、决策能力的了解不充分,对其他局中人偏好与品位的了解不完全,对其他局中人可用策略的了解不完全。对处于同一种博弈局势的局中人的具体数目了解不完全,等等。在理论上,这些多种多样的不完全信息情形在博弈论分析中可以统归为一种不完全信息:局中人对其他局中人的支付函数的不完全了解。
静态博弈中的不完全信息
※ 静态博弈中的不完全信息
在静态博弈中,我们把各种不完全信息归结为对对局中人的各种不同的类型。若局中人对参加博弈的每一个局中人的类型都了解,则对各个局势(即策略组合)下的收益(支付函数)就知道了。
※ 对这种设想,我们引入海萨尼转换。
海萨尼转换
(1)引入一个虚拟的局中人——“自然”(nature)或者说是“上帝”(God),他不用考虑自己的得失,他的唯一作用就是赋予博弈中各局中人的类型向量
其中 属于可行类型空间 ( 为局中人的特征的完备描述);
(2)自然只把局中人 i 的真实的类型 告诉局中人i 本人,却不让其他局中人知道。但“自然”将把在
上的概率分布 告诉每一个局中人;
海萨尼转换(续)
(3)所有局中人同时行动,局中人 i 从自己的策略空间 中选择策略 ;其中局中人 的策略空间
与局中人 的类型有关,一般记为
(4)各局中人除“自然”外的支付函数为
例 不完全信息的行业博弈
假定行业内有一个在位者(局中人1)和一个潜在的进入者(局中人2)。局中人1 决定是否在某地建立一个新工厂,同时局中人2 决定是否在该地进入该行业。假定局中人2不知道局中人1建厂的成本是高还是低,但局中人1自己知道。这个博弈的收益如下表所示。局中人2的收益取决于局中人1是否建厂,而不是直接取决于局中人1的成本。当且仅当局中人1不建厂时,局中人2进入才有利可图。
例 不完全信息的行业博弈(续)
例 不完全信息的行业博弈(续)
在这个例子中,进入者似乎是在与两个不同的在位者博弈,一个是高成本的在位者,另一个是低成本的在位者。一般地,如果在位者有T种可能的不同成本函数,进入者就似乎是在与T个不同的在位者博弈。在1967年以前,博弈论专家认为这样的不完全信息博弈是没法分析的,因为当—个局中人并不知道他在与谁博弈时,博弈的规则是没有定义的。直到1967年,海萨尼提出了海萨尼转换解决了这个问题。
例 不完全信息的行业博弈(续)
有了海萨尼转换,我们知道在例中,自然决定了局中人Ⅰ有两种类型,“高成本”和“低成本”。自然决定了局中人Ⅱ有一种类型。若局中人Ⅰ属于“高成本”类型,而局中人Ⅱ只有一种类型,则构成表中左边一个标准的完全信息下的静态博弈。若局中人Ⅰ属于“低成本”类型而局中人Ⅱ只有一种类型,则构成表中左边一个标准的完全信息下的静态博弈。局中人Ⅰ知道自己的类型,而局中人Ⅱ则不知道局中人Ⅰ的类型,但两个局中人对“自然”决定的局中人Ⅰ的类型的概率分布具有一致的判断。不妨设 , 。下节讨论
§规范式表述和贝叶斯纳什均衡
定义 不完全信息的静态博弈
定义 贝叶斯纳什均衡
贝叶斯纳什均衡与一般纳什均衡的区别
不完全信息的静态博弈定义
不完全信息静态博弈包括如下4个要素。
局中人集合 。
每个局中人有个类型空间 。以及在全体类型空间 上的概率分布 。
每个局中人有(与自身的类型 相关的)策略集
且策略集 与其它局中人的类型无关 。
每一个局中人都有其收益函数 ,即收益函数不仅依赖于策略组合 ,也依赖于自身的类型 。
不完全信息的静态博弈定义(续)
以上4个因素都是共同知识。局中人在以上情况下同时选择策略以追求自身收益最大化。
这种博弈称为不完全信息的静态博弈,也称为贝叶斯静态博弈,记为
贝叶斯纳什均衡的定义
在贝叶斯静态博弈 中,若
是一个策略组合,且对每一个 和
都有:
()
则称策略组合 是一个贝叶斯纳什均衡。
混合策略贝叶斯纳什均衡的定义
在贝叶斯静态博弈 中,若
是一个策略组合,且对每一个 和 都有:
()
则称混合策略组合 是一个混合策略贝叶斯纳什均衡。
这里的 E 是指对混合策略 下局中人 i 的收益u i 期望。
混合策略下贝叶斯纳什均衡的定理
在贝叶斯静态博弈 中, 是混合策略组合贝叶斯纳什均衡的充分必要条件为:
对每一个 和 都有:
这里的s i 是局中人i的一个纯策略,即特殊的混合策略(0,…,0,1,0,…,0)。
贝叶斯纳什均衡与一般纳什均衡的不同点
(1)贝叶斯纳什均衡用贝叶斯公式得到的,以概率分布作为依据,考虑自己的期望收益。贝叶斯静态博弈中的期望收益是对其它局中人不同类型下的期望收益,而不是自己类型下的期望收益。
(2)贝叶斯纳什均衡研究的是局中人的策略选择,并且这种策略选择依赖于自身的类型,当类型不同时,它们选择的策略就不一样。
贝叶斯纳什均衡存在性
定义只给出了贝叶斯纳什均衡的定义,但未给出在什么条件下贝叶斯纳什均衡一定存在。类似于完全信息静态博弈中纯策略纳什均衡的存在性讨论,我们给出下面一些概念和定理。
贝叶斯纳什均衡存在性(续)
在第二章定义中,我们定义了拟凹函数。显然,一个凹函数一定是拟凹函数。
贝叶斯纳什均衡存在性(续)
贝叶斯纳什均衡存在性(续)
贝叶斯纳什均衡存在性(续)
贝叶斯纳什均衡存在性(续)
贝叶斯纳什均衡存在性(续)
将定理和定理相比较,显然定理的条件更强些。其原因在于在贝叶斯博弈中,局中人 的收益是纯策略下的期望收益(见)或局中人 的收益函数 可以随着类型的变化而变化。当 是 的凹函数,则其凸组合 也是 的凹函数,这就保证了贝叶斯纳什均衡点的存在。但是若 是拟凹函数,则它的凸组合不能保证是拟凹函数。
贝叶斯纳什均衡存在性(续)
上面讨论都是对贝叶斯博弈在纯策略的情况下介绍的。类似于完全信息静态博弈,我们也对局中人的策略集是有限情况下讨论其混合策略。
贝叶斯纳什均衡存在性(续)
贝叶斯纳什均衡存在性(续)
在贝叶斯静态博弈 中,若
是一个混合策略组合,且对每一个
和对任意的 都有
则称混合策略组合 是一个混合策略下的贝叶斯纳什均衡。
贝叶斯纳什均衡存在性(续)
定义显然是对定义在混合策略下的一种直接扩展。对混合策略下的贝叶斯纳什均衡的存在性,有类似于完全信息下静态博弈中的两个定理。
贝叶斯纳什均衡存在性(续)
定理 在贝叶斯静态博弈 中,
是 的一个混合策略下的贝叶斯纳什均衡的充分必要条件是:对每一个局中人和每一个纯策略 有:
该定理的作用也与定理一样,通过有限的纯策略
的比较,去验证或者是去求解混合策略下的贝叶斯纳什均衡。
贝叶斯纳什均衡存在性(续)
定理 在贝叶斯静态博弈中,必有混合策略下的贝叶斯纳什均衡。
下面,我们对例进行正式的求解讨论。由于纯策略的贝叶斯纳什均衡包含在混合策略下的贝叶斯纳什均衡之中,我们采用定义和定理进行求解讨论。
例
在位者(局中人1)有两种类型, 代表高成本, 代表低成本及在位者(局中人2)只有1种类型, 。若自然决定了局中人类型上的概率分布为
例(续)
设局中人1在高成本时 。 代表建厂, 表示不建厂。局中人1此时采用 策略的概率为 ,采用策略 的概率为 , 。局中人1在低成本时, 代表建厂, 代表不建厂。局中人1此时采用策略 的概率为 ,采用策略策略 的概率为 , 。
例(续)
局中人2只有一种类型, , 代表进入, 代表不进入。局中人2此时采用策略 的概率为 ,采用策略 的概率为 , 。局中人1在高成本时期望收益记为 ,在低成本时的期望收益为 ,局中人2的期望收益记为 。
例(续)
由()式有:
例(续)
设 是混合策略下的贝叶斯纳什均衡,由定理,应满足下列不等式
化简
例(续)
由以化简所得不等式可进一步得其等价关系为:
例(续)
由以上不等式组(I),只能得到 。将 带入不等式组 有:
例(续)
为求解不等式组 和
类似双矩阵博弈的求解方法
可以作图:
在图中,满足不等式组 和
不等式组 的
解为A点和BC线段。
因此,原博弈的贝叶斯纳什均衡集为:
例(续)
以上混合策略贝叶斯纳什均衡包含两个纯策略贝叶斯纳什均衡。
(1)在位者为高成本和低成本都不建厂,而进入者建厂。
(2)在位者为高成本时不建厂,为低成本时建厂,而进入者不建厂。
另有无穷多个组合策略下的贝叶斯纳什均衡:在位者为高成本时不建厂,为低成本时建厂,进入者以 的概率进入,以 的概率不进入, 。
例(续)
读者可以验证,以上的贝叶斯纳什均衡与在考虑在位者为高成本时,只考虑在位者是低成本与进入者之间的双矩阵博弈纳什均衡是有差异的,其原因在于在位者为高成本时的策略选择对进入者是有威慑作用的。
§ 贝叶斯静态博弈的应用
※ 例不完全信息下的古诺模型
※ 例 酒商与顾客的博弈
※ 例独立私人价值下的一级密封拍卖
※ 例双向拍卖
不完全信息下的古诺模型
设市场上有1、2两个厂商,生产同一种产品。厂商1、2生产的商品的数量分别为 和 。他们有不同的不变边际成本。厂商1的边际成本为 ,厂商2有两种边际成本,低成本为
高成本为 。但厂商2的边际成本是低成本还是高成本,只有厂商2自己知道,厂商1不知道。即厂商2有自己成本的私人信息。厂商1对厂商2的成本是高还是低有一个判断信念,即高成本的可能性为 ,低成本的可能性为 ,这里假定 。这个判断信念得到厂商1和厂商2的共同认同。同时,市场的逆需求函数 。 是大于边际成本的一个常数,这里取 。两个厂商在没有任何协议和约定的情况下,同时分别决定生产产量,以追求市场利润最大化。
古诺模型的求解
按照对不完全信息博弈海萨尼转换的方法,可以视为“自然”决定厂商类型,厂商1有1种类型,厂商2有两种类型 , 表示低成本, 表示高成本。自然将厂商2的类型通知了厂商2,并且给出了在类型空间上的概率分布: 。 是一个确定常数,这里取 。
该博弈的局中人集 ,厂商的策略空间 与例一样。
古诺模型的求解(续)
这时厂商2在低成本类型下生产 时的收益函数为:
()
厂商2在高成本类型 生产 时的收益函数为:
()
厂商1只有一种类型,而对厂商2的两种类型,由()式,它生产的期望收益为:
()
古诺模型的求解(续)
显然,上述三个函数对自身变量
都是凹函数,分别求 、
并令为0,有
求解有:
即厂商1生产产量为 ,厂商2在低成本类型时生产产量为 ,在高成本类型时生产产量为 。
()
古诺模型的求解(续)
将题中给的具体数字 :
代入()式 有:
再代回到()()和()式 有
例 酒商与顾客的博弈
有一商人到某城镇去卖酒。该商人可能是诚实的,卖出的酒是好酒。也可能是不诚实的,卖出的酒掺了假。他有两个策略,一是加强宣传卖高价,一是一般卖出只卖低价。而该城镇中的消费者也有两类,一类是有饮酒的嗜好,一类无此嗜好。消费者对所卖的酒也有两个策略:一是买酒,一是不买酒。商人不知道来买酒的消费者是有嗜好还是无嗜好的;而消费者也不知道商人是诚实还是不诚实的,各种情况下商人和消费者的效用值如下表。
例 酒商与顾客的博弈
低价
低价
高价
高价
不诚实
(A 2)
诚实
(A 1)
-2,-4
2,4
-2,-4
2,5
不买酒
买酒
不买酒
买酒
无 嗜 好(B 2)
有 嗜 好(B 1)
-1,0
1,0
-1,1
1,0
-3,1
4,-3
-3,0
4,-3
-4,0
3,2
-4,-2
3,3
酒
商
消 费 者
酒商与顾客的博弈求解
显然商人的类型有两种 ,诚实记为 ,不诚实记为 ,而消费者类型也有两种 ,有嗜好的消费者记为 ,无嗜好的消费者记为 。并记商人的策略集为 ,高价卖酒记为 ,低价卖酒记为 ,并记消费者的策略集为 买酒记为 不买酒记为 。
根据该城镇历年来的记载有如下的情况:
嗜酒者遇到诚实商人的概率为:
嗜酒者遇到不诚实商人的概率为:
不嗜酒者遇到诚实商人的概率为:
不嗜酒者遇到不诚实商人的概率为:
那么商人和消费者各自采取什么策略呢?
酒商与顾客的博弈求解(续)
酒商与顾客的博弈求解(续)
根据贝叶斯法则
同理有
酒商与顾客的博弈求解(续)
设酒商在类型为 时混合策略为
在类型为 时混合策略为
设消费者在类型为 时的混合策略为
在类型为 时的混合策略为
从表可知,酒商为类型 时,面对两种类型的消费者,其收益矩阵分别是:
酒商与顾客的博弈求解(续)
在上述规定下的混合策略,酒商为类型 时的期望收益为:
由定理, 是贝叶斯纳什均衡的充分必要条件为:
酒商与顾客的博弈求解(续)
上面两个不等式的等价不等式组为
酒商为类型 时,面对两种类型消费者,其收益矩阵分别是:
酒商与顾客的博弈求解(续)
在上述规定的混合策略下,酒商为类型 时的期望收益:
由定理, 是贝叶斯纳什均衡的充分必要条件
为:
酒商与顾客的博弈求解(续)
上面两个不等式的等价不等式组为
消费者为类型 时,面对两种类型的酒商,其收益矩阵分别为:
酒商与顾客的博弈求解(续)
在上述规定的混合策略下,消费者为类型 时的期望收益
是贝叶斯纳什均衡的充分必要条件为
酒商与顾客的博弈求解(续)
上面两个不等式的等价不等式组为:
消费者类型为 时,面对两种类型的酒商,其收益矩阵分别是:
酒商与顾客的博弈求解(续)
在上述规定的混合策略下,消费者为类型 的期望收益
是贝叶斯纳什均衡的充分必要条件为
酒商与顾客的博弈求解(续)
上面两个不等式的等价不等式组为
若 是该博弈的贝叶斯纳什均衡,其充分必要条件是满足由(I)、(II)、(III)和(IV)组成的不等式组。对应这4个不等式组联合求解,可以采取如下方法进行。
酒商与顾客的博弈求解(续)
先将 可能的9种组合情况分别列出:
然后就这9种组合情况分别讨论是否有符合不等式组(I)、(II)、(III)和(IV)都成立的共同解。
酒商与顾客的博弈求解(续)
对第(1)种组合情况: 。此时由不等式组(III)和(IV)可知,此时只有 ,但 不满足不等式组(I)中:当
由此可以排除第(1)种组合情况。
对第(5)种组合情况: 这时由不等式组(I)和(II),要求 和 满足
但上面方程组解为: 。显然不符合要求。由此可以排除第(5)种组合情况。
酒商与顾客的博弈求解(续)
以上9种组合情况中,1、3、4、5、6、7、8都可以排除。
考察组合情况(2):
由不等式组(III)和(IV),只能是
综合考察
对不等式组(I)、(II)、(III)和(IV)都满足。
因此,由
可以组成贝叶斯纳什均衡。
酒商与顾客的博弈求解(续)
考察组合情况(9):
由不等式组(IV)可知,
再返回到不等式组(I),只有
和 满足不等式组(I)和(II)
再将和放到不等式组(III)中,则要求
综合考察:
对不等式组(I)、(II)、(III)和(IV)均满足,
因此 可以组成贝叶斯纳什均衡。
酒商与顾客的博弈求解(续)
综上所述,该博弈的贝叶斯纳什均衡为:
即酒商为诚实时,将以概率 卖高价, 的概率卖低价, 。
当酒商为不诚实时,一定采用卖高价策略。
消费者中对酒有嗜好的将买酒,而无嗜好的将不买酒。
例 独立私人价值下的一级密封拍卖
首先考虑有两个竞标人的情况,竞标人1和竞标人2 ,即 。令竞标人 对拍卖物的估价为 ,出价为
这时 可视为竞标人 的类型,只有竞标人 自己知道 是多少。 为投标人的策略,即 (显然没有一个理智的投标人会出比自己估价更高的报价)。这里“自然”确定了投标人 的类型 ,并给出了 的概率分布。两个竞标人都知道自己的估价 ,并假定 都是[0,1]上的独立均匀分布。
独立私人价值下的一级密封拍卖(续)
上述情况都是共同知识。竞标人 的收益函数如下:
根据()式,竞标人 在自己的类型为 ,出价为
的情况下,其期望收益为:
独立私人价值下的一级密封拍卖求解
为了下面讨论方便,我们对局中人的策略作如下规定:
, 为常数,
这里 可视为竞标人 的最低标价。局中人 报价
时,考虑到对方的策略,必有
在上述规定下, 也是一个均匀分布的随机变量,则对任意常数 。这样我们在()式中后两项均为0,不予以考虑。
独立私人价值下的一级密封拍卖求解(续)
当竞标人 在类型 时,其出价 的多少由()式和()、()、()式有:
()
求解()式有:
()
将()与()比较,有:
即: ()
独立私人价值下的一级密封拍卖求解(续)
()表明,在上述假定下,两个竞标人的出价都为自己估价的一半。 若()式中规定 是 的单调递增连续函数,结论同样成立。
若有 个人参加竞标,可以类似的分析得到
()
显然, 随 的增加而增加。特别地,当 时, 就是说,投标人越多,卖者能得到的价格就越高;当投标人趋于无穷时,卖者几乎得到买者价值的全部。因此,让更多的人加入竞标是卖者利益所在。
例 双向拍卖
下面我们考虑买方和卖方对自己的估价都存在私人信息的情况,分析一个叫做双向拍卖的交易博弈,卖方确定一个卖价 ,买方同时给出一个买价 。如果
则交易以 的价格进行,如果 ,则不发生交易。
双向拍卖(续)
买方对标的商品的估价为 ,卖方的估价为 ,双方的估价都是私人信息,并且服从[0,1]区间的均匀分布。如果买方以 价格购得商品,则可获得 的效用;如果交易不能进行,买方的效用为 0。
如果卖方以 价格售出商品,则可得到 的效用;如果交易不能进行,卖方的效用亦为0。(双方的效用函数都是衡量因交易而带来的效用变化,如果交易没有发生,则双方效用均没有变化。
(求解过程请参考课本P77-80)
§ 完全且完美信息动态博弈
§ 动态博弈的特征
§ 子博弈与子博弈完美纳什均衡
§ 完全且完美信息的动态博弈的案例
§ 完全不完美信息的两阶段博弈
§ 动态博弈的特征
§ 动态博弈的特征
§ 纳什均衡的可信性与不可信性
§ 动态博弈的特征
动态博弈有以下区别于静态博弈的特征 :
1. 阶段
2. 行动与策略
3. 行动组合和策略组合
4. 收益函数
5. 信息
例 二人取数游戏
有一个二人参加取数的游戏,游戏分三步进行。第一步,局中人1在{0,1}中取一个数记为 ,并告知局中人2。第二步,局中人2也在{0,1}中取一个数记为 ,但不告知局中人1。第三步,又轮到局中人1取数。若局中人1在第一步中取0,则可以在{0,1}中取一个数,若局中人1在第一步中取1,则可以在{0,1,2}中取一个数,记第三步局中人1取得数为 。三步后取数结束。现记 。若 S 为偶数,则局中人1赢 S记分点,局中人2输 S 记分点。若S 为奇数,则局中人1输 S记分点,局中人2赢 S 记分点。在这个游戏中,两个局中人各自采取什么行动?若你参加,你愿意当局中人1还是局中人2 。
回到:阶段 行动与策略 行动组合和策略组合 信息
例 二人取数游戏
经过简单计算,可以用下面的树形图表示
阶 段
动态博弈中,局中人是依照一定的约定规则依次进行行动。每个阶段至少有一个局中人要进行行动的,这里允许一个阶段中有多人行动(可见§ 中的两阶段博弈)。在例 中有三个阶段,分别有局中人1或局中人2行动。
行动与策略
动态博弈中,轮到局中人行动时,他在自己的行动集中选择一个行动。局中人行动集一般记为 。在不同的状态下和不同的阶段,局中人的行动集可能不一样。如例 中,局中人2见到“0”时,行动集是 ,见到“1”时,行动集 。
动态博弈的策略是指局中人在这个博弈前对自己各阶段行动的一个计划。例中,局中人2行动集是 ,而策略
={永远取0,取与见到相同的数,取与见到相反的数,永远取1}。
在静态博弈中,只有一个阶段,局中人的策略集与行动集是一致的。但动态博弈中策略集与行动集是不同的。
行动组合和策略组合
动态博弈中,每个局中人在每个阶段出一个行动构成一个行动组合,而每个局中人出一个策略则构成策略组合,行动组合是策略组合的一种“精炼”的表述。例 中,行动组合:(局中人1选0,局中人2选1,局中人1选0)是一个行动组合。这一行动组合是策略组合((局中人1第一次选0,第二次选0),局中人永远选1)和((局中人1第一次选0,第二次选0),局中人2选与见到的相反)两个策略的“精炼”表述。行动组合的个数小于策略组合的个数。
收益函数
在动态博弈中,为了分析方便,局中人的收益函数是所有行动组合到实数集的映射。如果博弈的局中人为n个人,则每个行动组合对应一个n维实数向量。但若动态博弈是用策略式表示,其收益函数仍是策略组合到实数集的映射。
在完全信息动态博弈中,博弈的收益函数是一个共同知识。
信 息
在动态博弈中,当每个局中人行动时,它对此前各局中人的行动组合是完全了解和知道的,称为有完美信息博弈,反之,则称为不完美信息博弈。不完美信息下,至少一个局中人在自己的行动选择时,不知道此前其它局中人采取了什么行动,自己是在什么状态下去选择自己的行动。
例 中,局中人2在第二阶段行动。此时他已知道局中人1在第一阶段的选择。但局中人1在第三阶段行动时,则不知道第二阶段局中人2是选择了0还是1,但他必须行动。这时的博弈是不完美信息博弈。
§ 纳什均衡的可信性与不可信性
举例说明
例 借债与还债问题
该博弈中有2个局中人。第一阶段,局中人2向局中人1借款2万元,并承诺一年后还给局中人1连本带息共3万元。局中人1面临借款还是不借钱给局中人2。若局中人1答应借钱给局中人2,则博弈进行到第二个阶段。这时,局中人2靠这笔钱共赚到4万元。他面临着到底履行诺言还是不履行诺言。若不履行诺言,则博弈进入到第三阶段,这时局中人1是将局中人2告上法庭还是不告上法庭。若告上法庭,则局中人1可以要回自己2万元,而局中人2则分文得不到。若不告上法庭,则局中人2独占4万元。在这个博弈中,局中人1和局中人2分别应采取什么策略呢?
例 借债与还债问题(续1)
这是一个完全且完美信息的动态博弈。
该博弈用规范式表示为:
用第二章的划线法可知,有三个纯策略纳什均衡(这里暂不考虑混合策略),分别是((借,上告),履行诺言),((不借,上告),不履行诺言),((不借,不告),不履行诺言)。
例 借债与还债问题(续2)
下面对这三个纯策略纳什均衡
可信性和不可信性进行分析。
为了可以有更直观的认识,
按第1章中介绍的扩展式
将这一问题进行表述如为:
这三个纳什均衡的第二个((不借,上告),不履行诺言)是不可信任的纳什均衡。因为一旦出现局中人1要上告,局中人2的行动一定是会履行诺言的。第三个纳什均衡((不借,不告),不履行诺言)也是不可信任的纳什均衡。因为一旦出现局中人2不履行诺言,局中人1采取的行动一定是上告。只有第一个纳什均衡((借,上告),履行诺言)是可信任的。
例 借债与还债问题(续3)
从上例中可以看出,在动态博弈中,采用静态博弈的方法求出来的纳什均衡,并不一定是可信的。必须对其进行“精炼”,求出可信的纳什均衡。
从该例可以看出,对简单的动态博弈,我们使用博弈的扩展式,可以使分析问题的思路和理解有更好的帮助。因此在本节中,我们尽可能地使用扩展式来分析一个博弈。
§ 子博弈与子博弈完美纳什均衡
§ 动态博弈的扩展型表述
§ 子博弈与子博弈完美纳什均衡
§ 子博弈完美纳什均衡的逆向归纳法
§ 动态博弈的扩展型表述
定义 扩展式表述
※ 扩展式表示的一个例子
定义 扩展式表述
定义 一个动态博弈的扩展式包括:
(1)博弈中的局中人,必要时包括“自然”局中人;
(2)局中人的行动顺序;
(3)局中人的行为空间(行动集),若“自然”局中人的行动,即它赋予其它局中人不同类型,则同时应给出不同行动的概率分布;
(4)每次轮到某一局中人行动时,他所了解的信息;
(5)对局中人可能选择的每一行动组合相对应的各局中人的收益。
(由于本节仅研究完全信息下的动态博弈,因而未考虑“自然”对类型的赋予,以及对类型的概率分布的赋予。)
定义 扩展式表述(续)
上述定义中,(2)、(3)和(4)是博弈规范式表示在动态博弈中的具体体现。以上各要点均是共同知识。
本大节讨论的完全且完美信息的动态博弈,无“自然”局中人。
对于博弈的扩展式描述,我们通过树形图来表示,也称博弈树。博弈树用于表述动态博弈是非常方便的,它一目了然地显示出局中人行动的先后次序,每位局中人可选择的行动,及不同行动组合下的支付水平。由于博弈树在通常情况下更便于表示和分析,因此在分析动态博弈时,人们大多采用博弈树的方式表示。
扩展式表示的一个例子
这个博弈树始于局中人1的一个决策结点,
这时1要从L和R中作出选择,如果局中人1选
择L,其后就到达局中人2的一个决策结点,
这时,局中人2要从L′和R′中作出选择。
类似地,如果局中人1选择R,
则将到达局中人2的另一个决策结点。
这时局中人2从L′和R′中选择行动。
无论局中人2选择了哪一个,
都将到达终结点 (即博弈结束)
且两局中人分别得到相应终点节下面的收益。关于博弈树更详细地介绍请看第1章
在扩展式表示的博弈中,我们更多关心的是各局中人在阶段中的行动,因此也称其为行为博弈。对应地,将使用行动、行动组合、行动组合上的收益函数等概念。
§ 子博弈与子博弈完美纳什均衡
定义 子博弈
定义 子博弈纳什均衡
子博弈完美纳什均衡两点说明
定义
扩展式博弈中,满足下面三个条件的博弈,称为该博弈的一个子博弈:
(a)始于单节信息集的决策结点n(但不包括博弈的第一个决策结点);
(b)包含博弈树中n之下所有的决策结点和终结点(但不在n下面的除外);
(c)没有对任何信息集形成分割。(即如果博弈树中n之下有一个决策结点n′,则和n′处于同一信息集的其他决策结点也必须在n之下,从而也必须包含于该子博弈中。) 举例说明
子博弈的一个例子
图中,存在着两个子博弈,
分别始于局中人2的两个决策集。
图很好地说明了
定义中的前两个条件(a)和(b)。
为了说明定义的第三个条件(c),
考虑图给出的博弈,
该博弈只有一个子博弈,
它始于局中人1选择R,
局中人2选择R′之后局中人3最右边一个决策点。
由于(c)的限制,局中人2的两个决策点之下都不能构成一个子博弈,即使这两
个决策结点处于单结点的信息集。
图 存在着信息集分割的博弈树
定义
在完全且完美信息动态博弈中,如果局中人的策略组合或行动组合在每一个子博弈中都构成了纳什均衡,则称纳什均衡是子博弈精炼的,并称为原博弈的子博弈纳什均衡。
子博弈完美纳什均衡两点说明
1. 关于行动组合的纳什均衡未直接给出定义。行动组合的纳什均衡和策略组合的纳什均衡没有本质差异。动态博弈既可以用策略式表示也可以用扩展式表示,因此该定义中既包含策略组合又包含行动组合。(P88)
2. 关于在每一个子博弈中构成纳什均衡未直接给出定义。子博弈所组成的纳什均衡是原博弈某个行动组合的纳什均衡的一个子集;原博弈该行动组合的纳什均衡构成子博弈中的纳什均衡。(P88)
§ 子博弈完美纳什均衡的逆向归纳法
※ 完全且完美信息动态博弈的主要特点
※ 子博弈完美纳什均衡的逆向归纳法
完全且完美信息动态博弈的主要特点
(1)行动是顺序发生的,
(2)下一步行动选择之前,所有以前的行动都可以被观察到,
(3)每个可能的行动组合下局中人的收益是共同知识。
子博弈完美纳什均衡的逆向归纳法
我们对这类动态博弈只有两阶段时进行讨论。这时的博弈为:
局中人1从可行集 中选择一个行动 ,
局中人2观察到 之后从可行集 中选择一个行动
两人的收益分别为 和
逆向归纳法
逆向归纳法求解子博弈完美纳什均衡
对上面完全且完美信息的两阶段动态博弈,我们可以使用逆向归纳法求解此类博弈问题。
这时局中人1在第一阶段很难给出自己的最优行动。因此,我们可以倒过来分析。假设局中人1在第一阶段选择了行动 ,当在博弈的第二阶段局中人2行动时,考虑到其前局中人1若选择行动 他面临的决策问题可用下式表示:
若每个 ,局中人2的这一最优化问题只有唯一解,用
表示,这就是局中人2对局中人1的行动的反应(或最优反应)。
逆向归纳法求解子博弈完美纳什均衡(续)
因为局中人1可以预测到局中人2对自己每个可能的行动 做出的反应,这样局中人1在第一阶段要解决的问题可归结为:
假定局中人1的这一最优化问题同样有唯一解,表示为 。再将 带回 中得到 我们称 是这个博弈的逆向归纳解。
§ 完全且完美信息的动态博弈的案例
例 斯塔克尔贝格双寡头竞争模型
例 劳资博弈
例 序贯谈判
例 制造商与销售商的博弈
例 承包基数博弈
斯塔克尔贝格双寡头竞争模型
斯塔克尔贝格(Stackelberg,1934)提出了双寡头垄断的动态模型,其中一个支配企业(领导者)首先行动,然后从属企业(追随者)行动。根据斯塔克尔贝格的假定,模型中企业选择其产量,这一点和古诺模型是一致的(不同的是,古诺模型中企业是同时行动的,而不是这里的序贯行动)
在这个博弈中,首先,企业1选择产量 ;然后,企业2可以观测到 ,并选择产量 ;此时,企业 的收益由下面的利润函数给出
这里 是市场上的总产量 时的市场出清价格, 是生产的边际成本,为一常数(令固定成本为0)。
斯塔克尔贝格双寡头竞争模型(续1)
不难看出,这是完全且完美信息两阶段博弈,逆向归纳法求解。假设企业1有产量 ,我们首先计算企业2对企业1任意产量的最优反应, 应满足
由上式可得
这与我们在上一章分析的古诺模型中,得到的 相同,两者不同的在于,这里得到的 是企业2对假定企业1产量为 时的最优反应。
斯塔克尔贝格双寡头竞争模型(续2)
由于企业1考虑到当它产量为 时,企业2的最优反应为 那么,在博弈的第一阶段,企业1的问题可表示为
由上式可得 及
是斯塔克尔贝格双寡头垄断博弈的逆向归纳解,也是该博弈的子博弈完美纳什均衡。
例 劳资博弈
在里昂惕夫(1946)模型中,讨论了一个企业主和一个垄断的工会组织(即作为企业劳动力惟一供给者的工会组织)的相互关系:工会对工人的工资水平提出要求,但企业主却可以自主决定就业人数。工会的效用函数为 ,其中 为工会向企业提出的工资水平
为就业人数。假定 是 和 的增函数。企业主的利润函数为 ,其中
为企业雇佣 名工人可以取得的收入(在最优的生产和产品市场决策下),假定 是增函数,并且为凹函数(concave)。
例 劳资博弈(续1)
假定博弈的时序为:
(1)工会提出需要的工资水平;
(2)企业主得到工会要求工资 后,选择雇佣人数
(3)收益分别为 和 。那么,工会要提出什么样的工资要求,而企业主又应雇用多少工人?
因为没有假定 和 的具体的表达式,从而无法明确解出该博弈的子博弈完美纳什均衡的表达式,我们仍可以就解的主要特征进行讨论。
例 劳资博弈(续2)
首先,对工会在第一阶段提出的任意一个工资水平 ,我们能够分析在第二阶段企业主最优反应 的特征。给定 ,企业选择 满足下式:
一阶条件为 ()
为保证 有解,假定
且 ,
如右图所示。
例 劳资博弈(续3)
对()式,可以将 表示为 的函数。从图中可见,当工资要求越高, 时,企业主雇用工人会减少, 。这一特征在 是凹函数时,可以得到证明。
若 ,从上面一阶条件有
对此式再对 求导,有: 。
由前面假设, 是 的凹函数,即 ,则必有:
。
例 劳资博弈(续4)
下面我们分析工会在第一阶段的问题,由于工会和企业主同样可以解出企业在第二阶段的问题,工会就可预测到如果它要求的工资水平为 ,企业最优反应的就业人数将为 。那么,工会在第一阶段的问题可以表示为
()
求解()式,由一阶条件有 ()
由前面假设, 是 的增函数,于是可以求出工会提出的工资水平 ,进而可由 求出企业主对雇用工人的人数 。
例 制造商与销售商的博弈
设有一个由制造商和销售商组成的二级供应链,为市场提供某种商品,该商品的市场需求函数设为
其中 为商品的价格, 为市场对商品需求数量, 为一常数,其经济意义是商品的最高需求量。制造商提供给销售商的批发价为每件 元。制造商和销售商都有不变的边际成本 和 。制造商和销售商的博弈顺序规定如下:制造商先确定产品的批发价 ,根据制造商的批发价 ,销售商确定商品的定价 。
例 制造商与销售商的博弈(续1)
现在要确定制造商如何确定批发价 ,销售商如何确定产品的销售价 ,以实现各自的利润最大。
这是一个两阶段的完全且完美信息下的动态博弈。博弈中有2个人。局中人1是制造商先行动,其行动空间是 。局中人2是销售商后行动,其行动空间
两个局中人的收益函数分别是 和 。
()
()
例 制造商与销售商的博弈(续2)
采用逆向递推法的思想求解问题。假设制造商的批发价定为 则销售商定价应满足:
即 ()
制造商知道销售商将采用()式的定价策略,则他的收益为:
例 制造商与销售商的博弈(续3)
对 求偏导,且令为0
则 ()
将()式代入()式有
()
将()式和()式代回到()式和()式有
例 承包基数博弈
承包基数的确定过程,实际上是发包人与承包人的博弈过程。
基数确定过程中的一个难题是,委托人(指发包人或董事会)从自己利益最大化角度考虑,总想提高基数;而代理人(指承包人或总经理)则是为自身利益的实现总想降低基数。对方对此僵持不下,进行一系列的讨价还价。
例 承包基数博弈(续1)
从博弈的角度分析该问题,可视为这是一个两阶段动态博弈。
在第一阶段,委托人对承包基数提出了一个要求数D和一个收益分配方案。
在第二阶段,代理人在明确基数要求数D和收益分配方案后,对承包基数给出一个自报数S。
两阶段完成后,进入承包期,并在 承包期后按照事先规定的方案进行收益分配。
例 承包基数博弈(续2)
这时,委托人是一个主动方,代理人是一个从动方。委托人知道“上有政策,下有对策”,于是从最终利益分配出发采用逆向归纳法的思想进行分析:
(1)假定代理人实际完成的结果是A,委托人会提出承包基数的要求数D,满足D<A;
(2)假设承包基数合同为C,委托人会对代理人完成的超额部分(A-C)进行分成奖励,而对不完成合同(C-A)进行惩罚(不完成合同,即A<C),以鼓励代理人去努力完成和超额完成
(3)假定承包人有意压低对基数的自报数S,也应给予惩罚,即在S<A 时,应对代理人给以一个少报惩罚。
例 承包基数博弈(续3)
委托人在进行上述分析后,在博弈的第一阶段提出了如下基本要求数D和分配方案:
(1)委托人提出一个自己收益的保底要求数D。这个数不宜过大,以使代理人有积极性去努力工作。
(2)委托人与代理人共同确定承包基数C。若委托人对基数的要求数是D,代理人对承包基数的自报数是S,则: , 。可见 是一个权重,不妨取 。但规定合同基数C全部归委托人,也即“基数全交”。
例 承包基数博弈(续4)
(3)对期末实际完成数A超过合同基数C时,超过部分 以 的比例作为奖励给代理人,若不能完成合同基数C时,不足部分同样以 比例由代理人补足。其中
不妨取 ,这条规定可以激励代理人去努力工作。
(4)对期末完成数A超过代理人对承包基数的自报数S时,将向代理人收取“少报罚金”。因为自报数S较小时,基数合同C也较小,损害了委托人的利益。少报罚金的数量为 。其中 ,不妨取
例 承包基数博弈(续5)
委托人在第一阶段不仅提出了承包基数的要求数D,也从(2)建立了基数合同规定,并从(3)的(4)以基数合同规范了期末的双方收益分配规则。
代理人在第二阶段如何对承包基数给出自己的自报数呢?我们从下面一个具体数据实例来说明。
假设委托人估计实际完成数A=80,则承包基数的要求数D=60,尚有一定余地给代理人。各参数值分别为: , , 。代理人策略选择和可能的结果见下表(单位万元):
例 承包基数博弈(续6)
例 承包基数博弈(续7)
在上表中,各栏数据是明确的。只需注意在 ,即没有少报数时,不存在负数罚金。
上表中可以看出,代理人在第二阶段对承包基数的自报数S等于其期末实际完成数 时,其收益最大。因此,在委托人是主动方时,代理人只有诚实地对承包基数进行自报,才能得到最大的收益。
实际上,委托人通过逆向归纳法思想,对代理人收益已建立了一个收益函数。设代理人的收益函数为 ,则
()
例 承包基数博弈(续8)
的几何图形为:
从 函数可以看到,
当 时,只要
则是S的增函数;
当 时, 是S的减函数.
而当 时, 有最大值 。
因此,委托人在第一阶段对承包基数和分配方案确定时,必须满足 。代理人在第二阶段时只能诚实地报出自报数S就是可能的完成数A。
§ 完全不完美信息的两阶段博弈
※ 完全不完美信息的两阶段博弈
※ 完全不完美信息的两阶段博弈求解思路
※ 例 关税和国际市场的不完全竞争
完全不完美信息的两阶段博弈
我们将分析以下类型的简单博弈,并称其为完全非完美信息两阶段博弈:
第一阶段,局中人1和2同时从各自的可行集 和
中选择行动 和 ;
第二阶段,局中人3 和4 观察到第一阶段的结果,并可推断出( , ),然后同时从各自的可行集 和
中选择行动 和 ;
两阶段结束后,每个局中人的收益为
完全不完美信息的两阶段博弈求解思路
假设博弈第一阶段有静态博弈的纳什均衡( , )。
(1)第二阶段:局中人3和局中人4以这一假定的纳什均衡( , )为参数,进行二人完全信息静态博弈 G2= N2,{A3,A4}, {u3,u4} ,其中 N2 = {3,4} ,从而得到纳什均衡
()
均衡结果 ()
(2)第一阶段,局中人1和局中人2以()结果作为收益函数进行二人完全信息下的静态博弈G1= N1,{A1,A2}, {u1,u2} ,其中N1 = {1 ,2} , u1,u2由()给出,从而得到纳什均衡 ()
均衡结果 : ()
(3)将()结果代回到()和()中,可得该博弈的子博弈完美纳什均衡 和对应的均衡结果
例 关税和国际市场的不完全竞争
考虑两个完全相同的国家,分别用表示 。每个国家有一个政府负责确定关税税率,有一个企业制造产品供给本国的消费者以及出口,以及一群消费者在国内市场购买本国企业和外国企业生产的产品。这里假定,分属两个国家的两个企业生产是相同产品。如果国家 的市场上产品总量为 ,则市场出清价格为
国家 中的企业(称企业 )为国内市场生产 并出口 ,则 。企业的边际成本都为常数 (不考虑固定成本)。从而,企业 的总生产成本为 另外,产品出口时企业 还要承担关税成本(费用),即如果政府 制定的关税税率为 ,企业 还要向国家 对出口产品 支付关税
给政府 。这里假定,国家 将不对本国企业 生产的产品征收出口税。
例 关税和国际市场的不完全竞争(续1)
博弈的时间顺序如下:
第一阶段,两个政府同时选择关税税率 ;
第二阶段,企业观察到关税税率,并同时选择其提供国内消费和出口的产量 和 ;
两个阶段结束后,企业 的收益为其利润额 ,政府 的收益则为本国总的福利 ,其中国家 的总福利是国家享受的消费者剩余、企业 获得的利润以及政府 从企业 收取的关税收入之和,分别表示为:
()
()
例 关税和国际市场的不完全竞争(续2)
下面,我们按照逆向归纳法进行对博弈的求解。
(1)假设政府已选定的税率分别为 ,先进行第二阶段计算,如果
为企业1和2的博弈的纳什均衡,对每个企业, 必须满足
由于
如()所述,
则分别求一阶条件:
……()
……()
……()
……()
例 关税和国际市场的不完全竞争(续3)
求解()、()、()、()组成的方程组有:
()
()
()
在上面()、()、()式中, , 。
(2)现进行第一阶段的博弈分析: 对 国家,其收益函数如()式所示,求解一阶条件
()
可得: ()
例 关税和国际市场的不完全竞争(续4)
(3)将()式代回()、()和()式,有该博弈的子博弈完美纳什均衡: ()
以及对应的纳什均衡结果 ()
在子博弈精炼解中,每个市场上的总量为 , 。
进一步分析我们发现,如果政府选择0关税税率,则每个市场上的总量为 , 。于是,政府就有动因签订一个相互承诺0关税税率的协定,即自由贸易。