博弈论——博弈信息
博弈论与信息经济学
郝 海
天津工程师范学院经济管理
博弈论的要素
博弈论的提法可能太过于学术化,容易让人们退避三舍。其实它有一个非常通俗的名字--游戏理论(博弈论的英文名字叫做"Game Theory",如果直译,就是"游戏理论")。博弈论在我国还有一个名字,叫对策论。这些名字都很好理解,博弈字面意思就是赌博、下棋,赌博和下棋当然是游戏了,赌博和下棋的时候常常要千方百计地应付对手,自然是要讲究对策了。
参与人 players
一个博弈中的决策主体,他的目的是通过选择行动(或战略)以最大化自己的支付(效用水平)。参与人可能是自然人,也可能是团体,如企业,国家等。
重要的是:每个参与人必须有可供选择的行动和一个很好定义的偏好函数。不做决策的被动主体只能被当作环境参数。
虚拟参与人pseudo-player
为了分析方便,自然nature被当作虚拟参与人。
自然代表决定外生随机变量的概率分布的机制。比如房地产开发中市场需求的大小。
行动 ACTIONS OR MOVES
参与人在博弈的某个时点的决策变量。
(坦白)
N个参与人的行动的有序集称为行动组合
(坦白,抵赖)。
行动的顺序
对于博弈的结果非常重要。有关静态和动态博弈的区分就是基于行动的顺序做出的。
同样的行动集合,行动的顺序不同,每个参与人的最有决策就不同,博弈的结果也不同。尤其在不完全信息博弈中,后行动者依赖观察先行动者的行动来获取信息。
信息 information
参与人有关博弈的知识,特别是有关自然的选择,其他参与人的特征和行动的知识。
完美信息perfect information:指一个参与人对其他参与人的行动选择有准确的理解,即每个信息集只包含一个值。
共同知识common knowledge
所有参与人知道每一步的信息集。
战略strategies
参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。
战略与行动:战略是行动的规则而不是行动本身。
在静态博弈中,战略和行动是相同的。
战略必须是完备的,要给出参与人在每一种可想象得到的情况下的行动选择。
支付payoff(效用utility)
在一个特定的战略组合下参与人得到的确定效用水平,或是指参与人得到的期望效用水平。
均衡equilibrium
指所有参与人的最优战略的组合。
博弈分类和主要思想
博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议。倘若不能,则称非合作博弈
Not-cooperative Game 。
合作博弈强调的是集体主义,团体理性
Collective rationality
效率、公平、公正
非合作博弈
非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果是有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益最大化,最后达到力量均衡。
例子
比如两家企业A、B合作建设一条VCD的生产线,协议由A方提供生产VCD的技术,B方则提供厂房和设备。在对技术和设备进行资产评估时就形成非合作博弈,因为每一方都试图最大化己方的评估值,这时B方如果能够获得A方关于技术的真实估价或参考报价这类竞争情报,则可以使自己在评估中获得优势;同理,A方也是一样。至于自己的资产评估是否会影响合作企业的总体运行效率这样的"集体利益",则不会非常重视。这就是非合作博弈,参与人在选择自己的行动时,优先考虑的是如何维护自己的利益。
顺序和信息
博弈论非常强调时间和信息的重要性,认为时间和信息是影响博弈均衡的主要因素。在博弈过程中,参与者之间的信息传递决定了其行动空间和最优战略的选择;同时,博弈过程中始终存在一个先后问题
Sequence order
参与人的行动次序对博弈最后的均衡有直接的影响。
分类
博弈的划分可以从参与人行动的次序和参与人对其它参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。把两个角度结合就得到了4种博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈 .
博弈的分类及对应的均衡
不完全信息动态博弈,
精炼贝叶斯纳什均衡;
泽尔腾(1975)Kreps,Wilson(1982),
Fudenberg,Tirole(1991)
不完全信息静态博弈;贝叶斯纳什均衡;
海萨尼(1967-1968)
不完全信息
完全信息动态博弈;
子博弈精炼纳什均衡;泽尔腾(1965)
完全信息静态博弈;
纳什均衡;
Nash(1950)
完全
信息
动态
静态
博弈的扩展式表述
扩展式表述所“扩展”的主要是参与人的战略空间
战略式表述简单地给出参与人有些什么战略可以选择,而扩展式表述要给出每个战略的动态描述:谁在什么时候行动,每次行动时有些什么具体行动方案可供选择,以及知道些什么
此时的战略:如果你这样,我将怎样
博弈的扩展式表述
要素:
参与人集合
参与人的行动顺序
参与人的行动空间
参与人的信息集
参与人的支付函数
外生事件(即“自然”的选择)的概率分布
博弈的扩展式表述
博弈树的基本元素:
结、枝、信息集
需要注意的概念:前列集、后续集;初始结、决策结、终点结;直接前列结、直接后续结。以及相应的符号
信息集:某个参与人都知道些什么
信息集是用来标注某个人知道些什么信息的,不同的标注表示这个人知道不同的信息
博弈的扩展式表述
如果博弈树的所有信息集都是单结的,则称为“完美信息博弈”,没有任何两个决策结是用虚线连起来的
自然信息集总是假设为单结的
博弈树上是否出现连接不同决策结的虚线取决于如何划决策结的顺序p145
一个参与人在决策之前所适当的事情必须出现在该参与人的决策结之前
有了信息集的概念,扩展式表述也可用来表述静态博弈
扩展式表述博弈的纳什均衡
需求大,开发者利润8千万,不开发者利润0。
需求大,两者都开发利润各为4千万。
需求小,开发者利润1千万,不开发者利润0。
需求小,两者都开发利润各为-3千万
两者都不开发利润各为0。
博弈树:房地产开发博弈I
A
开发 不开发
大 小 大 小
开发 不开发 开 不开 开 不开 开 不开
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
N1 N2
B1 B2 B3 B4
博弈树:不允许的情形
博弈树的结构
结(nodes):
枝(branches):
信息集(information sets):
包括决策结和终点结。决策结是参与人采取行动的时点;终点结是博弈行动路径的终点。
枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择。
一个信息集是决策结集合的一个子集(信息集是由决策结构成的集合),该子集包括所有满足下列条件的决策结:
(1)每一个决策结都是同一个参与人的决策结
(2)该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结。
信息集:房地产博弈II
A
开发 不开发
大 小 大 小
开发 不开发 开 不开 开 不开 开 不开
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
N1 N2
B1 B2 B3 B4
信息集:房地产博弈III
A
开发 不开发
大 小 大 小
开发 不开发 开 不开 开 不开 开 不开
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
N1 N2
B1 B2 B3 B4
信息集:房地产博弈IV
N
大 小
开 不开 开 不开
开发 不开发 开 不开 开 不开 开 不开
(4,4) (8,0) (0,8) (0,0) (-3,-3) (1,0) (0,1) (0,0)
B1 B2
A1 A2 A3 A4
几个符号的意义
第i个人的信息集为Hi,其中某特定信息集为hi,在hi的情况下会有A(hi)的行动。他的所有信息集所对应的所有行动A(hi)的集合为Ai,∪表示聚合。
第i个人有信息H,乃有行动A
此时的战略是S(而且是纯战略,
以后用其他字母表示“不纯”战略)
→maps into
153页第二段:“每一个纯战略都是从信息集到行动集的一个映射,Si可以表示为在每一个信息集hi上的行动空间A(hi)的笛卡儿积”
每一个纯战略都是原因现象依某种对应关系所导致的惟一结果现象 (信息集可视为自变量,行动集可视为因变量) ,纯战略的集合Si就是行动空间A(hi)中各种行动的交叉乘积。
完美信息博弈&不完美信息博弈
一个信息集可能包含多个决策结,也可能只包含一个决策结。只包含一个决策结的信息集称为单结信息集;
如果博弈树的所有信息集都是单结的,该博弈称为完美信息博弈(Game of perfect information);否则就是不完美信息博弈。
可信性:开金矿博弈
甲在开采一价值4万元的金矿时缺1万元资金,而乙正好有1万元资金可以投资。甲希望乙能将1万元资金借给自己用于开矿,并许诺在采到金子后与乙对半分成,乙是否该将钱借给甲呢?
参见谢识予p128
开金矿I——无法律的博弈
乙
甲
借 不借
分 不分
(2,2) (0,4)
(1,0)
开金矿II——有法律保障的博弈
乙
甲
借 不借
分 不分
(2,2)
打 不打
(1,0) (0,4)
(1,0)
子博弈
子博弈由一个决策结x和所有该决策结的后续结T(x)(包括终点结)组成,它满足下列条件:
(1)x是一个单结信息集;
(2)子博弈不改变原博弈的信息集和支付向量
条件1说的是一个子博弈必需从一个单结信息集开始。即:(1)当且仅当决策者在原博弈中确切地知道博弈进入一个特定的决策结时,该决策结才能作为一个子博弈的开始。(2)如果一个信息集包含两个以上决策结,没有任何一个决策结可以作为子博弈的初始结。
A
开发 不开发
大 小 大 小
开发 不开发 开 不开 开 不开 开 不开
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
N1 N2
B1 B2 B3 B4
A
开发 不开发
大 小 大 小
开发 不开发 开 不开 开 不开 开 不开
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
N1 N2
B1 B2 B3 B4
条件2说的是,子博弈的信息集和支付向量都直接继承自原博弈,并不会发生任何变化。
这意味着子博弈不能分割原博弈的信息集。
A
开发 不开发
大 小 大 小
开发 不开发 开 不开 开 不开 开 不开
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
N1 N2
B1 B2 B3 B4
逆向归纳法p157
开 不开
开 不开 开 不开
(-3,-3) (1,0) (0,1) (0,0)
A
B B
房地产开发:需求小
逆向归纳法就是从动态博弈的最后一个阶段或最后一个子博弈开始,逐步向前倒推以求解动态博弈的方法。