1 本课题得到国家十五重点科技攻关专题——电子商务环境下集成化建筑供应链管理研究(2004BA209B03)
的资助。
-1-
N人合作博弈解的目标规划方法 1
台双良 1,翟凤勇 1,蔡益宇 2
1.哈尔滨工业大学管理学院,黑龙江哈尔滨(150001)
2.浙江省临海市供电局,浙江临海(317000)
摘 要: 在 N人合作博弈中,对合作收益的解的研究是核心问题。本文分析了各种合作博
弈解的应用局限,在此基础上提出了非合作优势的概念,并给出了基于目标规划的合作博弈
解的确定方法。与其它合作博弈解概念相比,该方法更为符合实际,并具有更好的适应性和
可操作性。
关键词:合作博弈;解;非合作优势;目标规划
中图分类号:C936 文献标识码:A
1 引言1
近年来,博弈论在管理科学、经济学、
社会学、政治科学等方面扮演着重要角色,
这些研究的主流方法,几乎都集中于非合作
博弈。相比之下,基于合作博弈的相关研究
则被学术界所忽略。这并非意味着合作博弈
的重要性不如非合作博弈,研究表明,随着
经济社会的发展,特别是信息时代的今天,
真实世界中的合作行为变得越来越普遍[1]。
N 人合作博弈的数学原理和相应解概
念通常受运筹学、管理科学、决策论、经济
理论等各种不同学科启发而提出[2],其中合
作博弈的解概念(solution concepts),即对
合作博弈大联盟收益在参与人之间的合理
分配的研究,是合作博弈研究的核心内容
[3]。各种不同的解概念,如稳定集(stable
sets,von Neumann& Morgenstern, 1944),
Shapley 值(the Shapley value,Shapley, 1953),
核(the core,Gillies, 1959)和核心(the
nucleolus,Schmeidler, 1969)等。其中,
Shapley 值可能是最重要的合作博弈解概念
之一。这些已成为合作博弈经典内容的解概
念,往往从看似合理的一组公理假设导出,
然而针对同一个合作博弈问题,由于不同解
概念导出的结果往往并不一致,以至于实际
中无法确定哪一个解概念更为合理,甚至有
时候某个解集为空集。这些问题大大限制了
合作博弈在实际中的应用[4]。
根据经典合作博弈解,一些学者提出了
更为符合实际或具有一般性的解概念。
Shapley(1969) 提出了不可转移效用的
Shapley 值(NTU-Shapley value),这可看成
Shapley 值的一般化。 Kim Allan, 等(1999)
提出了基于多目标线性规划方法,用来计算
NTU-Shapley 值[5]. Aleksanda(2001)引入
了比率、区间和 序数尺度(ordinal scales),
分析了在这些概念下有意义和无意义的解
[5]. Jeroen 等(1999)介绍了在随机环境下的
合作博弈模型[2]。Ichiro Nishizaki 等(2000)
对产出问题给出了具有模糊参数的线性规
划模型,并构建了模糊合作模型 [6]。总之,
结合各种实际背景,对合作博弈的理论和应
用研究进行整合,成为近来合作博弈研究的
主要流向。
2 合作博弈简述
合作博弈的解
在合作博弈中,通常假定在博弈中的收
-2-
益可被任意分割,且收益可在不同参与人之
间传递,该假设与非合作博弈有着本质的差
别 , 这 个 特 性 被 称 为 转 移 支 付
(side-payments)。
在经典合作博弈中,往往用特征函数
(characteristic function)v 表示一个合作博
弈。记参与人集合为 N,一个 N 人合作博弈
特征函数是一个映射 v: 2N ÆR, 满足
v(∅ )=0, 对于 N 的任一非空子集,称该子集
为一个联盟(S⊆N ), v(S)是联盟 S 的值,表
示通过结盟内成员间策略的协调所能实现
的最大收益(无论其他参与人采用什么对
策)。结盟 N 又被称为大结盟 (grand
coalition), v(N) 是合作博弈的总收益。满足
∑ =ni 1 xi = v(N)的向量 x = (x1,…, xn) 被称为
博 弈 v 的 解 的 帕 雷 托 最 优 条 件
(Pareto-optimality condition),满足帕累托
最优条件的向量x = (x1,…, xn) 被称为博弈 v
的解。
假定合作博弈 v 的解 x 至少要保证不少
于参与人 i 单干所获得的收益({i})。 (否则,
参与人宁愿不合作,而是选择单干)。这个
准 则 被 称 为 个 体 理 性 准 则 (individual
rationality),也就是 x ∈Rn 要满足 xi ≥
v({i}), 对于任意的 i=1,…,n。博弈 v 的解
如果同时还满足个体理性条件,则被称为自
利解(imputations)。 于是博弈 v 的自利解
为满足下列条件的集
M ={∑ ix =v(N), xi ≥ v({i}),i=1,…,n}
()
考虑合作博弈 v 的两个解 x 和 y, 如果
存在一个非空子集 S 满足 xi>yi,∀ i∈S 且
满足 x(S) ≤ v(S),则称 x 优于 y (记为
xφ y) 。
合作博弈有各种解概念,其中 Shapley
值和核,可能是合作博弈最重要的解概念之
一。博弈 v 的核是满足如下条件的集合:
C {x:∑ ix = v(N) 且 x(S)≥ v(S), S⊆ N }
()
对于一个特定合作博弈,在核的意义
下,可能存在多个解,或核是空集。C=∅表
明对于任何解 x,不管何种联盟,某参与人
总可以通过与联盟外的参与人合作获得更
大的收益。
与核的概念相反,对于任何一个合作博
弈 v,Shapley 值恒存在且唯一。Shapley 值
由 Shapley 于 1953 年通过公理化方式建立。
合作博弈 v 的 Shapley 值被定义为
\{ }
| |!( | | 1)!( ) ( ( {}) ( ))
!i i S N i
S n Sx s x v S i v S
n⊆
− −= = −∑ U
()
这里|S| 表示集合 S 的势。
特别地,当 n=2 时, 由式 ()可以得
出
121 )2,1(,2
))2()1(()2,1( xvxvvvx −=−+=
()
于是很容易算出在二人合作博弈下,各参与
人通过合作所获得的收益增加值,为
)))2()1(()2,1((
2
1
21 vvvxx +−=Δ=Δ
()
核和 Shapley 值的简要评述
尽管核在理论上具有重要地位,但在实
际中较少使用。主要有两个原因:核可能是
空集,还可能具有相当多的解。这一方面给
出了很多可行分配方案,另一方面也带来了
计算上的困难。
Shapley 值由三个看似合理的公理假设
导出的,同时,每个合作博弈都存在一个唯
一的 Shapley 值。因此,与其他合作博弈解
的概念相比,Shapley 值在实际中应用的更
为普遍。然而,如果进一步分析就会发现,
Shapley 值在一定场合是有缺陷的。考察式
-3-
(),二人合作博弈中,两个参与人获得相
同份额的合作受益,这个结论在多数场合是
不成立的,特别是一个处于强势的参与人与
处于相对弱势参与人合作的时候。
合作博弈模型假设过于简单,也限制了
合作博弈解概念的应用。比如,标准合作博
弈结盟的值被看成确定的数,但在很多场
合,博弈收益值往往是不确定的。此外,在
真实博弈中,一些重要参数,如参与人的心
理状况,社会规范等等,也可能在真实博弈
中起着关键作用。但是,这些因素在标准合
作博弈分析中并没有包含进来。
第一个关于合作博弈的实验由 Kalish,
Milnor, Nash 和 Nering (1954)进行的,
以后,Selten and Schuster(1968), Kahan
和 Rapoport(1984)也对合作博弈进行了重
要实验分析[7]。来自这些博弈实验分析的数
据也表明,经典合作博弈各种意义下的解,
有时并不总是与实际相符。
3 目标规划方法
为使合作博弈的解概念更加符合实际,
一方面要考虑整体合作收益的帕累托化,同
时还要考虑个体理性条件、合作收益的不确
定和参与人在博弈中所处的地位等多个目
标。为此,这里考虑引入目标规划方法。
目标规划(Goal Programming)模型是
运筹学中已被证明为有效的模型。该模型包
含软约束,可处理彼此矛盾的问题,并且在
某种程度上可以表示决策者微妙的情绪状
态。为构造合作博弈解的目标规划模型,首
先引入两个定义。
定义 1:非合作优势。称一个结盟具有
“非合作优势,表明结盟如果不与结盟外的
参与人合作,仍能保证该结盟具有相对较高
的收益。该定义是一个描述性定义。
定义 2:非合作优势度。用来定量化描
述合作博弈某个结盟非合作优势的指标。式
()就是一个用以度量结盟 S 的一个非合
作优势度指标。
NSSt
Nv
SvSt ⊂≠∅== |,|,)(
)()(α
()
下面开始构建合作博弈解的目标规划模
型。
令 x = (x1,…,xn)为合作博弈的解。
模型的第一个假设是 : )(Stα 的值越
大,结盟 S 的收益也就越大,即 x(S)正比于
)(Stα 。
对于势为 t 的结盟,可构建软约束如下:
1,...,1)(
)'(
)(
|'|
,, −==−+ ∑∑
=
+−
∈
NtNvk
Sv
Svddx t
tS
SiSi
Sj
j
()
式()表明: 对于包含 t 个参与人的结盟,
S 中的收益分配正比于非合作优势度。等式
右边的常数项 kt 为调整系数,用于保证所有
参与人获得的分配收益的和恰好等于大联
盟的值。很容易验证调整系数 kt 的取值应满
足:
⎪⎩
⎪⎨⎧ <<
== −− NtC
t
k t
N
t 1,
1,1
1
1
()
(10, 0, 0)
x3
x2
x1
(0, 0, 10 )
(0, 10, 0 )
图 1 合作博弈各种解示意图
M N
-4-
所有偏差变量非负。
模型的第二个假设是:每个目标权重依
赖于结盟的“紧密度”。结盟的“紧密度”越高,
该结盟在真实博弈中越容易形成。实验分析
表明,结盟 S 的“紧密度”主要依据两个因素:
集合 S 的势(| S |)以及结盟的值 (v(S))。因
此,若认为权重为这两个指标的函数,即
|)|),(()( SSvFSwt = , t =| S |, 根据上述分析,
可得
0
||
,0 <∂
∂>∂
∂
S
F
v
F
()
式()的含义很明显:某个结盟的收
益越高,参与人的数目越少,则该结盟的“紧
密度”就越高。这个假设与实验分析结果是
一致的。
模型的第三个假设是:博弈的解必须是
自利解(imputations),即:
njjvx
Nvx
j
n
j
j
,...,1})({
)(
1
=≥
=∑
=
()
目标规划的决策目标是关于所有负偏
差变量的最小化。
4 算例
三个商人经商问题。一个城市有三个商
人,用 1, 2, 3 表示。如果每个人单独经商,
收益分别为 2, 1, 1,记为 v(1)=2, v(2)=1,
v(3)=1。如果 1 与 2 合作,可获得收益 7,
记为 v(1, 2) = 7。类似地,可得出 v(1, 3)=5,
v(2, 3)=4,v(1,2,3)=10。因此三个商人合作
是有利的。但如何分配他们的合作收益呢?
首先, 在 Shapley 值和核的意义下求解
合作解,然后作为与这两个解的对比分析,
我们采用目标规划模型求解。
如果 x = (x1, x2, x3) 在核中,则由式
(),可得出核需要满足的约束,如()
所示。
x1 ≥ 2 (S ={1});
x2 ≥ 1 (S ={2});
x3 ≥ 1 (S ={3});
x2 + x3 ≥ 4 (S ={2,3});
x1 + x3 ≥ 5 (S ={1,3});
x1 + x2 ≥ 7 (S ={1, 2});
x1 + x2 + x3 =10 (S ={1, 2, 3})
()
为清楚计,我们在三维坐标系中标出了
核的集合,这是一个梯形,即图 1 的阴影部
分。
由式 (), 可求出 Shapley 值,为 x1 =
, x2 = , x3 = 。图 1 的点 M 即为
Shapley 值点。
作为采用目标规划方法的解,关于偏差
变量的权重取决于相应的结盟状态。如果一
个结盟具有明显的优势,则赋予相应偏差变
量以较高的权系数。如果博弈还有其他一些
细节内容,也可通过权重方式解决。
作为例子, 假设 wj(S) = v(S)/2|S|,表明与
结盟 S 对应的负偏差变量的权重。由式
(),可建立算例的收益分配的目标规划
方法。
只有一个参与人的结盟(即参与人选择
单干)的约束为:
)3,2,1(
)3()2()1(
)2(
)3,2,1(
)3()2()1(
)1(
222
111
v
vvv
vddx
v
vvv
vddx
++=−+
++=−+
+−
+−
)3,2,1(
)3()2()1(
)3(
333 vvvv
vddx ++=−+
+−
()
包含两个参与人的软约束为:
)3,2,1(
)3,1()3,2()2,1(
)3,2(2
)3,2,1(
)3,1()3,2()2,1(
)2,1(2
5532
4421
v
vvv
vddxx
v
vvv
vddxx
++=−++
++=−++
+−
+−
-5-
)3,2,1(
)3,1()3,2()2,1(
)3,1(2
6631 vvvv
vddxx ++=−++
+−
()
帕雷托最优条件为:
3,...,1})({
)3,2,1(321
=≥
=++
jjvx
vxxx
j
()
目标函数为:
∑
=
−=
6
1
min
i
iidwz
()
所有变量均为非负。
将合作博弈的值和权系数代入()~
(),求解该模型,得到满意解为 x1=5,
x2=, x3=。即图 1 的点 N。
与 Shapley 值相比,GP 方法确定的解更
加偏重于参与人 1(具有明显的非合作优
势),这显然更为合理。
5 结论
当今社会合作现象日益普遍,如何对合
作带来的收益进行分配,在理论和实践上均
具有重要意义。与经典合作博弈的各种解的
求法相比,目标规划方法可表达更为详细的
因素,如参与人的心理,社会规范,随机或
模糊环境。而这些因素在经典合作博弈中均
没有考虑。因为本论文提出的方法源于实验
分析,因此模型更具有可行性。并且,由于
目标规划采用了软约束,因此比经典解模型
更具有适应性。
参考文献
[1] Alvaro Sandroni, Reciprocity and Cooperation in
Repeated Coordination Games: the Principled-Player
Approach[J]. Games and Economic Behavior, 2000,
32(2): 157-171.
[2] Jeroen Suijs, Peter Borm, Anja De Waegenaere,
Stef Tijs, Cooperative Games with Stochastic
Payoffs[J]. European Journal of Operational Research,
1999, 113: 193-205.
[3] . Thomas. Games, Theory and Applications[M].
Ellis Horwood Ltd, 1984.
[4] Larry Samuelson, Bounded Rationality and Game
Theory[J]. The Quarterly Review of Economics and
Finance(Special Issue), 1996, 36: 17-35.
[5] Aleksandar Pekeč, Meaningful and Meaningless
Solutions for Cooperative N-person Games [J].
European Journal of Operational Research,2001, 133:
608~623.
[6] Ichiro Nishizaki, Masatoshi Sakawa, Fuzzy
Cooperative Games Arising from Linear Production
Programming Problems with Fuzzy Parameters[J].
Fuzzy Sets and Systems,2000, 114: 11-21.
[7] Reinhard Selten. Game Theory and Economic
Behavior (, Selected Essays) [C]. Edward Elgar
Publishing Ltd. 1999: 102-135.
-6-
A Goal Programming Approach to Solutions for Cooperative
N-person Games
Tai Shuangliang1, Zhai Fengyong1, Cai Yiyu2
1. School of Management, Harbin Institute of Technology, Harbin, China (150001)
2. Linhai Electricity Supplying Company, Linhai, Zhejiang (317000)
Abstract
Research on solutions is a key problem for cooperative N-person games. Based on the analysis of the
limitations of classical solutions, the concept of non-cooperative advantage is presented. A goal
programming approach to solutions for cooperative N-person games is also given based on empirical
researches. Compared with classical solutions,the solution which is obtained from the approach
presented in this paper is more applicable and flexible.
Keywords: cooperative game; solutions; non-cooperative advantage; goal programming
作者简介:台双良(1973-),男,汉族,河南省中牟县人,哈尔滨工业大学管理学院博士研
究生,研究方向:建设项目沟通。