MBA智库文档经济经济分析 N人合作博弈解的目标规划方法.pdf

N人合作博弈解的目标规划方法.pdf

下载

Mmathews2k

6页 | 320KB | 1次下载 |

0.0

(0人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

1 本课题得到国家十五重点科技攻关专题——电子商务环境下集成化建筑供应链管理研究（2004BA209B03）的资助。 -1- N人合作博弈解的目标规划方法 1 台双良 1，翟凤勇 1，蔡益宇 2 1.哈尔滨工业大学管理学院，黑龙江哈尔滨（150001） 2.浙江省临海市供电局，浙江临海（317000）摘要：在 N人合作博弈中，对合作收益的解的研究是核心问题。本文分析了各种合作博弈解的应用局限，在此基础上提出了非合作优势的概念，并给出了基于目标规划的合作博弈解的确定方法。与其它合作博弈解概念相比，该方法更为符合实际，并具有更好的适应性和可操作性。关键词：合作博弈；解；非合作优势；目标规划中图分类号：C936 文献标识码：A 1 引言1 近年来，博弈论在管理科学、经济学、社会学、政治科学等方面扮演着重要角色，这些研究的主流方法，几乎都集中于非合作博弈。相比之下，基于合作博弈的相关研究则被学术界所忽略。这并非意味着合作博弈的重要性不如非合作博弈，研究表明，随着经济社会的发展，特别是信息时代的今天，真实世界中的合作行为变得越来越普遍[1]。 N 人合作博弈的数学原理和相应解概念通常受运筹学、管理科学、决策论、经济理论等各种不同学科启发而提出[2]，其中合作博弈的解概念（solution concepts），即对合作博弈大联盟收益在参与人之间的合理分配的研究，是合作博弈研究的核心内容 [3]。各种不同的解概念，如稳定集（stable sets，von Neumann& Morgenstern, 1944）， Shapley 值（the Shapley value，Shapley, 1953), 核（the core，Gillies, 1959）和核心（the nucleolus，Schmeidler, 1969）等。其中， Shapley 值可能是最重要的合作博弈解概念之一。这些已成为合作博弈经典内容的解概念，往往从看似合理的一组公理假设导出，然而针对同一个合作博弈问题，由于不同解概念导出的结果往往并不一致，以至于实际中无法确定哪一个解概念更为合理，甚至有时候某个解集为空集。这些问题大大限制了合作博弈在实际中的应用[4]。根据经典合作博弈解，一些学者提出了更为符合实际或具有一般性的解概念。 Shapley（1969）提出了不可转移效用的 Shapley 值（NTU-Shapley value），这可看成 Shapley 值的一般化。 Kim Allan, 等（1999）提出了基于多目标线性规划方法，用来计算 NTU-Shapley 值[5]. Aleksanda（2001）引入了比率、区间和序数尺度（ordinal scales），分析了在这些概念下有意义和无意义的解 [5]. Jeroen 等（1999）介绍了在随机环境下的合作博弈模型[2]。Ichiro Nishizaki 等（2000）对产出问题给出了具有模糊参数的线性规划模型，并构建了模糊合作模型 [6]。总之，结合各种实际背景，对合作博弈的理论和应用研究进行整合，成为近来合作博弈研究的主要流向。 2 合作博弈简述合作博弈的解在合作博弈中，通常假定在博弈中的收 -2- 益可被任意分割，且收益可在不同参与人之间传递，该假设与非合作博弈有着本质的差别，这个特性被称为转移支付（side-payments）。在经典合作博弈中，往往用特征函数（characteristic function）v 表示一个合作博弈。记参与人集合为 N，一个 N 人合作博弈特征函数是一个映射 v: 2N ÆR, 满足 v(∅ )=0, 对于 N 的任一非空子集，称该子集为一个联盟(S⊆N )， v(S)是联盟 S 的值，表示通过结盟内成员间策略的协调所能实现的最大收益（无论其他参与人采用什么对策）。结盟 N 又被称为大结盟 (grand coalition), v(N) 是合作博弈的总收益。满足 ∑ =ni 1 xi = v(N)的向量 x = (x1,…, xn) 被称为博弈 v 的解的帕雷托最优条件（Pareto-optimality condition），满足帕累托最优条件的向量x = (x1,…, xn) 被称为博弈 v 的解。假定合作博弈 v 的解 x 至少要保证不少于参与人 i 单干所获得的收益({i})。 (否则，参与人宁愿不合作，而是选择单干)。这个准则被称为个体理性准则 (individual rationality)，也就是 x ∈Rn 要满足 xi ≥ v({i})，对于任意的 i=1,…,n。博弈 v 的解如果同时还满足个体理性条件，则被称为自利解（imputations）。于是博弈 v 的自利解为满足下列条件的集 M ={∑ ix =v(N), xi ≥ v({i}),i=1,…,n} () 考虑合作博弈 v 的两个解 x 和 y, 如果存在一个非空子集 S 满足 xi>yi，∀ i∈S 且满足 x(S) ≤ v(S)，则称 x 优于 y (记为 xφ y) 。合作博弈有各种解概念，其中 Shapley 值和核，可能是合作博弈最重要的解概念之一。博弈 v 的核是满足如下条件的集合： C {x:∑ ix = v(N) 且 x(S)≥ v(S), S⊆ N } () 对于一个特定合作博弈，在核的意义下，可能存在多个解，或核是空集。C=∅表明对于任何解 x，不管何种联盟，某参与人总可以通过与联盟外的参与人合作获得更大的收益。与核的概念相反，对于任何一个合作博弈 v，Shapley 值恒存在且唯一。Shapley 值由 Shapley 于 1953 年通过公理化方式建立。合作博弈 v 的 Shapley 值被定义为 \{ } | |!( | | 1)!( ) ( ( {}) ( )) !i i S N i S n Sx s x v S i v S n⊆ − −= = −∑ U () 这里|S| 表示集合 S 的势。特别地，当 n=2 时, 由式 ()可以得出 121 )2,1(,2 ))2()1(()2,1( xvxvvvx −=−+= () 于是很容易算出在二人合作博弈下，各参与人通过合作所获得的收益增加值，为 )))2()1(()2,1(( 2 1 21 vvvxx +−=Δ=Δ () 核和 Shapley 值的简要评述尽管核在理论上具有重要地位，但在实际中较少使用。主要有两个原因：核可能是空集，还可能具有相当多的解。这一方面给出了很多可行分配方案，另一方面也带来了计算上的困难。 Shapley 值由三个看似合理的公理假设导出的，同时，每个合作博弈都存在一个唯一的 Shapley 值。因此，与其他合作博弈解的概念相比，Shapley 值在实际中应用的更为普遍。然而，如果进一步分析就会发现， Shapley 值在一定场合是有缺陷的。考察式 -3- ()，二人合作博弈中，两个参与人获得相同份额的合作受益，这个结论在多数场合是不成立的，特别是一个处于强势的参与人与处于相对弱势参与人合作的时候。合作博弈模型假设过于简单，也限制了合作博弈解概念的应用。比如，标准合作博弈结盟的值被看成确定的数，但在很多场合，博弈收益值往往是不确定的。此外，在真实博弈中，一些重要参数，如参与人的心理状况，社会规范等等，也可能在真实博弈中起着关键作用。但是，这些因素在标准合作博弈分析中并没有包含进来。第一个关于合作博弈的实验由 Kalish, Milnor, Nash 和 Nering （1954）进行的，以后，Selten and Schuster（1968）, Kahan 和 Rapoport（1984）也对合作博弈进行了重要实验分析[7]。来自这些博弈实验分析的数据也表明，经典合作博弈各种意义下的解，有时并不总是与实际相符。 3 目标规划方法为使合作博弈的解概念更加符合实际，一方面要考虑整体合作收益的帕累托化，同时还要考虑个体理性条件、合作收益的不确定和参与人在博弈中所处的地位等多个目标。为此，这里考虑引入目标规划方法。目标规划（Goal Programming）模型是运筹学中已被证明为有效的模型。该模型包含软约束，可处理彼此矛盾的问题，并且在某种程度上可以表示决策者微妙的情绪状态。为构造合作博弈解的目标规划模型，首先引入两个定义。定义 1：非合作优势。称一个结盟具有 “非合作优势，表明结盟如果不与结盟外的参与人合作，仍能保证该结盟具有相对较高的收益。该定义是一个描述性定义。定义 2：非合作优势度。用来定量化描述合作博弈某个结盟非合作优势的指标。式（）就是一个用以度量结盟 S 的一个非合作优势度指标。 NSSt Nv SvSt ⊂≠∅== |,|,)( )()(α () 下面开始构建合作博弈解的目标规划模型。令 x = (x1,…,xn)为合作博弈的解。模型的第一个假设是 : )(Stα 的值越大，结盟 S 的收益也就越大，即 x(S)正比于 )(Stα 。对于势为 t 的结盟，可构建软约束如下: 1,...,1)( )'( )( |'| ,, −==−+ ∑∑ = +− ∈ NtNvk Sv Svddx t tS SiSi Sj j () 式（）表明: 对于包含 t 个参与人的结盟， S 中的收益分配正比于非合作优势度。等式右边的常数项 kt 为调整系数，用于保证所有参与人获得的分配收益的和恰好等于大联盟的值。很容易验证调整系数 kt 的取值应满足： ⎪⎩ ⎪⎨⎧ << == −− NtC t k t N t 1, 1,1 1 1 () (10, 0, 0) x3 x2 x1 (0, 0, 10 ) (0, 10, 0 ) 图 1 合作博弈各种解示意图 M N -4- 所有偏差变量非负。模型的第二个假设是：每个目标权重依赖于结盟的“紧密度”。结盟的“紧密度”越高，该结盟在真实博弈中越容易形成。实验分析表明，结盟 S 的“紧密度”主要依据两个因素：集合 S 的势(| S |)以及结盟的值 (v(S))。因此，若认为权重为这两个指标的函数，即 |)|),(()( SSvFSwt = , t =| S |, 根据上述分析，可得 0 || ,0 <∂ ∂>∂ ∂ S F v F () 式（）的含义很明显：某个结盟的收益越高，参与人的数目越少，则该结盟的“紧密度”就越高。这个假设与实验分析结果是一致的。模型的第三个假设是:博弈的解必须是自利解（imputations），即: njjvx Nvx j n j j ,...,1})({ )( 1 =≥ =∑ = () 目标规划的决策目标是关于所有负偏差变量的最小化。 4 算例三个商人经商问题。一个城市有三个商人，用 1, 2, 3 表示。如果每个人单独经商，收益分别为 2, 1, 1，记为 v(1)=2, v(2)=1, v(3)=1。如果 1 与 2 合作，可获得收益 7，记为 v(1, 2) = 7。类似地，可得出 v(1, 3)=5， v(2, 3)=4，v(1,2,3)=10。因此三个商人合作是有利的。但如何分配他们的合作收益呢？首先, 在 Shapley 值和核的意义下求解合作解，然后作为与这两个解的对比分析，我们采用目标规划模型求解。如果 x = (x1, x2, x3) 在核中，则由式 ()，可得出核需要满足的约束，如（）所示。 x1 ≥ 2 (S ={1}); x2 ≥ 1 (S ={2}); x3 ≥ 1 (S ={3}); x2 + x3 ≥ 4 (S ={2,3}); x1 + x3 ≥ 5 (S ={1,3}); x1 + x2 ≥ 7 (S ={1, 2}); x1 + x2 + x3 =10 (S ={1, 2, 3}) () 为清楚计，我们在三维坐标系中标出了核的集合，这是一个梯形，即图 1 的阴影部分。由式 (), 可求出 Shapley 值，为 x1 = , x2 = , x3 = 。图 1 的点 M 即为 Shapley 值点。作为采用目标规划方法的解，关于偏差变量的权重取决于相应的结盟状态。如果一个结盟具有明显的优势，则赋予相应偏差变量以较高的权系数。如果博弈还有其他一些细节内容，也可通过权重方式解决。作为例子, 假设 wj(S) = v(S)/2|S|,表明与结盟 S 对应的负偏差变量的权重。由式（），可建立算例的收益分配的目标规划方法。只有一个参与人的结盟（即参与人选择单干）的约束为： )3,2,1( )3()2()1( )2( )3,2,1( )3()2()1( )1( 222 111 v vvv vddx v vvv vddx ++=−+ ++=−+ +− +− )3,2,1( )3()2()1( )3( 333 vvvv vddx ++=−+ +− () 包含两个参与人的软约束为： )3,2,1( )3,1()3,2()2,1( )3,2(2 )3,2,1( )3,1()3,2()2,1( )2,1(2 5532 4421 v vvv vddxx v vvv vddxx ++=−++ ++=−++ +− +− -5- )3,2,1( )3,1()3,2()2,1( )3,1(2 6631 vvvv vddxx ++=−++ +− () 帕雷托最优条件为： 3,...,1})({ )3,2,1(321 =≥ =++ jjvx vxxx j () 目标函数为： ∑ = −= 6 1 min i iidwz () 所有变量均为非负。将合作博弈的值和权系数代入（）~ （），求解该模型，得到满意解为 x1=5, x2=, x3=。即图 1 的点 N。与 Shapley 值相比，GP 方法确定的解更加偏重于参与人 1（具有明显的非合作优势），这显然更为合理。 5 结论当今社会合作现象日益普遍，如何对合作带来的收益进行分配，在理论和实践上均具有重要意义。与经典合作博弈的各种解的求法相比，目标规划方法可表达更为详细的因素，如参与人的心理，社会规范，随机或模糊环境。而这些因素在经典合作博弈中均没有考虑。因为本论文提出的方法源于实验分析，因此模型更具有可行性。并且，由于目标规划采用了软约束，因此比经典解模型更具有适应性。参考文献 [1] Alvaro Sandroni, Reciprocity and Cooperation in Repeated Coordination Games: the Principled-Player Approach[J]. Games and Economic Behavior, 2000, 32(2): 157-171. [2] Jeroen Suijs, Peter Borm, Anja De Waegenaere, Stef Tijs, Cooperative Games with Stochastic Payoffs[J]. European Journal of Operational Research, 1999, 113: 193-205. [3] . Thomas. Games, Theory and Applications[M]. Ellis Horwood Ltd, 1984. [4] Larry Samuelson, Bounded Rationality and Game Theory[J]. The Quarterly Review of Economics and Finance(Special Issue), 1996, 36: 17-35. [5] Aleksandar Pekeč, Meaningful and Meaningless Solutions for Cooperative N-person Games [J]. European Journal of Operational Research，2001, 133: 608~623. [6] Ichiro Nishizaki, Masatoshi Sakawa, Fuzzy Cooperative Games Arising from Linear Production Programming Problems with Fuzzy Parameters[J]. Fuzzy Sets and Systems，2000, 114: 11-21. [7] Reinhard Selten. Game Theory and Economic Behavior (, Selected Essays) [C]. Edward Elgar Publishing Ltd. 1999: 102-135. -6- A Goal Programming Approach to Solutions for Cooperative N-person Games Tai Shuangliang1, Zhai Fengyong1, Cai Yiyu2 1. School of Management, Harbin Institute of Technology, Harbin, China (150001) 2. Linhai Electricity Supplying Company, Linhai, Zhejiang (317000） Abstract Research on solutions is a key problem for cooperative N-person games. Based on the analysis of the limitations of classical solutions, the concept of non-cooperative advantage is presented. A goal programming approach to solutions for cooperative N-person games is also given based on empirical researches. Compared with classical solutions，the solution which is obtained from the approach presented in this paper is more applicable and flexible. Keywords: cooperative game; solutions; non-cooperative advantage; goal programming 作者简介：台双良（1973-），男，汉族，河南省中牟县人，哈尔滨工业大学管理学院博士研究生，研究方向：建设项目沟通。

联系我们

智库文档公众号

客服微信

N人合作博弈解的目标规划方法.pdf

下载

标签

相关专题更多

联系我们

意见反馈

标签

相关专题 更多

联系我们

意见反馈

相关专题更多