第 30 卷第 7 期 电 子 与 信 息 学 报
2008 年 7 月 Journal of Electronics & Information Technology Jul..2008
基于博弈论的二次博弈波束成形算法
吴 舟 赵春晖
(哈尔滨工程大学信息与通信工程学院 哈尔滨 150001)
摘 要:针对波束成形算法中,用户的信号方向估计值和用户之间的功率分配存在着相互矛盾,本文提出了一种基
于博弈论的二次博弈波束成形算法,构建了波束成形博弈算法数学模型,首先在第一次博弈的时候,将波束成形算
法中的信号方向和功率分配映射为博弈论数学模型中的“局中人”,将其建模为函数的极大极小值求解问题,先求解
出信号方向;然后在第二次博弈的时候,将不同用户的功率分配过程描述为一个多用户的博弈过程,设计了功率分
配更新算法,通过数学推导论证了纳什平衡点的存在性和唯一性。最后在仿真中,与传统最大信噪比算法进行比较。
结果表明该文算法的性能要优于最大信噪比算法,并且讨论了不同参数对该文算法的影响。
关键词:博弈论;无线定位;波束成形;多输入多输出;纳什平衡点
中图分类号: 文献标识码:A 文章编号:1009-5896(2008)07-1656-05
Twice Game Beamforming Algorithm Based on Game Theory
Wu Zhou Zhao Chun-hui
(School of Information and Communication Engineering, Harbin Engineering University, Harbin l50001, China)
Abstract: There is mutual contradiction between direction estimation of user’s signal and power allocation among
all users in the beamforming algorithm. A twice game beamforming algorithm based on game theory is proposed to
deal with it. Beamforming game algorithm mathematics model is constructed. During the first game, direction of
signal and power allocation are mapped the game theory as “player”, which are modeled as the problem of maximin
function and obtain direction estimation first. Then during the second game, power allocations of different users
are described as a multi-user game. Power updated algorithm is designed. The existence and uniqueness of the
Nash equilibrium in the twice game beamforming algorithm based on game theory are proved by mathematics
derivation. Finally in simulation the proposed algorithm is compared with conventional maximum SNR algorithm.
The results show that the proposed algorithm is better than MaxSNR algorithm and the impact of different
parameters on the proposed algorithm is discussed.
Key words: Game theory; Wireless location; Beamforming; Multiple Input Multiple Output (MIMO); Nash
equilibrium
1 引言
近来博弈论作为分布式无线资源管理的分析工具已经
得到广泛研究 [1 3]− 。文献[1]中定义了一些博弈论理论框架,
其中包括功率控制,呼叫接入控制和干扰避免。文献[2]分析
了分散式网络中的干扰避免博弈论模型在不同信道环境下
的收敛问题,提出了一种收敛干扰避免博弈论模型,可以降
低互相之间的干扰。文献[3]建立了非合作式功率控制博弈论
模型,以用户的 QoS 作为赢得函数,通过设计一个定价函数
来提高用户的性能。众所周知,博弈论是研究决策主体的行
为发生直接作用时的决策及这种决策的均衡,也就是说,博
弈论研究的是当一个主体的选择受到其他主体选择的影响,
而且反过来影响到其他主体选择时的决策问题和均衡问题。
自适应天线 [4 ]−6 利用多个天线阵元接收信号的加权组合
2006-12-15 收到,2007-06-25 改回
全国优秀博士学位论文作者专项基金(200037)和高等学校优秀青年
教师教学科研奖励计划(2001-226)资助课题
进行信号处理,根据一定的准则在期望用户的方向形成主波
束,在干扰方向上形成零陷,同时,自适应天线能够根据期
望用户和干扰用户的变化自动调整接收和发射方向图。因
此,可以在期望用户的方向上获得较高的增益,而在干扰方
向上获得较低的增益,从而达到提高信干噪比(SINR)的目
的。在文献[6]中为了解决信号方向估计值和实际值不匹配问
题,提出了最差情况约束算法,虽然该算法可以解决信号方
向不匹配的问题,提高接收机的稳定性,但是该算法将会降
低用户的 SINR,尤其是当约束条件在最差情况时,将会使
得 SINR 最小。而发送端又需要调整分配给用户功率来最大
化用户的 SINR,这样在用户的功率分配和信号方向估计值
之间就存在矛盾,两者之间存在着相互影响,相互制约的关
系。同时由于每个用户的 SINR 都受到了其他用户的干扰影
响,所以在调整某个用户的功率分配时必然会对其他用户产
生干扰,进而又需要调整对其他用户的功率分配来抑制干
扰,这样用户之间的功率分配就会周而复始,衍生出无数个
循环,同样会影响系统的全局性能,难以达到最佳状态。
第 7 期 吴 舟等:基于博弈论的二次博弈波束成形算法 1657
为了解决上述两个矛盾,本文提出了二次博弈波束成形
算法,将博弈论的思想应用于波束成形算法当中,将波束成
形算法建模为博弈论数学模型,设计了功率分配更新算法,
通过数学推导论证了纳什平衡点的存在性和唯一性。最后通
过仿真实验验证了算法的性能。
2 系统模型
本文考虑的系统模型为多天线系统下行链路,系统中的
用户数目为 L,假设发射端天线阵列和接收端天线阵列数目
为 M。那么用户 l 接收信号可以表示为
l l l l= +y H vx n (1)
假设信号为广义平稳信号,并且 H
1,
{ }
0,l i
l i
E x x
l i
⎧ =⎪⎪⎪= ⎨⎪ ≠⎪⎪⎩
。
lH 表示信道矩阵,假设发射机已经完美的知道用户的信道
信息。 lv 表示发射权值, 1l =v 。n 为加性噪声向量,表
示非期望信号的影响,例如热噪声、干扰以及多径。那么用
户 l 的 SINR,可以表示为
H
H
l l l
l
i l i
= v Rv
v v
Γ Φ (2)
其中 iv 表示其他用户的发射权值, lR 为信道的协方差矩阵,
lΦ为干扰加噪声的协方差矩阵。 lR 可以表示为
H{ }l E=R HH (3)
lΦ可以表示为
H{ }l l lE= n nΦ (4)
用户 l 的发射权值 lv 可以由两部分组成,可以表示为
l l lP=v u (5)
其中 lP 表示用户 l 的信号功率。 lu 表示用户 l 天线发射权值
的方向,定义了天线发射模式的形状。那么用户 l 的 SINR
可以表示为用户 l 的功率 lP ,其他用户的功率 iP 和发射方向
lu 的函数,即
H
H( , , )
l l l l
l l i l
i i l i
PP P
P
= u Ruu
u u
Γ Φ (6)
从式(6)可以看出,用户的 SINR 取决于用户 l 的功率 lP ,其
他用户的功率 iP 和发射方向 lu 三个参数。
3 基于博弈论的二次博弈波束成形算法
为了解决信号方向估计问题,文献[6]提出了最差情况约
束算法,可以表示为
约束条件
H
1
H
argmin ,
min 1, ,
L
l l i l
i
l l l
=
=
≥ ∀ ∈
∑u u Ru
u Ru u u A (7)
最差情况约束算法使用集合A中一系列所有可能的信
号方向来代替单一的信号方向,也就是说最差情况约束算法
使得约束条件包含了所有的可能情况,其中包括最差情况。
虽然最差情况约束算法能够很好地解决信号方向估计问题,
但是该算法却降低了用户的 SINR,尤其是当约束条件在最
差情况时,将会使得 SINR 最小。而发送端又需要调整发射
功率来最大化用户的 SINR。所以,影响用户 SINR 的用户 l
的功率 lP 和发射方向 lu 就存在矛盾,存在着相互影响,相
互制约的关系。同时从式(6)可以看出,每个用户的 SINR 都
受到了其他用户的干扰影响,所以在调整某个用户的功率分
配时必然会对其他用户产生干扰,进而又需要调整对其他用
户的功率分配来抑制干扰,这样用户之间的功率分配就会周
而复始, 衍生出无数个循环,同样会影响系统的全局性能,
难以达到最佳状态。所以在用户 l 的功率 lP 和其他用户的功
率 iP 之间也存在着矛盾。为了解决这两个矛盾,本文提出了
二次博弈波束成形算法,将博弈论的思想应用于波束成形算
法当中,将波束成形算法建模为博弈论数学模型,首先在第
一次博弈的时候,将波束成形算法中的信号方向和功率分配
映射为博弈论数学模型中的“局中人”,将其建模为函数的极
大极小值求解问题,先求解出信号方向;然后在第二次博弈
的时候,将不同用户的功率分配过程描述为一个多用户的博
弈过程,设计了功率分配更新算法,通过数学推导论证了纳
什平衡点的存在性和唯一性。
博弈论数学模型
博弈论作为分析不同个体之间交互作用的数学理论模
型已经得到广泛应用。它可以用来预测这些交互作用的输出
并且为不同个体选择最优解决策略。一般的博弈论包括 3 个
主要的部分。首先存在着发生交互作用的代表,即“局中人”;
其次,每个局中人可采取一系列的行动,这些行动称为局中
人的策略,局中人的一切可能的策略构成了该局中人的策略
集合;最后,各个局中人分别采取各自的策略后,就会有一
种结局,用数字或函数把这种结局对每个人的利益进行量
化,将得到局中人在此结局下的赢得函数。局中人及其策略
和赢得函数构成了博弈论的 3 个基本要素。博弈论的 3 个基
本要素的数学模型可以表示为
{ ,{ } ,{ } }l l L l l LL S UΛ ∈ ∈= (8)
这里 L 表示“局中人”集合, lS 和 lU 分别表示策略集合和赢
得函数集合。在本文博弈论数学模型中,每个“局中人”都是
独立的选择策略并且策略之间会相互影响。
基于博弈论的二次博弈波束成形算法
第一次博弈 如前所述,用户 l 的功率 lP 和发射方向
lu 之间存在着矛盾,该矛盾可以表示为
H
Hmaxmin
l
l l l l
P A i i l i
P
P∈u
u Ru
u uΦ (9)
在第一次博弈中,假设其他用户的功率 iP 已经给定并且
保持不变。所以在第一次博弈数学模型中,“局中人”就为用
户的 lP 和发射方向 lu ,赢得函数为用户的 SINR,即
H
1
H( , )
l l l l
l l l
i i l i
P
U P
P
= u Ruu
u uΦ (10)
式(10)所示的赢得函数的求解就可以等价为求解函数的极大
极小值,即
1maxmin ( , )lP
U P
u
u (11)
1658 电 子 与 信 息 学 报 第 30 卷
可以求解式(11)所示的极大极小问题。首先解出信号方向 lu
H
maxargmin ( , )l lλ∈= u Au uu Φ (12)
其中 max( , )X Yλ 表示 ( , )X Y 的最大广义特征值,可以表示为
2H 1/ 2 H 1/ 2 1/2 H
max max( , ) ( )l l l lλ λ − − −= =uu uu uΦ Φ Φ Φ (13)
这样式(12)可以表示为
21/2 Hminl nA
−
∈
=
u
u uΦ (14)
第二次博弈 按照式(14)求出信号方向 lu 之后,将其
代入式(6),那么用户 l的 SINR就可以表示为用户 l的功率 lP
和其他用户的功率 iP 的函数,即
H
H( , )
l l l l
l i l
i i l i
P
P
P
= u Ruu
u u
Γ Φ (15)
如前所述,用户 l 的功率 lP 和其他用户的功率 iP 之间存
在着矛盾,所以为了使得给用户分配的功率既能满足最大化
自身的 SINR,又能满足对其他用户的干扰最小,将不同用
户的功率分配描述为一个多用户的博弈过程,设计了功率分
配更新算法来获得最佳的系统稳态。在第二次博弈数学模型
中,“局中人”就为用户 l 的功率 lP 和其他用户的功率 iP ,赢
得函数可以表示为
2 l
l l
l
U P
Γ λΓ α= −+ (16)
其中α 和λ为常数,α 对所有用户都是一样的,本文将其定
义为一个可调参数,决定了效用函数曲线的陡峭程度。λ表
示代价因子,定义了受到干扰时用户所付出的代价。本文的
目标就是要使得式(16)所示的赢得函数最大,即
2argmax argmax
l
l
l
l
U PΓ λΓ α
⎛ ⎞⎟⎜ ⎟= −⎜ ⎟⎜ ⎟⎜ +⎝ ⎠ (17)
对于可微函数,一阶优化的必要条件是一阶导数为 0,
令
H
H
l l l
i i l i
k
P
= u Ru
u uΦ ,对赢得函数求导可得
2 2
2 0( )
l l l
l l l
U U k
P P
Γ αλ λΓ Γ α
∂ ∂ ∂= ⋅ − = − =∂ ∂ ∂ + (18)
求解式(18)可以得到功率 lP 的表达式,即
lP k k
α α
λ= − (19)
式(19)进一步说明了用户之间的功率分配是一个相互影响
的、动态的过程,所以为了使得自身的 SINR 最大,又要使
得用户之间的干扰最小,就需要寻找一个纳什平衡点,使得
系统达到最佳稳态。
纳什平衡点 定义一个博弈过程达到纳什平衡点的充
要条件为
( ) ( , ), ,l l l l l lU U s s l L s−≥ ∀ ∈ ∈S S (20)
当博弈满足上式的时候,就说赢得函数达到了纳什平衡
点。纳什平衡点为具有竞争冲突的竞争提供了通过优化来获
得可预测和稳定的博弈结果,从而达到一个每个参与者都不
愿意背离的平衡点,然而纳什平衡点并不总是存在的,所以
首先证明式(19)所示的功率分配过程纳什平衡点的存在性。
定理 1 存在纳什平衡点。
证明 根据纳什定理,只要证明① lP 是欧氏空间的非
空、闭的,有界的凸集;② 2
l
U 在P 上连续,在 lP 上拟凹。
由于每个用户的策略集合定义在区间 max[0, ]lP 上,显然
满足第 1 个条件。
对第 2 个条件,对赢得函数求 2 阶导数,有
2 2 2 2
2 3
( ) 2
0
( )
l
l l l
k
U k
P P kP
α λΓ α α
α
∂ −∂ + −= = <∂ ∂ + (21)
由上式可知赢得函数 2lU 在 lP 上是凹的。因为一个凹函
数也是拟凹的,所以赢得函数 2lU 在 lP 上是拟凹的,所以算
法存在纳什平衡点。
定理 2 存在唯一的纳什平衡点。
定义 ( ) /( ) /lr P k kα λ α= − ,根据文献[7]中的相关定
理,如果该函数是个标准函数的话,那么就存在唯一的收敛
点,所以只需要证明该函数是个标准函数,即函数满足正性、
单调性和可扩展性就可以了。
(1)正性 首先假设系统是可行的,所以每个用户可以通
过发射功率来获得一定的效用,同时还能够通过适当的准入
控制算法实现此假设,这样可以满足正性条件;
(2)单调性 即当 'l lP P≤ 时,有 ( ) ( )'l lr P r P≥ 。由于系
统是可行的,可知 2 0lU ≥ ,并且当 'l lP P≤ 时有 k k'≥ ,所
以可以得到:
2
0
1
l l
l l
l l
l
kP
P P
kP
P
k k
Γ λ λΓ α α
α α α
λ λ
− ≥ ⇒ ≥
+ +
⇒ ≥ + ⇒ ≥ (22)
所以
( ) ( )
( )/ ( ) / 0
'
l lr P r P k k k' k'
k' kk' k' k kk' k kk' kk'
α α α α
λ λ
α α α α α
⎛ ⎞ ⎛ ⎞⎟ ⎟⎜ ⎜− = − − −⎟ ⎟⎜ ⎜⎟ ⎟⎜ ⎜⎝ ⎠ ⎝ ⎠
≥ − − + = − ≥ (23)
所以当 'l lP P≤ 时,有 ( ) ( )'l lr P r P≥ 。
(3)可扩展性 即对任意的 1η > ,有 ( ) ( )l lr P r Pη η≥ 。
对于任意的 1η > ,定义
H
H
l l l
i i l i
k
Pη η=
u Ru
u uΦ ,因为 1η > ,
所以 k kη < ,则 ( )lr Pη 可以表示为
( )lr P k kη η
α αη λ= − (24)
所以
( ) ( )
1
0
l lr P r P k k k k
k kk
k k k k k kk
η η
η
η η η
α α α αη η η λ λ
α η ηα α α
⎛ ⎞⎛ ⎞ ⎟⎜ ⎟⎟⎜ ⎜− = − − − ⎟⎟⎜ ⎜ ⎟⎟⎜ ⎜⎝ ⎠ ⎟⎟⎜⎝ ⎠
⎛ ⎞ ⎛ ⎞−⎟ ⎟⎜ ⎜⎟ ⎟⎜ ⎜≥ − − + = >⎟ ⎟⎜ ⎜⎟ ⎟⎜ ⎜⎟ ⎟⎟⎟ ⎜⎜ ⎝ ⎠⎝ ⎠
(25)
所以当 1η > ,有 ( ) ( )l lr P r Pη η≥ 。
根据上面三点证明,即能证明 ( )lr P 是个标准函数,则该
算法具有唯一的纳什平衡点。下面就来获得纳什平衡点。如
果赢得函数满足下式,那么就达到均衡,则功率分配过程中
第 7 期 吴 舟等:基于博弈论的二次博弈波束成形算法 1659
止:
1n nU U ε+ − ≤ (26)
其中 ε表示收敛精度,为一个极小值。
基于博弈论的二次博弈波束成形算法步骤总结 (1)第
一次博弈:将用户 l 的功率 lP 和发射方向 lu 建模为函数的极
大极小值求解问题,按照式(14)首先求出信号方向 lu ;(2)
第二次博弈:将不同用户的功率分配描述为一个多用户的博
弈过程,按照式(19)为用户进行功率分配,当赢得函数满足
式(26)时,功率分配过程中止。
4 仿真与分析
为了对本文提出的二次博弈波束成形算法进行仿真验
证,将本算法与传统的最大信噪比波束成形算法(MaxSNR)
进行比较,MaxSNR 算法表示如下:
总
H
Hargmax .
l l l l
l
i i l i
P
P P
P
≤u Ru
u uΦ (27)
其中 总P 为发射机总的发射功率。在仿真中,采用的仿真模
型为单小区,发射机和接收机天线数目为 8M = ,天线阵元
之间间距为波长的一半,精度要求 510ε −= 。做 10,000 次
Monte Carlo 实验验证算法的性能。
图 1 和图 2 所示为两种算法归一化天线增益和天线增益
极坐标比较图。假设有两个干扰源,角度分别为 10°和 100°,
期望用户到达角度为 60°。在仿真中可调参数 1α = ,代价
因子 1λ = ,用户数目 4L = 。两幅图从不同角度比较了两
种算法的性能。从两幅图可以看出,本文算法的性能要优于
MaxSNR 算法,可以准确的对准期望用户方向,很好地抑制
干扰方向的信号,起到很好地“零陷”作用。并且采用了功率
分配之后,能够很好地抑制用户之间的相互干扰,增大覆盖
范围。下面分析一下本文算法在不同参数下的性能。
图 1 两种算法归一 图 2 两种算法天线
化天线增益比较图 增益极坐标比较图
图 3 所示为本文算法在不同可调参数下α 的影响。在仿
真中代价因子 1λ = ,用户数目 2L = 。从图中可以看出,
可调参数α 决定了效用函数的陡峭程度,不同的可调参数使
得赢得函数的结果也有所不同,并且在不同的可调参数下算
法收敛于稳定值的迭代次数也不同,所以可以通过设置不同
的α 值,在系统性能和收敛速度之间权衡,使得算法适应于
不同的环境要求。
图 4 所示为代价因子对迭代次数的影响。在仿真中可调
参数 1α = ,用户数目 4L = 。从图中可以看出,迭代次数
随着代价因子的增加而减小。这是因为随着代价因子的增
加,用户所付出的代价也越大,使得算法更快的收敛于稳定
值。所以选择合适的代价因子,可以取得系统性能和收敛速
度的折衷。
图 3 可调参数对 图 4 代价因子对
本文算法的影响 迭代次数的影响
下面分析一下收敛精度 ε对本文算法功率分配过程的影
响。如图 5 所示。在仿真中,可调参数 1α = ,用户数目L
4= 。代价因子 λ = 。从图中可以看出,当收敛精度越
大,迭代次数越少,并且随着收敛精度的减小,用户的发射
功率逐渐增加。这是因为收敛精度越大,算法很快就能够收
敛于稳定值,但是由于收敛精度大,算法过快收敛,使得发
射功率迭代不充分,造成了收敛精度越大,发射功率越小的
现象。但是如果收敛精度过小,将会造成算法无法收敛到稳
定值,所以可以合理选择收敛精度,使得算法满足不同的要
求。
图 5 收敛精度对算法的影响
5 结论
本文针对波束成形算法中,用户的信号方向估计值和用
户之间的功率分配存在着相互矛盾,提出了一种基于博弈论
的二次博弈波束成形算法,分别对波束成形算法中的信号方
向和功率分配进行两次博弈,并且设计了功率分配更新算
法,通过数学推导论证了纳什平衡点的存在性和唯一性。最
后在仿真实验中将本文算法和传统的 MaxSNR 算法进行比
1660 电 子 与 信 息 学 报 第 30 卷
较,从仿真结果可以看出,本文算法的性能要优于 MaxSNR
算法,并且讨论了代价因子、可调参数和收敛精度等参数对
算法的影响。通过设置不同的代价因子、可调参数和收敛精
度可以取得系统性能和收敛速度的折衷,使得算法满足不同
的要求。
参 考 文 献
[1] Neel J, Reed J H, and Gilles R P. The role of game theory in
the analysis of software radio networks. In Proc. SDR Forum
Technical Conference, San Diego, Calif, USA, Nov, 2002, 2:
NP-3-02.
[2] Menon R, MacKenzie A, Buehrer R, and Reed J H. Game
theory and interference avoidance in decentralized networks.
SDR Forum Technical Conference, Phoenix, Arizona, Nov
2004: 15-18.
[3] Saraydar C U, Mandayam N B, and Goodman D J. Efficient
power control via pricing in wireless data networks. IEEE
Trans. on Communications, 2002, 50(2): 291-303.
[4] Shahbazpanshi S, Gershman A B, Luo Zhi-Quan, and Wong
Kon Max. Robust adaptive beamforming for general-rank
signal models. IEEE Trans. on Signal Processing, 2003, 51(9):
2257-2269.
[5] Boche H and Schubert M. A new approach to power
adjustment for spatial covariance based on downlink
beamforming. IEEE international conference on ICASSP’01,
Salt Lake City, UT, USA, 2001, 5: 2957-2960.
[6] Vorobyov S A, Gershman A B, and Luo Zhi-Quan. Robust
adaptive beamforming using worst-Case performance
optimization: A solution to the signal mismatch problem.
IEEE Trans. on Signal Processing, 2003, 51(2): 313-324.
[7] Yates R D. A framework for uplink power control in cellular
radio systems. IEEE Journal on Selected Areas in
Communications, 1995, 13(7): 1341-1348.
吴 舟: 男,1981 年生,博士,研究方向为无线定位技术、无线
资源管理、MIMO 和 OFDM 技术.
赵春晖: 男,1965 年生,教授,博士生导师,研究方向为信号与
图像处理、非线性滤波、无线定位技术等.