第!"卷 第!期
#$$%年!月
计算机辅助设计与图形学学报
&’()*+,’-.’/0(12)3+452552647*8.’/0(12)7)+
:;<=!",*;=!
&>?=,#$$%
收稿日期:#$$@A$"A#!;修回日期:#$$@A!#A$#
基金项目:国家重点基础研究发展规划项目(#$$@!D$$$,7!EED$@$F$D);国家“八六三”高技术研究发展计划项目(#$$!++#@!$@!);国家
科技攻关计划课题奥运科技专项(#$$!C+E$BC$D)
基于序列蒙特卡罗方法的!"人体运动跟踪
陈 睿 刘国翌 赵国英 张 俊 李 华
(中国科学院计算技术研究所智能信息处理重点实验室 北京 !$$$D$)
(GHIJ?!KHL=>H=H?)
摘 要 针对人体运动跟踪的特点,在退火粒子滤波方法的基础上,提出基于序列蒙特卡罗方法的@5人体跟踪算
法=通过状态空间分解提高了退火系数选择的鲁棒性;同时,在每次退火时采用02)/采样方法,而不是标准的重采
样,能在一定程度上抑制观测模型与真实分布之间的误差,从而提高算法的稳定性=通过模拟实验表明,该算法适合
@5多关节人体跟踪=
关键词 跟踪;随机采样;序列蒙特卡罗;模拟退火;02)/
中图法分类号 10@E!
!"#$%&’()*+)’,-&./+’01&234)’536$3’*+&7()’*38&-7)(3*9)4
.IJ?)MK ,KM7M;NK OI>;7M;NK?P OI>?P&M? ,K9M>
(!"#$%&’(%)’(#’*+,)"--./",)+,*’(0%).’,1(’2"33.,/,+,3).)4)"’*5’064).,/7"28,’-’/#,58.,"3"92%:"0#’*;2.",2"3,<".=.,/ !$$$D$)
:;2*-&.* .I>G>HLJGKQJRSNKLTIKPIRKUJ?TK;?>?RUM<LK3U;R><,LIJ@5IMU>?U;LK;?LG>HVK?PI>TSJJ?
>TLMSS;G?WG;S<JUK?H;UWMLJGXKTK;?Y;GU>?NNJ>GT=1IKTW>WJGK?LG;RMHJT>?JZTJ[MJ?LK></;?LJ.>G<;
(6/.)UJLI;R,S>TJR;?>??J><JRW>GLKH<JYK<LJGK?P,L;T;<XJLIJWG;S<JU=-KGTL<N,LIJ?JZUJLI;R>R;WLT
LIJTL>LJTW>HJRJH;UW;TKLK;?K?H;?\M?HLK;?ZKLITKUM<>LJR>??J><K?PL;KUWG;XJLIJ>??J><K?PJYYKHKJ?HNK?
>H;UW>G>S<N<;ZJGRKUJ?TK;?;?J]L,LIJ02)/T>UW<K?P>YLJGJXJGN>??J><K?P,K?TLJ>R;YTL>?R>GR
GJT>UW<K?P,KTMTJRL;H;UWJ?T>LJLIJJGG;GSJLZJJ?LIJ;STJGX>LK;?U;RJ<>?RLIJLGMJL>GPJLRKTLGKSMLK;?=
+LLIJJ?R;YLIKTW>WJG,>TKUM<>LJRJ]WJGKUJ?LKTPKXJ?L;TI;ZLI>L;MGKUWG;XJR6/.3S>TJRUJLI;RKT
H>W>S<J;YLG>HVK?P@5>GLKHM<>LJRIMU>?=
<3=>)-42 LG>HVK?P;G>?R;UT>UW<K?P;TJ[MJ?LK></;?LJ.>G<;;TKUM<>LJR>??J><K?P;02)/
? 简 介
近年来,随着计算机技术的高速发展,对人的行
为的识别和研究引起越来越多的关注=其中一个重
要的内容是对运动人体的跟踪=它在视频监控、人
机交互、图像压缩、体育运动分析、电影动画制作和
虚拟现实等多个领域都有着广泛的应用=
顾名思义,人体运动跟踪就是通过各种手段连
续地确定人的位置,并且将这些位置信息以合适的
方式在计算机中表达出来=带标记球的人体运动捕
捉系统[!]已经成功地应用于体育运动分析和电影
动画制作等领域中=但是,带标记球的方法不仅需
要昂贵的硬件设备支持,而且对人的运动有诸多限
制,例如必须将标记球固定在关节位置=显然,一种
无需标记球、不需要特殊硬件设备支持的、只使用传
统的摄像机就能够捕捉人体运动的系统,将比带标
记球的人体运动捕捉系统具有更好的应用前景=
人体运动跟踪技术研究已有多年的历史[#]=但
是,涉及到全身的人体多关节模型跟踪的研究一直
都是计算机视觉领域的一个难题=其原因有以下几
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
点:全身人体模型的维数较高,例如一个简单的人体
万方数据
多关节模型就有!"多个关节参数自由度;很难找到
一个合适的模型与图像的匹配方法,特别是存在混
乱背景及自遮挡时,鲁棒的匹配方法更难找到;人体
跟踪是一个多峰的问题,多峰不仅来自于三维位置
到二维投影之间存在多义性,而且来自其他干扰,如
混乱背景、遮挡等#
针对以上问题,我们采用一种随机的方法,即序
列蒙特卡罗($%&’%()*+,-.()%/+0,.,$-/)方法,试
图从多个视频序列图像中恢复三维人体姿态#$-/
方法的最大优点在于它是一种非参数的方法,对跟
踪模型不需要做很多先验假设,而且非常适合于多
峰情况#
! 前人的工作
基于计算机视觉方法的人体跟踪技术研究已有
多年的历史#早期的工作多集中在二维跟踪,即只
需确定感兴趣目标在视频图像平面上的二维位置#
1+0*)+.2,’等[3]提出的 45是一个非常好的!6跟
踪系统,它使用自适应的减背景方法提取人体运动
轮廓,并用边界盒表示人体;/.7+(*8*’等[5]的
-%+($9*:)方法采用肤色的统计直方图属性对人脸
进行跟踪#值得一提的是;<+0=等[>]将基于?+@%<*+(
规则的概率模型引入到计算机视觉中,用于跟踪非
刚体的、多关节表示的手掌运动,这种被称为
/AB6CB$DE;AB(/.(=*)*.(+,6%(<*)@+2+)*.()的
方法近年来得到广泛的应用,并取得了非常有价值
的研究成果#
以上方法多是跟踪感兴趣目标的二维信息#二
维信息对于许多智能监控的应用而言已经足够#但
在许多应用中,对跟踪物体的三维信息感兴趣#对于
人体运动的跟踪,我们希望获取人体的三维空间信
息,并将其应用于运动分析、电影动画制作等领域#
三维人体跟踪相对由于二维而言,最大的区别在于
人体关节的自由度大幅度增加,使得跟踪的难度呈
指数级数地增长#
H+I0*,+等[J]是较早对三维人体进行跟踪的研
究者之一,他们用多关节的三维模型与5个相机的
边界距离图进行分层的跟踪,采用自上而下的离散
空间搜索技术,提高了参数空间搜索效率#40%(
等[K]的F:*(=%0系统利用头和手的位置给出一个比
较粗略的椭球体人体模型,头和手的位置用颜色块
的分割得到#还有F,+%(L%0<等[M]用三维点云与模
型进行匹配#6%’)<89%0等[N]在跟踪框架上采用基于
/AB6CB$DE;AB的退火粒子滤波,得到了很好的
实验效果#在其改进算法中[O"],引入了自适应搜索
空间分解和遗传算法,在一定程度上提高了计算
效率#
近年来还有不少文献将三维姿态的估计当作一
个学习和推理的过程[OOPO5]#采用学习方法的优点是
算法稳定性好,而且速度快,缺点是只能对已经学习
的运动进行跟踪,并不适合自然场景中人的任意动
作跟踪#
总之,二维人体跟踪技术已取得不少成果,并逐
步应用在视频监控和人机交互领域中#现在的研究
是由二维跟踪向三维跟踪深入,以适应更广泛的应
用需求#二维跟踪技术中的许多研究成果对三维人
体跟踪起了辅助作用,如通过识别二维头和手的位
置可以为三维人体跟踪提供重要信息#
" 序列蒙特卡罗方法
序列蒙特卡罗方法是近年来使用非常普遍的一
种时间序列分析方法,也称为粒子滤波或序列重要
采样#它在多个领域中都有应用,如物理学[O>]、生物
信息学[OJ]、数字信号处理[OK]、计算机视觉[>,OM]、金
融分析[ON]等#有关序列蒙特卡罗方法的详细介绍可
以参考文献[!"P!!],本文只对其进行简单的介绍#
通过建立一个状态空间模型,我们把视频序列
的跟踪问题表示为一个动态系统的状态估计问题#
在状态空间模型中,状态矢量!!用来描述系统的
信息#在人体跟踪问题中,!!表示在!时刻的人体
模型的姿态参数,如各个关节的角度#观测矢量"!
对应于状态矢量的观测值,如视频图像提取的边界、
轮廓或灰度等特征#一般情况下,假设!!服从一阶
马尔可夫过程,而且"!只与当前时刻的状态!!有
关,那么这个状态空间模型表示为
!!"#!(!!$O,#!) (O)
"!"%!(!!,$!) (!)
式(O)是系统动态模型,用来描述状态矢量随时间改
变而产生的变化;其中,#!是!!QO的函数,#!是系
统噪声#式(!)是观测似然模型,给出状态的噪声观
测值;其中,%!是!!的函数,$!是观测噪声#
跟踪问题可以描述为:在给定了累积到时刻!
的观测值""R!的条件下,计算在时刻!的状态!!#
换句话说,就是要计算后验概率密度函数(+S*,*)@
6%(<*)@T’(8)*.(,F6T)———&(!!!""R!)#对于线性
情况,U+,7+(滤波[!3]可以解决问题,但对于复杂的
非线性情况,$-/是更好的选择#$-/用一组离散
的加权样本集合{’(()! ,)
(()
! }(VO,⋯,*来表示后验
JM 计算机辅助设计与图形学学报 !"">年
万方数据
!"#———!(!"!"$%")
[&’],#($)" 是从重要性分布函数
%(!"!!"(’,"")中采样得到的样本,权为 &
($)
" )
!(!"!"$%")的估计可以通过预测、更新和重采样三
个步骤得到)
*+,-’)预测,根据全概率公式,当"(’时刻的后验
!(!"(’!"$%"(’)已知时,它用{#
($)
"(’,&
($)
"(’}$.’,⋯,’表示,预
测步骤就是利用系统动态模型(’)来获取"时刻的先验
!"#———!(!"!"$%"(’),如
!(!"("$)"*’)+"!(!"(!"*’)!(!"*’("$)"*’)/,"*’
(0)
!(!"!!"(’)表示系统状态的演化,它由式(’)决定)即由
{#($)"(’}生成预测样本{#(
($)
" })
*+,-&)更新)根据123,4526公式,在时刻"得到了观测
值"",则可以根据观测似然模型更新先验!"#———!(!"!
"$%"(’),
!(!"("$)")+
!(""(!")!(!"("$)"*’)
"!(""(!")!(!"("$)"*’)/,"
#!(""(!")!(!"("$)"*’) (7)
在式(7)中,新的观测值""用来改正先验!"#,从而得到所
需的当前状态的后验!"#)当%(!"!!"(’,"")取!(!"!
!"(’)时,就是899+4+:2-滤波
[&7],则权值更新为
&*(-)" +&
(-)
"*’!(""(!"))
*+,-0)重采样)为了样本抑制退化[&;],需要进行重采样
步骤[&$.&’],即对’个样本以其权值&($)" 为概率进行采样,
得到’新的样本,从而抑制权值较小的样本,增强权值较大
的样本)即由{#(($)" }生成新样本{#
($)
" })
这样,用这些加权样本的组合就能够近似地表
示后验分布!(!"!"$%")的某些特征,如"时刻的最
佳状态可以用期望值近似或最大后验估计表示)一
个基本的*<=算法如下:
初始化)假设已知初始样本集合{#($)$ ,&
($)
$ }$.’,⋯,’,
&($)$ .’!’,".’按照式(’)生成新样本{#
($)
" ,&
($)
" }$.’,⋯,’)
*+,-’)>9:-.’,⋯,’)
按照动态系统模型!(!"!!"(’.#
($)
"(’)生成新样本
#(($)" ;
计算似然值)
更新权值&($)" .&
($)
"(’/
($)
" )
*+,-&)对权{&($)" }$.’,⋯,’进行归一化)
*+,-0)按照权{&($)" }对样本{#(
($)
" }进行重采样得到’
个新样本{#($)" },对应的权为’!’)
序列蒙特卡罗方法是一种鲁棒性很强的人体运
动跟踪框架,能够适应复杂的跟踪环境)在实际跟
踪过程中,由于光照变化、遮挡或者其他干扰物的出
现,常常会出现一些不确定的观测数据)序列蒙特
卡罗方法的鲁棒性源于对这些不确定性的描述,在
跟踪过程中并不是只保留权值最大的样本,那些权
值较小的样本仍然有可能保留下来,在后续的跟踪
中起作用)
! 基于"#$的人体运动跟踪框架
!%& 人体模型及动态先验模型
图’ 人体模型的骨架结构和体结构示意图
如前所述,人体运动跟踪就是要建立人体模型
与输入图像序列之间的对应关系)我们所选用的人
体模型是由表示运动学特性的骨架结构和表示外观
特性的体结构共同组成)
骨架模型表示了各个关节点之间的链接关系和
解剖学上的限制,体模型则使模型与图像之间的匹
配更加方便)本文采用如图’所示的人体模型,其
中骨架模型有’0段(每一段是一个向量),’;个关
节点)其中根结点在腰部,躯干有?个自由度,包括
0个平移和0个旋转,左右锁骨各有&个自由度(无
绕向量轴的旋转),左右上臂和左右大腿各有0个自
由度,头有&个自由度(无绕向量轴的旋转),腰部根
节点到臀节点的自由度为$,其余的关节点(左右下
臂和左右小腿)各为’个自由度,这样共有&@个自
由度)体模型是用附在骨架上的圆台表示肢体)本
文暂不考虑圆台的形状参数及骨架的长度(采用手
工初始化),只关心涉及到运动链接关系的根关节点
的平移及所有关节点的角度,状态矢量定义为
!+{"’,"&,"0,0’,⋯,0&;} (;)
系统动态模型为
!"+!"*’1’($,!) (?)
其中’($,!)表示均值为$,协方差阵为!的高斯
分布,在本文假设各个变量是独立的,因此!为对
角阵)虽然公式(?)不能准确地反映真实的人体运
动特性,但它具有普遍意义,适合不同运动的跟踪,
因此较大的! 值才能覆盖尽可能大的运动参数
空间)
A@’期 陈 睿等:基于序列蒙特卡罗方法的0"人体运动跟踪
万方数据
!"# 观测似然模型
在!"#的跟踪框架中,观测似然函数的建立
尤为重要,它建立了提取的图像特征与人体模型之
间的匹配关系$似然函数的性能直接影响了跟踪结
果,因此有以下几点必须注意:
(%)所选择的图像特征$能适应多种观测条件,
不受周围环境或其他因素的影响;可以方便有效地
提取,不能占用过多的计算资源;因为没有一种特征
能够适应所有的跟踪条件,所以必须考虑多特征的
融合$
(&)似然函数的选择$似然函数的计算不能太
复杂;似然函数应能有效地反映观测特征的分布情
况,它必须有尖峰的形状来反映出真实的状态分布$
我们选择了边界和外轮廓作为匹配特征$由于
边界(如手臂边界)具有对光照、颜色、纹理的不变
性,因此是一种非常有效的图像特征$在提取图像
边界之前,先做高斯平滑及反差归一化;然后用边缘
检测算子检测边界,根据二值化的边界图计算图像
上各点到最近边界的距离,得到距离图!"$外轮廓
图像!#用减背景的方法得到$在背景变化不大时,
如没有光照变化及剧烈的背景运动,减背景方法[&’]
都能得到较好的前景信息,因此在实验室环境下基
本可以不考虑复杂背景变化问题$
似然函数定义为
$(!%")&()*(’((!
(
)&%
(%’*)(",!)
( )+
(!
,
)&%
(%’-)(",!)
, ))) (+)
式(+)中"由式(,)表示,!表示由视频图像提取的
特征,即边界距离图!"和外轮廓图!#;*)(",!)表
示当状态为" 时,-.人体模型内部点)处的外轮
廓特征图像观测值,内部点)是将-.人体模型投
影到图像平面上得到的内部点,( 为内部点的个
数;相应地,-)(",!)表示当状态为"时,人体模型
各肢体的边界点)在边界图像上的观测值,, 为边
界点的个数$
若考虑多个相机数据,.为相机个数,则有
$(!%")&"
.
$.(!%") (/)
!"$ 改进%&’算法的策略
有了动态系统先验模型式(’)和观测似然模型
式(+),式(/),根据第-节中的!"#算法就可以进
行跟踪$但是在实际应用中,由于蒙特卡罗方法存
在一个致命的弱点,即只有当样本数, 足够大时,
加权样本集合{/(0)1 ,2
(0)
1 }才能较好地模拟后验分
布$("1#!011)$那么需要多少个样本才能满足要
求呢?
为了说明问题,我们将问题简化,假设状态"
为%0维变量,每个变量服从正态分布3)!,(0,
!&)),这样状态空间大小可以用4%0表示$一般情况
下,对于多维正态分布密度函数$(")存在一个很
小的状态空间范围5,大多数样本都集中在这个5
内,5 被称为典型集$ 其大小可近似表示为
&6(3)[&+],6(3)为概率分布$(")的熵$因此只有
当所抽取样本{/(0)1 }基本上在典型集内时,才能较
好地反映后验分布$若采用均匀采样,实际状态空
间大小为4%0,则样本落在典型集的概率为&6"4%0,
换言之,落在典型集中的样本个数按照4%0"&6 变
化$若只考虑每个状态只取&0个离散值,而且假设
一般情况下62,"&2,,那么所需的最少样本个数
为(4)%0"&6 &(&0)%0"&,&-&0000000$这个数字
已经无法接受$对于实际的人体运动跟踪,维数高
达&/维,而且每个自由度的可能取值远不止&0个,
因此直接使用蒙特卡罗方法不可能进行密集的样本
采样,只能是稀疏采样$而稀疏采样带来的问题是
少量的样本不足以描述复杂的密度分布函数$
文献[3]提出了用模拟退火改进!"#的算法
———退火粒子滤波$其基本思路是按照模拟退火的
思想设计一组似然观测函数$%,$&,⋯,$7,$74%,
⋯,$(;$7 和$75%只有少许不同,而且$( 的形状
比较平坦,能反映出整个状态空间的趋势,$%则具
有很高的峰值,能够反映局部特征$在每个时刻1
都由似然观测函数$( 开始对样本进行退火,最后
收敛到$%$在本文中$72($0)87,872
%
*91):7
,
*91):20$’为常量$每退火一次,都进行重采样操
作,使样本集自适应地聚集到权值较高的位置$
模拟退火提供了一个非常好的高维空间搜索策
略,它采用渐进的方式由高温降到低温,来逼近真实
分布$但是退火的执行效率取决于温度5 的选择,
实际上是5的变化规律$若5变化太慢,显然执行
效率很低;反之,若5变化太快,很容易陷入局部极
值$一组好的退火温度5,能够指引初始的分布$(
逐渐地收敛到真实分布$%$对于自由度高达-0维
的人体运动跟踪而言,实际的状态分布$不仅很复
杂,而且是多峰的$因此,在高维情况下,温度5 的
选择是很难的,无法找到一个“鲁棒”的退火温度进
度表$在文献[3]中虽然使用了基于梯度的方法寻
找合适的温度5,但是仍会陷入局部极值$
// 计算机辅助设计与图形学学报 &00,年
万方数据
尽管模拟退火对于高维空间搜索存在一定的困
难,但是对于维数较低的情况,温度! 的选择就容
易得多!因此本文提出了结合空间分解与模拟退火
思想进行人体运动跟踪!即先按照退火粒子滤波的
思想,在每一时刻都对全身进行" 次退火!此时对
退火温度进度表并没有特殊的要求,只需退火后的
样本集在总体趋势上聚集在真实后验分布周围!但
是如图"#所示,在一些细节部分,如手臂的姿态,仍
有错误;然后进行分解搜索,即以退火后的状态估计
值作为当前的初始值,固定躯干的自由度不动,分别
对四肢进行退火搜索!此时由于退火操作是在较低
的状态空间(如左臂的自由度是$维)上进行,只需要
很简单的退火温度进度表就可以使样本集收敛到真
实分布位置,如图"%所示!空间分解的过程如下!
&’()*!进行原始的全身模拟退火操作,得到样本集合
{#($)% ,&
($)
% }$+*,⋯,’!
&’()"!分别对左臂、右臂、左腿和右腿进行退火,即退火
时只有对应肢体的自由度(!+{%*,%",%,,(*,⋯,("-}的一
个子集)可以变化,其他自由度不变!
#完整人体模型样本退火分布
%左臂样本退火分布
图" 直接退火与加入分解搜索的退火样本分布比较示意图
第,节已经提到过,在&./的框架中为了控制
退化问题(0(1(2(3#45),采用了重采样方法!重采样
方法虽然对抑制退化问题很有效,但是这种方法是
以权值的计算为基础的,必须依照样本的权值重采
样!如果权值计算不准确,就失去了重采样的依据!
在本文的&./框架中,权的计算是由观测似然模
型)("!!)决定的!在高维情况下,观测似然模型
)("!!)不仅因为维数的增加而变得复杂,而且会
呈现出多峰的情况,这种多峰是由于混乱背景、其他
物体的遮挡、运动目标自身的遮挡和光照变化等原
因引起!而我们实际选择的观测似然模型式(6)和
式(7)很难反映出真实观测情况,所以根据观测似然
模型得到的样本权值存在误差!若完全依靠权值进
行重采样,则有可能陷入错误的“陷阱”!因此本文
借鉴89:.(83;2(<=923>4?(<:@A(2%B;’?.(’?@<)
思想来改进&./算法!
89:.是C3#AA%(31(3[*-]提出的,在该方法中对
权值&($)% "&D的样本进行随机抑制,即按照一定
的概率(接受这个样本!若该样本被接受,新权值
为"E&($)% ;对权值&
($)
% #&F的样本进行增强,即
将该样本作* 次重复采样,采样后的样本权值为
&($)% !*;对处于&D和&F之间的样本直接保留,
权值不变!
89:.采样方法的意义在于:少数权值很大的
样本有可能不是真实人体模型状态,只是由于我们
采用的观测模型与真实情况存在偏差,导致在一个
错误的状态下计算出的权值很大!若直接使用标准
重采样,高权值样本基本上会被重复选中多次,而且
重采样后的所有新样本的权值相同!而在89:.
中,通过样本增强,样本被复制多次,但其权值通过
自适应地调整而减小,样本权值的调整是89:.与
标准重采样方法的一个主要区别!另外,对于权值
较小的样本,虽然可能反映了真实的人体模型状态,
若直接采用标准重采样,该样本一般情况下很难被
选中!但在89:.中,通过样本抑制,小权值样本以
一个适中的概率保留,其权值被增大,在随后的标准
G7*期 陈 睿等:基于序列蒙特卡罗方法的,0人体运动跟踪
万方数据
重采样中,这些小权值样本很有可能被保留下来!
"#$%采样的优点在于采样后权值被自适应地调
整到一个合适的范围,既不会出现很大的权值点,也
不会出现极小的权值点,从而有效地抑制那些出现
错误的极值点!
综上所述,本文采用的结合"#$%和模拟退火
的&%’算法框架如下:
设置初始样本集合{!(")( ,#
(")
( }")*,⋯,$,%)*,退火方
差,(!*,⋯,!&,!&+*,⋯,!’),!&)!*,(()%*+)&,退火
系数(,*,⋯,,&,,&+*,⋯,,’),,&)(*!()%*+)&,"#$%参
数#-,#+,),-!
&./0*! 将 {.(")% ,#
(")
% }"-*,⋯,$ 表 示 为 {.
(")
%,*,
#(")%,*}")*,⋯,$!
&./01!对每个样本进行’ 次退火!
234&)*,⋯,’!
234")*,⋯,$!
.-(")%,& ).
(")
%,&+$((,!&)!
#-(")%,& )/&("%!#%).-
(")
%,& ))[/*("%!#%)
.-(")%,& )],&!
52(#-(")%,& "#-){按照概率)保留.
(0)
%,&).-
(")
%,& ,
#(0)%,&)1,#-
(")
%,& ,0)0+*}!
/67/52(#-(")%,& ##+){把该样本保留- 次.
(0)
%,&)
.-(")%,& ,#
(0)
%,&)#-
(")
%,&!-,0)0+-}!
/67/{直接保留!(0)%,&)!
(")
%,&,#
(0)
%,&)#-
(")
%,& ,0+0+
*}
对样本集{.(0)%,&,#
(0)
%,&}进行标准重采样得到$ 个新
样本{.(")%,&,#
(")
%,&}!
&./08!输出估计状态#%)$
"
.(")%,’,#
(")
%,’!
&./09!{.(")%+*,#
(")
%+*}")*,⋯,$){.
(")
%,’,#
(")
%,’}")*,⋯,$!
! 实验结果
为了检验本文算法的有效性,我们用037/4生
成了一个模拟人在跑步机上的行走,在该数据中,使
用了单一背景简化特征图像提取的难度,用9个相
机从不同视角拍摄人的运动!图8所示为退火粒子
滤波与结合了分解搜索和"#$%的退火粒子滤波
的结果进行比较!
:直接退火跟踪结果
;加入分解搜索的退火跟踪结果
<分解搜索与$#$%采样相结合的退火跟踪结果
图8 直接退火与结合分解搜索与"#$%采样的退火比较
(= 计算机辅助设计与图形学学报 1((>年
万方数据
从图!可以看出,本文算法效果较好,退火系数
取"#$#图!%采用直接退火方法,只能跟踪到第&"
帧;图!’中加入了分解搜索,跟踪精度提高,但到第
!$帧就失败;图!(使用了分解搜索和)*+,采样,
可以正确跟踪到--帧#
通过取不同的参数进行实验,我们发现:使用
.""个样本,每个样本的退火次数为/次时能取得
较好的结果,更多的样本并不能改善跟踪结果#其
中初始的退火方差!&0"#&,相邻的两次退火方差
之间的系数为"#$%&0"#$,)*+, 采样算法中的
’10"#.,’20"#/,#0"#!,(0.#该算法不作
任何优化,在)!蜇)8,&./,9内存的普通
)7机上运行,跟踪&"$帧图像耗时::;<,平均每帧
:#.<#
! 总结与展望
人体运动跟踪的主要难点在于多关节人体模型
的维数太高,一般情况下有!"个自由度#因此要从
几个视频图像中恢复人体模型的姿态参数是一个从
低维空间到高维空间对应的问题,这是一个典型的
病态问题#从这个意义上理解,人体运动跟踪就是
一个在高维空间中搜索最优解的问题#
现有的搜索方法一般分为确定性方法和随机性
方法#确定性的搜索方法,如局部邻域搜索很容易
陷入局部极值,特别是对于人体运动跟踪这样的高
维空间搜索问题,通常是存在很多极值点#因此,确
定性的搜索方法不适合人体运动跟踪问题的求解#
另外,随机性方法(如随机采样),虽然适合多峰的复
杂密度分布的搜索,但是这类方法通常需要对状态
空间进行密集采样#人体运动跟踪的模型状态空间
都在!"维左右,密集采样显然是不可行的#
本文针对人体运动跟踪的特点,在=>?@<(A>B
等[-C&"]提出的退火粒子滤波方法的基础上,提出了
新的基于序列蒙特卡罗方法的!=人体跟踪算法#
一方面通过状态空间分解,使得退火操作能够在较
低的状态空间进行,从而提高了退火系数———退火
温度进度表———选择的鲁棒性;另一方面,考虑到观
测模型的分布与真实分布之间存在误差,在每次退
火时采用)*+,采样方法,而不是标准的重采样,
能在一定程度上抑制观测模型与真实分布之间的误
差,从而提高算法的稳定性#
在今后的工作中,将利用大量真实数据检验算
法的性能,并且希望能够进一步提高算法执行效率,
包括算法的鲁棒性和执行速度#一方面在随机性采
样方法上可以结合局部邻域搜索,提高采样效率;另
一方面,可以考虑使用更多的特征,如运动信息,颜
色等,并能够建立一种自适应的多特征融合框架#
最终目标是建立一个准实时的、能够面向多种不同
应用领域的!=人体跟踪系统#
参 考 文 献
[&] DE(FG# DE(FG HF@EFG(%I@?B><J<@>H[KL]#A@@I://MMMN
OE(FGN(FH/,.""!
[.] 5FPP=7#,FQ>RC’%<>QOE<EFG:SIBFPB%H@F<>>%M%RTEGP
I>B<FG[U]#VH%P>%GQDE<EFG7FHI?@EGP,&-/!,&(&):3"."
[!] 5%BE@%FPR?V,5%BMFFQ=,=%OE<L#W::WAF,MA>G,MA>B>,
MA%@:SB>%R@EH><J<@>HXFBQ>@>(@EGP%GQ@B%(TEGPI>FIR>[S]#
VG:)BF(>>QEGP<FXV***VG@>BG%@EFG%R7FGX>B>G(>FGY%(>%GQ
4><@?B>+>(FPGE@EFG,Z%B%,&--/#..."..;
[:] 7FH%GE(E?=,+%H><AD,,>>B)#+>%RC@EH>@B%(TEGPFXGFGC
BEPEQF’[>(@<?<EGPH>%G<AEX@[S]#VG:V***)BF(>>QEGP<FX
VG@>BG%@EFG%R7FGX>B>G(>FG 7FHI?@>B DE<EFG%GQ )%@@>BG
+>(FPGE@EFG,5ER@FG5>%QV<R%GQ,.""",.:&:."&:-
[3]V<%BQ ,,9R%T> S# 7KZ=*Z\S]VKZC7FGQE@EFG%RQ>G<E@J
IBFI%P%@EFGXFBOE<?%R@B%(TEGP[U]#VG@>BG%@EFG%RUF?BG%RFX
7FHI?@>BDE<EFG,&--/,.-(&):3"./
[$] 4%OBER%=,=%OE<L#!C=HFQ>R’%<>Q@B%(TEGPFXA?H%G<EG
%(@EFG:SH?R@EOE>M%IIBF%(A[S]#VG:V***)BF(>>QEGP<FX
VG@>BG%@EFG%R7FGX>B>G(>FG 7FHI?@>B DE<EFG%GQ )%@@>BG
+>(FPGE@EFG,\%GYB%G(E<(F,7%REXFBGE%,&--$#;!"/"
[;] WB>G7,)>G@R%GQS#=JG%H%G:SB>(?B<EO>HFQ>RFXA?H%G
HF@EFG[+]#7%H’BEQP>,,S:,V],>QE%L%’,&--/
[/] )R%>GT>B<+,Y?%)#SB@E(?R%@>Q<FX@F’[>(@<XFBOEQ>FC’%<>Q
’FQJHFQ>REGP[S]#VG:V***)BF(>>QEGP<FXVG@>BG%@EFG%R
7FGX>B>G(>FG7FHI?@>BDE<EFG,D%G(F?O>B,.""&#!-:":"&
[-] =>?@<(A>BU,9R%T>S,+>EQV#SB@E(?R%@>Q’FQJHF@EFG(%I@?B>
’J%GG>%R>QI%B@E(R>XER@>BEGP[S]#VG:V***)BF(>>QEGP<FX
VG@>BG%@EFG%R7FGX>B>G(>FG 7FHI?@>B DE<EFG%GQ )%@@>BG
+>(FPGE@EFG,5ER@FG5>%QV<R%GQ,.""",.:&.$"&!!
[&"] =>?@<(A>BU,=%OEQ<FGS,+>EQV#SB@E(?R%@>QI%B@E@EFGEGPFX
AEPAQEH>G<EFG%R<>%B(A<I%(><%<<F(E%@>QME@A%B@E(?R%@>Q’FQJ
HF@EFG(%I@?B>[S]#VG:V***)BF(>>QEGP<FXVG@>BG%@EFG%R
7FGX>B>G(>FG 7FHI?@>B DE<EFG%GQ )%@@>BG +>(FPGE@EFG#
5%M%EE,.""&,.:$$-"$;$
[&&] 9B%GQ,#\A%QFMI?II>@BJ[S]#VG:V***)BF(>>QEGP<FX
VG@>BG%@EFG%R7FGX>B>G(>FG7FHI?@>BDE<EFG,7FBX?,&---#
&.!;"&.::
[&.] 5FM>Z,L>O>G@FG,,YB>>H%GW#9%J><E%GB>(FG<@B?(@EFGFX
!=A?H%GHF@EFGXBFH<EGPR>C(%H>B%OEQ>F[S]#VG:Z>?B%R
VGXFBH%@EFG)BF(><<EGP\J<@>H<,7FRFB%QF,&---#/.""/.$
[&!] )%ORFOE(D,+>APU,7A%H],)$#*#SQJG%HE(9%J><E%G
%IIBF%(A@FXEP?B>@B%(TEGP?<EGPR>%BG>QQJG%HE(%RHFQ>R<[S]#
VG:V***)BF(>>QEGP<FXVG@>BG%@EFG%R7FGX>B>G(>FG7FHI?@>B
DE<EFG,7FBX?,&---#-:"&".
&-&期 陈 睿等:基于序列蒙特卡罗方法的!=人体运动跟踪
万方数据
[!"] #$%&’($%)*+,,*-%&.$%%(%&,/(0$%,!"#$1234(3%4-54+6-
736*+8$%834(3%)9%4*-)()[:]1;%:<63=-->(%&)374*-"4*
?*(%$&6$@*?3%7-6-%=-1A-(B(%&,CDDC1"D!ED((%?*(%-)-)
(王天树,郑南宁,李 岩,等1用于人体运动合成的运动纹
理模型[:]1见:第"届中国计算机图形学大会,北京,
CDDC1"D!ED)
[!E] F6$))G-6&-6<1 ’*- @6+%->H-%6(=*-> I3)-%GJ+4* 8-4*3>:
K(8+J$4(3%)374*-4$@3J98-6)37=*$(%J-%&4*+@43!,DDD,DDD
[L]1<*9)(=$JI-M(-NO,!PPQ,ER(P):SRTC!SRPS
[!R] ,*$%&L,/(+LK1:%-N)-U+-%4($J(8@364$%=-)$8@J(%&8-4*3>
N(4*(4)$@@J(=$4(3%434*-CV*9>63@*3G(=H*9>63@*(J(=83>-J
[L]1L3+6%$J37?*-8(=$J<*9)(=),CDDC,!!Q(Q):S"PC!S"PT
[!Q] #$%&W,?*-%I,/(+LK1 23%4-?$6J3A$9-)($%)(&%$J
@63=-))(%&736N(6-J-))=388+%(=$4(3%)[L]1L3+6%$J37X/K;
K(&%$J<63=-))(%&1CDDC,SD(C):TP!!DE
[!T] F-8$%K,F-8$%V1K43=*$)4(=6-J$5$4(3%,F(GG)>()46(G+4(3%)
$%>4*-A$9-)($%6-)436$4(3%37(8$&-)[L]1;OOO’6$%)$=4(3%)
3%<$44-6%:%$J9)()$%>2$=*(%-;%4-JJ(&-%=-,!PT",R(R):QC!
!Q"C
[!P] <(442,K*-@*$6>.1Y(J4-6(%&M($)(8+J$4(3%::+5(J($69@$64(=J-
7(J4-6(%&[L]1L3+6%$J374*-:8-6(=$%K4$4()4(=$J:))3=($4(3%,
!PPP,P"(""R):EPD!EPP
[CD] V3+=-4:1Z%)-U+-%4($J23%4-?$6J38-4*3>)736A$9-)($%
7(J4-6(%&[I]1?$8G6(>&-:?$8G6(>&-[%(M-6)(49V-@$648-%437
O%&(%--6(%&,!PPT
[C!] /(+LK,?*-%I1K-U+-%4($J23%4-?$6J38-4*3>)736>9%$8(=$J
)9)4-8)[L]1L3+6%$J374*-:8-6(=$%K4$4()4(=$J:))3=($4(3%,
!PPT,PS:!DSC!!D""
[CC] 2$=\$9VL?1;%463>+=4(3%4323%4-?$6J38-4*3>)[:]1;%:
/-$6%(%&(%&6$@*(=$J83>-J)[?]1?$8G6(>&-,2::2;’
<6-)),!PPP1!QE!CD"
[CS] #-J=*F,A()*3@F1:%(%463>+=4(3%434*-]$J8$%7(J4-6[I]1
?*$@-J^ (JJ:[%(M-6)(*?$63J(%$,!PPE
[C"] F36>3%.,K$J83%V,K8(4*:1:%3M-J$@@63$=*43%3%H
J(%-$6/%3%HF$+))($%A$9-)($%)4$4--)4(8$4(3%[Z/]1*44@://
(---5@J36-1(---136&/5@J/I-=-%4;))+-1B)@?@+.+8G-6_CCDP‘9-$6
_!PPS,!PPT
[CE] ]3%&:,/(+LK,#3%&# 1^K-U+-%4($J(8@+4$4(3%)$%>
A$9-)($%8())(%&>$4$@63GJ-8)[L]1L3+6%$J374*-:8-6(=$%
K4$4()4(=$J:))3=($4(3%,!PP",TP("CE):CQT!CTT
[CR] K4$+77-6?,F6(8)3%O/1/-$6%(%&@$44-6%)37$=4(M(49+)(%&
6-$JH4(8-46$=\(%&[L]1;OOO’6$%)$=4(3%)3%<$44-6%:%$J9)()
$%>2$=*(%-;%4-JJ(&-%=-,CDDD,CC(T):Q"Q!QEQ
[CQ]L36>3% 2 ;1 2V/(%463>+=4(3%$%>)3+6=-=3>(%&[I]1
A-6\-J-9:[%(M-6)(4937?$J(736%($$4A-6\-J-9,V-@$648-%437
?38@+4-6K=(-%=-,CDD!
陈 睿 男,!PQR年生,博士研究生,
主要研究方向为计算机视觉、数字图像处
理、计算机图形学1
刘国翌 男,!PQQ年生,博士研究生,
主要研究方向为数字图像处理、计算机视
觉、计算机图形学(&9J(+"(=41$=1=%)1
赵国英 女,!PQQ年生,博士研究生,
主要研究方向为数字图像处理、计算机视
觉、计算机图形学(&9a*$3"(=41$=1=%)1
张 俊 男,!PQQ年生,硕士,主要研
究方向为计算机图形学、虚拟现实(a*$%&B+%
"(=41$=1=%)1
李 华 男,!PEQ年生,博士,研究
员,博士生导师,主要研究方向为计算机图
形学、计算机视觉、数字图像处理、虚拟现
实等(J(*+$"(=41$=1=%)1
CP 计算机辅助设计与图形学学报 CDDE年
万方数据