智库文档所有分类

（目标管理）基于粒子滤波器的非线性或非高斯分布情况下的在线数据贝叶斯目标追踪.doc

下载

卓越管理

10页 | 1023KB | 0次下载 |

0.0

(0人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

（目标管理）基于粒子滤波器的非线性或非高斯分布情况下的在线数据贝叶斯目标追踪基于粒子滤波器的非线性或非高斯分布情况下的于线数据贝叶斯目标追踪的讲解个人翻译作品 By梧桐 QQ:340287132 原文 ATutorialonParticleFiltersforOnline Nonlinear/Non-GaussianBayesianTracking ,SimonMaskell,NeilGordon,andTimClapp 基于粒子滤波器的非线性或非高斯分布情况下的于线数据贝叶斯目标追踪的讲解摘要——如今许多应用领域中，为了提高物理系统中基础动力的建模精度，人们纷纷引入非线性和非高斯性情况的处理方法，促使该技术地位日益重要。加之，无论是计算仓储费用仍是对变化的信号特征作出迅速判断，于线数据的处理的方法均起着关键性的作用。因此本文将着重针对粒子滤波器中的非线性和非高斯分布情况下的目标追踪问题，讨论最优和次优贝叶斯算法的实际应用。粒子滤波器的思想是源自序列蒙特卡罗方法，它用粒子来表示概率密度函数。这种方法能够应用到任何形式的状态空间模型中，且且涵盖了壹切卡尔曼滤波方法能处理的情况。而且滤波器形式多样，例如 SIR，ASIR，以及 RPF，但它们均引用了名为序列性重要化采样算法（SIS）的通用框架。下文中，通过讨论，对比以及引用典型事例，我们将对标准的卡尔曼滤波器进行详细阐述。关键词：贝叶斯算法，非线性和非高斯分布，粒子滤波器，序列蒙特卡罗方法，目标追踪简介科学生活中面对许多问题时，均需要对系统状态进行估算，即利用含有噪声的观测量，对非线性系统的状态做出实时估计的问题。本文中，我们将主要研究动态模型系统中的状态空间法，而重点是离散时间公式的讨论。因此，系统随时间演化的过程中，我们会使用不同的公式和之对应。动态状态估算中，离散时间公式既简便又实用。离散时间公式主要着眼于系统状态向量的运算。状态矢量是用于描述系统调查过程中所需要的壹切关联信息的合集，比如研究目标追踪时，目标的运动特征。再之，于经济计量学上的资金流，利率，通货膨胀等信息。观测矢量代表同状态矢量关联的干扰观测值。壹般来讲，观测向量比状态向量维数低（但也且非绝对）。状态空间公式便于解决多变量数据和非线性及非高斯分布的情况，且且为传统的时间序列方法提供了极大的优势。公式【41】对此进行了详细的解释。另外，于【26】中，列举出各类应用非线性和非高斯分布的状态空间模型。处理动力系统问题时，至少需要俩个模型才能对其作出分析和推理。第壹个表达状态随时间变化的动态方程（系统模型），第二个表表述观测向量和状态向量之间关系的量测方程（量测模型）。假设俩种模型于概率形式上可行。理想状态下，时间空间的概率方程和得到新测量值后对信息的更新需求仍然适用贝叶斯算法。那么这就为动态状态估算时提供了严密的通用框架。于动态状态估算中运用贝叶斯算法时，有人曾尝试建立壹个后验概率密度函数处理任何信息，包括接收到的所有测量值。自从后验概率函数出现之后，能够说它是壹切估算问题的全解。原则上来讲，通过后验概率函数能够得到系统的最优估算方法，以及精确估算的测量方法。可是很多问题中，估算非常频繁，每接收到壹份测量值均需要进行壹次估算。于这种情况下，最方便的解决方法是递推滤波器。这种滤波器能够对接收到的测量值进行有序处理，而非分批处理。这样就能有效避免存储完整数据集后才处理，或者每接收新的测量值就要对已存于的所有数据重新计算。递推滤波器有预测和修正俩个必要步骤。预测阶段，系统模型会对下壹个测量值的后验概率函数进行期望值计算。由于系统状态通常会受未知因素干扰（随机噪声），预测时会对状态后验概率函数进行编译，变形，以及扩展。修正运算是使用最新的测量值则对期望值的后验状态函数进行修改。之上俩步均建立于贝叶斯理论之上，即按照新数据中的额外信息对目标状态进行及时修正。本文的第二部从非线性目标追踪问题的描述和最优贝叶斯算法展开。于某些特定条件下，最优贝叶斯算法非常实用。而另外俩种算法，卡尔曼滤波器算法和网格点算法将于本文第三部分进行阐述。最优算法此时不易实现。第四部分则概括了几种最优算法的近似算法，其中包括扩展卡尔曼滤波算法，网格点逼近算法和粒子滤波算法。然后于第六部分，文章通过壹个简单的标量实例，。。。。最后第七部分为总结部分。本文是壹篇指导性文章：因此。。。 II.非线性目标追踪为了定义目标追踪，设目标状态运动序列为函数方程为此处，为非线性概率函数，是独立分布的噪音序列。分别为状态规模和噪音向量处理，为自然数集。目标的追踪是对进行递推估算。函数方程为其中，为非线性概率函数，是独立分布的噪音序列，分别为状态规模和噪音向量处理，的变量为时间 K。设所需后验概率函数于时间 K-1为可求。那么预测阶段就通过方程式（3）使用系统模型（1）求的于时间 K时前壹后验概率函数的值。其后于时间为 K时，测量值可求，此时根据贝叶斯定理对前壹数据进行修正（修正阶段）。而其归壹化常数函数为 III.最优算法 A．卡尔曼滤波方法当系统方程为线性函数。过程噪声。观测噪声以及系统状态的先验概率密度函数为高斯分布时。递推的贝叶斯会计问题能够大大减化。于这种条件下，由于高斯分布的壹、二阶矩包含了概率分布的全部信息，只须估计系统状态的条件均值及协方差阵。就能够递推计算后验概率密度函数．其实现过程就是卡尔曼滤波算法。此时。系统方程为：卡尔曼滤波算法由公式（3）和（4）推出，通常用壹下函数表示其递推关系。其中及表示变量 X服从均值为 m，方差为 P的高斯密度。 B．网格点算法当状态空间为离散态且包含状态限量时，网格点算法引入了最优递增算法中的密度函数。设状态空间于时间 K-1包含离散状态。那么于每个状态下，为其引入假定状态概率，且用表示到时间 K-1为止的测量值，函数即。如此于 K-1时刻的后验概率密度函数即为其中为狄拉克测量函数。将函数（17）替换到（3）和（4）的预测和修正方程式中，分别为其中 IV.次优算法而实际应用中，许多情况下上文中的假设且不成立，因此尔曼滤波算法和网格点算法且不实用，此时，只能采用近似的次优滤波算法。本部分我们将介绍 3种非线性贝叶斯近似算法： a) 扩展的卡尔曼算法（EKF） b) 近似网格点算法 c) 粒子滤波算法 A．扩展的卡尔曼算法 EKF 于非线性函数中，（1）和（2）不能写成（6）和（7）的形式，我们就用壹个区域线化等式来描述非线性情况。EKF即是基于次思想的近似算法，是壹个高斯近似算法函数其中此处和为非线性函数，和是之前非线性函数中的区域化线性函数(例如，矩阵算法)。 EKF方法于线性化过程中。仅对泰勤级数展开作壹阶截短，因而其相应的均值，方差估计仅仅有壹阶精度；而且，该方法忽略了系统状态及噪声的随机分布特性，仅仅于当前状态、估计值点上作线性变换。这些均对转换后变量均值、方差估计引入了较大的误差，甚至导致滤波器发散。 B．近似网格点算法如果状态空间是连续的，但不属于“集合单元”，那么能够用网格点算法近似计算其后的密度值。设后验概率密度函数于 K-1时的函数值近似为那么预测和修正函数则为其中此处，表示 V.粒子滤波算法 A．序列化重要性抽样算法（SIS）序列化重要性抽样算法是壹种蒙特卡洛算法。这种算法是过去几十年由大连续蒙特卡洛算法演变而来的。为了展示算法的细节，用表示壹个含后验概率密度的随机估量。其中支持点关联加权，而表示到时间 K为止所有的状态量。Weight壹个固定值，表达式为。那么于 K时的后验密度即近似表示为因此我们就有了得到壹个计算真后验的离散加权的逼近算法。。加权选用重要性采样原理。这个原理的依据是设是壹个难以采样的系统的概率密度函数。此外，令为样本，且能够从假设中轻易产生，称为重要密度。那么对的加权近似密度算法就为其中是对 i的粒子的标准化加权。因此样本从重要密度函数中得到。然后用（42）表示（40）的加权函数就是回到序列，于每个迭代中，能够得到样本的近似函数，和新样本集的期望值。将重要密度函数因数分解得出增加现存样本，能够得到样本。通过（4）中提到的方法能够推出积分（45）将（44）（46）代入（43），加权修正等式为另外，如果，如此重要密度函数变量仅为和。此式适用于每个时间段只需滤波估算的通常情况。由此我们能够加上壹个条件，只有能够被存储，因此能够丢弃频道以及的历史观测值。修改后的加权函数即为后验过滤密度函数即近似于由于每壹个测量值均是按序接收的，因此序列重要采样算法含递增加权和支点。此算法的伪码描述为算法 1. 1）粒子退化现象：于滤波过程中经过几次迭代,除了壹个样本外其余样本的重要性权重均很小,结果粒子集无法表达实际的后验概率分布。其中代表“真实加权”。此值不能被精确估算。可是的能够通过下式估算出。 2）重要密度的最佳选择。第壹种方法中包括选择重要密度函数对进行最小化计算令最大。最优重要密度函数方程为：将（48）代入（52）得出如果建模中的动力情况为非线性及测量值为线性的。那么系统函数为：其中是壹个非线性方程，是观测矩阵，和相互独立的独立同分布高斯序列，且。令得出且最后，选择重要密度函数做前验计算非常方便。将（48）代入（62） 3）重采样：为了解决样本退化问题,引入了重要性重采样的采用方法。重采样的基本思想通过于俩次重要性采样之间增加重采样步,消除权值较小的样本,且对权值较大的样本复制,产生的采样是独立同分布。所以权值均变为。虽然重采样的引用减弱了粒子退化问题的影响。可是同时产生了其他的实际问题。首先，减少粒子的平行几率，所有粒子必须组合。其二，粒子必须经历大量的多次加权计算，增加计算量。导致了粒子分集度的损失。于小型的噪音处理过程中，这个问题比较频繁，且被称为采样点贫乏。实际上，由于采样点贫乏，于小的噪音处理时，所有的粒子于几个迭代之后就会坍塌到壹点。第三，由于粒子分集数减少，任何基于粒子路径的平滑估算均会衰变。计算中必须加入有中和方法。壹种方法是由前粒子状态决定后续滤波，然后通过对第壹及最后时标的递推计算，重新计算对粒子做加权计算，以得到平滑估算【16】。另壹种方法是使用蒙特卡罗算法【5】。 B．其余关联粒子滤波算法第五部分 A中所介绍的序列重要采样算法为大部分的粒子滤波算法提供了理论基础。而事实上粒子滤波算法仍有教广的发展。于其他文献中提到的各种版本的粒子滤波算法均能够归纳为通用序列重要采样算法的特例。通过重要采样密度和重采样步骤的修正，这些特例，均能够由序列重要采样算法得出。以下列出了几项典型的粒子滤波特殊算法。 i)重要性重采样滤波算法（SIR） ii)辅助重要性重采样滤波算法（ASIR） iii)正规粒子滤波算法(RPF). 1）重要性重采样滤波算法本算法属于蒙特卡罗算法的壹种，且普遍应用于解决递推贝叶斯滤波问题。状态的动态方程和量测方程即(1)和（2），，分别需要作为已知条件给出，且需要从信号噪声分配过程的和前验中进行实感（realizations这个词）抽样。最后概似函数必须能于逐点函数中实现。如果对递推重要性采样函数选择正确，就能够轻易推出重要性重采样滤波算法， 1）重要密度中选作为前验密度函数，2）重采样应用于每个时间系数。之上的对重要密度的选择表明我们需从中进行抽样，样本的推导有俩个步骤，首先推出壹个噪音采样方程，然后设，其中为概率密度函数。通过此重要密度函数的特殊选择方法，我们很明显的见出加权方程为然而每个时间系数均需要进行重采样，因此得出重采样过程之前(66)中比例项所导出的加权为常量。于算法四中我们会对本算法中的迭代进行讲解。由于 SIR算法中的重要性抽样密度独立于测量值，状态空间量能够不依据观测量得出。所以此滤波算法受异常值影响较大甚至无效。另外由于每壹个迭代步骤中均有重采样过程，这将导致粒子多样化得迅速损失。然而，本算法的优点于于重要性加权估算步骤简单，重要性密度的抽样步骤便捷。 2）辅助重要性重采样滤波算法本算法是由 Pitt和 Shephard作为 SIR算法的衍生算法提出的。本算法由 SIR算法的核心算法导出，引入了对进行抽样的重要性密度函数，其中表示时的粒子指数。根据贝叶斯算法规则，比值可由下式推出 ASIR的算法是通过联合概率密度函数获取样本，省略中的指数 i，从而从边缘化密度中得到，用于描述样本的重要密度函数规定为满足比例函数设由（68）为样本分配壹个加权比例函数至（67）（68）等式右边具体算法如下所示（34）中原版 ASIR算法内仍包含另外壹个步骤，即重采样，用于产生壹个同样本等同的加权值。同 SIR算法相比，1能从 K-1的样本中便捷的算出结果。2ASIR于前壹个单位时间内能够见做是重采样过程。 3）正规化粒子滤波算法采样是于第五部分 B1中提出的壹种解决例子退化问题的算法，于粒子滤波算法中应用普遍。然而，需要指出的是，重采样同时为计算过程带来了新的问题，尤其是粒子多样性的损失。引起这个问题的原因是粒子是被绘制成离散态而非连续的，如果此问题处理不当，那么会引起粒子坍塌现象。正规化粒子滤波算法（RPF）是壹种改进后的粒子滤波算法，能够处理上述的问题。 RPF同 SIR滤波算法除了重采样步骤之外完全壹致，RPF是从壹个后验密度函数的连续近似值中重新采样。SIR则是从密度近似函数（64）中进行重采样。特别是于 RPF中，样本是来自近似等式其中为核密度方程，为核带宽，是状态向量 X的尺寸，且。是加权常量。核密度方程是壹个对称的概率密度方程如下核密度方程以及核带宽 h用来最小化真是厚颜密度函数和和其壹致的（73）中的正规化表述之间的综合平方差误差。方程如下约等于（73）的等式右边的。如果有种特殊情况，所有的样本均由相同的加权，那么核函数的最优选择是 Epanechnikov核函数。基础密度函数为高斯分布，且有壹系列协方差矩阵,那么带宽的最优选择也是【31】虽然（76）（77）（78）的结果只是壹些特定情况下的最佳方案，可是这些结果仍然能够于壹般情况下作为次优方案使用。算法 6中列出了 RPF的算法内的相互作用。RPF和壹般的粒子滤波算法最大的区别就于算法 3中，不只是经验协方差矩阵的计算，而是于重采样是加入了规则化的步骤。图标壹根据之上步骤我们就能从（73）中得出的随机样本。就复杂性而言，RPF算法和 SIR差不多，除了 RPF于每壹个时间步骤中，需要从核函数中得出的的附加条件。RPF有壹个理论缺陷，样本不能保证近似值和后验的值渐近。于实际应用中，当样本严重贫乏时，例如，噪音信号非常小，RPF算法要比 SIR更加实用，精确。 VI.实例此处我们将以下方程式作为例证说明：或等同于其中和分别表示。。。。的和。我们令且。这个例子曾被多次发表。作为对照，为样本的真正运动状态，为测量值。以 K为变量状态值为解的样本运动方程的真正数据。同相同的样本运动方程中状态值的测量值。近似网格点算法使用 50个状态值【-25,25】。所有的粒子滤波算法拥有 50个粒子，且且于阶段会进行连续重新取样。辅助粒子滤波算法则用，正则化粒子滤波算法用第五部分 B3 中提到的核和频宽。 A．扩展卡尔曼算法扩展卡尔曼算法中的局部线性化技术，和高斯近似算法扩展卡尔曼滤波算法且不能对样 .扩展卡尔曼算法开发为状态值估算 .于之上或者之下位置的状态值展为 EKF算法。真正固定的状态量也显示出来。本的非线性和非高斯本质进行充分描述。壹旦EKF不能近似于基本的后验概率，高斯近似算法也实用时——EKF算法则倾向技能选择“错误”的模式，又能于个模式间求平均。结果于这种无法近似求概率密度的情况下，线性近似算法也不能实现。 B. 近似网格点滤波算法这是壹个低纬度例子,人们认为近似网格点算法于其中非常实用。正如图5所示。这种算法能够为多峰问题建模。另外仍能利用近似网格点算法而非扩展卡尔曼算法减少显著的均方根误差。粒子滤波算法中粒子于运算步骤中是通过迭代算法，然而近似网格点算法中是通过单元运算。如此近似网格点算法中的均方差根误差要比其他的粒子滤波算法大，这壹点很令人惊讶。作者认为这是壹种认为误差；而且有人提出了解决算法。另外网格点中固定位置表明网格点接近正负25的区间内，而真实状态值远于其范围之外，那么就会产生极大误差。 C．辅助粒子滤波算法误差产生的壹个原因是抽出的粒子群位置较差。可能有人认为，选取较好的位置抽取粒子就能够减少误差。辅助粒子滤波算法见似可行。他能够作为SIR的合适候补算法。此处，我们为样本中的壹个样本。此图为SIR粒子滤波器中的概率密度图如Fig7所示，对于本例，辅助粒子滤波算法表现出色。毫无疑问，表7比表6中的斑点要少，数据更加集中于真实状态值。可是可能有人会认为解决这壹问题辅助粒子滤波算法且不适用，因为先验性要比拟然性范围更广。此图为辅助粒子滤波算法中的概率密度图均方差误差能够通过辅助粒子滤波算法得到壹定减少。此图为正规粒子滤波算法中的概率密度图 VII.总结对于某些特定问题，如果卡尔曼滤波算法或网格点滤波算法的假设成立，那么这俩种方法是解决这些问题的最佳算法。然而，于多数实际情况中，这种假设难以成立，只能采用近似算法。我们使用扩展卡尔曼算法近似出动力学及测量过程中的模型，从而近似的求出其于高斯分布下的概率密度函数。而近似网格点算法求出离散分布下，连续状态空间量的近似值。可是这个算法均需要对目标地区进行预算，而于处理高纬状态空间问题时，这会极大的加大成本。粒子滤波算法是直接将密度值近似为定量的样本群。如今的粒子滤波算法可谓多种多样，其中壹些应用到特殊算法，于众多算法中比较杰出。然而为专业应用领域涉及粒子滤波器时，恰当得选取重要密度起着至关重要的作用。 REFERENCES [1],“Comparisonoftheparticlefilterwithrangeparamete rizedandmodifiedpolarEKF’sforangle-onlytracking,”,,–2 99,2000. [2],Multitarget–MultisensorTracking:PrinciplesandTechn ,IL:YBS,1995. [3],“RecursiveBayesianestimation:Navigationandtrackingapplications,” ,LinköpingUniv.,Linköping,Sweden,1999. [4],,,“OptimalestimationandCramer–Raoboundsfor partialnon-Gaussianstatespacemodels,”.,,, –112,2001. [5],,,“AMonteCarloapproachtononnormalandn onlinearstate-spacemodeling,”.,,,–500,1 992. [6],,,“Improvedparticlefilterfornonlinea rproblems,”.,Radar,Sonar,Navig.,1999. [7],“Statisticalmethodsfortheprocessingofcommunicationsdata,” issertation,.,,Cambridge,.,2000. [8],“ImprovementstrategiesforMonteCarloparticlefilters, ”inSequentialMonteCarloMethodsinPractice,,, n,:Springer-Verlag,2001. [9],“ iontononlinearfilteringproblems,”.,,,–495,1998. [10],,,“Non-linearfilteringusingbranchingandi nteractingparticlesystems,”MarkovProcessesRelatedFields,,,–319,1 999 [11],“Non-linearfiltering:Interactingparticlesolution,”MarkovPro cessesRelatedFields,,,–580. [12],“OnsequentialMonteCarlomethodsforBayesianfiltering,”.,U ,UK,.,1998. [13],,,“AnintroductiontosequentialMonte Carlomethods,”inSequentialMonteCarloMethodsinPractice,,,a ,:Springer-Verlag,2001. [14],,,“OnsequentialMonteCarlosamplingmethodsf orBayesianfiltering,”.,,,–208. [15],,,“Particlefiltersforstateestimation ofjumpMarkovlinearsystems,”,,–624, 001. [16],,,“MethodologyforMonteCarlosmoothingwithappl icationtotime-varyingautoregressions,” ing,2000. [17],,,“Novelapproachtononlinearandnon-Gauss ianBayesianstateestimation,”.,F,,–113,1993. [18],“TheViterbialgorithm,”,,–278, . [19],“Followingamovingtarget—MonteCarloinferenceford ynamicBayesianmodels,”,,–146,2001. [20],,,“Fixed-intervalsmoothingforMarkovian switchingsystems,”,,–1855,. [21],“ABayesianapproachtoproblemsinstochasticestimationan dcontrol,”.,-9,–339,1964. [22],:Academic,197 0. [23],“Askewedapproachtofiltering,”,,–282,1 998 [24],,,“Stochasticsimulationalgorithmsfordy namicprobabilisticnetworks,”,1995, –351. [25],“MonteCarlofilterandsmootherfornon-Gaussiannonlinearstatespa cemodels,”.,,,–25,1996. [26],:Sprin ger-Verlag,1996. [27],“Combinedparameterandstateestimationinsimulation-basedfi ltering,”inSequentialMonteCarloMethodsinPractice,,, .Gordon,:Springer-Verlag,2001. [28],“SequentialMonteCarlomethodsfordynamicalsystems,” .,,–1044,1998. [29],“Aprobabilisticexclusionprinciplefortrackingmult ipleobjects,”,1999,–578. [30],“DataassociationandtrackingusinghiddenMarkovmo delsanddynamicprogramming,”,1992. [31],,,“Improvingregularisedparticlefilters,”i nSequentialMonteCarloMethodsinPractice,,,,E :Springer-Verlag,2001. [32],“Particlefiltersfortrackingwithout-of-sequencemeasure ments,”.,submittedforpublication. [33],“Progressivecorrectionforregularizedparticlefilters,” ,2000. [34],“Filteringviasimulation:Auxiliaryparticlefilters,” .,,,–599,1999. [35],“AtutorialonhiddenMarkovmodelsandselectedapplicationsinspee chrecognition,”,,,–285,. [36],“AnintroductiontohiddenMarkovmodels,”IEEEAcous t.,Speech,SignalProcessingMag.,–16,. [37],:Wiley,1987. [38],“Anapproachtotimeseriessmoothingandforecastin gusingtheEMalgorithm,”.,,,–264,1982. [39],“FrequencylinetrackingusinghiddenMarkovmodels, ”.,Speech,SignalProcessing,,–598,. [40],,,,“Theunscentedparticlefi lter,”.,. [41],“Bayesianforecastinganddynamicmodels,”inSpringerSe riesinStatistics,:Springer-Verlag,1997. [42],“TheunscentedKalmanfilterfornonlinearestimation,” .,.,LakeLouise,AB,Canada,Oct. 2000. [43],“TheunscentedKalmanfilter,”:W iley,2001,,tobepublished.