您好,欢迎来到花图问答。
搜索
您的当前位置:首页第二章公式

第二章公式

来源:花图问答
2.4 粒子滤波

2.4.1 蒙特卡洛采样

蒙特卡罗方法又称为随机抽样或统计试验方法,它是一种采用统计抽样近似的求解数学、物理以及工程问题的方法。1946年物理学家冯·诺伊曼等人参与了一项与原子弹有关的秘密工作;在计算机上用随机抽样方法模拟裂变物质的中子连锁反应,为保密起见以摩洛哥著名蒙特卡罗(Monte Carlo)作为随机模拟方法的代号。此后该方法得到了广泛的应用,许多典型的数学问题,例如重积分计算、微分方程边值问题、积分方程、线性方程组的求解等等都用到了蒙特卡罗方法。蒙持卡罗模拟的实质是利用服从某种分布的随机数来模拟现实系统中可能出现的随机现象。由于每次模拟试验只能描述所考察系统可能出现的一次情况,在进行了大量次数的模拟试验后,根据概率论中心极限定理和大数定理,即可得出有价值的统计结论。由于计算机的发展,蒙持卡罗模拟己成为一种实用有效的分析方法。

蒙特卡洛方法应用在粒子滤波中是从后验概率分别采集带权重的粒子集(样本集),用粒子集表示后验分布,将积分转换为求和形式。具体来说,就是后验分布通过粒子集可以近似为经验估计。

(i)这里s0:k:i1,,N是从后验概率分布采集的随机样本集。于是,关于状态

n序列的函数gt:R(t1)nsRg的期望

E(gt(s0:t))gt(s0:t)p(s0:t|z1:t)ds0:t

1

还可以近似为:

1N(i)E(gt(s0:t))gt(s0:t)

Ni12

(i)为了让近似成立,这里还需要假设这些s0:k:i1,,N粒子同分布。根据大

a.sa.sEgs数定理,有Egts0:t,这里, 表示几乎确定收敛t0:tNN(Almost Surely Convergence)。而且,如果varp(|y1:t)gts0:t,那么由中心极限定理可得:

pNE(gt(s0:t))-E(gt(s0:t))N(0,varp(|y1:t)gt(s0:t)) N3

p这里表示概率上收敛。 N2.4.2 贝叶斯重要性采样

后验概率分布可以用有限离散的样本集近似。根据大数定理,随着粒子数N的增加,期望Egts0:t可以用求和Egts0:t来实现。但是经常无法直接从后验概率分布采样。然而,可以通过采用一个己知的、容易采样的概率分布——重要性采样分布或重要性函数qs0:t|z1:t来回避这个问题。下面是其推导过程:

E(gt(s0:t))=gt(s0:t)p(s0:t|z1:t)(s)q(s0:t|z1:t)ds0:tgt(s0:t)t0:tq(s0:t|z1:t)ds0:t

q(s0:t|z1:t)pz1:t4

这里ts0:t是没有归一化的重要性权重(Unnormalized Importance Weights):

t(s0:t)p(z1:t|s0:t)p(s0:t)

q(s0:t|z1:t)5

通过如下变换,可以进一步去掉未知的归一化分布pz1:t:

E(gt(s0:t))gt(s0:t)t(s0:t)pz1:tq(s0:t|z1:t)ds0:tpz1:t|s0:tp(s0:t)q(s0:t|z1:t)ds0:tq(s0:t|z1:t)Eq(|y1:t)(t(s0:t))g(st0:t)t(s0:t)q(s0:t|z1:t)ds0:t

Eq(|y1:t)(gt(s0:t)t(s0:t))6

这里Eq(|z1:t)表示期望计算是在重要性采样分布qs0:t|z1:t上进行的。因此,通过从

(i)重要性函数qs0:t|z1:t采集样本s0:k:i1,,N就可以得到期望Eq(|z1:t)gts0:t的离散近似表示:

1NE(gt(s0:t))=g(sti1N(i)0:t(i))t(s0:t)(i)0:t1N(sti1N)(i)(i)gt(s0:t)t(s0:t) i1N7

这里ti是归一化的重要性权重(Normalized Importance Weights):

(i)tt(i)k1N

(k)t8

因为式8涉及到估计的比例,所以它是有偏的。但是在一定的假设下,它是

a.sEgts0:t。可以保证当N趋向渐进收敛的,而且大数定理Egts0:tN无穷大时,下式可以无限接近ps0:t|z1:t即:

ˆ(s0:t|z1:t)t(i)s0:pt(ds0:t)

i1N9

这里,d是Dirac-delta函数。

2.4.3 序贯重要性采样

贝叶斯重要性采样有一个明显的缺点是在获得每一个观测数据时都需要重新计算样本的权重。这不仅需要很多存储空间,而且在计算量方面花费代价也是巨大的。序列重要性采样很好的解决了这一问题。

序贯重要性采样(Sequential Importance Sampling,SIS)算法,是一种采用蒙特卡罗方法模拟实现递推贝叶斯滤波器的算法。其核心思想是利用一系列随机样本的加权和表示所需的目标后验概率密度,得到实际目标状态的估计值。由蒙特卡罗理论知,当粒子的数量满足一定条件时,则这组具有权值的粒子就能完全地描述目标后验概率分布,此时,蒙特卡罗特性等价于目标后验概率密度的函数,也即SIS滤波器接近最优贝叶斯估计。

对后验分布进行递推形式的估计,即序贯重要性采样,此时参考分布

q(x0:k|z1:k):

q(x0:k|z1:k)q(xk|x0:k1,z1:k)q(x0:k1|z1:k1)

10

假设系统的观测模型服从马尔可夫过程,那么通过由q(x0:k1|z1:k1)得到的支

ii撑点集xk可得到的支撑点x0:k,则权值更新公式可以做进一步推导,将式XX代

入式8得:

kp(z1:k|x0:k)p(x0:k)

q(xk|x0:k1,z1:k)q(x0:k1|z1:k1)11

又由式5得:

k1p(z1:k1|x0:k1)p(x0:k1)

q(x0:k1|z1:k1)12

合并式11和式12得:

kk1

p(z1:k|x0:k)p(x0:k)p(zk|xk)p(zk|xk1)1 k1p(z1:k1|x0:k1)p(x0:k1)q(xk|x0:k1,z1:k)q(xk|x0:k1,z1:k)13

进一步如果状态估计的过程是最优估计,则参考分布概率密度函数只依赖于xk-1和zk即:

q(xk|x0:k1,z1:k)q(xk|xk1,z1:k)

14

i进行抽样之后,对每个粒子赋予权值k,将式14代入式11得:

ikik1iiip(zk|xk)p(xk|xk1) iiq(xk|xk1,z1:k)15

ii,zqx|x这样,参考分布的选择的关键是如何合理选择qxk|xk,因为1kkk1,zk的最优选取方法是:

iiiq(xk|xk1,z1:k)optq(xk|xk1,zk)

16

ii在这种选择下,参考分布qxk|xk1,zk等于真实分布,则对于任意粒子xk1都有

i权重k1N,varki0此时:

)p(xk|xk1)dxk kiki1p(zk|xk17

i但上述参考分布的最优选方法有两个严重缺陷,首先真实分布pxk|xk1,z1:k通

常无法得到,其次上式积分一般无法求解。

因此最常见的参考分布选择为先验密度:

iiq(xk|xk1,zk)p(xk|xk1)

18

带入式17得:

iiikk1p(zk|xk)

19

2.4.4 退化现象与重采样

上述SIS粒子滤波在理论上给出了后验概率的计算方法,但是当将其应用到实际工程中的时候该算法却没有得到理论上的正确结果,产生这一问题的一个根本原因在于粒子的退化现象。算法在经过几次计算后,粒子权重的方差会越来越大,就会导致只有少数粒子权重较大而多数粒子的权重变得非常小,这就是粒子退化。此时粒子集已经失去其多样性,对后验概率分布的准确表达产生了严重影响。粒子集一旦产生退化,就有大量的小权重粒子对后验概率密度的计算几乎不起任何作用,为了避免计算时间在权重较小粒子上的浪费,所以要设法消除其产生的不利影响。

重采样技术在一定程度上可以缓解粒子退化问题。抛弃部分权值过小的粒子,而从权值较大的粒子衍生出一些粒子。重采样技术的基本思想是通过对后验

(i)概率密度再采样Ns次,产生新的支撑点集x0:k:i1,,N,保留或者复制具有

较大权重的粒子,去除权重较小的粒子,新的样本的个数仍为NS,新样本中每个粒子的权值重新分配为1Ns,即:样本为均匀样本。原来的带权值的样本变为等权重的样本。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuowenda.com 版权所有 湘ICP备2023022495号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务