找回密码
 注册
关于网站域名变更的通知
查看: 462|回复: 2
打印 上一主题 下一主题

卡尔曼今天挖深一点

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2020-1-7 11:36 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
本帖最后由 行者~ABC 于 2020-1-7 13:25 编辑 ' ?4 q$ ^5 S/ q* k
  ~& r& ?1 x2 ^' z  d# [
( w5 U- l8 z/ J" S$ c
什么是卡尔曼滤波?

, h1 C/ a& s" i4 N. H) a
你可以在任何含有不确定信息的动态系统中使用卡尔曼滤波,对系统下一步的走向做出有根据的预测,即使伴随着各种干扰,卡尔曼滤波总是能指出真实发生的情况。
: x& m4 O( m4 X7 q. y- f
在连续变化的系统中使用卡尔曼滤波是非常理想的,它具有占用内存小的优点(除了前一个状态量外,不需要保留其它历史数据),并且速度很快,很适合应用于实时问题和嵌入式系统。

$ R" m' v- C' H2 [( J
在Google上找到的大多数关于实现卡尔曼滤波的数学公式看起来有点晦涩难懂,这个状况有点糟糕。实际上,如果以正确的方式看待它,卡尔曼滤波是非常简单和容易理解的,下面我将用漂亮的图片和色彩清晰的阐述它,你只需要懂一些基本的概率和矩阵的知识就可以了。

( l$ K: Q5 R. V7 ~; [4 n
我们能用卡尔曼滤波做什么?
4 @. b1 ~$ ~* E8 {
用玩具举例:你开发了一个可以在树林里到处跑的小机器人,这个机器人需要知道它所在的确切位置才能导航。

1 P6 c& d  q+ `  B* H
8 o! b! [/ c7 k& g- N' m) {6 E0 C8 s6 J
注意这个状态只是关于这个系统基本属性的一堆数字,它可以是任何其它的东西。在这个例子中是位置和速度,它也可以是一个容器中液体的总量,汽车发动机的温度,用户手指在触摸板上的位置坐标,或者任何你需要跟踪的信号。

9 m6 R% k( W7 t
这个机器人带有GPS,精度大约为10米,还算不错,但是,它需要将自己的位置精确到10米以内。树林里有很多沟壑和悬崖,如果机器人走错了一步,就有可能掉下悬崖,所以只有GPS是不够的。

9 S9 q7 d  D: a& W
或许我们知道一些机器人如何运动的信息:例如,机器人知道发送给电机的指令,知道自己是否在朝一个方向移动并且没有人干预,在下一个状态,机器人很可能朝着相同的方向移动。当然,机器人对自己的运动是一无所知的:它可能受到风吹的影响,轮子方向偏了一点,或者遇到不平的地面而翻倒。所以,轮子转过的长度并不能精确表示机器人实际行走的距离,预测也不是很完美。

! |* L* q% P* q( W/ u: E0 S
GPS 传感器告诉了我们一些状态信息,我们的预测告诉了我们机器人会怎样运动,但都只是间接的,并且伴随着一些不确定和不准确性。但是,如果使用所有对我们可用的信息,我们能得到一个比任何依据自身估计更好的结果吗?回答当然是YES,这就是卡尔曼滤波的用处。
% o2 s1 C6 S" e: p2 d; o) w
卡尔曼滤波是如何看到你的问题的
% u3 |- z( o: n; @0 s
下面我们继续以只有位置和速度这两个状态的简单例子做解释。

: Q5 C4 v: m, x0 E# A
我们并不知道实际的位置和速度,它们之间有很多种可能正确的组合,但其中一些的可能性要大于其它部分:

3 c) y* Z8 e# ?7 `4 [
* e0 ?' Q7 q5 e) V+ J2 h3 {2 ^
卡尔曼滤波假设两个变量(位置和速度,在这个例子中)都是随机的,并且服从高斯分布。每个变量都有一个均值 μ,表示随机分布的中心(最可能的状态),以及方差,表示不确定性。
" p" }8 N8 R6 N- e( U9 J
& T- v# @. m2 g/ _, Q+ q
在上图中,位置和速度是不相关的,这意味着由其中一个变量的状态无法推测出另一个变量可能的值。下面的例子更有趣:位置和速度是相关的,观测特定位置的可能性取决于当前的速度:
8 R  v: t1 N, u! u

- I5 D3 f' _& {8 D0 r8 H* B
这种情况是有可能发生的,例如,我们基于旧的位置来估计新位置。如果速度过高,我们可能已经移动很远了。如果缓慢移动,则距离不会很远。跟踪这种关系是非常重要的,因为它带给我们更多的信息:其中一个测量值告诉了我们其它变量可能的值,这就是卡尔曼滤波的目的,尽可能地在包含不确定性的测量数据中提取更多信息!

- C8 @# _4 B' J) R
' C' t; s$ k( M8 Y
使用矩阵来描述问题
) x- c* A& U* ~" z' @! u
' B0 i% u+ _& p3 J$ i8 Z4 M

: Q8 {# j5 t" S0 N2 u/ l4 R2 W: ]: j! ]: g. [
(当然,在这里我们只用到了位置和速度,实际上这个状态可以包含多个变量,代表任何你想表示的信息)。接下来,我们需要根据当前状态(k-1 时刻)来预测下一状态(k 时刻)。记住,我们并不知道对下一状态的所有预测中哪个是“真实”的,但我们的预测函数并不在乎。它对所有的可能性进行预测,并给出新的高斯分布。
% d3 d& }$ p# X$ v/ j# B- O

( b0 _. \1 B6 w/ v$ T; m, T* @
' x# h( T9 R5 T
) F+ T. j% q# G4 \9 _8 J, N
它将我们原始估计中的每个点都移动到了一个新的预测位置,如果原始估计是正确的话,这个新的预测位置就是系统下一步会移动到的位置。那我们又如何用矩阵来预测下一个时刻的位置和速度呢?下面用一个基本的运动学公式来表示:
$ @; ~# g# A: {3 f$ d
# s& Q* i- y; f( L+ b9 i. s6 P
现在,我们有了一个预测矩阵来表示下一时刻的状态,但是,我们仍然不知道怎么更新协方差矩阵。此时,我们需要引入另一个公式,如果我们将分布中的每个点都乘以矩阵 A,那么它的协方差矩阵会怎样变化呢?很简单,下面给出公式:
9 \& W" }8 L4 @. R  A- |+ I- X, |1 m
) j4 y" |7 [* a
外部控制量
3 Y# e0 Y8 o8 Q+ }
我们并没有捕捉到一切信息,可能存在外部因素会对系统进行控制,带来一些与系统自身状态没有相关性的改变。
6 h  W% j  U0 z2 d& k) L( z% V
以火车的运动状态模型为例,火车司机可能会操纵油门,让火车加速。相同地,在我们机器人这个例子中,导航软件可能会发出一个指令让轮子转向或者停止。如果知道这些额外的信息,我们可以用一个向量来表示,将它加到我们的预测方程中做修正。

' M' X- c6 t6 `4 |3 h8 k/ s& c
假设由于油门的设置或控制命令,我们知道了期望的加速度,根据基本的运动学方程可以得到:
- H: Q8 _8 q3 D$ E

. a+ c  r6 J) r* c. C9 t3 L9 e- ~- P5 j! s# [8 Q
外部干扰

% n2 q, l) N0 Y$ c
如果这些状态量是基于系统自身的属性或者已知的外部控制作用来变化的,则不会出现什么问题。

% S# L1 T0 e- x* z, \) w
但是,如果存在未知的干扰呢?例如,假设我们跟踪一个四旋翼飞行器,它可能会受到风的干扰,如果我们跟踪一个轮式机器人,轮子可能会打滑,或者路面上的小坡会让它减速。这样的话我们就不能继续对这些状态进行跟踪,如果没有把这些外部干扰考虑在内,我们的预测就会出现偏差。

; i' O: C; G) y, L) S
在每次预测之后,我们可以添加一些新的不确定性来建立这种与“外界”(即我们没有跟踪的干扰)之间的不确定性模型:

9 }- i" R; u* j: s
1 x' L9 v7 r8 r1 L; x8 h
3 V9 `7 ^5 l5 {1 ?) H" ]- @/ g
这产生了具有不同协方差(但是具有相同的均值)的新的高斯分布。

9 q  _7 R7 K5 [% H

& W% O! z7 w! y, b0 Y- [; q4 }7 b, s
( z- n- {2 h: f
用测量值来修正估计值

$ G" i: _  J1 S" }" u
我们可能会有多个传感器来测量系统当前的状态,哪个传感器具体测量的是哪个状态变量并不重要,也许一个是测量位置,一个是测量速度,每个传感器间接地告诉了我们一些状态信息。

+ I9 }8 W3 f  f$ g) n4 C" ]9 g* w

) P9 S3 b9 J2 W7 b% t6 Z4 W& ~5 n3 A# ]1 L6 n! V
卡尔曼滤波的一大优点就是能处理传感器噪声,换句话说,我们的传感器或多或少都有点不可靠,并且原始估计中的每个状态可以和一定范围内的传感器读数对应起来。

( O% J! l" C8 S4 |8 H4 ]
从测量到的传感器数据中,我们大致能猜到系统当前处于什么状态。但是由于存在不确定性,某些状态可能比我们得到的读数更接近真实状态。

3 g0 p7 N7 J2 F5 _/ [3 x
我们必须在预测值(粉红色)和传感器测量值(绿色)之间找到最优解。
3 }2 h3 S7 ]+ K
那么,我们最有可能的状态是什么呢?对于任何可能的读数,有两种情况:(1)传感器的测量值;(2)由前一状态得到的预测值。如果我们想知道这两种情况都可能发生的概率,将这两个高斯分布相乘就可以了。
0 N# V+ h+ A7 v* S7 C* ^

% O) m  d( H2 G/ r; ~
剩下的就是重叠部分了,这个重叠部分的均值就是两个估计最可能的值,也就是给定的所有信息中的最优估计。

1 m5 T, P1 N) M  W& J
瞧!这个重叠的区域看起来像另一个高斯分布。

" L; }  N; t3 _' U$ P8 O

' {  X- O' x& m% ]. g, ?0 m" M
如你所见,把两个具有不同均值和方差的高斯分布相乘,你会得到一个新的具有独立均值和方差的高斯分布!下面用公式讲解。

# E5 ]& R  x1 N# Z/ ~
融合高斯分布

  i# t* j8 c. K( c% d; t. ]/ |6 E+ f
1 l9 Z2 }3 i& B: H8 Z7 ]

# d# e. F. U$ K* l

( b5 o/ ?  f; T5 J, N) U$ [, q1 X1 Z

. i2 }( T5 D% j9 V& q
. ]2 x1 t' B* n5 }
总结

' W* k9 Q3 U: w% v. D
以上所有公式中,你只需要用到式(7)、(18)、(19)。(如果忘了的话,你可以根据式(4)和(15)重新推导一下)

; r/ U9 A; U! V% V7 X+ S
我们可以用这些公式对任何线性系统建立精确的模型,对于非线性系统来说,我们使用扩展卡尔曼滤波,区别在于EKF多了一个把预测和测量部分进行线性化的过程。
8 d& n# C( Q0 n* p

该用户从未签到

2#
发表于 2020-1-7 22:02 | 只看该作者
卡尔曼太难了,终于找见能理解的了!

“来自电巢APP”

该用户从未签到

3#
发表于 2020-1-14 23:42 | 只看该作者
谢谢分享

“来自电巢APP”

您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-8-24 19:39 , Processed in 0.125000 second(s), 27 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表