Probabilistic Robotics读书笔记（一）

2023-11-22 11:27:15

转自我的博客http://gongzheng92.net

贝叶斯滤波器的推导

模型与方程

首先我们从贝叶斯滤波器谈起。
首先我们需要的是对机器人目前状态（states）的估计，用概率的方式表达为：

p(xt│x0:t−1,z1:t−1,u1:t) $p(x_t│x_{0:t−1},z_{1:t−1},u_{1:t} )$
上式可以在诸多假设条件（马尔科夫假设，观测不对环境造成影响等）下化为：

p(xt│xt−1,ut)(1) $p(x_t│x_{t−1},u_t ) \tag{1}$
同样的我们有测量模型：

p(zt│x0:t,z1:t−1,u1:t)=p(zt│xt)(2) $p(z_t│x_{0:t},z_{1:t−1},u_{1:t} )=p(z_t│x_t ) \tag{2}$
然而，由于 状态(states)(x)的 不可直接观测，于是我们提出了 置信度（belief）的概念。于是我们希望得到的状态(1)估计便可转化为：

bel(xt)=p(xt|z1:t,u1:t）(3) $\color{red}{bel(x_t )}=p(x_t |z_{1:t},u_{1:t}） \tag{3}$
注意这里并没有应用马尔科夫假设。

然而这里对 $x_t$ 的估计是先完成测量，再进行估计,因此(3)还有一种形式，便是

先完成估计，再进行测量 $先完成估计，再进行测量$ ，即

bel¯¯¯¯(xt)=p(xt│z1:t−1,u1:t)(4) $\color{blue}{\overline{bel}(x_t )}=p(x_t│z_{1:t−1},u_{1:t} ) \tag{4}$
于是我们就有了贝叶斯滤波器:

Byes_filter(bel(xt−1),ut,zt)for all xt dobel¯¯¯¯(xt)=∫p(xt|ut,xt−1)bel(xt−1)dxbel(xt)=ηp(zt|xt)bel¯¯¯¯(xt)endforreturn bel(xt)(5) $\begin{align}Byes&\_filter(bel(x_{t−1} ),u_t,z_t)\\&\text{for all $x_t$ do}\\&\color{blue}{\overline{bel}(x_t )}=\int \color{magenta}{p(x_t |u_t,x_{t−1} )}\color{red}{bel(x_{t−1} )}dx\\&\color{red}{bel(x_t)}=\eta \color{green}{p(z_t|x_t)}\color{blue}{ \overline{bel}(x_t)}\\&\text{endfor}\\&\text{return }bel(x_t) \end{align}\tag{5}$

其实在这里， $\color{magenta}{p(x_t |u_t,x_{t−1) }}$ 就是系统模型， $\color{green}{p(z_t│x_t )}$ 就是测量模型。

推导过程

那么这个(5)是怎么来的呢？我们从(3)推起：

(p(xt│z1:x,u1:t)=p(zt│xt,z1:t−1,u1:t)p(xt│z1:t−1,u1:t)p(zt│z1:t−1,u1:t)=ηp(zt│xt,z1:t−1,u(1:t))p(xt│z1:t−1,u1:t))(6) $\begin{align}\color{red}{(p(x_t│z_{1:x},u_{1:t} )}&=\frac{p(z_t│x_t,z_{1:t−1},u_{1:t} )p(x_t│z_{1:t−1},u_{1:t} )}{p(z_t│z_{1:t−1},u_{1:t} ) }\\&=\eta \color{green}{p(z_t│x_t,z_{1:t−1},u_(1:t) )}\color{blue}{p(x_t│z_{1:t−1},u_{1:t} ) }) \end{align}\tag{6}$
其中因为

p(zt│z1:t−1,u1:t) $p(z_t│z_{1:t−1},u_{1:t} )$ 与我们感兴趣的

xt $x_t$ 没有关系，因此可范化为

η $\eta$ 。

$p(x,y)=p(x│y)p(y)=p(x)p(y)$ 记住联合概率（,）的运算级别高于条件概率（|）。
然后在这里推一下书上没推的公式：
Bayes rule: $p(x│y)=\frac{p(y│x)p(x)}{p(y)}$

$\begin{align} p(x│y,z)&=\frac{p(y,z│x)p(x)}{p(y,z)} \\&=\frac{p(y,z,x)}{p(y│z)p(z) }\\&=\frac{p(y│x,z)p(x,z)}{p(y│z)p(z)}\\&=\frac{p(y│x,z)p(x)}{p(y|z)} \end{align}$

然后在 $\color{green}{p(z_t│x_t,z_{1:t−1},u_{1:t} )}$ 之中，由于我们假设测量 $z_t$ 只于当前状态有关，与之前的状态与历史控制量均无关系，因此我们有：

p(zt|xt,z1:t−1,u1:t)=p(zt│xt) $\color{green}{p(z_t|x_t,z_{1:t−1},u_{1:t} )=p(z_t│x_t )}$

于是有：

p(xt│z1:t,u1:t)=ηp(zt│xt)p(xt|z1:t−1,u1:t)(7) $\color{red}{p(x_t│z_{1:t},u_{1:t} )}=\eta \color{green}{p(z_t│x_t )}\color{blue}{p(x_t |z_{1:t−1},u_{1:t})} \tag{7}$

即

bel(xt)=ηp(zt│xt)bel¯¯¯¯(xt) $\color{red}{bel(x_t)}=\eta \color{green}{p(z_t│x_t )}\color{blue}{\overline{bel}(x_t)}$
但其实这句话很废话，因为就是“测量前的估计乘以测量等于测量后的估计”。
然后：

bel¯¯¯¯(xt)=p(xt│z1:t−1,u1:t)=∫p(xt│xt−1,z1:t−1,u1:t)p(xt−1│z1:t−1,u1:t)dxt−1(8) $\begin{align}\color{blue}{\overline{bel} (x_t )}&=p(x_t│z_{1:t−1},u_{1:t} )\\&=\int \color{magenta}{p(x_t│x_{t−1},z_{1:t−1},u_{1:t} )}\color{red}{p(x_{t−1}│z_{1:t−1},u_{1:t} )}dx_{t−1} \end{align}\tag{8}$

然后由于状态转移假设（其中包括了马尔科夫假设），则

p(xt│xt−1,z1:t−1,u1:t)=p(xt|xt−1,ut) $\color{magenta}{p(x_t│x_{t−1},z_{1:t−1},u_{1:t} )} = p(x_t|x_{t-1},u_t)$
再加之忽略红色

p(xt−1│z1:t−1,u1:t) $\color{red}{p(x_{t−1}│z_{1:t−1},u_{1:t} )}$ 部分的

ut $u_t$ （因为是未来的控制量），于是我们有

bel¯¯¯¯(xt)=∫p(xt|ut,xt−1)bel(xt−1)dx $\color{blue}{\overline{bel}(x_t )}=\int \color{magenta}{p(x_t |u_t,x_{t−1} )}\color{red}{bel(x_{t−1} )}dx$

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 《统计学习方法》感知机——读书笔记
下一篇 > 机器学习之二（读书笔记）

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

Probabilistic Robotics读书笔记（一）

贝叶斯滤波器的推导

模型与方程

推导过程

相关文章