Advanced Vision lecture 3 Optical Flow

temporal information: 时间信息

典型建模:
motion cues: 用cue points标记人/物,反映其移动时的姿态
比如刻画正在运动的一个人,或者发生冲突的几个人

Some Applications Involving Temporal Information:

  • Action Recognition
  • Structure from Motion
  • Applications to Graphics

Problem: 预测出时间戳t和t+1之间的图像
在这里插入图片描述
引出Optical Flow的定义:
Optical flow or optic flow is the pattern of apparent motion of objects, surfaces, and edges in a visual scene caused by the relative motion between an observer and a scene. (wiki)
也就是人眼中物体移动的模式
相对概念:motion field:物体实际移动的情况

sources of motion:
scene, camera…都有可能是移动的(2*2=4种情况)

表示视频的方式:(此处提到过去的Vision Experience)
这门课要有vision方面的prerequisites,必须课下补上readings
在这里插入图片描述
[算法]color/brightness constancy assumption
根据颜色/亮度选择最近的点,视作该点上一帧的位置在这里插入图片描述
Brightness Constancy 的数学表述:

在这里插入图片描述
Aperture Problem and Solving it:
光圈问题和解决方式:
Spatial Coherence Constraint:
假设实际不在一个平面的两点有相同的(u,v)
u,v是平面坐标?

没听懂


Optical Flow的Aliasing问题:
? 发生偏移…

解决方式:Reduce resolution

Robust Estimation 的Penalty function:
全是平方,为了…?
在这里插入图片描述
数据集:

  • Middlebury (2007)
  • Sintel
  • KITTI (2012)
  • FlyingChairs(2015) 有足够数据训练CNN

不同的学习Optical Flow的网络结构:

  • FlowNet
  • SpyNet
  • Self-Supervised Flow(自学习 不需要外部数据)

Backward flow就是forward flow反过来:

在这里插入图片描述
基础概念:
warp:图像扭曲
具体怎么扭曲有具体的warp function

Guest Talk:
谷歌学者Deqing Sun

从三个方面讲了关于Optical Flow:
1、Network
成就:构造了参数更小,Error而更小(Better Performance)的PWC-Net
2、Data
关于FlyingChair的一些问题,如何构造Optical flow的data set,实验效果(3~4个物体在sintel上表现最好等)
3、Application
比如谷歌官方已经推出的:脸部去除模糊,视频慢动作补全等


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部