本文从 07 年的 IVT 讲到 16 年的。。。
参考:
[1] 深度学习在目标跟踪中的应用
[2] 【VALSE前沿技术选介16-18期】Object Tracking新思路
基本知识
首先来看看视觉跟踪算法的一些基本知识,包括主要的数据集和跟踪算法的主要构成等。
数据集
13 年以前各自为政,13 年 OTB-50, OTB-100, VOT13~15, 300,快速发展
跟踪算法主要模块
运动模型,表观模型
算法流程:Init + Track + Update
传统视觉跟踪算法
主要分为生成式和判别式
生成式算法
IVT 为代表,随后 Sparse Representation, LSST,可识别遮挡,生成式的一个关键概念在于重构。
IVT
在数据集上的结果。。。
Sparse Representation
在数据集上的结果。。。
判别式模型
TLD 为代表,SCM,Struck,Superpixel,MEEM,Muster 等
Kernelized Correlation Filters
12 提出,15 年改进,very popular,随后大量改进出现,如 DSST,SRDCF 等,即使在深度学习出来后仍在用该框架
基于深度学习的方法
一种是在通用数据集上训练,在跟踪视频上微调。一种是在跟踪数据集上训练,在另一些上微调。但都离不开 Motion + Appearance 框架。基本过程仍然是 Init + Track + Update。
最新的任性算法
基于深度学习的成功,最近出现了许多十分任性的视觉跟踪算法。
一篇 regression,无模型更新,只比较前后帧。
另一篇更牛,无更新,无遮挡处理等等,只在第一帧初始化,随后不再更新,效果很好。