论文笔记 - FCOS Fully Convolutional One-Stage Object Detection - 作壹條苟

文章提出一种不依赖于预定义锚点的逐像素预测的OD方法。

基于锚点的OD方法具有如下缺陷：

用于训练的ground truth bbox结构如下：

\[B_i = (x^{(i)}_0, y^{(i)}_0, x^{(i)}_1, y^{(i)}_1, c^{(i)})\in R^4\times{1,2...C}\]

以此ground truth构造标签，训练时FCOS会直接对bbox的坐标进行学习，而非学习基于锚点的坐标差和尺寸差。实际训练时标签为类别C及一个四维实数向量$(l^, t^,r^,b^)$，分别表示当前坐标到bbox四个边缘的距离。