作壹條苟

螳臂挡车,蚍蜉撼树

论文笔记 - Label-free Supervision of NNs with Physics and Domain Knowledge

针对标注数据稀缺问题,文章提出一种以定律/特定领域知识代替标注数据的监督学习方法。 使用特定领域知识代替标注数据进行监督学习的关键是将损失函数中基于output-groundtruth pair distance的最优化,改变为将input-output pair约束到最符合先验知识域的映射。即从 \[f^* = \mathop{argmin}_{f\in F}\sum^n_{l...

论文笔记 - FCOS Fully Convolutional One-Stage Object Detection

文章提出一种不依赖于预定义锚点的逐像素预测的OD方法。 基于锚点的OD方法具有如下缺陷: 与锚点相关的超参必须被小心选择,否则会较明显的影响最终预测效果(如average precision)。 预置的锚点大小、比例在检测差异较大物体时不够灵活,且在迁移数据集后需要重新设计。 为提高召回率,多个锚点box被紧密排列,而绝大部分锚点都被标定为negative,这样会导...

论文笔记 - Real Time Loop Closure in 2D LIDAR SLAM

这篇文章是Cartographer的理论基础,描述了一种可达到实时效果的用于激光雷达室内SLAM建图方法。目前对SLAM的学习和理解还处在一个很初级的阶段,对除文章描述方法之外的其他方法以及整个方向缺乏认知,需要以这篇文章以及Cartographer的源码阅读为契机,理解SLAM以至自动驾驶方向的任务目标、评价指标、实现方法等,深度参与到这个方向中去。 Workflow ...

论文笔记 - Bottom-up Object Detection by Grouping Extreme and Center Points

文章提出一种利用极值点回归以极值点连接的菱形/八边形而非bounding box represented的object detection,以更好的表达被识别物体。该方法是完全基于外观信息的底层方法,通过学习不同类别物体的极值点,避免了region proposal及对区域进行classification的计算消耗。但同时将极值点组合为有意义的物体分组也引入了很大的额外消耗。 对于h×...

论文笔记 - Spatial CNN for Traffic Scene Understanding

文章针对traffic scene understanding中,基于局部感受野进行特征识别的传统CNN对具有连续明显几何特征(pole、lane)物体识别效果不佳的问题,提出spatial CNN,使特征能够在同一个layer中进行传播,以更好的学习空间特征。SCNN将feature map的行或列作为layer,。SCNN不仅可以学习连续空间特征,还可以对遮掩的连续特征进行补全。 ...

论文笔记 - Bag of tricks for classification with convolutional neural networks

通过这篇文章,可以系统化的掌握一些调优方式,同时可以将整个模型训练的过程及其中涉及的一些细节进行系统化的总结。 Abstract 当前image classification领域的进步很大程度来自于对训练过程的优化,如data argumentation和optimization方面的改进。这篇文章对这些方法进行了测试并通过ablation对他们对于模型最终表现的影响进行了 emp...

论文笔记 - Understanding deep learning requires for rethinking generalization

一般认为大型神经网络的高泛化性一定程度上来自于正则项约束。这篇文章通过随机label训练得出结论,多种正则均无法保证大型神经网络的泛化性,但可以优化训练过程,得到更快的收敛结果。 同时文章得出结论,大型神经网络一定可以“记忆”住定量的数据集的(注意非学习,因为学习需要具有可泛化性)。并给出计算公式:DNNs的学习能力为N+2D,其中N为样本数,D为输入维度。 文章读下来,感觉重新泛化与...

技术总结 - Instance Level Segmentation

Object detection可以看作是一种粗粒度的instance segmentation。在场景推理中,重叠物体的遮掩及其空间关系之间的判断与推理以object detection的bounding box representation实现起来比较困难。携带边缘和occlusion信息的instance segmentation在这种任务上更有优势。 UToronto的in...

技术总结 - Apollo & 自动驾驶

Udacity上看了Apollo的course,正好又在GTC看了一些自动驾驶肌肉秀。既然是要做AGV,自动驾驶当然是要学习的。 Apollo的架构 定位: RTK(real time kinematic):GPS+IMU 多传感器融合:GPS+IMU+激光雷达 感知: input:雷达数据,图像数...

技术总结 - 资源汇总

ML notes 机器之心-数据科学家必须了解的六大聚类算法:带你发现数据之美 object detection 模型汇总 图像语义分割之FCN和CRF Image Segmentation with Tensorflow using CNNs and Conditional Random Fields ...