CVPR 2019 论文概要汇总

启发自皮质神经元根据不同的刺激可动态调节其自身的receptive field，是结合了SE operator，Merge-and-Run Mappings，以及 attention on inception block 思想的产物，实测目前在超分辨的任务上有明确的提升，扩展应用前景还是值得期待的~

36、CVPR2019语义分割论文：Structured Knowledge Distillation for Semantic Seg

这是一篇CVPR2019做语义分割任务的文章，在训练好的大的分割模型上运用知识蒸馏的算法，使得比较小的模型也能提高语义分割的性能。

35、CMU和旷视科技开源：KL-Loss目标检测边界框回归新算法（CVPR2019）

作者提出一个全新的 regression loss，结合kl散度，使得网络可以更好的学习拟合ground truth，让网络更好的学习和收敛(而不被模糊样例造成的大loss干扰)。

34、CVPR2019 | 旷视提出Meta-SR：单一模型实现超分辨率任意缩放因子

旷视的CVPR2019论文，论文提出一种全新方法，称之为 Meta-SR，首次通过单一模型解决了超分辨率的任意缩放因子问题（包括非整数因子）

33、CVPR2019 |「准满分」论文：英伟达推出首个跨摄像头汽车跟踪数据集

这篇论文主要介绍了英伟达新推出的 CityFlow（流动之城）数据集，是目前世界上第一个支持跨摄像头汽车跟踪及再识别的大型数据集，同时拥有最多的摄像头数量（40）以及最大的空间跨度（> 3 km^2），为智慧城市的解决方案提供了最好的测试平台。

32、CVPR 2019 | 旷视等Oral论文提出GeoNet：基于测地距离的点云分析深度网络

基于网格曲面的几何拓扑信息可以为物体语义分析和几何建模提供较强的线索，但是，如此重要的连接性信息在点云中是缺失的。为此，旷视西雅图研究院首次提出一种全新的深度学习网络，称之为 GeoNet，可建模点云所潜在表征的网格曲面特征。

31、CVPR 2019 Oral | 京东AI研究院提出 ScratchDet：随机初始化训练SSD目标检测器

作者从优化的角度出发，通过实验解释了梯度稳定手段之一的 BatchNorm 是如何帮助随机初始化训练一阶段检测器 SSD，进而结合了 ResNet 与 VGGNet 来加强对小物体的检测。

30、CVPR2019 | R-MVSNet: 一个高精度高效率的三维重建网络

MVSNet升级版——“R-MVSNet”，该网络在原MVSNet的基础上进行改进，引入循环神经网络架构，可依序地在深度方向通过GRU单元正则化2D的代价图，较大程度地缓解了内存消耗。

29、CVPR2019目标检测方法进展综述

本文首先综述近年来二维目标检测的优化方向，之后介绍CVPR2019目标检测最新进展，包括优化IoU的GIoU，优化anchor设计的GA-RPN，以及single-stage detection的FSAF。

28、CVPR2019无人驾驶相关论文

CVPR2019无人驾驶相关论文的汇总，包括3D目标检测，立体匹配，单目视觉测距等，更新中。

27、CVPR2019 | Decoders 对于语义分割的重要性

该文章提出了一种不同于双线性插值的上采样方法，能够更好的建立每个像素之间预测的相关性。得益于这个强大的上采样方法，模型能够减少对特征图分辨率的依赖，能极大的减少运算量。

26、CVPR 2019 | 用异构卷积训练深度CNN：提升效率而不损准确度

对于深度卷积神经网络而言，准确度和计算成本往往难以得兼。本文则给出了一个新的思路——使用异构的卷积过滤器；实验表明这种方法能在保证准确度的同时显著降低计算成本。

25、图像分类算法优化技巧：Bag of Tricks for Image Classification

这篇文章是亚马逊科学家介绍CNN网络调优的细节，许多实验是在图像分类算法做的，比如ResNet，作者不仅复现出原论文的结果，在许多网络结构上甚至超出原论文的效果，而且对于目标检测，图像分割算法同样有提升作用。目前论文已被CVPR2019接收。

24、双重注意力网络：中科院自动化所提出新的自然场景图像分割框架（附源码）

本文提出了一个新的自然场景图像分割框架，称为双重注意力网络（DANet），引入了一种自注意力机制来分别捕捉空间维度和通道维度上的视觉特征关联。目前论文已被CVPR2019接收。

23、CVPR 2019| ILC：用于自然场景多目标的计数模型

本文提出用于自然场景的计数模型，基于Image-level的方式训练，相较于以往需要Instance-level/point-level/bounding box level等训练方式来说，此模型只要有出现的类别以及各自的数量即可进行训练。

22、CVPR 2019 | 用异构卷积训练深度CNN：提升效率而不损准确度

对于深度卷积神经网络而言，准确度和计算成本往往难以得兼，本文则给出了一个新的思路——使用异构的卷积过滤器；实验表明这种方法能在保证准确度的同时显著降低计算成本。

21、CVPR2019 | 西北工业大学开源拥挤人群数据集生成工具，大幅提升算法精度

来自西北工业大学的学者提出使用计算机图形工具创建拥挤人群数据集的方法，并开源了他们创建的大型数据集，在此数据集上训练的算法精度获得了大幅提升，超越了之前的state-of-the-art。

20、DaSiamRPN的升级版，视觉目标跟踪之SiamRPN++

商汤新工作，DaSiamRPN的升级版：SiamRPN++，在多个跟踪数据集上都是state-of-the-art ，目前论文已被CVPR2019接收（oral）。

19、CVPR 2019 | 让机器帮你做行测题，UCLA朱松纯团队提出关系和类比视觉推理数据集RAVEN

为了突破当前视觉推理能力的极限，UCLA 朱松纯团队基于一项更难的人类视觉推理任务——瑞文测试（RPM，例如《行测》中的图形推理题）构建了关系和类比视觉推理数据集 RAVEN。

18、CVPR 2019 | 微软亚研院提出用于语义分割的结构化知识蒸馏

该文研究了在语义分割模型的知识蒸馏中引入结构化信息的损失函数，在不改变模型计算量的情况下，使用该方法在Cityscapes数据集上mIoU精度取得了最高达15.17%的提升。

17、CVPR 2019 | 京东AI研究院提出 ScratchDet：随机初始化训练SSD目标检测器

本文介绍了京东AI研究院被接受的一篇 Oral 论文，作者从优化的角度出发，通过实验解释了梯度稳定手段之一的 BatchNorm 是如何帮助随机初始化训练一阶段检测器 SSD，进而结合了 ResNet 与 VGGNet 来加强对小物体的检测。

16、CVPR2019 | 业内最大规模！美图联合清华推出教程类行为数据集 COIN

美图和清华团队联合发布了业界规模最大，多样性最丰富的教程类行为数据集 COIN。该数据集在标注结构上采用分层的组织结构，涵盖了多种不同类型的教程类视频。给复杂场景下视频动作时序定位等问题的研究提供了丰富的数据资源。

15、CVPR2019 | Stereo R-CNN 3D 目标检测

这是一篇来自DJI与港科大合作的双目的3d object detection文章，解决立体视觉中的检测问题。整个文章将传统的detection的任务，结合了geometry constraint优化的方式，用在3Ddetection上面还是比较新颖的。

14、CVPR2019 oral | 这个面部3D重建模型，造出了6000多个名人的数字面具

本文提出了一种新型的面部三维重建模型，效果惊艳。该模型基于自监督学习，使用了来自 YouTube 抓取的 6000 多个名人的视频片段进行训练，该模型可以完全从零开始学习，将面部的多种特征分离再重新组合。

13、CVPR2019 | 医学影像：MIT 团队提出利用学习图像变换进行数据增强

近日，由麻省理工学院（MIT）电子工程与计算机科学（ECCS）实验室多位博士所著的医学影像AI论文被CVPR 2019收录。该团队为了解决医学图像标注数据缺乏的问题，提出了通过学习图像的变换（transforms）进行数据增强的半监督分割方法。

12、CVPR2019 | SiamMask：视频跟踪最高精度

本文介绍一篇非常优秀的视觉跟踪方面的论文，作者提出的新算法SiamMask，在视频跟踪任务上达到最优性能，并且在视频目标分割上取得了当前最快速度。作者来自中科院自动化所，牛津大学等，本文带来一作自动化所王强的解读。

11、CVPR2019 | FSAF：来自CMU的Single-Shot目标检测算法

本文介绍了来自CMU的CVPR2019论文，提出了一个非常优秀的Single-Shot目标检测算法：FSAF。

10、CVPR2019 | AlphaPose升级！上海交大卢策吾团队开源密集人群姿态估计代码

AlphaPose升级了！上海交大MVIG组(卢策吾团队)构建了CrowdPose数据集，用来衡量算法在拥挤场景中的性能。同时提出了一个高效的算法来解决拥挤人群中的姿态估计问题，实验结果远高于当前最好的算法。

9、CVPR2019 | 实例分割的进阶三级跳：从 Mask R-CNN 到 Hybrid Task Cascade

在本篇论文中，作者提出了一种新的实例分割框架，设计了多任务多阶段的混合级联结构，并且融合了一个语义分割的分支来增强 spatial context。取得了明显优于 Mask R-CNN 和 Cascade Mask R-CNN 的结果。

8、CVPR2019 | 开源分割新算法MS R-CNN，性能超越何恺明Mask R-CNN

本文分析了过去的经典分割框架存在的缺陷，并提出基于Mask R-CNN提出一个新的框架Mask Scoring R-CNN，能自动学习出mask quality，试图解决不配准的问题。

7、CVPR2019 | 专门为卷积神经网络设计的训练方法：RePr

本文提出了一种针对卷积神经网络的训练方法RePr，非常简单有效，在cifar，ImageNet，VQA，object detection上涨点很多，ablation study做的非常充分。

6、CVPR2019 | 审稿排名第一满分论文：让机器人也能「问路」的视觉语言导航新方法

本文是CVPR满分文章（3个Strong Accept），在5165篇投稿文章中得分排名第一。该论文提出的新方法结合了强化学习和自监督模仿学习两者之长，在视觉-语言导航任务上取得了显著的进步。

5、CVPR2019 | 全景分割：Attention-guided Unified Network

中国科学院自动化研究所所做关于全景分割问题。本文提出了一个叫做 Attention-guided Unified Network ( AUNet ) 的结构去解决全景分割问题，该方法在MS-COCO数据集上取得了目前最好的结果。

4、CVPR2019 | 6D目标姿态估计，李飞飞夫妇等提出DenseFusion

李飞飞夫妇等研究者提出了 DenseFusion——一种可单独处理两个数据源的异质架构。目前这项工作已被CVPR2019接收。

3、CVPR2019 | 目标检测新文：Generalized Intersection over Union

本文提出用IoU这个直接的指标来指导回归任务的学习，用直接指标IoU作为损失函数的缺陷性，提出新的metric来代替L1，L2损失函数，从而提升regression效果。

2、CVPR2019 | 微软，中科大开源基于深度高分辨表示学习的姿态估计算法

来自微软和中国科技大学研究学者提出了基于深度高分辨表示学习的姿态估计算法，论文和相应代码甫一公布，立刻引起大家的关注，不到一天之内，github上已有将近50颗星。

1、CVPR2019 | Guided Anchoring: 物体检测器也能自己学 Anchor

物体检测领域论文”Region Proposal by Guided Anchoring”解读，这篇 paper 的方法用在了 COCO Challenge 2018 检测任务的冠军方法中，在极高的 baseline 上涨了1个点。论文目前已被CVPR2019接收。

人脸技术篇

超分辨率篇

https://github.com/extreme-assistant/cvpr2019