「4月20日」十篇(将)开源论文代码分享

整理:CV君

今日将或已开源论文,包含图像去雾、实例分割、图像修复、Transformer 在自动驾驶的应用等


#CVPR 2021##去雾#

1、Contrastive Learning for Compact Single Image Dehazing

华东师范大学&厦门大学&腾讯优图

提出 ACER-Net,通过 contrastive regularization(对比正则化)和高度紧凑的 autoencoder-like(类自动编码器)的除雾网络,可有效生成高质量的无雾图像。与最先进的方法相比,AECR-Net 实现了最佳的参数-性能权衡。其中,对比正则化作为一种通用正则化,可以进一步改善各种最先进的去雾网络的性能。类自动编码器(AE)去雾网络中的自适应混叠和动态特征增强模块分别可以帮助去雾模型自适应地保存信息流和增强网络的转换能力。

将开源:https://github.com/GlassyWu/AECR-Net

论文:https://arxiv.org/abs/2104.09367

「4月20日」十篇(将)开源论文代码分享

#CVPR 2021 Oral#

2、Single-view robot pose and joint angle estimation via render & compare

ENS/Inria&法国国立路桥学校&CIIRC CTU

提出 RoboPose,用于从一张 RGB 图像中估计已知关节机器人的关节角度和 6D 相机对机器人姿势。

已开源:https://github.com/ylabbe/robopose

主页:https://www.di.ens.fr/willow/research/robopose/

视频:https://www.youtube.com/watch?v=3yzwS99sgLI

论文:https://arxiv.org/abs/2104.09359

「4月20日」十篇(将)开源论文代码分享

#CVPRW2021#

3、OmniLayout: Room Layout Reconstruction from Indoor Spherical Panoramas

宾夕法尼亚州立大学

所提出的 OmniLayout 在两个不同的基准数据集(PanoContext 和 Stanford 2D-3D)上的表现优于最先进的技术约 4%。

将开源:https://github.com/rshivansh/OmniLayout

论文:https://arxiv.org/abs/2104.09403

「4月20日」十篇(将)开源论文代码分享

#Transformer##自动驾驶##CVPR 2021#

4、Multi-Modal Fusion Transformer for End-to-End Autonomous Driving

马普所&图宾根大学

先是证明基于现有的传感器融合方法的模仿学习策略在高密度动态代理和复杂场景下表现不佳,需要全局性的上下文推理,如在不受控制的交叉路口处理多方向来车。

本次研究中,作者提出 TransFuser,一种新型的多模态融合 Transformer,利用注意力来整合图像和激光雷达的表示。并通过实验验证了所提出方法在涉及复杂场景的城市环境中使用 CARLA 城市驾驶模拟器的功效。该方法实现了最先进的驾驶性能,同时与基于几何的融合相比,减少了 76% 的碰撞。

已开源:https://github.com/autonomousvision/transfuser

论文:https://arxiv.org/abs/2104.09224

「4月20日」十篇(将)开源论文代码分享

#CVPR 2021##图像修复#

5、Image Inpainting with External-internal Learning and Monochromic Bottleneck

香港科技大学

作者称这是首个将 external-internal 学习方法用于深度图像修复的工作,通过在大型数据集上进行训练,从外部学习语义知识,同时充分利用单幅测试图像的内部统计数据。设计一个渐进式的内部色彩复原网络,可实现出色的色彩化性能。将所提出的方法推广到多个深度修复模型,并在多个数据集上观察到视觉质量和模型泛化能力的明显改善。

已开源:https://github.com/Tengfei-Wang/external-internal-inpainting

论文:https://arxiv.org/abs/2104.09068

「4月20日」十篇(将)开源论文代码分享

6、Distilling Knowledge via Knowledge Review

港中文&思谋科技&牛津大学

提出一个新的知识蒸馏 review 机制,利用 teacher 的 multi-level 信息指导学生网络的 one-level 学习。 residual 学习框架是为实现更好的 review 机制学习进程。基于注意力的融合(ABF)模块和分层上下文损失(HCL)函数,可以进一步完善 knowledge review 机制。实验验证,所提出框架在多个计算机视觉任务中实现了许多紧凑模型的最先进性能。

将开源:https://github.com/Jia-Research-Lab/ReviewKD

论文:https://arxiv.org/abs/2104.09044

「4月20日」十篇(将)开源论文代码分享

7、Filtering Empty Camera Trap Images in Embedded Systems

Federal University of Amazonas

已开源:https://github.com/alcunha/filtering-empty-camera-trap-images

论文:https://arxiv.org/abs/2104.08859

「4月20日」十篇(将)开源论文代码分享

#CVPR 2021##自动驾驶#

8、Self-Supervised Pillar Motion Learning for Autonomous Driving

QCraft(轻舟智航)&约翰斯霍普金斯大学

将开源:https://github.com/qcraftai/pillar-motion

论文:https://arxiv.org/abs/2104.08683

「4月20日」十篇(将)开源论文代码分享

#CVPR 2021##实例分割##细粒度#

9、RefineMask: Towards High-Quality Instance Segmentation with Fine-Grained Features

清华&商汤*同济等

提出 RefineMask,用于目标和场景的高质量实例分割,它以多阶段的方式在实例分割过程中融合了细粒度的特征。通过逐级融合更多的细节信息,RefineMask 能够持续地提纯高质量的掩模。RefineMask 成功地克服了以往分割中所遇到的困难案例,如物体的弯曲部分被过度平滑,并输出了准确的边界。Without bells and whistles,RefineMask 在COCO、LVIS 和 Cityscapes基准上分别比 Mask R-CNN 产生了 2.6、3.4、3.8 AP的显著收益,而额外的计算成本却很少。此外,单模型结果在 LVIS 测试装置集上比 2020 LVIS 挑战赛的冠军高出 1.3 个百分点,实现了新的 SOTA。

已开源https://github.com/zhanggang001/RefineMask

论文:https://arxiv.org/abs/2104.08569

「4月20日」十篇(将)开源论文代码分享

#CVPRW 2021##去雾#

10、A Two-branch Neural Network for Non-homogeneous Dehazing via Ensemble Learning

麦克马斯特大学&国科大&西安电子科技大学

已开源https://github.com/liuh127/Two-branch-dehazing

论文:https://arxiv.org/abs/2104.08902

「4月20日」十篇(将)开源论文代码分享

转载请注明:《「4月20日」十篇(将)开源论文代码分享