【11月15日】六篇(将)开源论文代码分享

作者 | CV君
编辑 | CV君
报道 | 我爱计算机视觉(微信id:aicvml)

 

#超分辨率##空中动物监测##航空影像#

Small or Far Away? Exploiting Deep Super-Resolution and Altitude Data for Aerial Animal Surveillance

由高空飞行的无人机捕获的视觉图像越来越多地被用于评估全球的生物多样性和动物种群动态。然而,尽管有超高分辨率的相机,但具有挑战性的采集场景和机载图像中微小的动物描述,迄今为止一直是成功应用计算机视觉检测器的高置信度的限制性因素。

在本文中,作者首次通过将深度目标检测器与超分辨率技术和高度数据相结合来解决上述问题。具体来说,将基于整体注意力网络的超分辨率方法和定制的高度数据利用网络整合到标准的识别管道中,可以大大增加现实世界中的检测效率。在两个公共的大型空中捕捉动物数据集 SAVMAP 和 AED 上评估了该系统。发现,在这两个数据集上,所提出的方法可以持续改进,超过消融的基线和最先进的性能。

此外,还对动物分辨率和检测性能之间的关系进行了系统分析。得出的结论是,超分辨率和高度知识利用技术可以显著提高不同环境下的基准,因此,在检测航空图像中细微分辨率的动物时,应常规使用。

将开源:github.com/Mowen111/SAL

论文:arxiv.org/abs/2111.0683

 

 


#NeurIPS 2021##GAN#

Deceive D: Adaptive Pseudo Augmentation for GAN Training with Limited Data

南洋理工大学&商汤

生成式对抗网络(GANs)通常需要大量的数据进行训练,以合成高保真图像。近期的研究表明,在有限的数据下训练 GANs 仍然很困难,因为判别器过拟合,这是阻碍生成器收敛的根本原因。

本次研究工作,提出 Adaptive Pseudo Augmentation(APA)的新策略,以鼓励生成器和判别器之间的良性竞争。作为现有的依靠标准数据增强或模型正则化的方法的替代方法,APA 通过利用生成器本身用生成的图像来增强真实的数据分布,从而自适应地欺骗鉴别器,缓解过度拟合。

广泛的实验证明了 APA 在低数据体制下提高合成质量的有效性。提供一个理论分析来研究新的训练策略的收敛性和合理性。APA是简单而有效的。可以被无缝地添加到强大的当代 GANs 中,如 StyleGAN2,而计算成本可以忽略不计。

将开源:github.com/EndlessSora/

论文:arxiv.org/abs/2111.0684

 

 


#3D目标检测##NeurIPS 2021#

Multimodal Virtual Point 3D Detection

本文提出一种将 RGB 传感器无缝融合到基于激光雷达的 3D 识别的方法。它采用一组二维检测来生成密集的三维虚拟点,以增强原本稀疏的三维点云。这些虚拟点与常规的激光雷达测量一起自然地整合到任何标准的基于激光雷达的三维检测器中。由此产生的多模式检测器简单而有效。

在大规模的nuScenes数据集上的实验结果表明,该框架将强大的 CenterPoint 基线大幅提高了 6.6mAP,并超过具有竞争性的融合方法。

得克萨斯大学奥斯汀分校

已开源:github.com/tianweiy/MVP

论文:arxiv.org/abs/2111.0688

 

 


#表面重建#

Temporally-Consistent Surface Reconstruction using Metrically-Consistent Atlases

本文介绍一种基于 atlas 的方法,以无监督的方式产生时间上一致的表面重建,通过强制要求典范形状表示上的一个点映射到重建表面上的计量上一致的三维点。以及设计了一种优化策略,使所提出方法对噪声和全局运动具有鲁棒性,不需要先验的对应关系或预对准步骤。因此,在几个具有挑战性的数据集上的表现超过了最先进的方法。

已开源github.com/bednarikjan/

论文:arxiv.org/abs/2111.0683

 

 


#医学#

Monte Carlo dropout increases model repeatability

麻省总医院&麻省理工学院等

文中作者使用不同的模型架构(ResNet18, ResNet50, DenseNet121)对三种医疗任务(宫颈癌筛查、乳房密度估计和早产儿视网膜病变分类)的四种模型(二元、多类、序数和回归)类型的可重复性进行了评估。并证明了在测试时间内的 MC 采样会产生更可靠的分类模型,对同一病人的不同图像提供更稳定和可重复的预测。以及只有回归模型在利用MC采样时没有显示出持续的改进。MC采样很灵活,因为它适用于任何模型类型和架构,同时很容易实现。

已开源github.com/andreanne-le

论文:arxiv.org/abs/2111.0675

 

 


#TensorFlow##旋转检测#

AlphaRotate: A Rotation Detection Benchmark using TensorFlow

上海交通大学

本文介绍一个开源库:AlphaRotate。

AlphaRotate是一个开源的 Tensorflow 基准,用于对各种数据集进行可扩展的旋转检测。目前,它在一个单一的、记录良好的 API 下提供了超过18个流行的旋转检测模型,旨在供从业者和研究人员使用。

AlphaRotate将高性能、鲁棒性、可持续性和可扩展性视为设计的核心理念,所有模型都有单元测试、持续集成、代码覆盖、可维护性检查以及可视化监控和分析。AlphaRotate可以从PyPI上安装,并在Apache-2.0许可证下发布。

已开源github.com/yangxue0827/

论文:arxiv.org/abs/2111.0667

转载请注明:《【11月15日】六篇(将)开源论文代码分享