「开源」近期遥感航空影像的检索、检测、跟踪、计数、相关工作

作者 | CV君
编辑 | CV君
报道 | 我爱计算机视觉(微信id:aicvml)

本篇收录遥感航空影像相关论文,其中应用到超分辨率、检索、对齐、检测、跟踪、计数与分类技术。共计 5 篇。

01

Unsupervised Remote Sensing Super-Resolution via Migration Image Prior

武汉大学&武汉工程大学&阿肯色大学

文章提出一个全新的无监督学习框架:MIP”,可以在没有低/高分辨率图像对的情况下实现了 SR 任务。首先,将随机噪声图通过一个设计好的生成对抗网络(GAN)进行重建。然后,所提出的方法将参考图像转换为隐空间作为迁移图像的先验。最后,通过隐式方法更新输入噪声,并进一步迁移参考图像的纹理和结构化信息。在 Draper 数据集上的大量实验结果表明,MIP 在数量上和质量上都比最先进的方法有了明显的改进。

  • 论文链接:https://arxiv.org/abs/2105.03579
  • 项目链接:https://github.com/jiaming-wang/MIP
「开源」近期遥感航空影像的检索、检测、跟踪、计数、相关工作

标签:遥感影像+超分辨率

02

A Novel Triplet Sampling Method for Multi-Label Remote Sensing Image Search and Retrieval

来自柏林工业大学

学习遥感(RS)图像之间的相似性是基于内容的RS图像检索(CBIR)的基础。最近,将图像的语义相似性映射到一个嵌入空间的深度度量学习方法在RS中非常流行。学习度量空间的常见方法依赖于选择类似(正)和不类似(负)图像的 triplets(三联体),以作为锚的参考图像。而选择 triplets(三联体)是一项艰巨的任务,特别是对于多标签 RS CBIR 来说,每个训练图像都有多个类别标签。

为了解决这个问题,作者在深度神经网络(DNNs)的框架内提出一种新的三联体采样方法,该方法是针对多标签 RS CBIR 问题而定义的。所提出的方法基于两个主要步骤,选择一小部分最具代表性和信息量的三联体。在第一步中,使用迭代算法从当前的小批量中选择一组在嵌入空间中彼此不同的锚点。在第二步中,通过评估相关度、困难度和基于新的排名策略的图像之间的多样性,为每个锚选择不同的正面和负面图像集。

在两个多标签基准上获得的实验结果表明,在 DNN 的背景下,选择信息量最大和最有代表性的三联体的结果是:i)减少 DNN 训练阶段的计算复杂性,而对性能没有任何重大损失;ii)提高学习速度,因为信息量大的三联体允许快速收敛。

  • 论文链接:https://arxiv.org/abs/2105.03647
  • 项目链接:https://git.tu-berlin.de/rsim/image-retrieval-from-triplets
「开源」近期遥感航空影像的检索、检测、跟踪、计数、相关工作

标签:遥感图像+图像检索

03

SIPSA-Net: Shift-Invariant Pan Sharpening with Moving Object Alignment for Satellite Imagery

来自韩国科学技术院,CVPR 2021

韩国科学技术院学者提出一个新的框架:用于移动目标对齐的 shift-invariant pan-sharpening(SIPSA-Net),是第一个考虑到移动目标区域的这种大的错位来进行 pan-sharpened 方法。通过实验表明,与最先进的方法相比,SIPSA-Net 可以生成 pan-sharpened 图像,在视觉质量和对齐方面有显著的改善。

  • 论文链接:https://arxiv.org/abs/2105.02400
  • 项目链接:https://github.com/brachiohyup/SIPSA
「开源」近期遥感航空影像的检索、检测、跟踪、计数、相关工作

标签:卫星图像+移动目标对齐

04

Detection, Tracking, and Counting Meets Drones in Crowds: A Benchmark

来自JD金融美国公司&纽约州立大学奥尔巴尼分校&天津大学,CVPR 2021

通过提出 STNNet 方法来共同解决无人机拍摄的拥挤场景中的密度图估计、定位和跟踪。值得注意的是,作者设计了相邻上下文损失来捕捉连续帧中相邻目标之间的关系,对定位和跟踪是有效的。为了更好地评估无人机的性能,作者还收集并标记了一个新的数据集:DroneCrowd。

作者称这是迄今为止最大的数据集,其中包含了用于密度图估计、人群定位和无人机跟踪的头部标注轨迹。并称希望这个数据集和提出的方法能够促进无人机上人群定位、跟踪和计数的研究和发展。

  • 论文链接:https://arxiv.org/abs/2105.02440
  • 项目链接:https://github.com/VisDrone/DroneCrowd
「开源」近期遥感航空影像的检索、检测、跟踪、计数、相关工作

标签:无人机图像+检测+跟踪+计数

05

A Novel Uncertainty-aware Collaborative Learning Method for Remote Sensing Image Classification Under Multi-Label Noise

来自柏林工业大学,ICIP 2021

文章中提出一种独立于架构的协同多标签学习(Consensual Collaborative Multi-Label Learning,CCML)方法,用于训练 MLC 问题中输入依赖(异方差)多标签噪声下的深度分类器。CCM L通过四个主要模块来识别、排列和纠正嘈杂的多标签图像:

  1. group lasso 模块:通过估计基于两个协作网络聚合的标签不确定性来检测隐藏噪声标签。
  2. discrepancy(差异)模块:确保两个网络学习不同的特征,同时获得相同的预测结果。
  3. flipping module(翻转)模块:对识别的噪声标签进行修正。
  4. swap module(交换)模块:在两个网络之间交换排名信息。

多标签 RS 图像档案 IR-BigEarthNet 上进行的实验证实了所提出的 CCML 在极端多标签噪声率下的鲁棒性。

  • 论文链接:https://arxiv.org/abs/2105.05496
  • 项目链接:https://git.tu-berlin.de/rsim/CCML/-/tree/master
「开源」近期遥感航空影像的检索、检测、跟踪、计数、相关工作

标签:遥感图像分类

转载请注明:《「开源」近期遥感航空影像的检索、检测、跟踪、计数、相关工作