「9月15日」八篇(将)开源论文代码分享

作者 | CV君

编辑 | CV君

报道 | 我爱计算机视觉(微信id:aicvml)


#图像复原##ICCV 2021#

Dynamic Attentive Graph Learning for Image Restoration
北京大学深圳研究生院&鹏城实验室
文中提出一个用于图像修复的改进图注意模型。与之前的非局部图像修复方法不同,该模型可以为每个查询项分配一个自适应的邻居数量,并基于特征斑块构建长距离的关联。此外,提出的动态注意力图学习(DAGL)可以很容易地扩展到其他计算机视觉任务。
大量的实验表明,所提出的模型在广泛的图像修复任务中取得了最先进的性能,如合成图像去噪、真实图像去噪、图像去马赛克和压缩伪影减少。
将开源:https://github.com/jianzhangcs/DAGL
论文:https://arxiv.org/abs/2109.06620

「9月15日」八篇(将)开源论文代码分享

#ICCV 2021##点云配准#
Sampling Network Guided Cross-Entropy Method for Unsupervised Point Cloud Registration
南京理工大学
CEM,全称 cross-entropy method,一个嵌入的端到端深度模型,用于无监督的点云配准,由一个采样网络模块和一个可微的CEM模块组成。
在采样网络模块中,给定一对点云,采样网络在变换空间上学习一个先验采样分布。学习到的采样分布可以作为可微分CEM模块的 “良好 “初始化。
在可微调 CEM 模块中,首先提出一个基于最大共识准则的对齐指标作为点云配准任务的奖励函数。基于奖励函数,对于每个状态,再构建一个融合的分数函数来评估采样的变换,其中对变换的当前和未来奖励进行加权。特别是,采样变换的未来奖励是通过对变换后的状态执行迭代最接近点(ICP)算法得到的。
通过选择得分最高的 top-k 变换,迭代更新采样分布。此外,为了使 CEM 具有可微性,使用 sparsemax 函数来代替硬 top-k 选择。最后,制定一个基于 Geman-McClure 估计器的损失来训练该端到端配准模型。大量的实验结果表明,所提出方法在基准数据集上具有良好的性能。
将开源:https://github.com/Jiang-HB/CEMNet
论文:https://arxiv.org/abs/2109.06619

「9月15日」八篇(将)开源论文代码分享

#ICCV 2021##快照压缩成像#
Dense Deep Unfolding Network with 3D-CNN Prior for Snapshot Compressive Imaging
北京大学深圳研究生院&鹏城实验室
快照压缩成像(SCI)旨在通过二维相机记录三维信号。为了建立一个快速准确的 SCI 恢复算法,作者结合基于模型方法的可解释性和基于学习方法的速度,提出一个新的 dense deep unfolding network(DUN)与 3D-CNN 先验的 SCI,其中每个阶段是由半二次分割(HQS)的迭代展开的。为了更好地利用帧之间的时空相关性,并解决现有 DUNs 中相邻阶段之间的信息损失问题,提出在近端映射模块中采用 3D-CNN 先验,并分别开发一个新的密集特征图(DFM)策略。此外,为了促进网络的鲁棒性,进一步提出密集特征图适应(DFMA)模块,使相间信息能够自适应地融合。所有的参数都是以端到端的方式学习的。并在模拟数据和真实数据上进行的大量实验验证了所提出方法的优越性。
将开源:https://github.com/jianzhangcs/SCI3D
论文:https://arxiv.org/abs/2109.06548

「9月15日」八篇(将)开源论文代码分享

Identifying partial mouse brain microscopy images from Allen reference atlas using a contrastively learned semantic space
丹麦哥本哈根大学
本项工作探讨了 Siamese 网络作为为给定的部分二维小鼠大脑图像寻找相应的二维参考图集板的方法。Siamese 网络是一类卷积神经网络(CNN),它使用权重共享的路径来获得输入图像对的低维嵌入。部分小鼠大脑图像和参考图集板之间的对应关系是根据大脑切片和图集板的低维嵌入之间的距离确定的,这些嵌入是利用对比学习从Siamese 网络获得。
实验表明,当训练和测试图像来自同一来源时,Siamese CNN 可以使用 Allen 小鼠脑图集精确地识别大脑切片。可以达到了 TOP-1 和 TOP-5 的准确率,分别为 25% 和 100%,识别 29 幅图像只需要 7.2 秒。
已开源:https://github.com/Justinas256/2d-mouse-brain-identification
论文:https://arxiv.org/abs/2109.06662

「9月15日」八篇(将)开源论文代码分享

#图像属性编辑##GAN#
High-Fidelity GAN Inversion for Image Attribute Editing
香港科技大学&腾讯
文章提出一个新的高保真生成对抗网络(GAN)逆映射框架,它可以在很好地保留图像特定细节(如背景、外观和光照)的情况下进行属性编辑。首先将 GAN 逆映射表述为一个有损数据压缩问题,并仔细讨论了速率-失真-编辑的权衡。由于这种权衡,以前的工作未能实现高保真重建,同时仅用低比特率的隐代码保持引人注目的编辑能力。
在本次工作中,提出一种 distortion consultation 方法,它采用 distortion map 作为重建的参考。在 DCI 中,首先将 distortion map 投射到一个高速率的隐藏图上,然后通过咨询融合对基本的低速率隐码进行补充(丢失)细节。为了实现高保真编辑,提出一个具有自监督训练方案的自适应失真对齐(ADA)模块。在人脸和汽车领域的大量实验表明,在逆映射和编辑质量方面都有明显的改善。
将开源:https://github.com/Tengfei-Wang/HFGI
主页:https://tengfei-wang.github.io/HFGI/
论文:https://arxiv.org/abs/2109.06590

「9月15日」八篇(将)开源论文代码分享

#EMNLP 2021#
Broaden the Vision: Geo-Diverse Visual Commonsense Reasoning
加利福尼亚大学洛杉矶分校
GD-VCR,用于评估 V&L 模型在涉及不同地理常识知识的 QA 对上的推理能力。实验结果表明,V&L 模型不能很好地概括关于非西方地区的区域特征的图像。基于 VisualBERT 的结果发现:1)婚礼、宗教和节日等场景,需要地理上不同的常识知识来理解;2)QA对的推理难度与性能差异高度相关。为了扩大影响,作者称希望 GD-VCR 基准可以拓宽研究人员对常识推理领域的视野,并激励研究人员在更多的考虑下建立更好的常识推理系统。
已开源:https://github.com/WadeYin9712/GD-VCR
论文:https://arxiv.org/abs/2109.06860

「9月15日」八篇(将)开源论文代码分享

#车辆重识别#
Camera-Tracklet-Aware Contrastive Learning for Unsupervised Vehicle Re-Identification
韩国科学技术院
已开源:https://github.com/andreYoo/CTAM-CTACL-VVReID
论文:https://arxiv.org/abs/2109.06401

「9月15日」八篇(将)开源论文代码分享

#图像重建#
Luminance Attentive Networks for HDR Image and Panorama Reconstruction
武汉大学&京东等
文中提出一个端到端和可训练的 luminance attentive 网络,用于从单一的 LDR 图像重建 HDR 图像,以及其扩展网络用于 HDR 全景图重建,用于基于图像的照明使用。广泛的实验表明,所提出方法 LANet 可以重建视觉上令人信服的 HDR 图像,并证明其在反色调映射的所有指标方面都优于最先进的方法。使用所提出 panoLANet 的基于图像的照明应用也证明了该方法可以仅使用 LDR 全景图模拟自然场景照明。
已开源:https://github.com/LWT3437/LANet
论文:https://arxiv.org/abs/2109.06688

「9月15日」八篇(将)开源论文代码分享

转载请注明:《「9月15日」八篇(将)开源论文代码分享