ECCV 2020 论文大盘点-图像与视频检索篇

本文盘点ECCV 2020中检索类任务相关论文:包括图像与视频检索、形状检索等。总计18篇。

下载包含这些论文的 ECCV 2020 所有论文:

ECCV 2020 论文合集下载,分类盘点进行中

 

Targeted Attack for Deep Hashing based Retrieval

作者 | Jiawang Bai, Bin Chen, Yiming Li, Dongxian Wu, Weiwei Guo, Shu-tao Xia, En-hui Yang

单位 | 清华大学;鹏城实验室;vivo;滑铁卢大学

论文 | https://arxiv.org/abs/2004.07955

代码 | https://github.com/jiawangbai/DHTA-master

备注 | ECCV 2020 Oral

 

#细粒度图像检索#

ExchNet: A Unified Hashing Network for Large-Scale Fine-Grained Image Retrieval

作者 | Quan Cui, Qing-Yuan Jiang, Xiu-Shen Wei, Wu-Jun Li, Osamu Yoshie

单位 | 日本早稻田大学;南大;旷视

论文 | https://arxiv.org/abs/2008.01369

备注 | ECCV 2020 Oral

本文主要研究了实用而又具有挑战性的细粒度哈希任务,旨在利用紧凑哈希码的搜索和存储效率来解决大规模的FGIR问题。

作者表示,未来想要探究一个无监督细粒度哈希课题,期待。

 

Multi-modal Transformer for Video Retrieval

作者 | Valentin Gabeur, Chen Sun, Karteek Alahari, Cordelia Schmid

单位 | Inria;谷歌

论文 | https://arxiv.org/abs/2007.10639

代码 | https://github.com/gabeur/mmt

主页 | http://thoth.inrialpes.fr/research/MMT/

备注 | ECCV 2020 spotlight ;MMT获得CVPR 2020 Video Pentathlon挑战赛第一名

 

Deformation-Aware 3D Model Embedding and Retrieval

作者 | Mikaela Angelina Uy, Jingwei Huang, Minhyuk Sung, Tolga Birdal, Leonidas Guibas

单位 | 斯坦福大学;Adobe研究

论文 | https://arxiv.org/abs/2004.01228

代码 | https://github.com/mikacuy/deformation_aware_embedding

主页 | https://deformscan2cad.github.io/

备注 | ECCV 2020

 

Smooth-AP: Smoothing the Path Towards Large-Scale Image Retrieval

作者 | Andrew Brown, Weidi Xie, Vicky Kalogeiton, Andrew Zisserman

单位 | 牛津大学

论文 | https://arxiv.org/abs/2007.12163

代码 | https://github.com/Andrew-Brown1/Smooth_AP

备注 | ECCV 2020

作者将 Smooth-AP 应用于标准检索基准:Stanford Online 产品和VehicleID,并在更大规模的数据集上进行评估。INaturalist用于细粒度类别检索,VGGFace2和IJB-C用于人脸检索。

在所有情况下,所提出方法的性能都比最先进的技术有所提高,尤其是对于更大规模的数据集,从而证明了Smooth-AP在现实世界场景中的有效性和可扩展性。

 

Location Sensitive Image Retrieval and Tagging

作者 | Raul Gomez, Jaume Gibert, Lluis Gomez, Dimosthenis Karatzas

论文 | https://arxiv.org/abs/2007.03375

代码 | https://github.com/gombru/LocSens

备注 | ECCV 2020

作者提出LocSens,一个用于检索与查询标签相关的图像和靠近给定位置的模型。

 

A Large-scale Annotated Mechanical Components Benchmark for Classification and Retrieval Tasks with Deep Neural Networks

作者 | Sangpil Kim, Hyung-gun Chi, Xiao Hu, Qixing Huang, Karthik Ramani

单位 | 普渡大学;得克萨斯大学奥斯汀分校

论文 | https://www.ecva.net/papers/eccv_2020/

papers_ECCV/papers/123630171.pdf

备注 | ECCV 2020

本文创建了一个大规模的标注化机械部件基准(Mechanical Components Benchmark (MCB))。定义机械部件的层次分类法,并对深度学习形状分类器在机械上的有效性进行基准测试。

 

Preserving Semantic Neighborhoods for Robust Cross-modal Retrieval

作者 | Christopher Thomas, Adriana Kovashka

单位 | 匹兹堡大学

论文 | https://arxiv.org/abs/2007.08617

代码 | https://github.com/CLT29/semantic_neighborhoods

主页 | https://people.cs.pitt.edu/~chris/semantic_neighborhoods/

备注 | ECCV 2020

 

SceneSketcher: Fine-Grained Image Retrieval with Scene Sketches

作者 | Fang Liu, Changqing Zou, Xiaoming Deng, Ran Zuo, Yu-Kun Lai, Cuixia Ma, Yong-Jin Liu, Hongan Wang

单位 | 中科院;国科大;华为;卡迪夫大学;清华大学

论文 | https://www.ecva.net/papers/eccv_2020/

papers_ECCV/papers/123640698.pdf

备注 | ECCV 2020

本次工作作者首次解决和探索了基于场景级细粒度草图的图像检索新问题。提出了一个基于图的框架,可以同时对草图场景的布局和细粒度细节进行明确建模。设计了一个类别化的IoU,以简单有效的方式提升SBIR性能。

实验表明,所提出方法优于现有的基于草图的图像检索方法。
作者表示未来工作将融合语义分析和场景理解,促进该方法在更大的数据集上工作。

 

TVR: A Large-Scale Dataset for Video-Subtitle Moment Retrieval

TVR: 用于视频字幕片段检索的大规模数据集

作者 | Jie Lei, Licheng Yu, Tamara L. Berg, Mohit Bansal

单位 | 北卡罗来纳大学教堂山分校

论文 | https://arxiv.org/abs/2001.09099

TVR数据集 | https://tvr. cs.unc.edu

TVC数据集 | https://tvr.cs.unc.edu/tvc.html

TVR代码 | https://github.com/jayleicn/TVRetrieval

TVC代码 | https://github.com/jayleicn/TVCaption

备注 | ECCV 2020

TVR是电视节目检索,一个新的多模态检索数据集。TVR要求系统同时理解视频及其相关的字幕(对话)文本,使其更加真实。数据集包含109K查询,收集了6个不同类型电视节目的21.8K视频,其中每个查询都与一个紧密的时间窗口相关联。
提出方法:Cross-modal Moment Localization (XML)
此外,还收集了TVR中每个带标注时刻的其他描述,以形成一个具有262K字幕的新的多模式字幕数据集,名为TV show Caption(TVC)。

 

Learning Joint Visual Semantic Matching Embeddings for Language-guided Retrieval

作者 | Yanbei Chen, Loris Bazzani

单位 | 伦敦玛丽女王大学;Amazon

论文 | https://www.ecva.net/papers/eccv_2020/

papers_ECCV/papers/123670137.pdf

备注 | ECCV 2020

 

SOLAR: Second-Order Loss and Attention for Image Retrieval

作者 | Tony Ng, Vassileios Balntas, Yurun Tian, Krystian Mikolajczyk

单位 | 帝国理工学院;Facebook Reality Labs

论文 | https://arxiv.org/abs/2001.08972

代码 | https://github.com/tonyngjichun/SOLAR

备注 | ECCV 2020‍

 

Graph Wasserstein Correlation Analysis for Movie Retrieval

作者 | Xueya Zhang, Tong Zhang, Xiaobin Hong, Zhen Cui, Jian Yang

单位 | 中国科学技术大学

论文 | https://arxiv.org/abs/2008.02648

备注 | ECCV 2020

提出 Graph Wasserstein Correlation Analysis(GWCA)来处理比较 pairwise movie graphs,并显示出有效性。

 

视频片段检索

video moment retrieval 

VLANet: Video-Language Alignment Network for Weakly-Supervised Video Moment Retrieval

作者 | Minuk Ma, Sunjae Yoon, Junyeong Kim, Youngjoon Lee, Sunghun Kang, Chang D. Yoo

单位 | 韩国科学技术院

论文 | https://arxiv.org/abs/2008.10238

备注 | ECCV 2020

 

形状检索

A Novel Line Integral Transform for 2D Affine-Invariant Shape Retrieval

作者 | Bin Wang, Yongsheng Gao

单位 | 格里菲斯大学;南京财经大学

论文 | https://www.ecva.net/papers/eccv_2020/

papers_ECCV/papers/123730596.pdf

备注 | ECCV 2020

以上均为【我爱计算机视觉公众号】整理,未经允许,不得转载。

转载请注明:《ECCV 2020 论文大盘点-图像与视频检索篇