ECCV 2020 Spotlight 谷歌论文大盘点

ECCV2020 已经结束,官方放出了所有论文:
ECCV 2020 论文合集下载,分类盘点进行中

ECCV 2020 总计录取1361篇论文,其中Oral 102篇,Spotlight 161 篇。

前文已经汇总了ECCV 2020 Oral论文中谷歌公司参与的相关论文:

ECCV 2020 Oral 中谷歌论文盘点,点云与3D方向工作居多

共计10篇。

本文继续盘点谷歌 Spotlight 中论文,看看工业界巨头都在关注什么方向,取得了哪些突破。该部分论文总计 12 篇,

点云分类、数据增强
[1].PointMixup: Augmentation for Point Clouds
作者 | Yunlu Chen, Vincent Tao Hu, Efstratios Gavves, Thomas Mensink, Pascal Mettes, Pengwan Yang, Cees G.M. Snoek
单位 | 阿姆斯特丹大学;谷歌;北大
论文 | https://arxiv.org/abs/2008.06374
代码 | https://github.com/yunlu-chen/PointMixup/
备注 | ECCV 2020  Spotlight
Mixup 在2D图像的深度学习训练数据增广中获得了巨大的成功,该文是把其扩展到了点云领域,想想其实是很自然要做的事儿。

 

[2].Connecting Vision and Language with Localized Narratives

作者 | Jordi Pont-Tuset, Jasper Uijlings, Soravit Changpinyo, Radu Soricut, Vittorio Ferrari

单位 | 谷歌

论文 | https://arxiv.org/abs/1912.03098

解读 | 900万注释图像数据集升级了!谷歌开放Open Images V6,首增语音、文本、鼠标轨迹同步注释

备注 | ECCV 2020 Spotlight

超大数据集 Open Images 的更新,新增了507444个局部叙事。连接视觉与语言,这是一个可能会出现颠覆性创新的领域。

 

[3].View-Invariant Probabilistic Embedding for Human Pose

作者 | Jennifer J. Sun, Jiaping Zhao, Liang-Chieh Chen, Florian Schroff, Hartwig Adam, Ting Liu

单位 | 加州理工学院;谷歌

论文 | https://arxiv.org/abs/1912.01001

代码 | https://github.com/google-research/google-research/tree/master/poem

视频结果 | https://drive.google.com/drive/folders/

1kTc_UT0Eq0H2ZBgfEoh8qEJMFBouC-Wv

备注 | ECCV 2020 Spotlight

该文发明了一种视角不变的概率嵌入模型,用于人体姿态的表示,在人体姿态检索、动作识别、视频对齐中获得了成功应用。

 

[4].Big Transfer (BiT): General Visual Representation Learning

作者 | Alexander Kolesnikov, Lucas Beyer, Xiaohua Zhai, Joan Puigcerver, Jessica Yung, Sylvain Gelly, Neil Houlsby

单位 | 谷歌;Z¨urich, Switzerland

论文 | https://arxiv.org/abs/1912.11370

代码 | https://github.com/google-research/big_transfer

解读 | 谷歌发布最先进的计算机视觉迁移模型BigTransfer(BiT)

备注 | ECCV 2020 Spotlight

使用大型数据集训练并开放了模型,有助于CV社区模型预训练的研究。

全景分割

[5].Axial-DeepLab: Stand-Alone Axial-Attention for Panoptic Segmentation

作者 | Huiyu Wang, Yukun Zhu, Bradley Green, Hartwig Adam, Alan Yuille, Liang-Chieh Chen

单位 | 约翰斯·霍普金斯大学;谷歌

论文 | https://arxiv.org/abs/2003.07853

代码 | https://github.com/csrhddlam/axial-deeplab

备注 | ECCV 2020 Spotlight

DeepLab系分割算法向全景分割的演化。

 

[6].Mask2CAD: 3D Shape Prediction by Learning to Segment and Retrieve

作者 | Weicheng Kuo, Anelia Angelova, Tsung-Yi Lin, Angela Dai

单位 | 谷歌;慕尼黑工业大学

论文 | https://arxiv.org/abs/2007.13034

备注 | ECCV 2020 Spotlight

学习分割和检索的三维形状预测。

 

[7].A Generalization of Otsu’s Method and Minimum Error Thresholding

作者 | Jonathan T. Barron

单位 | 谷歌

论文 | https://arxiv.org/abs/2007.07350

代码 | https://github.com/jonbarron/hist_thresh

备注 | ECCV 2020 Spotlight

大津法阈值化的推广,一个简单快速的 Bayesian 算法,用大约10行代码编写,在图像二值化上优于或匹配大型CNN网络,统一了三种经典的阈值化算法。

 

[8].Learning to Factorize and Relight a City

作者 | Andrew Liu, Shiry Ginosar, Tinghui Zhou, Alexei A. Efros, Noah Snavely

单位 | 谷歌;UC伯克利;Humen AI

论文 | https://arxiv.org/abs/2008.02796

主页 | https://factorize-a-city.github.io/

备注 | ECCV 2020 Spotlight

城市级场景的分解及重打光特效。

 

[9].Weakly Supervised 3D Human Pose and Shape Reconstruction with Normalizing Flows

作者 | Andrei Zanfir, Eduard Gabriel Bazavan, Hongyi Xu, Bill Freeman, Rahul Sukthankar, Cristian Sminchisescu

单位 | 谷歌

论文 | https://arxiv.org/abs/2003.10350

备注 | ECCV 2020 Spotlight

弱监督3D人体姿态估计与形状重建,对高标准的标注数据需求降低,更加实用。

视频检索

[10].Multi-modal Transformer for Video Retrieval

作者 | Valentin Gabeur, Chen Sun, Karteek Alahari, Cordelia Schmid

单位 | Inria;谷歌

论文 | https://arxiv.org/abs/2007.10639

主页 | http://thoth.inrialpes.fr/research/MMT/

备注 | ECCV 2020 Spotlight

多模态的Transformer 用于大规模视频检索。

 

三维重建

[11].GeLaTO: Generative Latent Textured Objects

作者 | Ricardo Martin-Brualla, Rohit Pandey, Sofien Bouaziz, Matthew Brown, Dan B Goldman

单位 | 谷歌

论文 | https://arxiv.org/abs/2008.04852

主页 | https://gelato-paper.github.io/

备注 | ECCV 2020 Spotlight

该文发明了一种生成式潜在纹理对象的方法,用于物体的三维重建,对透明的、反光的、细的物体的重建效果更好。

 

[12].Neural Design Network: Graphic Layout Generation with Constraints

作者 | Hsin-Ying Lee, Lu Jiang, Irfan Essa, Phuong B Le, Haifeng Gong, Ming-Hsuan Yang, Weilong Yang

单位 | 谷歌;University of California, Merced;Yonsei University;Georgia Institute of Technology

论文 | https://arxiv.org/abs/1912.09421

备注 | ECCV 2020 Spotlight

该文发明了一种称之为神经设计网络的技术,用于在给定图像和文本内容和限定条件时,进行人工化的版面设计。(平面设计师要失业了)

转载请注明:《ECCV 2020 Spotlight 谷歌论文大盘点