CV Papers|计算机视觉论文推荐周报20200503期

五月第三周,推荐本周新出几篇有意思的 CV 论文,其中还有 3 篇最新综述,希望对大家有帮助。
 

  换装人员重识别

#CVPR2020##数据集#

COCAS: A Large-Scale Clothes Changing Person Dataset for Re-identification

COCAS:用于重识别的大规模换衣服人员数据集

人员重识别(ReID)是视频监控的主要技术之一,可以帮助人们在海量视频中查找到同一个人。如果这个人没换衣服那么这个问题还简单一点,但现实中犯罪分子可不会乖乖的按套路来。

所以为解决换衣服的人员重识别问题,该文作者构建了一个新的大规模重识别基准数据集,称为COCAS,该数据集提供了具有不同衣服的相同个体的多个图像。COCAS总共包含来自5266人的62382幅人体图像。

另外,作者不仅制作了大型数据集,还针对换衣服问题引入了新的人员ReID设置,在查询中既包含特定服装模板,又包含拍摄的身着其他衣服的人员的图像。此外,作者提出了BC-Net两分支网络,该网络可以有效地整合人物识别特征和衣服特征,以便在以上设置下重识别。实验表明,通过服装模板进行换衣服进而ReID是可行的。

作者 | Shijie Yu, Shihua Li, Dapeng Chen, Rui Zhao, Junjie Yan, Yu Qiao

单位 | 中科院;中国科学院大学

论文 | https://arxiv.org/abs/2005.07862

  

 弱监督动作分割

#弱监督动作分割#

On Evaluating Weakly Supervised Action Segmentation Methods

这篇文章研究了一个有意思的问题,对弱监督动作分割算法进行了评估,发现了有意思的结论:

1)同一种方法在同一数据集训练实验重复 5 次,结果标准差竟达到1~2.5%之多,不同算法的比较几乎没意义了;

2)较高层次的I3D特征比经典的IDT特征还差!

这是一篇打脸文~

作者 | Yaser Souri, Alexander Richard, Luca Minciullo, Juergen Gall

单位 | 波恩大学;丰田汽车欧洲公司

论文 | https://arxiv.org/abs/2005.09743

ISBA代码 | https://github.com/Zephyr-D/TCFPN-ISBA

NNV代码 | https://github.com/alexanderrichard/NeuralNetwork-Viterbi

CDFL代码 | https://github.com/JunLi-Galios/CDFL

 

  目标跟踪

#多目标跟踪#

MOTS: Multiple Object Tracking for General Categories Based On Few-Shot Method

MOTS: 复旦等提出基于少样本学习的一般类别多目标跟踪

传统的多目标跟踪往往使用人员重识别(ReID)方法进行目标的对应,且往往针对特定类别的多目标跟踪。而该文提出的算法使用目标匹配完成目标对应,其分两个阶段,第一阶段用简单的目标匹配,可以在不牺牲精度情况下在MOT16训练集上带来88.76%正确的目标分配,第二阶段作者发明了精细的目标匹配,对剩下的未匹配目标进行匹配。实验在新数据集TRACK-REID上表现不俗,甚至可以泛化到未出现的类别。

作者 | Xixi Xu, Chao Lu, Liang Zhu, Xiangyang Xue, Guanxian Chen, Qi Guo, Yining Lin, Zhijian Zhao

单位 | 复旦,闪马智能

论文 | https://arxiv.org/abs/2005.09167

 

 建筑物内部结构探测

An Innovative Approach to Determine Rebar Depth and Size by Comparing GPR Data with a Theoretical Database

建筑物透视眼,钢筋深度和尺寸探测:通过比较GPR(地面穿透雷达)数据与数据库的方法

实验结果表明:

(1)实施本文所提出的方法可以完全去除GPR数据中的直接波噪声,并能成功地从交错的双曲面中提取出轮廓;

(2)所提出的方法可以同时确定钢筋深度和尺寸,准确率分别为100%和95.11%。

相信这种技术在建筑物验检测验收、维护领域很有用。

作者 | Zhongming Xiang, Ge Ou, Abbas Rashidi

单位 | 犹他大学

论文 | https://arxiv.org/abs/2005.09643

 

   枪手识别

#ICIP2020#

Localizing Firearm Carriers by Identifying Human-Object Pairs

这项研究看起来是J方的项目,假设在绑匪持枪劫持人质的场景中,暗中观察的机器人狙击手如何才能分辨枪手?该文提出了一种通过识别人-物对来定位枪手的方法。作者来自巴基斯坦。

作者 | Abdul Basit, Muhammad Akhtar Munir, Mohsen Ali, Arif Mahmood

单位 | ITU(巴基斯坦信息技术大学)

论文 | https://arxiv.org/abs/2005.09329

 

  最新综述

#指纹识别#

A Survey on Unknown Presentation Attack Detection for Fingerprint

未知类型指纹识别攻击检测综述,对与使用不同的手段妄图绕过指纹识别系统的技术进行了梳理。

作者 | Jag Mohan Singh, Ahmed Madhun, Guoqiang Li, Raghavendra Ramachandra

单位 | 挪威科技大学

论文 | https://arxiv.org/abs/2005.08337

 

Regularization Methods for Generative Adversarial Networks: An Overview of Recent Studies

GAN正则化方法近期研究综述

GAN的研究和应用突飞猛进,但GAN的训练时稳定性却是一个大问题,所以研究社区提出了大量的针对GAN系统的正则化方法,本文详细考察了近三年出现的GAN正则化方法的,并按照技术特征分组,也指出了未来该领域可能的方向。

作者 | Minhyeok Lee, Junhee Seok

单位 | 高丽大学

论文 | https://arxiv.org/abs/2005.09165

 

#自动驾驶##点云技术#

Deep Learning for LiDAR Point Clouds in Autonomous Driving: A Review

自主驾驶中的LiDAR点云深度学习技术综述

本综述总结了近五年来140多个关键性的贡献,包括里程碑式的3D深度架构,在3D语义分割、目标检测和分类方面的显著深度学习应用;具体的数据集、评估指标以及最新的性能状况。

作者 | Ying Li, Lingfei Ma, Zilong Zhong, Fei Liu, Dongpu Cao, Jonathan Li, Michael A. Chapman

单位 | 滑铁卢大学;中山大学;赛灵思电子科技;瑞尔森大学

论文 | https://arxiv.org/abs/2005.09830

在我爱计算机视觉公众号对话框回复“CVPapers”即可获取以上所有论文下载地址。(网盘位置:Papers周报–20200503期)
往期”精彩阅读”

转载请注明:《CV Papers|计算机视觉论文推荐周报20200503期