作者 | CV君
编辑 | CV君
报道 | 我爱计算机视觉(微信id:aicvml)
本文继续总结人脸识别相关论文,包含低光条件下、极端姿势下、人脸关键点检测等。共计 18 篇。
大家可以在:https://openaccess.thecvf.com/CVPR2021?day=all按照题目下载这些论文。
人脸识别
A 3D GAN for Improved Large-pose Facial Recognition
本文介绍一种从自然图像中学习非线性纹理模型的方法,它可以用于生成具有完全分离姿势的合成身份的图像,不需要专门捕获的面部纹理扫描。通过用合成的三维 GAN 图像增强数据集,large-pose 面部识别得到改进,以及CPLFW 的最先进的准确性。
作者 | Richard T. Marriott, Sami Romdhani, Liming Chen
单位 | 里昂中央理工学院;IDEMIA
论文 | https://arxiv.org/abs/2012.10545
When Age-Invariant Face Recognition Meets Face Age Synthesis: A Multi-Task Learning Framework
文章提出一个多任务学习框架:MTLFace,可以同时实现 AIFR 和 FAS。设计两个新的模块:AFD 将特征分解为年龄和身份相关的特征,ICM 实现身份层面的人脸年龄合成。在跨年龄段和一般基准数据集上进行的广泛的人脸识别实验证明了所提出的方法的优越性。
作者 | Zhizhong Huang, Junping Zhang, Hongming Shan
单位 | 复旦大学;
论文 | https://arxiv.org/abs/2103.01520
代码 | https://github.com/Hzzone/MTLFace
备注 | CVPR 2021 oral
MagFace: A Universal Representation for Face Recognition and Quality Assessment
MagFace: 用于人脸识别和质量评估的通用表示法
作者 | Qiang Meng, Shichao Zhao, Zhida Huang, Feng Zhou
单位 | Aibee Inc
论文 | https://arxiv.org/abs/2103.06627
代码 | https://github.com/IrvingMeng/MagFace
备注 | CVPR 2021 oral
WebFace260M: A Benchmark Unveiling the Power of Million-Scale Deep Face Recognition
本文介绍一个大规模的人脸识别数据集:WebFace260M,由 4M identities(身份)和 260M 人脸组成,为百万级深度人脸清洗和识别提供了很好的资源。
又通过提纯,即所设计的可扩展高效的自训练 pipeline 对 WebFace260M 进行自动提纯,获得最大的训练集 WebFace42M,它在具有挑战性的 IJB-C 上得到新的SOTA,在 NIST-FRVT 上排名第三。
为方便评估现实世界的应用,构建了 FRUITS 协议以及具有丰富属性的测试集,根据不同的部署情况,设计了一系列的轨道。
基于新的基准,作者进行了广泛的百万级人脸识别实验。在分布式训练框架的支持下,在FRUITS 协议下的测试集上建立了全面的基线。结果表明,轻量级赛道有很大的提升空间,同时也说明了重量级赛道创新的必要性。
作者 | Zheng Zhu, Guan Huang, Jiankang Deng, Yun Ye, Junjie Huang, Xinze Chen, Jiagang Zhu, Tian Yang, Jiwen Lu, Dalong Du, Jie Zhou
单位 | 清华;XForwardAI;帝国理工学院
论文 | https://arxiv.org/abs/2103.04098
代码 | https://www.face-benchmark.org/
ForgeryNet: A Versatile Benchmark for Comprehensive Forgery Analysis
逼真的合成技术飞速发展,使真实图像与操纵图像之间的界限开始模糊。因此,基准化和推进数字伪造分析已经成为一个迫在眉睫的问题。但现有的对此问题所需要的人脸伪造数据集要么多样性有限,要么只支持粗粒度的分析。
作者在本次工作中,针对上述挑战,构建了 ForgeryNet 数据集,是一个极其庞大的人脸伪造数据集,在图像和视频级数据中具有统一的标注,涵盖以下四个任务。
- Image Forgery Classification:图像伪造分类,包括双向(真/假)、三向(真/假与身份置换的伪造方法/假与身份保留的伪造方法)和 n 向(真和 15 种各自的伪造方法)分类。
- Spatial Forgery Localization:空间伪造定位,将伪造图像的操纵区域与其对应的源头真实图像进行对比分割。
- Video Forgery Classification:视频伪造分类,对视频级作假分类进行重新定义,在随机位置上进行操纵帧。因为现实世界中的攻击者可以自由操纵任何目标帧。
- Temporal Forgery Localization:时间伪造定位,对被操纵的时间段进行定位。
ForgeryNet 是目前公开的最大的深度人脸伪造数据集,从数据规模(290万张图像,221247个视频)、manipulations操纵(7种图像级方法,8种视频级方法)、perturbations扰动(36种独立的和更多的混合扰动)和标注(630万个分类标签,290万个操纵区域标注和221247个时空伪造段标签)来看,它都是最大的。
作者 | Yinan He, Bei Gan, Siyu Chen, Yichun Zhou, Guojun Yin, Luchuan Song, Lu Sheng, Jing Shao, Ziwei Liu
单位 | 北京邮电大学;商汤;中国科学技术大学;南洋理工大学
论文 | https://arxiv.org/abs/2103.05630
代码 | https://yinanhe.github.io/projects/forgerynet.html
备注 | CVPR 2021 oral
Spherical Confidence Learning for Face Recognition
作者 | Shen Li、Jianqing Xu、Xiaqing Xu、Pengcheng Shen、Shaoxin Li、Bryan Hooi
单位 | 新加坡国立大学;腾讯优图;Aibee
论文 |https://openaccess.thecvf.com/content/CVPR2021/papers/Li_Spherical_Confidence_Learning_for_Face_Recognition_CVPR_2021_paper.pdf
论文 | https://github.com/MathsShen/SCF/
备注 | CVPR 2021 oral
简介 | 1
CRFace: Confidence Ranker for Model-Agnostic Face Detection Refinement
作者 | Noranart Vesdapunt, Baoyuan Wang
单位 | 微软;小冰人工智能
论文 | https://arxiv.org/abs/2103.07017
Cross-Domain Similarity Learning for Face Recognition in Unseen Domains
跨域度量学习用于未见域人脸识别
作者 | Masoud Faraki, Xiang Yu, Yi-Hsuan Tsai, Yumin Suh, Manmohan Chandraker
单位 | NEC Labs America;加利福尼亚大学圣迭戈分校
论文 | https://arxiv.org/abs/2103.07503
FACESEC: A Fine-grained Robustness Evaluation Framework for Face Recognition Systems
FACESEC,一个用于人脸识别系统的细粒度鲁棒性评估框架。它包含四个评估维度,并可用于人脸识别和开集和闭集系统验证。也是首个支持从多个维度和各种对抗环境下评估人脸识别系统不同组件风险的平台。在五 个最先进的人脸识别系统上进行的全面和系统的评估表明,FACESEC 可以极大地帮助了解系统对数字和物理上可实现攻击的鲁棒性。
作者 | Liang Tong, Zhengzhang Chen, Jingchao Ni, Wei Cheng, Dongjin Song, Haifeng Chen, Yevgeniy Vorobeychik
单位 | 圣路易斯华盛顿大学;NEC Laboratories America;康涅狄格大学
论文 | https://arxiv.org/abs/2104.04107
Dynamic Class Queue for Large Scale Face Recognition In the Wild
计算资源成本和长尾分类仍是大规模人脸识别任务中的挑战。本次工作,作者提出 dynamic class queue(DCQ)来解决这两个问题。
具体来说,在训练过程中的每一次迭代,都会动态地选择用于识别的类的子集,其类的权重是即时烧录动态生成的,并存储在一个队列中。由于每次迭代只选择一个类的子集,所以计算要求降低了。通过使用没有模型并行的单一服务器,在大规模数据集中经验性地验证了 10% 的类足以达到与使用所有类相似的性能。此外,类的权重是以小样本方式动态生成的,因此适用于只有少量实例的尾部类。
在最大的公共数据集 Megaface Challenge2(MF2)中,结果显示出比强大的基线有明显的改进,该数据集有 672K 个身份,其中 88% 以上的身份少于 10 个实例。
作者 | Bi Li, Teng Xi, Gang Zhang, Haocheng Feng, Junyu Han, Jingtuo Liu, Errui Ding, Wenyu Liu
单位 | 百度&华中科技大学&清华
论文 | https://arxiv.org/abs/2105.11113
代码 | https://github.com/bilylee/DCQ
Consistent Instance False Positive Improves Fairness in Face Recognition
问题:人口统计学上的偏差是实用人脸识别系统的一个重大挑战。而现有方法在很大程度上依赖于准确的人口统计学标注,在真实场景中通常是不可用的,多为特定的人口群体设计,不够普遍。
方案:提出一种假阳性率惩罚损失,通过提高实例 False Positive Rate(FPR)的一致性来减轻人脸识别的偏差。具体来说,首先将实例 FPR 定义为超过统一阈值的非目标相似性数量与非目标相似性总数之间的比率。其中统一的阈值是针对给定的总 FPR 而估计的。然后,在基于 softmax 的损失的分母中引入一个额外的惩罚项,该惩罚项与实例 FPR 总体 FPR 的比例成正比。实例 FPR 越大,惩罚就越大。通过这种不平等的惩罚,实例的 FPR 应该是一致的。与以前的 debiasing 方法相比,该方法不需要人口统计学标注。因此,可以减轻由各种属性划分的人口群体之间的偏差,而且这些属性不需要在训练中预定义。
结果:在流行基准上的广泛的实验结果表明,所提出方法比最先进的竞争对手更有优势。
作者 | Xingkun Xu, Yuge Huang, Pengcheng Shen, Shaoxin Li, Jilin Li, Feiyue Huang, Yong Li, Zhen Cui
单位 | 腾讯优图&南京理工大学
论文 | https://arxiv.org/abs/2106.05519
代码 | https://github.com/Tencent/TFace
VirFace: Enhancing Face Recognition via Unlabeled Shallow Data
文中提出一种新的人脸识别方法,VirFace,可以有效利用未标记的浅层数据进行人脸识别。VirFace 由 VirClass 和 VirInstance 组成。具体来说,前者通过添加未标记的数据作为新的身份来扩大类间距离,后者则从每个身份的学习分布中抽取虚拟实例来进一步扩大类间距离。是首个解决 Unlabeled Shallow Data 问题的工作。
在小型和大型数据集上进行的广泛的实验,如 LFW 和 IJB-C 等,都证明了所提方法的优越性。
作者 | Wenyu Li、Tianchu Guo、Pengyu Li、Binghui Chen、Biao Wang、 Wangmeng Zuo、 Lei Zhang
单位 | 哈尔滨工业大学;香港理工大学
论文 | https://openaccess.thecvf.com/content/CVPR2021/papers/Li_VirFace_Enhancing_Face_Recognition_via_Unlabeled_Shallow_Data_CVPR_2021_paper.pdf
Variational Prototype Learning for Deep Face Recognition
作者 | Jiankang Deng、Jia Guo、Jing Yang、Alexandros Lattas、 Stefanos Zafeiriou
单位 | 华为;帝国理工学院;InsightFace;诺丁汉大学
论文 | https://openaccess.thecvf.com/content/CVPR2021/papers/Deng_Variational_Prototype_Learning_for_Deep_Face_Recognition_CVPR_2021_paper.pdf
Mitigating Face Recognition Bias via Group Adaptive Classifier
通过群体自适应分类器缓解人脸识别偏差
作者 | Sixue Gong, Xiaoming Liu, Anil K. Jain
单位 | 密歇根州立大学
论文 | https://arxiv.org/abs/2006.07576
代码 | https://github.com/gongsixue/GAC
Improving Transferability of Adversarial Patches on Face Recognition with Generative Models
用生成模型提高对抗性补丁在人脸识别中的可迁移性
作者 | Zihao Xiao、Xianfeng Gao、Chilin Fu、Yinpeng Dong、Wei Gao、Xiaolu Zhang、Jun Zhou、Jun Zhu
单位 | 瑞莱智慧;蚂蚁金服;清华;北京理工大学;南洋理工大学
论文 |
https://openaccess.thecvf.com/content/CVPR2021/papers/Xiao_Improving_Transferability_of_Adversarial_Patches_on_Face_Recognition_With_Generative_CVPR_2021_paper.pdf
低光数据下的人脸识别
HLA-Face: Joint High-Low Adaptation for Low Light Face Detection
低光环境下的人脸检测非常具有挑战性,但对监控视频、夜间自动驾驶等许多实际应用又至关重要。大多数现有的人脸检测器都严重依赖大量的标注,而收集数据则是费时费力的。
为了减少为低光条件建立新数据集的负担,作者充分利用现有的正常光数据,并探索如何使人脸检测器从正常光适应低光。而这项任务的挑战在于,正常光和低光之间的差距对于 pixel-level 和 object-level 来说都过于巨大和复杂。因此,大多数现有的低光增强和适应方法并没有达到理想的性能。
针对上述挑战,作者提出联合 High-Low Adaptation(HLA)框架,即通过在 low-level 和 high-level 联合适应,并且无需在标注黑暗数据下进行训练也能超越最先进的方法。
具体来说,对于 low-level 适应,设计一个双向的方案。通过提亮低光数据,用噪声和颜色偏差扭曲正常光数据,设置一个中间状态,使两个域各自向对方迈出一步。对于 high-level 适应,引入跨域的自监督学习来进行特征适应。通过基于上下文的对比学习,全面缩小了多个域之间的特征距离,并进一步加强表征。
作者 | Wenjing Wang, Wenhan Yang, Jiaying Liu
单位 | 北大
论文 | https://arxiv.org/abs/2104.01984
代码 | https://github.com/daooshee/HLA-Face-Code
主页 | https://daooshee.github.io/HLA-Face-Website/
极端姿势下的人脸识别
Pseudo Facial Generation with Extreme Poses for Face Recognition
文中提出一个轻量级的伪人脸生成器来重建极端姿势下的面部图像,并将其应用于预训练的面部识别判别器。与其他基于GAN的方法相比,所提出方法所需计算消耗更小,获得精度更高。与 face frontalization 模型不同的是,仅对原始输入做一些微小的改变,生成伪侧面脸。
在六个基准数据集上的实验结果充分证实了所提出的方法在人脸识别任务上的有效性。值得注意的是,该方法并不局限于极端姿势下的人脸识别,也适用于那些受到域差距影响的任务,比如遮挡和化妆问题。
作者 | Guoli Wang、Jiaqi Ma、Qian Zhang、Jiwen Lu1、Jie Zhou
单位 | 清华;武汉大学;地平线
论文 | https://openaccess.thecvf.com/content/CVPR2021/papers/Wang_Pseudo_Facial_Generation_With_Extreme_Poses_for_Face_Recognition_CVPR_2021_paper.pdf
无监督人脸关键点识别
Clusformer: A Transformer based Clustering Approach to Unsupervised Large-scale Face and Visual Landmark Recognition
Clusformer: 基于 Transformer 的聚类方法用于无监督的大规模人脸和视觉关键点识别
作者 | Xuan-Bac Nguyen、Duc Toan Bui、Chi Nhan Duong、Tien D. Bui、Khoa Luu
单位 | VinAI Research;康考迪亚大学;阿肯色大学
论文 |
https://openaccess.thecvf.com/content/CVPR2021/papers/Nguyen_Clusformer_A_Transformer_Based_Clustering_Approach_to_Unsupervised_Large-Scale_Face_CVPR_2021_paper.pdf
– END –
编辑:CV君
转载请联系本公众号授权
转载请注明:《CVPR 2021 论文大盘点-人脸识别篇》