通过姿态引导知识转移进行弱监督和半监督人体部位解析+推动无约束面部检测的限制:挑战数据集和基线结果

PAD-Net:用于同时深度估计和场景分析的多任务导向预测蒸馏网络

Dan Xu, Wanli Ouyang, Xiaogang Wang, Nicu Sebe

深度估计和场景解析是视觉场景理解中两个特别重要的任务。在本文中,我们解决了联合CNN中同时进行深度估计和场景解析的问题。任务通常可以被看作是一个深度的多任务学习问题[42]。与以前的方法不同,在给定输入训练数据的情况下直接优化多任务,本文提出了一种新型的多任务引导预测精馏网络(PAD-Net),首先预测一组中等辅助任务,从低到高然后通过我们提出的用于最终任务的多模式蒸馏模块将来自这些中间辅助任务的预测用作多模式输入。在联合学习期间,中间任务不仅充当监督,学习更强大的深层表示,而且还提供丰富的多模式信息以改进最终任务。针对深度估计和场景解析任务,对两个具有挑战性的数据集(即NYUD-v2Cityscapes)进行了大量实验,证明了所提出方法的有效性。[1805.04409v1]

 

用于模拟暗物质晕目录的体积深度卷积神经网络

菲利普伯格,乔治斯坦

对于现代大型结构测量技术来说,在大型模拟仿真套件上测试数据分析流水线已成为标准做法,这对于完全N体仿真而言目前非常昂贵。我们没有计算这种昂贵的引力演化,而是训练了一个三维深层卷积神经网络(CNN),从宇宙初始条件直接识别暗物质原始晕。我们对Peak Patch半分析代码中的光环目录进行了培训,我们测试了各种CNN体系结构,发现它们在24小时的训练中一般达到~92%的Dice系数。我们提出了一种简单而快速的几何光晕发现算法,从这个强大的逐像素二进制分类器中提取光晕,并发现预测的目录将地面真实模拟的质量函数和功率谱匹配在~10%之内。我们研究了远距离潮汐力对逐个物体的影响,并发现网络的预测与Peak Patch算法明确使用的非线性椭球体崩溃方程一致。[1805.04537v1]

 

迭代训练交互式分割

Sabarinath MahadevanPaul Voigtlaender,巴斯蒂安身体

深度学习需要大量的培训数据才有效。对于对象分割的任务,手动标记数据非常昂贵,因此需要交互式方法。在最近的方法之后,我们开发了一个交互式对象分割系统,它使用点击形式的用户输入作为卷积网络的输入。虽然以前的方法使用启发式点击抽样策略来模拟用户在训练过程中的点击,但我们提出了一种新的迭代训练策略。在训练期间,我们会基于当前预测的分割的错误迭代添加点击。我们展示了我们的迭代训练策略以及对网络架构的额外改进,可以改善最先进的结果。[1805.04398v1]

 

敌对扩张非平稳纹理合成

Yang Zhou, Zhen Zhu, Xiang Bai, Dani Lischinski, Daniel Cohen-Or, Hui Huang

现实世界展现出丰富的非固定纹理。例子包括具有大规模结构的纹理,以及空间变化和不均匀的纹理。虽然现有的基于示例的纹理合成方法可以很好地处理固定纹理,但非固定纹理仍然是一个相当大的挑战,仍然没有解决。在本文中,我们提出了一种基于实例的非平稳纹理合成的新方法。我们的方法使用生成对抗网络(GAN),经过训练可以将从特定纹理样本中提取的纹理块的空间范围加倍。一旦完成训练,完全卷积发生器能够扩展整个范例以及其任何子块的大小。我们证明,这种概念上简单的方法对于捕获大规模结构以及输入示例的其他非固定属性非常有效。因此,它可以应对具有挑战性的纹理,据我们所知,没有其他现有的方法可以处理。[1805.04487v1]

 

基于胶囊网络的交通标志检测新型深度学习模型

Amara Dinesh Kumar

利用各种攻击手段,CNN可以很容易地被愚弄,而胶囊网络可以克服入侵者的这种攻击,并且可以为自动驾驶汽车提供更高的可靠性来检测交通标志。胶囊网络已经达到了德国97.6%的最高精确度交通标志识别基准数据集(GTSRB)。[1805.04424v1]

 

基于深度的手势估计的增强骨架空间转移

Seungryul BaekKwang In KimTae-Kyun Kim

培训基于深度的3D手姿势估计器(HPE)的成功至关重要的是可用的综合数据集,涵盖不同的摄像机视角,形状和姿态变化。但是,收集这些带注释的数据集具有挑战性。我们建议通过生成新的数据库条目来完成现有数据库。关键的想法是在骨架空间中合成数据(而不是在深度图空间中这样做),从而实现操作数据条目的简单而直观的方法。由于以这种方式生成的骨架条目没有相应的深度图条目,因此我们通过训练单独的手形成生成器(HPG)来利用它们,该手形合成器从骨架条目合成深度图。通过在单一统一优化框架中对HPGHPE进行培训,强化1HPE同意配对深度和骨架条目2HPG-HPE组合满足通过新生成的不成对骨架观察到的循环一致性(HPG-HPE的输入和输出都是骨架),我们的算法构建了一个HPE,该变量对超出覆盖范围现有的数据库。我们的训练算法采用生成对抗网络(GAN)训练过程。作为副产品,我们获得了一个能够挑选逼真手姿的手姿识别器(HPD)。我们的算法利用此功能来优化测试中的初始骨架估计,进一步提高准确性。我们在四个具有挑战性的基准数据集(ICVLMSRANYUBig Hand 2)上测试我们的算法。2M数据集),并证明我们的方法在数量和质量上都优于或等于最先进的方法。[1805.04497v1]

 

基于条件深度卷积生成对抗网络的视网膜血管分割

Yun Jiang, Ning Tan

视网膜血管的分割对于医生诊断眼底疾病具有重要意义。然而,现有方法在视网膜血管分割中存在着视网膜血管分割不足,抗噪声干扰能力弱,对病变敏感等问题。针对现有方法存在的不足,本文提出使用有条件的深度卷积生成对抗网络来分割视网膜血管。我们主要改进发电机的网络结构。在卷积层引入剩余模块进行残留学习,使网络结构对输出变化敏感,从而更好地调整发生器的重量。为了减少参数和计算的数量,在使用大型卷积核之前使用小卷积将输入签名中的通道数量减半。通过使用跳过连接将卷积层的输出与解卷积层的输出连接起来,以避免低层次的信息共享。通过对DRIVESTARE数据集上的方法进行验证,分割准确率分别为96.08%和97.71%,灵敏度分别达到82.74%和85.34%,F值分别达到82.08%和85.02%。灵敏度比R2U-Net4.82%和2.4%。[1805.04224v1] 通过对DRIVESTARE数据集上的方法进行验证,分割准确率分别为96.08%和97.71%,灵敏度分别达到82.74%和85.34%,F值分别达到82.08%和85.02%。灵敏度比R2U-Net4.82%和2.4%。[1805.04224v1] 通过对DRIVESTARE数据集上的方法进行验证,分割准确率分别为96.08%和97.71%,灵敏度分别达到82.74%和85.34%,F值分别达到82.08%和85.02%。灵敏度比R2U-Net4.82%和2.4%。[1805.04224v1]

 

基于条件生成模型生成增强训练图像的航空影像St鱼检测

Yi-Min Chou, Chein-Hung Chen, Keng-Hao Liu, Chu-Song Chen

在本文中,我们提出了一种基于航拍图像处理黄貂鱼检测问题的物体检测方法。在这个问题中,使用无人驾驶飞行器(UAV)将图像空中捕捉在海面上,并且在海面下(但靠近)游动的黄貂鱼是我们想要检测和定位的目标。为此,我们使用深度目标检测方法,更快的RCNN来训练基于有限训练集的图像的黄貂鱼探测器。为了提高性能,我们开发了一种新的生成方法,条件GLO,以增加黄貂鱼的训练样本,这是生成潜在优化(GLO)方法的延伸。与仅为图像分类生成新数据的传统数据增强方法不同,我们提出的将前景和背景混合在一起的方法可以为物体检测任务生成新的数据,从而提高CNN检测器的训练效率。实验结果表明,利用我们的方法对航拍图像中的st鱼进行检测,可以获得满意的性能。[1805.04262v1]

 

通过姿态引导知识转移进行弱监督和半监督人体部位解析

Hao-Shu Fang, Guansong Lu, Xiaolin Fang, Jianwen Xie, Yu-Wing Tai, Cewu Lu

人体部分解析或人类语义部分分割是许多计算机视觉任务的基础。在传统的语义分割方法中,提供了地面真实分割,并且完全卷积网络(FCN)以端到端方案进行训练。虽然这些方法已经显示出令人印象深刻的结果,但它们的性能高度依赖于培训数据的数量和质量 在本文中,我们提出了一种使用容易获得的人关键点注释来生成合成人体部分分割数据的新方法。我们的主要想法是利用人类之间的解剖相似性将人的分析结果传递给具有相似姿势的另一人。使用这些估计结果作为额外的训练数据,我们的半监督模型在PASCAL-Person-Part数据集上优于强监督对象6 mIOU,并且我们实现了最先进的人类解析结果。我们的方法是一般的,并且可以容易地扩展到其他对象/动物解析任务,假定它们的解剖相似性可以由关键点注释。建议的模型和附带的源代码可在https://github.com/MVIG-SJTU/WSHP [1805.04310v1]

 

互惠注意融合视觉问题解答

Moshiur R Farazi,萨尔曼汗

现有的注意机制要么参加本地图像网格,要么参与视觉问答(VQA)的对象级特征。受到观察结果的启发,问题可能与对象实例及其部分有关,我们提出了一种新颖的关注机制,共同考虑两个视觉细节层次之间的相互关系。由此产生的自下而上的注意力进一步与自上而下的信息相结合,仅聚焦于与给定问题最相关的场景元素。我们的设计通过高效的张量分解方案分层融合了多模态信息,即语言,物体和网格级特征。该模型将VQAv1中最先进的单模型性能从67.9%提高到68.2%,VQAv2将模型性能从65.3%提高到67.4%,显示出显着的提升。

 

嵌入式系统深度学习模型的自适应选择

Ben TaylorSanz Marco VicentWilly WolffYehia ElkhatibZheng Wang

深度学习网络(DNN)最近的突破性进展使它们对嵌入式系统具有吸引力。但是,DNN需要很长时间才能对资源受限的嵌入式设备进行推理。由于隐私问题,高延迟或缺乏连接性,将计算卸载到云中通常是不可行的。因此,迫切需要找到一种在设备上本地有效执行DNN模型的方法。本文提出了一种自适应方案,通过考虑期望的精度和推理时间来确定哪个DNN模型用于给定的输入。我们的方法采用机器学习来开发预测模型,以快速选择预先训练的DNN以用于给定输入和优化约束。我们通过首先培训离线预测模型来实现这一目标,然后使用学习模型选择一个DNN模型用于新的,看不见的输入。我们将我们的方法应用于图像分类任务,并使用ImageNet ILSVRC 2012验证数据集在Jetson TX2嵌入式深度学习平台上对其进行评估。我们考虑一系列有影响力的DNN模型。实验结果表明,我们的方法实现了推理精度的7.52%的提高,推断时间比最大能力的单DNN模型减少了1.8倍。[1805.04252v1] 推理精度提高52%,推理时间比最大型单DNN模型缩短1.8倍。[1805.04252v1] 推理精度提高52%,推理时间比最大型单DNN模型缩短1.8倍。[1805.04252v1]

 

半自动开源算法软件分割下颌骨的临床评估:实用可行性和评估新行动方案

于尔根瓦尔纳,克斯廷Hochegger,晓军陈,Mischak艾琳,克努特Reinbacher,毛罗·保罗,托米斯拉夫Zrnc,卡佳Schwenzer,木匠,沃尔夫冈Zemann,迪特Schmalstieg,扬艾格

基于算法软件分割的计算机辅助技术是复杂手术病例中越来越感兴趣的话题。但是,由于功能不稳定,耗时的软件过程,人员资源或基于许可的财务成本,许多细分流程通常从临床中心外包给第三方和行业。因此,该试验的目的是评估在临床实践中使用的简单可用,功能稳定且免许可证的分割方法的实际可行性。在这回顾,随机,控制踪迹基于开源的分割算法的准确性和一致性GrowCutGC)通过与使用来自临床例程的10CT下颌数据集的相同解剖结构的手动生成的基底真实度的比较来评估。评估参数是分段时间,体积,体素数,骰子分数(DSC)和豪斯多夫距离(HD)。总体分段时间大约为一分钟。平均DSC值可以达到85%以上,而HD可以达到33.5以下的体素。评估参数之间的统计学差异不显着(p <0.05),相关系数接近于1r> 0.94)。通过所提出的基于交互式开放源码的方法,可以执行具有高精确度和高正相关性的完整功能稳定且节省时间的分段。在颅颌面复合体中,所使用的方法可以代表在临床实践中用于例如手术治疗计划或术后结果的可视化的基于图像的分割的算法替代方案,并且提供多个优点。与其他分割方法或更大数据量的系统比较是未来工作的领域。[1805.08604v1]

 

利用主要卷积神经网络结构对蛋白质结晶X射线图像进行分类

Soheil GhafurianPeter OrthCorey Strickland,华苏,Sangita PatelSteven SoissonBelma Dogdas

蛋白质晶体的生成对于蛋白质分子功能和结构的研究是必需的。这是通过处理大量的结晶试验并经常检查它们以寻找具有结晶的晶体来经验性地完成的。为了避免遗漏晶体,人工完成了试验X射线图像的视觉检查,而不是现有的不太精确的机器学习方法。为了实现更高的自动化精度,我们应用了一些最成功的卷积神经网络(ResNetInceptionVGGAlexNet)来对X射线图像进行10路分类。我们表明,与以前为此目的提出的两个较简单的网络相比,使用这种网络获得了实质性的分类准确性。ResNet获得最高的准确性(81.43%),这对应于5.9%的错过结晶速率。通过使用排名前3的分类策略,这个比率可以降低到0.1%以下。我们的数据集由486,000个内部注释图像组成,为了解决阶级失衡问题,这个数据量增加到100多万。我们还对结果进行标签分析,找出错误和不准确的主要来源。[1805.04563v1]

 

利用分层生成对抗网络开发视频图像识别

Feiwu Yu, Xinxiao Wu, Yuchao Sun, Lixin Duan

视频识别的现有深度学习方法通 常需要大量标记视频进行训练。但对于一项新任务,视频往往没有标签,而且注释它们也耗费时间和劳动力。我们试图利用现有的完全标记的图像来帮助识别这些视频,而不是人类注释。然而,由于域转移和异构特征表示的问题,对图像进行训练的分类器的性能可能会显着降低以用于视频识别任务。在本文中,我们提出了一种称为分层生成对抗网络(HiGAN)的新方法,通过从图像(即源域)传输知识来增强视频(即目标域)中的识别。HiGAN模型由一个\ emph {低级}条件GAN和一个\ emph {高级}条件GAN组成。通过利用这些两级对抗学习,我们的方法能够学习源图像和目标视频的域不变特征表示。对两个具有挑战性的视频识别数据集(即UCF101HMDB51)进行全面实验证明,与现有的最先进的领域自适应方法相比,该方法的有效性。[1805.04384v1] UCF101HMDB51)与现有的最先进的领域适应方法相比较,证明了该方法的有效性。[1805.04384v1] UCF101HMDB51)与现有的最先进的领域适应方法相比较,证明了该方法的有效性。[1805.04384v1]

 

分段分类器映射:以少数示例为小类学习细粒度学习者

Xiu-Shen Wei, Peng Wang, Lingqiao Liu, Chunhua Shen, Jianxin Wu

人类能够在很少监督的情况下学习一种新的细粒度概念,例如,一些鸟类的典型图像很少,但是我们最好的深度学习系统需要数百或数千个标记的例子。在本文中,我们试图通过在一个具有挑战性的少量镜头学习环境中研究细粒度图像识别问题来缩小这种差距,称为少镜头细粒度识别(FSFG)。FSFG的任务要求学习系统从几个例子(只有一个或少于五个)为新的细粒度类别构建分类器。为了解决这个问题,我们提出了一个端到端的可训练深度网络,它受到最先进的细粒度识别模型的启发,并且为FSFG任务量身定制。具体而言,我们的网络由双线性特征学习模块和分类器映射模块组成:而前者将示例图像的区分信息编码为特征向量,后者将中间特征映射到新类别的决策边界。我们的模型的关键新颖之处在于分类器映射模块中的分段映射功能,其通过以更多参数经济的方式学习一组更可达到的子分类器来产生决策边界。我们以元学习的方式学习基于辅助数据集的范例到分类器映射,预计它能够推广到新的范畴。通过对三个细粒度数据集进行全面的实验,我们证明了所提出的方法在竞争基线上实现了优越的性能。[1805.04288v1] 后者将中间特征映射到新类别的决策边界。我们的模型的关键新颖之处在于分类器映射模块中的分段映射功能,其通过以更多参数经济的方式学习一组更可达到的子分类器来产生决策边界。我们以元学习的方式学习基于辅助数据集的范例到分类器映射,预计它能够推广到新的范畴。通过对三个细粒度数据集进行全面的实验,我们证明了所提出的方法在竞争基线上实现了优越的性能。[1805.04288v1] 后者将中间特征映射到新类别的决策边界。我们的模型的关键新颖之处在于分类器映射模块中的分段映射功能,其通过以更多参数经济的方式学习一组更可达到的子分类器来产生决策边界。我们以元学习的方式学习基于辅助数据集的范例到分类器映射,预计它能够推广到新的范畴。通过对三个细粒度数据集进行全面的实验,我们证明了所提出的方法在竞争基线上实现了优越的性能。[1805.04288v1] 其通过以更多参数经济的方式学习一组更可达到的子分类器来生成决策边界。我们以元学习的方式学习基于辅助数据集的范例到分类器映射,预计它能够推广到新的范畴。通过对三个细粒度数据集进行全面的实验,我们证明了所提出的方法在竞争基线上实现了优越的性能。[1805.04288v1] 其通过以更多参数经济的方式学习一组更可达到的子分类器来生成决策边界。我们以元学习的方式学习基于辅助数据集的范例到分类器映射,预计它能够推广到新的范畴。通过对三个细粒度数据集进行全面的实验,我们证明了所提出的方法在竞争基线上实现了优越的性能。[1805.04288v1] 我们证明了所提出的方法在竞争基线上实现了优越的性能。[1805.04288v1] 我们证明了所提出的方法在竞争基线上实现了优越的性能。[1805.04288v1]

 

准时重建:使用单视图深度预测器作为初始值来修补稀疏地图

Chamara Saroj WeerasekeraThanuja DharmasiriRavi GargTom DrummondIan Reid

我们通过卷积神经网络(CNN)以数据相关的方式获得参数化CRF模型的置信度权重,所述卷积神经网络经过训练以模拟给定每个输入深度图源和相关RGB图像的条件深度误差分布。我们的CRF模型惩罚其节点中的绝对深度误差和其边缘中的成对尺度不变深度误差,并且基于置信度的融合最小化异常值输入深度值对融合结果的影响。我们通过在室内和室外以任意比例和不规则稀疏量实时修复ORB-SLAMKinectLIDAR深度图,展示了我们方法的灵活性。[1805.04239v1] 我们的CRF模型惩罚其节点中的绝对深度误差和其边缘中的成对尺度不变深度误差,并且基于置信度的融合最小化异常值输入深度值对融合结果的影响。我们通过在室内和室外以任意比例和不规则稀疏量实时修复ORB-SLAMKinectLIDAR深度图,展示了我们方法的灵活性。[1805.04239v1] 我们的CRF模型惩罚其节点中的绝对深度误差和其边缘中的成对尺度不变深度误差,并且基于置信度的融合最小化异常值输入深度值对融合结果的影响。我们通过在室内和室外以任意比例和不规则稀疏量实时修复ORB-SLAMKinectLIDAR深度图,展示了我们方法的灵活性。[1805.04239v1]

 

基于注意力弱监督领域特定的颜色命名

Lu Yu, Yongmei Cheng, Joost van de Weijer

现有的大多数颜色命名方法都着重于英语的十一个基本颜色术语。但是,在许多应用中,使用不同的颜色名称集合来精确描述对象。标记数据以了解这些特定于域的颜色名称是一项昂贵且费力的任务。因此,在本文中,我们旨在从弱标记的数据中学习颜色名称。为此,我们将关注分支添加到颜色命名网络。关注分支用于调整网络的像素方式颜色命名预测。在实验中,我们说明注意分支正确识别相关区域。此外,我们展示了我们的方法在EBAY数据集中获得了像素级和图像级分类的最新结果,并且能够学习各个域的颜色名称。[1805.04385v1]

 

使用密集型CNN特征和重点再定位的运动结构

Aji Resindra WidyaTorii AkihikoOkutomi Masatoshi

运动结构(SfM)使用涉及极端外观变化的图像,但由于功能可重复性的损失,这仍然是一项具有挑战性的任务。通过匹配密集提取的卷积神经网络(CNN)特征获得的特征对应性显着提高了SfM重建能力。然而,重建准确度受到提取的CNN特征的空间分辨率的限制,这在现有方法中甚至不是像素级准确度。由于密集特征的内存限制和计算负担,提供与精确关键点位置密集的特征匹配并不是微不足道的。为了以高度可重复的密集特征实现准确的SfM重建,我们提出了一个SfM管道,它使用密集的CNN特征和关键点位置的重新定位,可以高效准确地提供像素级特征对应关系。然后,我们在亚琛日夜数据集上演示,使用密集CNN特征的关键点重定位所提出的SfM优于最先进的SfM(使用RootSIFTCOLMAP)。[1805.03879v2]

 

深度2.5D车辆分类,自动化收费系统的稀疏SfM深度

Georg WaltnerMichael MaurerThomas HolzmannPatrick RuprechtMichael OpitzHorst PosseggerFriedrich FraundorferHorst Bischof

自动收费系统依靠对过往车辆的正确分类。当用于分类的图像仅覆盖车辆的一部分时,这是特别困难的。获取有关整车的信息。我们将车辆重建为3D对象,并在卷积神经网络(CNN)内利用这些附加信息。但是,当使用深度网络进行三维物体分类时,需要大量密集的三维模型以获得较高的精确度,这通常既不可用也不可行,这是由于内存要求。因此,在我们的方法中,我们使用重构的点,线或两者将3D对象重投影到图像平面上。我们在辅助网络分支之前利用这个稀疏深度,在训练期间充当正规化者。我们证明这个辅助调整器有助于提高与真实世界数据集上2D分类相比的准确性。此外,由于网络的设计,在测试时间仅需要2D照相机图像进行分类,这使得便携式计算机视觉系统中的使用成为可能。[1805.03511v2]

 

推动无约束面部检测的限制:挑战数据集和基线结果

Hajime NadaVishwanath A. Sindagi,何章,Vishal M. Patel

人脸识别在过去几年中取得了巨大的进步,每年都有新的里程碑被超越。虽然诸如规模,姿势,外观上的巨大变化等许多挑战已被成功解决,但仍存在若干问题,这些问题没有被现有方法或数据集专门捕获。在这项工作中,我们确定了需要研究界关注的下一组挑战,并收集涉及这些问题的新图像数据集,例如基于天气的降级,运动模糊,焦点模糊等等。我们证明,在最先进的探测器和真实世界需求的性能方面存在相当大的差距。因此,为了加强对无约束人脸检测的研究,我们提出了一个新的带注释的无约束面部检测数据集(UFDD),其中有几个挑战和基准最近的方法。此外,我们对这些方法的结果和失败案例进行了深入分析。数据集以及基线结果将在适当的时候公布。UFDD数据集以及基线结果可在以下网址获得:www.ufdd.info/ [1804.10275v2]

 

基于视觉的房地产价格估算

Omid PoursaeedTomas MateraSerge Belongie

自从ZillowTruliaRedfin等在线房地产数据库公司问世以来,自动估算房屋市场价值的问题受到了相当的关注。一些房地产网站使用专有公式提供这种估计。尽管这些估计值通常接近实际销售价格,但在某些情况下,这些估计值非常不准确。影响房屋价值的关键因素之一是其内部和外部外观,这在计算自动价值估计时未考虑。在本文中,我们评估了房屋视觉特征对其市场价值的影响。在家庭室内和室外照片的大型数据集上使用深度卷积神经网络,我们开发了一种估算房地产照片奢侈品水平的方法。我们还开发了一种新颖的自动化价值评估框架,使用上述照片以及家庭特征,包括尺寸,价格和卧室数量。最后,通过将我们提出的价格估算方法应用于一个新的房地产照片和元数据数据集,我们发现它的表现优于Zillow的估算。[1707.05489v2]

 

MAT:一种多强度对抗训练方法来缓解敌对攻击

Chang Song, Hsin-Pai Cheng, Huanrui Yang, Sicheng Li, Chunpeng Wu, Qing Wu, Hai Li, Yiran Chen

最近的一些研究表明,深层神经网络(DNNs)很容易受到所谓的敌对攻击,其中输入示例有意扰乱愚蠢的DNN。在这项工作中,我们重新审视了包含敌对案例的DNN培训流程,以提高DNN对敌对攻击的抵御能力,即对抗性培训。我们的实验表明,不同的对抗强度,即对抗性事例的扰动水平,有不同的工作区域来抵抗攻击。基于观察,我们提出了一种多强度对抗训练方法(MAT),它将对抗训练的例子与不同的对抗优势结合起来,以防御敌对对手的攻击。两种训练结构混合MAT和并行MAT–被开发用于促进训练时间和记忆占用之间的权衡。我们的研究结果表明MAT可以将深度学习系统的准确度降低降至MNISTCIFAR-10CIFAR-100SVHN的敌对攻击。[1705.09764v2]

转载请注明:《通过姿态引导知识转移进行弱监督和半监督人体部位解析+推动无约束面部检测的限制:挑战数据集和基线结果

发表评论