深度学习图像去雾:比较和分析+超越One-hot编码:低维目标嵌入+在低功耗/低质量消费者成像系统上进行高效CNN实现以进行视线估计

用外观和形状的联合模型进行稳健的姿态跟踪

Yuliang Guo, Lakshmi Narasimhan Govindarajan, Benjamin Kimia, Thomas Serre

我们提出了一种新颖的方法来估计一个铰接物体的二维姿态,并应用于实验室小动物的自动视频分析。我们发现为人类开发的可变形零件模型(例如灵活的零件混合模型(FMP)模型)通常无法应对具有挑战性的动物姿势。我们认为,除了编码外观和空间关系之外,还需要塑造形状以克服实验动物体缺乏独特的标志。在我们的方法中,形状一致的FMPscFMP)模型在使用标准FMP模型来快速丢弃虚假部分检测之后计算有前景的姿势候选。这种级联方法结合了空间关系的相对优势,外观和形状表现,并且显示出比原始FMP模型以及代表性深层神经网络基线显着改进。[1806.11011v1]

 

迁移学习和图像类别发现的概率约束聚类

许彦昌,赵朝阳,乔尔施洛瑟,菲利普奥多姆,索尔特基拉

基于神经网络的聚类近来越来越受欢迎,并且特别是已经提出了使用深度学习执行转移学习和图像类别发现的约束聚类公式。其核心思想是制定一个可用于训练深度聚类网络的成对约束聚类目标因此集群分配及其基础特征表示是端到端联合优化。在这项工作中,我们提供了一种新颖的聚类公式,以解决先前工作中优化更深网络和更多类别的可扩展性问题。所提出的目标直接最小化聚类分配相对于成对约束的负对数似然性,没有超参数,并且在监督学习和无监督学习转移学习方面展现出改进的可扩展性和性能。[1806.11078v1]

 

GANs进行高清晰度属性导引的人脸生成

Evgeny Izutov

在这项工作中,我们专注于基于GAN的属性导向面合成解决方案。之前的作品利用GAN生成照片般逼真的人脸图像,并没有关注所得图像多样性的问题。所提出的解决方案又引入了单位复数的新型潜在空间,能够在生日悖论分数上提供比训练数据集大3倍的多样性。需要强调的是,我们的结果显示在相对较小的数据集(20k样本与200k样本)上,同时以较高的分辨率(128×128,与之前作品的32×32相比)保留了生成面部的照片般真实的属性。[1806.10982v1]

 

使用模拟内窥镜图像来自动初始化配准算法

Ayushi SinhaMasaru IshiiRussell H. TaylorGregory D. HagerAustin Reiter

注册不同形式的图像是计算机辅助医疗干预研究的一个活跃领域。已经开发了几种注册算法,其中许多算法实现了高精度。但是,这些结果取决于许多因素,包括提取的特征或分段的质量以及初始对齐。尽管已经开发了几种方法来改进分割算法并使分割过程自动化,但很少有自动初始化算法被探索。在许多情况下,开始注册的初始对齐是手动执行的,这会干扰临床工作流程。我们的目标是在内窥镜程序中使用场景分类来实现内窥镜的粗对准和解剖结构的术前图像。在本文中,我们展示了使用模拟场景,神经网络可以通过观察单个内窥镜视频帧来预测内窥镜位于的解剖区域(相对于术前图像)。由于训练有限且没有任何超参数调整,我们的方法达到了76.53+/- 1.19)%的准确度。有几个途径需要改进,使得这是一个有前景的研究方向。代码位于https://github.com/AyushiSinha/AutoInitialization[1806.10748v1] 

 

建模动作定位的时空人体轨迹结构

GuilhemChéronAnton OsokinIvan LaptevCordelia Schmid

本文介绍了视频中人类行为的时空定位。为了及时本地化行动,我们提出了一个经常性的本地化网络(RecLNet),该网络被设计用来模拟人类轨迹层面的行为的时间结构。我们的模型经过训练,能够及时识别和定位动作类别,并基于两层门控循环单元(GRU)分别应用于两个流,即外观和光流。当与最先进的人员检测和跟踪一起使用时,我们的模型显示可以大大改善视频中的大幅时空动作定位。显示增益主要是由于时间局部化改善。我们在两个最近的时空动作定位数据集UCF101-24DALY上评估我们的方法,表明了现有技术的显着改进。[1806.11008v1]

 

NSCLC组织针活检中自动化PD-L1肿瘤细胞评分的深度半监督生成学习

Ansh KapilArmin MeierAleksandra ZurawKeith SteeleMarlon RebelattoGünterSchmidtNicolas Brieu

免疫组织化学(IHC)测定中PD-L1表达水平是鉴定可能对抗PD-1 / PD-L1治疗有反应的非小细胞肺癌(NSCLC)患者的关键生物标志物。PD-L1表达的定量目前包括由病理学家对肿瘤细胞(TC)评分的视觉估计,并且包括评估PD-L1阳性和PD-L1阴性肿瘤细胞的比率。已知的挑战如临床相关临界点附近的积极性评估差异和样品的次优质量使得视觉评分冗长和主观,产生病理学家之间的评分变异性。在这项工作中,我们提出了一种新型的深度学习解决方案,能够在晚期NSCLC穿刺活检中首次实现PD-L1表达的自动客观评分。为了解释活组织图像中可用的组织量较少并限制培训所需的手动注释的数量,我们探讨了在标准完全监督方法中使用半监督方法。我们整合了用于培训的手册注释以及用于与多位病理学家进行定量评估的视觉TC分数。通过在训练期间看不到的一组幻灯片计算出的一致性度量提供了证据,证明我们的自动评分方法与所考虑数据集的视觉评分匹配,同时确保可重复性和客观性。[1806.11036v1] 我们整合了用于培训的手册注释以及用于与多位病理学家进行定量评估的视觉TC分数。通过在训练期间看不到的一组幻灯片计算出的一致性度量提供了证据,证明我们的自动评分方法与所考虑数据集的视觉评分匹配,同时确保可重复性和客观性。[1806.11036v1] 我们整合了用于培训的手册注释以及用于与多位病理学家进行定量评估的视觉TC分数。通过在训练期间看不到的一组幻灯片计算出的一致性度量提供了证据,证明我们的自动评分方法与所考虑数据集的视觉评分匹配,同时确保可重复性和客观性。[1806.11036v1]

 

深度学习图像去雾:比较和分析

BenoitLeonel CuevasJean-Baptiste Thomas

我们将基于深度学习Dehazenet的最新除雾方法与传统的最先进方法进行比较,并参考基准数据。Dehazenet根据单色图像上的透射因子估算深度图,该图用于在存在雾度时反转Koschmieder成像模型。从这个意义上说,解决方案仍然依附于Koschmieder模型。我们证明了网络对透射的估计很好,但是由于使用相同的成像模型,这种方法也显示出与其他方法相同的局限性。[1806.10923v1]

 

考虑直方图稀疏性和向后兼容JPEG的双层无损HDR编码

渡边am治,小林弘之,仁志仁

本文提出了一种有效的两层编码方法,该方法使用直方图压缩技术,与传统JPEG向后兼容。作为用于压缩HDR图像的国际标准的JPEG XT采用两层编码方案以向后兼容传统JPEG。然而,与其他现有的用于HDR图像的单层编码方法相比,这种两层编码结构不具有更好的无损性能。此外,JPEG XT在确定无损编码参数方面存在问题找到适当的参数值组合是实现良好无损性能的必要条件。讨论了HDR图像的直方图稀疏性,指出考虑稀疏性的直方图包装技术能够提高HDR图像的无损压缩性能,并提出了一种新的直方图包装技术的双层编码方法。实验结果表明,不仅提出的方法具有比JPEG XT更好的无损压缩性能,而且不需要确定良好压缩性能的图像相关参数值,尽管它具有向后兼容性已知的传统JPEG标准。[1806.10746v1] 实验结果表明,不仅提出的方法具有比JPEG XT更好的无损压缩性能,而且不需要确定良好压缩性能的图像相关参数值,尽管它具有向后兼容性已知的传统JPEG标准。[1806.10746v1] 实验结果表明,不仅提出的方法具有比JPEG XT更好的无损压缩性能,而且不需要确定良好压缩性能的图像相关参数值,尽管它具有向后兼容性已知的传统JPEG标准。[1806.10746v1]

 

如何从社交媒体中提取时尚潮流?支持无监督学习的鲁棒对象检测器

Vijay GabaleAnand Prabhu Subramanian

随着社交媒体的激增,来自知名人士,知名设计师以及时尚影响者的时尚风潮缩短了时装设计和制造的周期。然而,随着时尚相关内容的大量涌现和大量用户生成的时尚照片的出现,时装设计师通过社交媒体的照片和创造趋势时尚的摘要是一项艰巨的任务。这就需要对社交媒体上的时尚照片进行深度解析,以对来自给定时尚照片的多个时尚物品进行本地化和分类。虽然诸如MSCOCO之类的对象检测竞赛对于每个对象类别都有数千个样本,但为快速时尚项目获取大型标记数据集相当困难。此外,最先进的物体检测器没有任何功能来摄取社交媒体上可用的大量未标记数据,以便用标记的数据集对对象检测器进行微调。在这项工作中,我们展示了一个通用对象检测器的应用,该检测器可以以无监督的方式预训练,从最近发布的Open Images V4数据集的24个类别中进行。我们首先使用从社交媒体收集的来自24个类别的60K无标签照片上的无监督学习来训练对象检测器的基础架构,然后在来自Open Images V4数据集的8.2K标记照片上进行微调。在300X300图像输入上,我们在2.4K照片的测试数据集上实现了72.7%的mAP,同时与最先进的物体检测器相比,性能提高了11%到17%。我们表明,这种改进是由于我们选择的架构可以让我们进行无监督学习,并且在识别小物体方面表现更好。[1806.10787v1]

 

高速卷积神经网络的自动秩选择

Hyeji KimChong-Min Kyung

低秩分解在加速卷积神经网络(CNN)中起着核心作用,分解核内张量的秩是决定神经网络复杂性和精确性的关键参数。在本文中,我们将秩选择定义为组合优化问题,并提出一种方法来最小化网络复杂度,同时保持所需的准确性。由于搜索空间限制,组合优化不可行。为了限制搜索空间并获得最优秩,我们用边界条件定义空间约束参数。我们还提出了一个线性近似精度函数来预测优化CNN模型在降低成本期间的精确调整精度。在AlexNetVGG-16上的实验结果表明,所提出的秩选择算法满足精度约束。我们的方法结合截断SVD在推理和训练时间方面的性能优于最先进的方法,精度几乎相同。[1806.10821v1]

 

DeepSDCS:解剖Ki67数字整个载玻片图像中的癌增殖异质性

Priya Lakshmi Narayanan, Shan E Ahmed Raza, Andrew Dodson, Barry Gusterson, Mitchell Dowsett, Yinyin Yuan

Ki67是乳腺癌的重要生物标志物。组织学切片中阳性和阴性Ki67细胞的分类是确定癌症增殖状态的常用方法。然而,在大规模患者队列中缺乏可自动化Ki67评分的一般化和精确方法。在这项工作中,我们采用了基于超列描述符的新型深度学习技术,用于Ki67图像中的细胞分类。具体来说,我们开发了同时检测和细胞分割(DeepSDCS)网络来执行细胞分割和检测。VGG16网络用于培训和微调培训数据。我们提取每个单元格的超列描述符,以形成特定图层的激活矢量,以不同粒度捕捉特征。来自这些层的对应于相同像素的特征使用随机梯度下降优化器来传播以产生核和最终细胞分割的检测。随后,从细胞分割产生的种子被传播到空间受限的卷积神经网络,用于将细胞分类为基质,淋巴细胞,Ki67阳性癌细胞和Ki67阴性癌细胞。我们在雌激素受体阳性乳腺癌的大规模临床试验中验证了它的准确性。我们在包含活检和整张幻灯片图像的两组独立的Ki67染色乳腺癌数据集中获得了99.06%和89.59%的准确性。[1806.10850v1] 从细胞分割产生的种子被传播到空间受限的卷积神经网络,用于将细胞分类为基质,淋巴细胞,Ki67阳性癌细胞和Ki67阴性癌细胞。我们在雌激素受体阳性乳腺癌的大规模临床试验中验证了它的准确性。我们在包含活检和整张幻灯片图像的两组独立的Ki67染色乳腺癌数据集中获得了99.06%和89.59%的准确性。[1806.10850v1] 从细胞分割产生的种子被传播到空间受限的卷积神经网络,用于将细胞分类为基质,淋巴细胞,Ki67阳性癌细胞和Ki67阴性癌细胞。我们在雌激素受体阳性乳腺癌的大规模临床试验中验证了它的准确性。我们在包含活检和整张幻灯片图像的两组独立的Ki67染色乳腺癌数据集中获得了99.06%和89.59%的准确性。[1806.10850v1] 对包含活组织检查和全张幻灯片图像的两组独立的Ki67染色的乳腺癌数据集的准确度为59%。[1806.10850v1] 对包含活组织检查和全张幻灯片图像的两组独立的Ki67染色的乳腺癌数据集的准确度为59%。[1806.10850v1]

 

急性脑卒中监测中的CT图像配准

Lucio AmelioAlessia Amelio

我们提出了一种新的系统,该系统基于患者脑部CT检查中的图像配准技术追踪中风病变的时间演变。该系统能够比较过去的CT检查和最近的与中风事件有关的检查,以便评估与中风无关的过去的病变。然后,它可以比较最近与当前中风有关的CT检查以评估病变随时间的演变。在图像配准期间,还引入了一种新的相似性度量来比较源图像和目标图像。这将导致对中风急性期的更便宜,更快和更容易获得的评估,以克服现有技术中提出的系统的当前局限性。[1806.10836v1]

 

超越one-hot编码:低维目标嵌入

保罗罗德里格斯,米格尔A.包蒂斯塔,霍尔迪·冈萨雷斯,塞尔吉奥埃斯卡利拉

目标编码在学习卷积神经网络时起着核心作用。在这个领域,由于其简单性,one-hot编码是最流行的策略。然而,这种如此广泛的编码模式假设了一个平坦的标签空间,因此忽略了可以在训练期间被利用的标签之间存在的丰富关系。在大规模数据集中,数据不能跨越整个标签空间,而是位于低维输出流形中。在观察之后,我们将目标嵌入低维空间,在保持准确性的同时大大提高了收敛速度。我们的贡献有两个:(i)我们表明标签空间的随机投影是找到这种较低维嵌入的有效工具,以零计算代价提高收敛速度ii)我们提出了一类归一化的类流形,它以最小的信息损失对目标进行编码,提高了随机投影编码的准确性,同时获得了相同的收敛速度。在CIFAR-100CUB200-2011ImagenetMIT Places上的实验表明,所提出的方法极大地提高了收敛速度,同时达到了极具竞争力的准确率。[1806.10805v1]

 

使用卷积神经网络和时间信息进行准确高效的视频隔离

Chen Du, Byeongkeun Kang, Zheng Xu, Ji Dai, Truong Nguyen

防护是为了消除图像或视频上捕获的栅栏,提供场景的清晰视图。它已经应用于许多目的,包括协助摄影师和改善计算机视觉算法的性能,如物体检测和识别。然而,由于栅栏分割的困难而导致的最新防护方法的性能有限,并且还受到照相机或物体的运动的困扰。为了克服这些问题,我们提出了一种使用卷积神经网络和快速/鲁棒恢复算法进行分割的新方法。使用卷积神经网络的分割算法实现了围栏分割精度的显着提高。使用光流的恢复算法产生似是而非的防护图像和视频。所提出的方法在我们不同的和复杂的数据集和公开可用的数据集上进行实验。实验结果表明,该方法实现了分段和内容恢复的最先进的性能。[1806.10781v1]

 

Switchable Normalization:可微分可学习的批规范化

Ping Luo, Jiamin Ren, Zhanglin Peng

我们通过提出可切换标准化(SN)来解决学习到标准化问题,其可学习为深度神经网络(DNN)的不同标准化层选择不同的操作。SN的统计量(均值和差异)在三个范围内计算,包括通道,图层和小批次。SN通过以端到端的方式学习其重要性权重来选择它们。它有几个吸引人的好处。首先,SN适应各种网络体系结构和任务。其次,它适用于各种批量大小,在提供小型小型批次(例如2个图像/ GPU)时保持高性能。第三,SN的上述优点是通过将所有通道视为一个组来获得的,这与将组数目搜索作为超参数的组标准化不同。大量的评估表明SN在诸如ImageNet中的图像分类,COCO中的对象检测和分割,艺术图像程式化以及神经架构搜索等各种具有挑战性的问题上优于其同行。SN的代码将在https://github.com/switchablenorms/中提供。[1806.10779v1]

 

探索基于CNN的词汇体系结构

Eugen RusakovSebastian SudholtFabian WolfGernot A. Fink

单词识别的目标是检索与某个用户定义的查询相关的部分文档图像。最近过去已经看到基于属性的卷积神经网络接管了这个研究领域。正如其他计算机视觉领域常见的那样,用于此任务的CNN已经相当深入。然而,出现的问题是:美国有线电视新闻网络对于发现字词有多复杂?越来越深的模型会给出越来越好的结果,或者性能对这些架构渐近地表现出来吗?另一方面,使用更小的CNN可以获得类似的结果吗?本文的目标是回答这些问题。因此,最近成功的TPP-PHOCNet将与剩余网络进行比较,密集连接的卷积网络和经验上的LeNet架构。从评估中可以看出,一个复杂的模型对于在IAM离线数据库等较困难的任务上进行词语识别可能是有益的,但对于乔治华盛顿数据库等更简单的基准测试并不会带来任何好处。[1806.10866v1]

 

用于图像集分类的流形降维Grassmannian判别映射(GDM

Rui Wang, Xiao-Jun Wu, Kai-Xuan Chen, Josef Kittler

在图像集分类中,通过在Grassmann流形上表示原始图像集已经取得了相当大的进展。为了将基于欧几里德的降维方法的优点扩展到格拉斯曼流形,最近提出了几种在Grassmann流形上联合执行降维和度量学习以提高性能的方法。尽管如此,当应用于复杂数据集时,学习功能不具有足够的区分能力。为了克服这个问题,我们提出了一种新的格拉斯曼判别映射(Grassmannian Discriminant MapsGDM)方法用于多维降维问题。该方法的核心是度量学习和降维的一种新的判别函数。为了比较和更好的理解,我们还研究了GDM的一个简单变体。它们之间的关键区别在于判别函数。我们对与三个任务相对应的数据集进行实验:人脸识别,对象分类和手势识别,以评估所提出的方法及其简单扩展。与现有技术相比,所获得的结果显示了所提出算法的有效性。[1806.10830v1]

 

状态感知抗漂移鲁棒相关跟踪

Yuqi Han, Chenwei Deng, Zengshuo Zhang, Jinghong Nan, Baojun Zhao

基于相关滤波器(CF)的跟踪器由于在保持高运行速度的同时在多个数据集上具有优异的性能而在视觉跟踪领域引起了越来越多的关注。对于每个帧,训练一个理想的滤波器以区分目标与其周围背景。考虑到跟踪过程中目标始终受到外部和内部的干扰,训练后的滤波器不仅要考虑外部干扰,还要考虑目标外观变化。为此,本文提出了一种状态感知反漂移跟踪器(SAT),它将滤波器学习中的识别和可靠性信息联合建模。具体而言,将全局上下文补丁纳入过滤培训阶段,以更好地区分目标和背景。同时,学会了基于颜色的可靠掩模,以鼓励滤波器专注于适合追踪的更可靠区域。我们表明,提出的优化问题可以有效地解决使用替代方向的乘法器,并充分执行傅立叶域。在OTB-100数据集上进行了大量实验,将SAT跟踪器(手工制作的特征和CNN特征)与其他相关的最先进的方法进行比较。定量和定性评估都进一步证明了拟议工作的有效性和稳健性。[1806.10759v1] 我们表明,提出的优化问题可以有效地解决使用替代方向的乘法器,并充分执行傅立叶域。在OTB-100数据集上进行了大量实验,将SAT跟踪器(手工制作的特征和CNN特征)与其他相关的最先进的方法进行比较。定量和定性评估都进一步证明了拟议工作的有效性和稳健性。[1806.10759v1] 我们表明,提出的优化问题可以有效地解决使用替代方向的乘法器,并充分执行傅立叶域。在OTB-100数据集上进行了大量实验,将SAT跟踪器(手工制作的特征和CNN特征)与其他相关的最先进的方法进行比较。定量和定性评估都进一步证明了拟议工作的有效性和稳健性。[1806.10759v1]

 

深度CNN降噪器和多层相邻分量嵌入的面部幻觉

Junjun Jiang, Yi Yu, Jinhui Hu, Suhua Tang, Jiayi Ma

目前大多数面对幻觉的方法,无论是浅层学习还是深度学习,都尝试通过训练集学习低分辨率(LR)和高分辨率(HR)空间之间的关系模型。他们主要关注通过基于模型的优化或区分性推理学习之前的图像建模。然而,当输入的LR面很小时,所学习的先验知识不再有效,并且其性能会急剧下降。为了解决这个问题,本文提出了一种通用的面部幻觉方法,该方法可以整合基于模型的优化和区分性推理。具体而言,为了利用基于模型的先前技术,利用图像自适应拉普拉斯正则化技术将深度卷积神经网络(CNN)降噪器优化插入到超分辨率优化模型中。此外,我们进一步开发了一种高频细节补偿方法,将人脸图像分割为人脸部分,并以多层邻居嵌入方式进行面部幻觉。实验证明,所提出的方法可以为微小输入LR面获得有前途的超分辨率结果。[1806.10726v1] 实验证明,所提出的方法可以为微小输入LR面获得有前途的超分辨率结果。[1806.10726v1] 实验证明,所提出的方法可以为微小输入LR面获得有前途的超分辨率结果。[1806.10726v1]

 

在低功耗/低质量消费者成像系统上进行高效CNN实现以进行视线估计

Joseph LemleyAnuradha KarAlexandru DrimbareanPeter Corcoran

准确有效的眼睛注视估计对于新兴的消费电子系统如驾驶员监控系统和新颖的用户界面非常重要。这些系统需要在低功耗和低成本的困难,不受限制的环境中可靠运行。在本文中,引入了一种新的硬件友好的,具有最小计算要求的卷积神经网络模型,并对基于外观的有效注视估计进行评估。该模型经过测试并与现有的基于CNN方法的外观进行比较,以更少的计算要求实现更好的视线注视准确性。还提供了简要的更新文献回顾。[1806.10890v1]

 

网络中具有扩散的动态纹理分析

Lucas C. RibasWesley N. GoncalvesOdemir M. Bruno

由于多媒体数据库的爆炸性增长,动态纹理是一个由计算机视觉领域引起广泛关注的研究领域。此外,动态纹理存在于各种视频中,这使得它在基于视频的专家系统(如医疗系统,交通监控系统,森林火灾探测系统等)中非常重要。本文提出了一种基于有向网络扩散的动态纹理特征表征方法。动态纹理被建模为定向网络。该方法包括在基于边权重的一系列图切换变换之后分析该网络的动态。对于每个网络转换,估计每个顶点的活动。活动是一个顶点被随机游走的相对频率。然后,通过连接活动直方图来构造纹理描述符。本文的主要贡献是使用有向网络建模和网络扩散来动态纹理表征。这些倾向于在动态纹理分类中提供更好的性能。为了证明该方法的鲁棒性,进行了运动模式的旋转和干涉实验。所提出的方法与其他动态纹理方法在两个非常熟悉的动态纹理数据库和交通状况分类上进行比较,并且在大多数情况下表现优于其他方法。[1806.10681v1] 本文的主要贡献是使用有向网络建模和网络扩散来动态纹理表征。这些倾向于在动态纹理分类中提供更好的性能。为了证明该方法的鲁棒性,进行了运动模式的旋转和干涉实验。所提出的方法与其他动态纹理方法在两个非常熟悉的动态纹理数据库和交通状况分类上进行比较,并且在大多数情况下表现优于其他方法。[1806.10681v1] 本文的主要贡献是使用有向网络建模和网络扩散来动态纹理表征。这些倾向于在动态纹理分类中提供更好的性能。为了证明该方法的鲁棒性,进行了运动模式的旋转和干涉实验。所提出的方法与其他动态纹理方法在两个非常熟悉的动态纹理数据库和交通状况分类上进行比较,并且在大多数情况下表现优于其他方法。[1806.10681v1] 为了证明该方法的鲁棒性,进行了运动模式的旋转和干涉实验。所提出的方法与其他动态纹理方法在两个非常熟悉的动态纹理数据库和交通状况分类上进行比较,并且在大多数情况下表现优于其他方法。[1806.10681v1] 为了证明该方法的鲁棒性,进行了运动模式的旋转和干涉实验。所提出的方法与其他动态纹理方法在两个非常熟悉的动态纹理数据库和交通状况分类上进行比较,并且在大多数情况下表现优于其他方法。[1806.10681v1]

 

一种用于肿瘤显着性估计的混合框架

Fei Xu, Min Xian, Yingtao Zhang, Kuan Huang, H. D. Cheng, Boyu Zhang, Jianrui Ding, Chunping Ning, Ying Wang

乳房超声(BUS)图像的自动肿瘤分割由于乳房的解剖结构复杂且图像质量差而相当具有挑战性。大多数肿瘤分割方法在控制环境中收集的BUS图像上获得良好的性能但是,来自不同来源的BUS图像的性能会大大降低。肿瘤显着性估计(TSE)已经引起越来越多的关注,通过对放射学家的注意机制建模来解决这个问题。在本文中,我们提出了一种新颖的TSE混合框架,它集成了高级领域知识和强大的低级显着性假设,并且可以克服传统TSE方法中由直接映射造成的缺陷。新的框架将Neutro-ConnectednessNC)地图,自适应中心,相关性和基于层次结构的加权映射。实验结果表明,所提出的方法优于最先进的TSE方法。[1806.10696v1]

 

梯度相似性:检测对抗性攻击对抗深度学习的可解释方法

Jasjeet DhaliwalSaurabh Shintre

深度神经网络容易受到能够欺骗网络的小而特定的敌对扰动。此漏洞可能导致安全关键应用程序可能产生的有害后果。为了解决这个漏洞,我们提出了一种叫做\ emph {Gradient Similarity}的新颖度量,它可以让我们捕捉训练数据对测试输入的影响。我们证明\ emph {梯度相似}对于正常和敌对投入具有不同的表现,并且使我们能够以近乎完美的95-100%的ROC-AUC检测各种敌对攻击。即使配备完善的系统知识的白盒对手也无法轻松绕过我们的探测器。在MNIST数据集上,白盒攻击或者以87-96%的高ROC-AUC检测,或者需要非常高的失真来绕过我们的检测器。[1806.10707v1]

转载请注明:《深度学习图像去雾:比较和分析+超越One-hot编码:低维目标嵌入+在低功耗/低质量消费者成像系统上进行高效CNN实现以进行视线估计

发表评论