FastDeRain:使用定向梯度的新型视频雨条去除方法+功能磁共振成像:预处理,分类和模式识别

通过合成的无监督人重新识别的领域适应

Slawomir BakPeter CarrJean-Francois Lalonde

监控摄像机照明的巨大差异使得人员重新识别问题极具挑战性。目前的大规模重新识别数据集具有大量的训练主题,但缺乏光照条件的多样性。因此,训练有素的模型需要微调以在看不见的照明条件下变得有效。为了缓解这个问题,我们引入了一个新的合成数据集,其中包含数百个照明条件。具体而言,我们使用100个虚拟人照亮多个HDR环境地图,这些地图可精确模拟真实的室内和室外照明。为了在看不见的照明条件下获得更好的准确性,我们提出了一种新颖的领域适应技术,它利用我们的合成数据并以完全无监督的方式进行微调。我们的方法比半监督和无监督的最先进的方法具有更高的准确性,并且与监督技术非常具有竞争力。[1804.10094v1]

 

生成的抽样隐写术

Jia Liu, Yu Lei, Yan Ke, Jun Li, Minqing Zhang, Xiaoyuan Yan

在本文中,提出了一种新的数据驱动的信息隐藏方案,称为生成隐写术(GSS)。隐形食物直接由强大的发生器采样而没有明确的掩盖。双方共享的密钥分别用于消息嵌入和提取。Jensen-Shannon Divergence被引入作为生成隐写术安全性评估的新标准。基于这些原理,提出了一种使用语义图像修复的简单实用的生成隐写方法。实验通过定性和定量评估生成的隐形图像来展示框架的潜力。[1804.10531v1]

 

异构推理的生成模型

Honggang Zhou, Yunchun Li, Hailong Yang, Wei Li, Jie Jia

诸如生成对手网络(GAN)和变分自动编码器(VAE)等生成模型(GM)近年来蓬勃发展,并在生成新样本方面取得了高质量的结果。特别是在计算机视觉领域,GMs已经被用于图像修复,去噪和完成,可以被视为从观察像素到被破坏的像素的推断。然而,图像是分层结构的,与许多具有非分层特征的真实世界推断场景截然不同。这些推断方案包含异构随机变量和不规则的相互依赖。传统上他们是由贝叶斯网络(BN)建模的。然而,BN模型的学习和推理是NP-hard的,因此BN中的随机变量数量受到很大限制。在本文中,我们调整典型的GMs以实现多项式时间的异构学习和推理。我们还提出了一个扩展的自回归(EAR)模型和一个带有对手损失(EARA)模型的EAR,并给出了它们有效性的理论结果。对几个BN数据集的实验表明,与其他GM相比,我们提出的EAR模型在大多数情况下实现了最佳性能。除黑箱分析外,我们还对GMs的马尔可夫边界推理进行了一系列白盒分析实验,并给出了理论结果。[1804.09858v1] 对几个BN数据集的实验表明,与其他GM相比,我们提出的EAR模型在大多数情况下实现了最佳性能。除黑箱分析外,我们还对GMs的马尔可夫边界推理进行了一系列白盒分析实验,并给出了理论结果。[1804.09858v1] 对几个BN数据集的实验表明,与其他GM相比,我们提出的EAR模型在大多数情况下实现了最佳性能。除黑箱分析外,我们还对GMs的马尔可夫边界推理进行了一系列白盒分析实验,并给出了理论结果。[1804.09858v1]

 

用补丁级通信对建筑物状况进行可视化估计

David KochMiroslav DespotovicMuntaha SakeenaMario DollerMatthias Zeppelzauer

建筑物的状况是房地产估价的重要因素。目前,房地产估价师对房地产估价具有一定的主观性。我们提出了一种新颖的基于视觉的方法,用于从建筑物的外部视图评估建筑物状况。为此,我们开发了一种多尺度贴片模式提取方法,并将其与卷积神经网络相结合,从视觉线索估计建筑物状况。我们的评估显示,视觉估计的建筑条件可以作为评估师对条件估计的代理。[1804.10113v1]

 

竞争学习丰富了学习表征并加速了CNN的微调

Takashi Shinozaki

在这项研究中,我们提出将竞争性学习整合到卷积神经网络(CNN)中以改善表示学习和微调效率。传统的CNN使用反向传播学习,它可以通过区分任务实现强大的表示学习。但是,它需要大量标记数据,并且标记数据的获取比未标记数据的难得多。因此,有效使用未标记的数据对于DNN越来越重要。为了解决这个问题,我们将无监督的竞争学习引入卷积层,并利用未标记的数据进行有效的表示学习。使用玩具模型的验证实验的结果证明强表示学习使用未标记的数据有效地将图像的基础提取到卷积滤波器中,并加快了后续监督反向传播学习的微调速度。当滤波器数量足够大时,杠杆作用更明显,并且在这种情况下,在微调的初始阶段误差率急剧下降。因此,所提出的方法扩大了CNN中的滤波器的数量,并且使得更加详细和通用的表示。它不仅可以提供一个深层广泛的神经网络的可能性。[1804.09859v1] 并提供了更详细和更广泛的代表性。它不仅可以提供一个深层广泛的神经网络的可能性。[1804.09859v1] 并提供了更详细和更广泛的代表性。它不仅可以提供一个深层广泛的神经网络的可能性。[1804.09859v1]

 

功能磁共振成像:预处理,分类和模式识别

马克西姆Sharaev,亚历山大安德列夫,阿列克谢Artemov,亚历山大伯恩斯坦,叶夫根尼Burnaev,叶卡捷琳娜Kondratyeva,斯韦特兰娜SushchinskayaRenat Akzhigitov

随着机器学习在神经科学界不断涌现,我们目睹了新的应用的出现,如诊断,表征和预测精神病和神经疾病的治疗结果,例如癫痫和抑郁症。对这些精神障碍的系统研究日益涉及以数据驱动方法为基础的临床结论为此,结构和功能神经影像作为关键的来源形式。识别信息神经成像标记需要为可能被人造信号波动严重破坏的数据建立一个全面的准备流程。在这项工作中,我们回顾了大量文献,为临床应用中模式识别方法的优势提供了充分的证据,概述了基于图形的高级模式识别方法,并提出了一种噪声感知神经影像数据处理流水线。为了证明我们的方法的有效性,我们提供了一个试点研究的结果,显示了分类准确性的显着改善,表明了一个有前途的研究方向。[1804.10167v1]

 

通过GAN进行零视频分类的可视化数据综合

Chenrui Zhang, Yuxin Peng

视频分类中的零点学习(ZSL)是一个有前途的研究方向,旨在应对视频类别爆炸性增长带来的挑战。大多数现有的方法通过学习视觉和语义空间之间的投影来利用看不见的相关性。然而,这种基于投影的范式不能充分利用数据分布中隐含的区分信息,而且常常遭受由异质性差距引起的信息退化问题。在本文中,我们通过GAN提出了一个可视化数据合成框架来解决这些问题。具体而言,利用语义知识和视觉分布来合成未见类别的视频特征,并将ZSL转化为具有综合特征的典型监督问题。第一,我们提出了多层次的语义推理来促进视频特征合成,它通过特征级别和标签级别语义推断来捕获联合视觉语义分布中隐含的区分信息。其次,我们提出匹配感知互信息相关来克服信息降级问题,该问题通过互信息捕获匹配和不匹配视觉语义对中的看不见的相关性,为零炮合成过程提供鲁棒的引导信号。在四个视频数据集上的实验结果表明,我们的方法可以显着提高零镜头视频分类性能。[1804.10073v1] 它通过特征级和标签级语义推断来捕获联合视觉语义分布中隐含的判别性信息。其次,我们提出匹配感知互信息相关来克服信息降级问题,该问题通过互信息捕获匹配和不匹配视觉语义对中的看不见的相关性,为零炮合成过程提供鲁棒的引导信号。在四个视频数据集上的实验结果表明,我们的方法可以显着提高零镜头视频分类性能。[1804.10073v1] 它通过特征级和标签级语义推断来捕获联合视觉语义分布中隐含的判别性信息。其次,我们提出匹配感知互信息相关来克服信息降级问题,该问题通过互信息捕获匹配和不匹配视觉语义对中的看不见的相关性,为零炮合成过程提供鲁棒的引导信号。在四个视频数据集上的实验结果表明,我们的方法可以显着提高零镜头视频分类性能。[1804.10073v1] 为零点合成程序提供强大的引导信号。在四个视频数据集上的实验结果表明,我们的方法可以显着提高零镜头视频分类性能。[1804.10073v1] 为零点合成程序提供强大的引导信号。在四个视频数据集上的实验结果表明,我们的方法可以显着提高零镜头视频分类性能。[1804.10073v1]

 

用于协同智能的近无损深度特征压缩

Hyomin ChoiIvan V. Bajic

协作智能是通过移动云基础设施高效部署深度神经网络的新范例。通过划分移动设备和云之间的网络,可以分配计算工作量,从而使系统的整体能量和/或延迟最小化。但是,这需要将深度特征数据从移动设备发送到云端以执行推断。在这项工作中,我们研究了深层特征数据与自然图像数据之间的差异,并提出了一种简单而有效的近无损深层特征压缩器。与HEVC-Intra相比,所提出的方法实现了高达5%的比特率降低,甚至更多地针对其他流行的图像编解码器。最后,我们提出了一种用于从云中的压缩深度特征重建输入图像的方法,这可以用来补充深层模型的推论。[1804.09963v1]

 

机器学习管道,用于在神经病学和精神病学中发现基于神经影像的生物标志物

亚历山大·伯恩斯坦,叶夫根尼·Burnaev,叶卡捷琳娜Kondratyeva,斯韦特兰娜Sushchinskaya,马克西姆Sharaev,亚历山大安德列夫,阿列克谢Artemov,长Renat Akzhigitov

我们从神经影像数据中考虑诊断模式识别/分类的问题。我们提出了一个通用的数据分析管道,用于使用各种ML算法和处理工具箱进行脑成像的基于神经影像学的诊断分类问题。我们基于临床和MRI / fMRI数据为患者和健康志愿者发现了用于诊断癫痫和抑郁症的新生物标志物,从而说明了管道应用。[1804.10163v1]

 

神经外科技术领域的推广前景:通过深度学习增强共聚焦激光内窥镜诊断

Mohammadhassan Izadyyazdanabadi,叶甫Belykh,迈克尔·穆尼,詹妮弗Eschbacher,彼得中路,Yezhou阳,马克C. Preul

共聚焦激光内视镜(CLE)是一种先进的光学荧光成像技术,由于它具有亚细胞尺寸分辨率,因此具有提高术中精确度,扩大切除范围和定制恶性浸润性脑肿瘤手术的潜力。在手术过程中手动检查和滚动成千上万的动态图像是费力和费时的。因此,我们应用了深度学习神经网络和计算机视觉的新方法来创建一个模型,可以为病理学家或外科医生的评论选择诊断图像。在这项研究中,我们提出并评估深度学习模型,以便使用手动注释的数据集自动检测诊断CLE神经胶质瘤图像。我们探讨了各种训练制度和集成建模对深度学习预测模型的影响力。诊断CLE图像的组织学特征通过浅层和深层神经激活的可视化来定位。参与者间比较实验的结果证实,深度微调模型的集合与经过训练的神经病理学家建立的基本事实达成了有希望的一致。自动诊断框架选择的速度和精度的显着提高将增强CLE的诊断潜力,改善手术工作流程并融入脑肿瘤手术。这种技术和生物信息学分析有助于提高脑肿瘤治疗的精确度,个性化和可操作性。[1804.09873v1] 诊断CLE图像的组织学特征通过浅层和深层神经激活的可视化来定位。参与者间比较实验的结果证实,深度微调模型的集合与经过训练的神经病理学家建立的基本事实达成了有希望的一致。自动诊断框架选择的速度和精度的显着提高将增强CLE的诊断潜力,改善手术工作流程并融入脑肿瘤手术。这种技术和生物信息学分析有助于提高脑肿瘤治疗的精确度,个性化和可操作性。[1804.09873v1] 诊断CLE图像的组织学特征通过浅层和深层神经激活的可视化来定位。参与者间比较实验的结果证实,深度微调模型的集合与经过训练的神经病理学家建立的基本事实达成了有希望的一致。自动诊断框架选择的速度和精度的显着提高将增强CLE的诊断潜力,改善手术工作流程并融入脑肿瘤手术。这种技术和生物信息学分析有助于提高脑肿瘤治疗的精确度,个性化和可操作性。[1804.09873v1] 参与者间比较实验的结果证实,深度微调模型的集合与经过训练的神经病理学家建立的基本事实达成了有希望的一致。自动诊断框架选择的速度和精度的显着提高将增强CLE的诊断潜力,改善手术工作流程并融入脑肿瘤手术。这种技术和生物信息学分析有助于提高脑肿瘤治疗的精确度,个性化和可操作性。[1804.09873v1] 参与者间比较实验的结果证实,深度微调模型的集合与经过训练的神经病理学家建立的基本事实达成了有希望的一致。自动诊断框架选择的速度和精度的显着提高将增强CLE的诊断潜力,改善手术工作流程并融入脑肿瘤手术。这种技术和生物信息学分析有助于提高脑肿瘤治疗的精确度,个性化和可操作性。[1804.09873v1] 这种技术和生物信息学分析有助于提高脑肿瘤治疗的精确度,个性化和可操作性。[1804.09873v1] 这种技术和生物信息学分析有助于提高脑肿瘤治疗的精确度,个性化和可操作性。[1804.09873v1]

 

使用3D CNNOCT卷强制估算

Nils GessertJens BeringhoffChristoph OtteAlexander Schlaefer

\ textit {功能}评估器械和组织的相互作用力是有意义的,特别是在机器人辅助微创干预期间提供触觉反馈。已经提出了基于外部和综合力传感器的不同方法。这些因摩擦,传感器尺寸和灭菌性而受到阻碍。我们调查了一种新的方法来直接估计来自光学相干断层扫描图像体积的力矢量。\ textit {方法}我们介绍一种新颖的连体3D CNN架构。网络将未变形的参考体积和变形的样本体积作为输入,并输出力矢量的三个分量。我们采用具有瓶颈的深度剩余架构来提高效率。我们将连体方法与使用不同体积和二维投影的方法进行比较。使用机器人设置产生数据以获得用于硅组织幻影以及猪组织的基本真实力矢量。\ textit {结果}当估计力矢量时,我们的方法实现7.7±4.3 mN的平均平均误差。我们的新型Siamese 3D CNN架构胜过单径方法,平均误差为11.59±6.7 mN。此外,与仅处理达到24.38±22.0mN的平均平均误差的表面信息相比,体积数据的使用导致显着更高的性能。基于组织数据集,我们的方法显示出不同主题之间的良好泛化。\结论}我们提出了一种使用光学相干层析成像的新型基于图像的力估计方法。我们说明捕获地下结构的变形大大提高了力估计。当使用术中光学相干断层扫描术时,我们的方法可以提供准确的手术设置力估计值。[1804.10002v1]

 

卷积神经网络的加速器感知修剪

Hyeong-Ju Kang

卷积神经网络在计算机视觉任务中表现出巨大的性能,但是它们过多的权重和操作阻止了它们在嵌入式环境中被采用。其中一个解决方案涉及修剪,其中一些不重要的权重被迫为零。已经提出了许多修剪方案,但主要集中在修剪权重的数量上。之前的修剪方案几乎不考虑ASICFPGA加速器体系结构。当修剪后的网络运行在加速器上时,缺乏架构考虑会导致一些低效率问题,包括内部缓冲区失调和负载不平衡。本文提出了反映加速器体系结构的新修剪方案。在提议的方案中,执行修剪使得对于与同时取得的激活相对应的每个权重组保留相同数量的权重。通过这种方式,修剪方案解决了无效率问题。即使受到约束,所提出的修剪方案也达到了与先前的无约束修剪方案类似的修剪比例,不仅在AlexNetVGG16中,而且在像ResNet这样的最先进的非常深的网络中。此外,所提出的方案在已经修剪通道的细长网络中展现出可比的修剪比率。除了提高以前稀疏加速器的效率外,还将显示所提出的修剪方案可用于减少稀疏加速器的逻辑复杂度。[1804.09862v1] 修剪方案解决了无效率问题。即使受到约束,所提出的修剪方案也达到了与先前的无约束修剪方案类似的修剪比例,不仅在AlexNetVGG16中,而且在像ResNet这样的最先进的非常深的网络中。此外,所提出的方案在已经修剪通道的细长网络中展现出可比的修剪比率。除了提高以前稀疏加速器的效率外,还将显示所提出的修剪方案可用于减少稀疏加速器的逻辑复杂度。[1804.09862v1] 修剪方案解决了无效率问题。即使受到约束,所提出的修剪方案也达到了与先前的无约束修剪方案类似的修剪比例,不仅在AlexNetVGG16中,而且在像ResNet这样的最先进的非常深的网络中。此外,所提出的方案在已经修剪通道的细长网络中展现出可比的修剪比率。除了提高以前稀疏加速器的效率外,还将显示所提出的修剪方案可用于减少稀疏加速器的逻辑复杂度。[1804.09862v1] 所提出的修剪方案的修剪比例类似于之前不受约束的修剪方案,不仅在AlexNetVGG16中,而且在像ResNet这样的最先进的非常深的网络中。此外,所提出的方案在已经修剪通道的细长网络中展现出可比的修剪比率。除了提高以前稀疏加速器的效率外,还将显示所提出的修剪方案可用于减少稀疏加速器的逻辑复杂度。[1804.09862v1] 所提出的修剪方案的修剪比例类似于之前不受约束的修剪方案,不仅在AlexNetVGG16中,而且在像ResNet这样的最先进的非常深的网络中。此外,所提出的方案在已经修剪通道的细长网络中展现出可比的修剪比率。除了提高以前稀疏加速器的效率外,还将显示所提出的修剪方案可用于减少稀疏加速器的逻辑复杂度。[1804.09862v1] 还将显示所提出的修剪方案可以用于减少稀疏加速器的逻辑复杂度。[1804.09862v1] 还将显示所提出的修剪方案可以用于减少稀疏加速器的逻辑复杂度。[1804.09862v1]

 

从个人衣橱推荐衣服

Pongsate TangsengKota YamaguchiTakayuki Okatani

我们考虑为推荐评分时尚服饰,我们假设用户拥有一系列物品,并且我们的目标是为衣柜中的任意物品组合打分。服装分级的挑战在于系统的输入是一包无序且物品大小不同的物品图片。我们建立一个基于深度神经网络的系统,可以采用不同长度的项目并预测分数。我们从流行的时尚分享网站Polyvore收集大量服装,并评估我们的评分系统的表现。我们将模型与随机选择基线进行比较,无论是传统的分类评估还是使用众包平台的人们的判断。分类准确率超过84%,人类注释者匹配率达到91%我们的模型可以可靠地评级服装的质量。我们还在我们的平地机上建立了一套服装推荐器,以展示我们的模型在个人衣橱助理中的实际应用。[1804.09979v1]

 

IamNN:用于高效图像分类的迭代和自适应移动神经网络

Sam LerouxPavlo MolchanovPieter SimoensBart DhoedtThomas BreuelJan Kautz

深度残留网络(ResNets)近期在深度学习方面取得突破。ResNets的核心思想是在图层之间建立快捷连接,使网络更加深入,同时易于优化,避免渐变消失。这些快捷连接具有有趣的副作用,使ResNets的行为与其他典型网络架构不同。在这项工作中,我们使用这些属性来设计基于ResNet但具有参数共享和自适应计算时间的网络。所得到的网络比原始网络小得多,并且可以使计算成本适应输入图像的复杂度。[1804.10123v1]

 

检测追踪有效的人员分析:DetTA管道

Stefan BreuersLucas BeyerUmer Rafi,巴斯蒂安身体

在过去的十年中,很多机器人都被部署在野外,人员检测和跟踪是此类部署的重要组成部分。最重要的是,人们经常需要运行模块来分析人员并提取更高级别的属性,如年龄和性别,或者动态信息,如注视和姿势。后者对于构建一个被动的社交机器人人员交互尤为必要。在本文中,我们将这些组件组合在完全模块化的检测跟踪分析管道中,称为DetTA。我们通过使用一致的轨道ID来对分析模块的观测结果进行时间滤波,在头部和骨骼姿态的例子中研究这种集成的好处,显示出在具有挑战性的真实世界情景中略有改善。我们还研究了所谓的“ 当在移动平台上运行许多分析组件时,特别是在昂贵的深度学习方法时代,这种见解对于降低功耗和共享宝贵的(GPU)内存尤其重要。[1804.10134v1] 当在移动平台上运行许多分析组件时,特别是在昂贵的深度学习方法时代,这种见解对于降低功耗和共享宝贵的(GPU)内存尤其重要。[1804.10134v1]

 

用于低数据传输学习的胶囊网络

安德鲁GritsevskiyMaksym Korablyov

我们提出了一个基于胶囊网络的体系结构,用于通过少数例子将学习推广到新数据。使用生成和非生成胶囊网络与中间路由,我们能够推广到比类似卷积神经网络快25倍的新信息。我们在multiMNIST数据集上训练网络,缺少一位数字。在网络达到其最大精度后,我们将1-100个缺失数字的例子注入训练集,并测量返回到可比较的准确度所需的批次数。然后我们讨论胶囊网络带来的低数据传输学习的改进,并为胶囊研究提出未来的发展方向。[1804.10172v1]

 

双流双目网络:基于双目图像的精确近场手指检测

Yi Wei, Guijin Wang, Cairong Zhang, Hengkai Guo, Xinghao Chen, Huazhong Yang

指尖检测在人机交互中起着重要作用。先前的作品将双眼图像转换为深度图像。然后使用基于深度的手姿势估计方法来预测指尖的三维位置。与以前的工作不同,我们提出了一个新的框架,名为双流双目网络(TSBnet),直接从双目图像中检测指尖。TSBnet首先共享左右图像低级特征的卷积图层。然后分别提取双流卷积网络中的高层特征。此外,我们添加了一个新层:双目距离测量层,以提高我们模型的性能。为了验证我们的方案,我们构建了一个双目手图像数据集,包含训练集中的约117k对图像和测试集中的10k对图像。我们的方法在我们的测试装置上实现了10.9mm的平均误差,比以前的工作性能要好5.9mm(相对35.1%)。[1804.10160v1]

 

大型EM图像体的联合变形配准:矩阵求解方法

Khaled KhairyGennady DenisovStephan Saalfeld

用于连接组学的大型电子显微镜图像数据集通常由成千上万至数百万个部分重叠的二维图像(图块)组成,在进一步分析之前必须将其注册到连贯的体积中。常见的配准策略是找到相邻和重叠图像对之间的匹配特征,然后使用所谓的解算器程序对最佳图像变形进行数值估计。现有的求解器不适合大数据量,对于小规模图像配准效率不高。在这项工作中,提出了一种高效,准确的基于矩阵的求解方法。构造一个线性系统,将正则化项中的特征对平方距离的最小化与显式约束组合在一起。由于缺乏可靠的正规化先导,我们展示了如何构造一个刚性模型近似用作先验。线性系统通过使用可用的计算机程序来解决,这些计算机程序的性能与我们简要比较的典型注册任务的性能以及未来的扩展授权相关。我们的方法适用于联合对齐267万个图像,超过2亿个点对,并且已经用于成功对齐第一个完整的成年果蝇大脑。[1804.10019v1] 拥有超过2亿个点对,并已用于成功对齐第一个完整的成年果蝇脑。[1804.10019v1] 拥有超过2亿个点对,并已用于成功对齐第一个完整的成年果蝇脑。[1804.10019v1]

 

通过跨模态训练数据生成来增强基于LiDAR的语义标记

Florian PiewakPeter PinggeraManuelSchäferDavid PeterBeate SchwarzNick SchneiderDavid PfeifferMarkus EnzweilerMariusZöllner

移动机器人和自动驾驶车辆依靠多模式传感器设置来感知和理解周围环境。除了摄像头之外,LiDAR传感器是最先进感知系统的核心组件。除了准确的空间感知外,对环境的全面语义理解对于高效安全操作至关重要。在本文中,我们提出了一种叫做LiLaNet的新型深层神经网络体系结构,用于半密集LiDAR数据的点分类,多类语义标注。网络利用3D点云的虚拟图像投影进行有效推理。此外,我们提出了一个自动化的大规模跨模态训练数据生成过程称为Autolabeling,以提高语义标注性能,同时保持低的手动标注努力。所提出的网络体系结构的有效性以及自动数据生成过程在手动注释的地面实况数据集上得到证明。显示LiLaNet的性能明显优于目前用于LiDAR数据的最先进的CNN架构。应用我们自动生成的大规模培训数据,与只通过手动注释数据培训的网络相比,最多可提升14个百分点。[1804.09915v1] 应用我们自动生成的大规模培训数据,与只通过手动注释数据培训的网络相比,最多可提升14个百分点。[1804.09915v1] 应用我们自动生成的大规模培训数据,与只通过手动注释数据培训的网络相比,最多可提升14个百分点。[1804.09915v1]

 

关注病毒性:通过关注机制了解社交媒体视频的流行

Adam BielskiTomasz Trzcinski

预测社交媒体视频发布之前的流行度是一项具有挑战性的任务,主要是由于内容分发网络的复杂性以及此过程中参与的因素数量。由于解决此任务为媒体内容创作者提供了巨大的帮助,因此提出了许多成功的方法来解决机器学习的问题。在这项工作中,我们改变了观点,并假定不仅重要预测的人气,而且更重要的是可以理解个体部分如何影响最终人气分数。为此,我们建议将Grad-CAM可视化方法与软注意机制相结合。我们的初步结果表明,这种方法可以更直观地解释内容对视频流行度的影响,同时在预测准确性方面取得竞争结果。[1804.09949v1]

 

更好更快:通过图形蒸馏实现多个自我监督学习任务的知识转移,用于视频分类

Chenrui Zhang, Yuxin Peng

视频表示学习是分类任务的一个重要问题。最近,出现了一种被称为自监督学习的有前途的无监督范式,它通过解决辅助任务探索了海量数据中蕴含的固有监督信号,用于特征学习。然而,当扩展到视频分类时,这方面的现有方法受到两个限制。首先,他们只关注单个任务,而忽视不同任务特定功能之间的互补性,从而导致视频表现不理想。其次,高计算和内存成本阻碍了它们在现实世界中的应用。在本文中,我们提出了一个基于图的精馏框架来解决这些问题:(1)我们提出了logits图和表示图来传递来自多个自我监督任务的知识,前者通过解决多分配联合匹配问题来提炼分类器级知识,后者从成对的集合表示中提取内部特征知识,以解决不同特征之间异质性的挑战2)采用师生框架的建议可以显着减少教师从教学中学到的冗余,从而形成一个轻量级的学生模型,更有效地解决分类任务。在3个视频数据集上的实验结果验证了我们的提议不仅有助于学习更好的视频表示,还可以压缩模型以加快推断速度。[1804.10069v1] 后者从成对的集合表示中提炼出内部特征知识,以解决不同特征之间异质性的挑战2)采用师生框架的建议可以显着减少教师从教学中学到的冗余,从而形成一个轻量级的学生模型,更有效地解决分类任务。在3个视频数据集上的实验结果验证了我们的提议不仅有助于学习更好的视频表示,还可以压缩模型以加快推断速度。[1804.10069v1] 后者从成对的集合表示中提炼出内部特征知识,以解决不同特征之间异质性的挑战2)采用师生框架的建议可以显着减少教师从教学中学到的冗余,从而形成一个轻量级的学生模型,更有效地解决分类任务。在3个视频数据集上的实验结果验证了我们的提议不仅有助于学习更好的视频表示,还可以压缩模型以加快推断速度。[1804.10069v1] 3个视频数据集上的实验结果验证了我们的提议不仅有助于学习更好的视频表示,还可以压缩模型以加快推断速度。[1804.10069v1] 3个视频数据集上的实验结果验证了我们的提议不仅有助于学习更好的视频表示,还可以压缩模型以加快推断速度。[1804.10069v1]

 

人体动作视频中的深度关键帧检测

Xiang Yan, Syed Zulqarnain Gilani, Hanlin Qin, Mingtao Feng, Liang Zhang, Ajmal Mian

基于人类行为检测视频中的代表性帧非常具有挑战性,因为人类姿势在行动和背景的综合因素。本文解决了这个问题,并将关键帧检测制定为寻找最佳地有助于区分潜在动作类别与所有其他类别的视频帧。为此,我们在视频中引入了一种深度两码流ConvNet,用于学习直接预测关键帧位置的视频。我们的主要想法是使用监督线性判别方法为CNN学习自动生成标记数据。虽然考虑到许多不同的人类活动视频生成培训数据,但受过训练的CNN可以从单个视频预测帧的重要性。我们指定一个新的ConvNet框架,由一个汇总器和鉴别器组成。总结器是一个双流ConvNet,首先捕获视频帧的外观和运动特征,然后对获得的外观和运动特征进行编码以便进行视频表示。鉴别器是一种拟合功能,旨在区分视频中的关键帧和其他关键帧。我们在具有挑战性的人类行为数据集UCF101上进行实验,并证明我们的方法可以高精度地检测关键帧。[1804.10021v1] 鉴别器是一种拟合功能,旨在区分视频中的关键帧和其他关键帧。我们在具有挑战性的人类行为数据集UCF101上进行实验,并证明我们的方法可以高精度地检测关键帧。[1804.10021v1] 鉴别器是一种拟合功能,旨在区分视频中的关键帧和其他关键帧。我们在具有挑战性的人类行为数据集UCF101上进行实验,并证明我们的方法可以高精度地检测关键帧。[1804.10021v1]

 

伪装网:一种野外伪装人脸验证的对比方法

Skand Vishwanath PeriAbhinav Dhall

本文描述了我们在野外伪装面孔(DFW2018年挑战中的方法。这里的任务是验证伪装和冒名顶替者图像中的一个人的身份。鉴于脸部验证任务的重要性,必须在一个通用平台上比较方法。我们的方法基于VGG-face体系结构与基于余弦距离度量的对比损失配对。为了扩大数据集,我们从互联网获取更多数据。实验表明该方法对DFW数据的有效性。我们表明,向带有嘈杂标签的DFW数据集添加额外数据也有助于提高网络的泛化性能。建议的网络在DFW基线上的准确度提高了27.13%。[1804.09669v2]

 

智能ICU试点研究:使用人工智能技术进行自主病人监护

阿尼斯Davoudi,罗希特·库马尔·马尔霍特拉,本杰明Shicken,斯科特·西格尔,赛斯·威廉姆斯,马修·鲁珀特,EMEL Bihorac Tezcan Ozrazgat-Baslanti,帕特里克·泰伊,Bihorac内特,巴黎拉希迪

目前,许多重要的护理指标都是由负担过重的护士重复评估和记录的,例如非语言患者的身体功能或面部疼痛表情。此外,关于患者及其环境的许多重要信息根本不会被捕获,或者以非粒状方式捕获,例如睡眠干扰因素,例如明亮的光线,大声的背景噪音或过度探访。在这项初步研究中,我们研究了使用普适传感技术和人工智能对重症监护病房(ICU)的危重病人及其环境进行自主和粒状监测的可行性。作为一种典型的流行病症,我们还描述了deli妄症和非deli妄症患者及其环境。我们使用可穿戴式传感器,光线和声音传感器,和一台高分辨率照相机收集关于患者及其环境的数据。我们使用深度学习和统计分析来分析收集的数据。我们的系统执行人脸检测,人脸识别,面部动作单元检测,头部姿势检测,面部表情识别,姿势识别,体动记录分析,声压和光水平检测以及访问频率检测。我们能够检测患者的面部(平均精确度(mAP= 0.94),识别患者的面部(mAP = 0.80)和他们的姿势(F1 = 0.94)。我们还发现,deli妄和非deli妄患者的所有面部表情,11个活动特征,白天的访问频率,夜间的访问频率,光照水平和声压水平显着不同(p<0.05 )。总之,我们发现危重病人及其环境的颗粒状和自主监测是可行的,可用于表征危重病护理条件和相关环境因素。[1804.10201v1]

 

渐进式神经网络用于图像分类

Zhi Zhang, Guanghan Ning, Yigang Cen, Yang Li, Zhiqun Zhao, Hao Sun, Zhihai He

现有的深度神经网络的推理结构和计算复杂性一旦被训练,就被固定,并且对于所有测试图像保持相同。然而,实际上,为深度神经网络建立渐进式结构是非常理想的,其能够针对具有不同视觉识别复杂度的图像调整其推理过程和复杂度。在这项工作中,我们为深度神经网络开发了一个集成置信分析和决策策略学习的多阶段渐进结构。这个新的框架由一系列网络单元组成,以顺序方式激活,逐渐增加复杂性和视觉识别能力。我们在CIFAR-10ImageNet数据集上的广泛实验结果表明,所提出的渐进深度神经网络能够获得10倍以上的复杂度可扩展性,同时使用满足不同复杂度的单一网络模型实现最先进的性能,精度要求。[1804.09803v1]

 

运动融合帧:手势识别的数据级融合策略

OkanKöpüklüNeslihanKöseGerhard Rigoll

获取动作的时空状态是动作分类的最关键步骤。在本文中,我们提出了一种数据级融合策略,即运动融合帧(MFFs),其设计为将运动信息融合为静态图像,以更好地表示动作的时空状态。通过对网络进行很少的修改,MFF可以用作任何深度学习体系结构的输入。我们使用三个视频数据集 – JesterChaLearn LAP IsoGDNVIDIA动态手势数据集评估手势识别任务的MFF,这些数据集要求捕获手部运动的长期时间关系。我们的方法在JesterChaLearn基准测试中获得了非常具有竞争力的性能,分类准确率分别为96.28%和57.4%,同时获得了84分的最新性能。NVIDIA基准测试的准确率为7%。[1804.07187v2]

 

深部热位图对部分遮挡的三维物体姿态估计具有鲁棒性

Markus OberwegerMahdi RadVincent Lepetit

我们引入了一种新颖的方法,用于在大遮挡下从单色图像中进行稳健和准确的三维物体姿态估计。在最近的方法之后,我们首先预测与目标对象相关的3D点的二维重新投影,然后使用几何方法从这些对应关系计算三维姿态。不幸的是,正如我们的实验所表明的那样,使用常规CNN或卷积姿态机来预测这些2D重投影对部分遮挡非常敏感,即使这些方法是用部分遮挡的例子训练的。我们的解决方案是独立预测来自多个小块的热图,并累积结果以获得准确和可靠的预测结果。随后训练变得具有挑战性,因为具有类似外观但对象上的不同位置的贴片对应于不同的热图。但是,我们提供了一个简单而有效的解决方案来处理这种模糊问题。我们表明,我们的方法在两个具有挑战性的数据集上的性能优于现有方法:Occluded LineMOD数据集和YCB-Video数据集,它们都呈现出高度遮挡物体的混乱场景。项目网站:https//www.tugraz.at/institute/icg/research/team-lepetit/research-projects/robust-object-pose-estimation/ [1804.03959v2]

 

学会注意

Saumya JetleyNicholas A. LordNamhoon LeePhilip HS Torr

我们提出了一个端到端可训练的关注模块,用于为图像分类构建的卷积神经网络(CNN)体系结构。该模块将在CNN流水线的不同阶段形成输入图像的中间表示的2D特征矢量图作为输入,并输出每个图的得分的2D矩阵。标准CNN体系结构通过引入该模块进行修改,并且在约束条件下训练标准CNN体系结构,如由分数矩阵参数化的中间2D特征向量的凸组合必须用于单独分类。通过激励来扩大相关性并抑制不相关或误导,评分因此承担注意力价值的作用。我们的实验观察为此提供了明确的证据:学习的关注地图整齐地突出显示感兴趣的区域,同时抑制背景混乱。因此,所提议的功能能够为图像分类任务引导标准的CNN 系结构,在6个不可见的基准数据集上展现出优越的泛化。在进行二值化时,我们的注意力映射优于其他基于CNN的注意力图,传统显着性图和用于弱监督分割的顶级对象建议,如Object Discovery数据集中所示。我们还证明了对抗对抗攻击的快速梯度符号方法的稳健性。[1804.02391v2] 6个看不见的基准数据集上展现出超强的泛化能力。在进行二值化时,我们的注意力映射优于其他基于CNN的注意力图,传统显着性图和用于弱监督分割的顶级对象建议,如Object Discovery数据集中所示。我们还证明了对抗对抗攻击的快速梯度符号方法的稳健性。[1804.02391v2] 6个看不见的基准数据集上展现出超强的泛化能力。在进行二值化时,我们的注意力映射优于其他基于CNN的注意力图,传统显着性图和用于弱监督分割的顶级对象建议,如Object Discovery数据集中所示。我们还证明了对抗对抗攻击的快速梯度符号方法的稳健性。[1804.02391v2]

 

FastDeRain:使用定向梯度的新型视频雨条去除方法

Tai-Xiang Jiang, Ting-Zhu Huang, Xi-Le Zhao, Liang-Jian Deng, Yao Wang

去除雨带是室外视觉系统中的一个重要问题,最近已经进行了广泛的调查。在本文中,我们提出了一种新颖的视频雨滴去除方法FastDeRain,它充分考虑了梯度区域中雨纹和干净视频的区分特征。具体而言,一方面雨滴沿着雨滴的方向是稀疏和平滑的,而另一方面,干净的视频呈现沿垂直雨滴方向的分段光滑度和沿着时间方向的连续性。这些平滑性和连续性分别导致不同方向梯度域的稀疏分布。因此,我们最小化1$ \ ell_1 $范数来增强潜在雨条的稀疏性,2)单向全变分(TV)正则化器的两个$ \ ell_1 $范数以保证各向异性空间平滑性,以及3)时间方向差分算子的$ \ ell_1 $范数来表征时间连续性。设计了一种基于分裂增广拉格朗日收缩算法(SALSA)的算法来解决所提出的最小化模型。对合成和实际数据进行的实验证明了所提出的方法的有效性和有效性。根据全面的量化绩效评估指标,我们的方法优于其他最先进的方法,尤其是考虑到运行时间。[1803.07487v2] 设计了一种基于分裂增广拉格朗日收缩算法(SALSA)的算法来解决所提出的最小化模型。对合成和实际数据进行的实验证明了所提出的方法的有效性和有效性。根据全面的量化绩效评估指标,我们的方法优于其他最先进的方法,尤其是考虑到运行时间。[1803.07487v2] 设计了一种基于分裂增广拉格朗日收缩算法(SALSA)的算法来解决所提出的最小化模型。对合成和实际数据进行的实验证明了所提出的方法的有效性和有效性。根据全面的量化绩效评估指标,我们的方法优于其他最先进的方法,尤其是考虑到运行时间。[1803.07487v2]

 

具有注意力的LSTM的临时身份识别SSD

Xingyu Chen, Junzhi Yu, Zhengxing Wu

时间对象检测已引起重大关注,但大多数流行的检测方法无法利用视频中丰富的时间信息。最近,已经为视频检测任务开发了许多不同的算法,但是实时在线方法通常是不足的。在本文中,基于注意机制和卷积式长时短时记忆(ConvLSTM),我们提出了一种用于真实世界检测的时间信号镜头检测器(TSSD)。与以前的方法不同,我们的目标是利用ConvLSTM对金字塔特征层次结构进行时间整合,并设计一个包含低层次时间单元和高层次结构(HL-TU)的多尺度特征地图的新结构。此外,我们开发了一个创造性的时间分析单元,即注意力ConvLSTMAC-LSTM),其中时间关注模块专门用于背景抑制和缩放抑制,而ConvLSTM整合了注意力感知功能。关联性损失是为时间一致性而设计的。此外,在线小管分析(OTA)被用于识别。最后,我们的方法在ImageNet VID数据集和2DMOT15数据集上进行评估。对检测和跟踪能力的广泛比较验证了所提出的方法的优越性。因此,开发的TSSD-OTA速度相当快,在检测和跟踪方面实现了整体竞争优势。源代码将可用。[1803.00197v3] 关联性损失是为时间一致性而设计的。此外,在线小管分析(OTA)被用于识别。最后,我们的方法在ImageNet VID数据集和2DMOT15数据集上进行评估。对检测和跟踪能力的广泛比较验证了所提出的方法的优越性。因此,开发的TSSD-OTA速度相当快,在检测和跟踪方面实现了整体竞争优势。源代码将可用。[1803.00197v3] 关联性损失是为时间一致性而设计的。此外,在线小管分析(OTA)被用于识别。最后,我们的方法在ImageNet VID数据集和2DMOT15数据集上进行评估。对检测和跟踪能力的广泛比较验证了所提出的方法的优越性。因此,开发的TSSD-OTA速度相当快,在检测和跟踪方面实现了整体竞争优势。源代码将可用。[1803.00197v3] 开发的TSSD-OTA速度相当快,在检测和跟踪方面实现了全面的竞争表现。源代码将可用。[1803.00197v3] 开发的TSSD-OTA速度相当快,在检测和跟踪方面实现了全面的竞争表现。源代码将可用。[1803.00197v3]

 

使用可视化数据进行精确杂草管理的快速部署分类系统

大卫霍尔,费拉斯Dayoub,特里斯坦佩雷斯,克里斯McCool

在这项工作中,我们展示了一种可快速部署的杂草分类系统,该系统使用可视化数据来启用自动精确除草,而无需事先假定某一领域存在哪些杂草。以前在这方面的工作依赖于事先了解现场杂草种类。这个假设并不总是适用于每个领域,从而限制了基于这种假设的杂草分类系统的使用。在这项工作中,我们避免了这种假设,并引入了一种快速部署的方法,能够在任何领域进行操作,而无需在部署前进行任何杂草物种假设。我们提供了一个三级管道,用于实施我们的杂草分类系统,包括初始现场监测,离线处理和选择性标记以及自动化精确除草。我们方法的关键特点是将植物聚类和选择性标记相结合,这使我们的系统能够在没有以前的杂草种类知识的情况下进行操作。使用现场数据进行测试,我们能够标记比传统完整标签少12.3倍的图像,同时将分类精度仅降低14%。[1801.08613v2]

 

运动轨迹非刚性结构的基准与评估

Sebastian Hoppe Nesgaard JensenAlessio Del BueMads Emil Brix DoestHenrikAanæs

非刚性运动结构(NRSfM)是计算机视觉中一个长期存在的核心问题,它允许我们在场景动态时从多个图像中获取3D信息。关于这一重要计算机视觉主题的进一步发展的一个主要问题是缺乏高质量的数据集。我们在这里通过提供为此目的编制的数据集来解决这个问题,该数据集已公开发布,并且比先前的技术水平大得多。为了验证此数据集的适用性,并提供和调查NRSfM的最新技术状况,包括潜在的发展方向,我们在这里提供一个基准和一个严格的评估使用这个数据集。这个基准测试使用可用的代码评估16种不同的方法,我们认为它合理地涵盖了NRSfM的最新技术。我们也希望,提供的和公开的数据集和评估将为这一领域的进一步发展提供基准工具。[1801.08388v2]

 

从单个编码图像学习光场重建

Anil Kumar VadathyaSaikiran CholletiGautham RamajayamVijayalakshmi KanchanaKaushik Mitra

光场成像是代表我们周围3D世界的丰富方式。然而,由于有限的传感器分辨率捕获光场数据固有地构成空间角分辨率的折衷。在本文中,我们提出了一个基于深度学习的解决方案来解决分辨率的权衡问题。具体而言,我们从单个编码图像重建完整的传感器分辨率光场。我们建议在三个阶段完成1)从编码图像重建中心视图2)根据编码图像和中心视图估计视差图3)使用视差产生光场的变形中心视图。我们为这些阶段提出三个神经网络。我们的视差估计网络以无监督的方式进行训练,减轻了对地面真实性差异的需求。我们的结果表明更好地从编码图像恢复视差。此外,我们比基于字典学习的方法在定性和定量方面获得更好的结果。[1801.06710v2]

 

CM-GANs:用于公共表示学习的跨模态生成敌对网络

Yuxin Peng, Jinwei Qi, Yuxin Yuan

众所周知,不同形式(如图像和文本)的不一致分布和表示会导致异质性差距,这使得将这些异构数据关联起来具有挑战性。生成对抗网络(GANs)已经显示出其强大的数据分布建模能力和学习歧视性表示的能力,现有的基于GAN的作品主要关注生成问题以生成新数据。我们有着不同的目标,旨在通过利用GAN的功能来模拟跨模式联合分布来关联异构数据。因此,我们提出跨模态GAN来学习桥接异质性差距的歧视性共同表示。主要贡献有:(1)提出了跨模态GAN体系结构来模拟不同模态数据的联合分布。在生成模式和区分模式中可以同时探索模态间和模态内相关性。他们两人互相推cross以促进跨模式相关学习。(2)提出了具有权重共享约束的跨模态卷积自编码器,形成生成模型。他们不仅可以利用跨模态相关性来学习常用表示,还可以保留用于捕获每种模式中语义一致性的重构信息。(3)提出了跨模态对抗机制,该机制利用两种判别模式同时进行模态间和模态间的判别。它们可以相互促进,使对抗训练过程中的共同表示更具歧视性。据我们所知,我们提出的CM-GANs方法是第一个利用GAN进行跨模态共同表征学习的方法。为了验证我们提出的跨模态检索范式方法的性能,与3个跨模态数据集上的10个方法相比较,我们进行了实验验证。[1710.05106v2]

 

视觉文本注意驱动的细粒表示学习

Xiangteng He, Yuxin Peng

细粒度图像分类是识别属于同一基本类别的数百个子类别,这是一个非常具有挑战性的任务,因为类似子类别之间的相当微妙的视觉差异。大多数现有方法通常学习部分检测器以发现区分区域以获得更好的性能。然而,并非所有的局部化部件对于分类都是有益的和不可或缺的,并且部件检测器的数量设置严重依赖于先前的知识以及实验结果。众所周知,当我们通过自然语言将图像对象描述为文本时,我们只关注关键特征,很少关注共同特征以及背景区域。这是从人类视觉注意力到文本注意力的非自愿转移,这导致了文本上的注意力告诉我们有多少和哪些部分是有区别性和重要的。因此,自然语言描述的文本注意可以帮助我们发现图像中的视觉注意力。受此启发,我们提出了一种视觉文本注意力驱动的细粒度表示学习(VTA)方法,其主要贡献如下:(1)细粒度视觉文本模式挖掘致力于发现区分性视觉文本配对信息以提升通过将视觉和文本与生成对抗网络(GAN)联合建模来进行分类,其自动且自适应地发现区分性部分。(2)视觉文本表征学习共同结合视觉和文字信息,其保留了模态内和模态间信息以生成互补的细粒度表示,并且进一步改善了分类性能。对两个广泛使用的数据集进行的实验证明了我们的VTA方法的有效性,该方法实现了最佳的分类准确性。[1709.00340v2]

 

半密集SLAM的增量3D线段提取

Shida He, Xuebin Qin, Zichen Zhang, Martin Jagersand

虽然半稠密同时定位和映射(SLAM)在过去几年中变得越来越流行,但缺乏用于表示和处理其大规模点云的有效方法。在本文中,我们建议使用3D线段来简化半密集SLAM生成的点云。具体而言,我们提出了一种新的3D线段提取增量方法。这种方法将3D线段拟合问题减少为两个2D线段拟合问题,并利用图像和深度图。在我们的方法中,通过使两个平面上的拟合误差最小化,3D线段被沿着检测到的边缘段递增地拟合。通过对检测到的线段进行聚类,所得到的场景的3D表示在紧凑性和完整性之间实现了良好的平衡。我们的实验结果表明,我们的方法生成的3D线段高度准确。作为应用,我们证明,与基于特征点的基线相比,这些线段极大地提高了三维表面重建的质量。[1708.03275v3]

 

Patchnet:用于图像分类的可解释的神经网络

Adityanarayanan RadhakrishnanCharles DurhamAli SoylemezogluCaroline Uhler

了解复杂的机器学习模型如何进行分类决策对于其在诸如医疗保健等敏感领域的接受程度至关重要。在某些情况下,使用从整个图像导出的特征(即全局图像上下文)可能会导致模型根据不正确的原因做出正确的分类决策。为了解决这个问题,我们提出了PatchNet,一种在限制全局图像上下文和分类错误之间提供折衷的方法。我们使用PatchNet在数学上分析了这种权衡,展示了我们的方法如何让我们构建学习功能的锐利视觉热图表示,并通过将PatchNet应用于从描述性纹理数据集(DTD),小鼠与人细胞核,正常与纤维囊性细胞核以及良性与恶性皮肤的裂缝与穿孔纹理的分类中定量比较这些特征与领域专家选择的特征如何一致来自ISBI-ISIC 2017黑色素瘤分类挑战的病灶。[1705.08078v2]

 

随机形状分析的几何框架

Alexis ArnaudonDarryl D. HolmStefan Sommer

我们引入微分同胚的随机模型,其对各种数据类型的作用下降到形状,图像和地标的随机演化。在矢量场中引入随机性,该矢量场用于形状分析和图像配准中的大变形微分形貌度量映射(LDDMM)框架中的数据传输。因此随机性模拟了在遵循规定的变形速度时流动的误差或不确定性。在有限维地标流形的例子中说明了这种方法,通过Fokker-Planck方程和数值模拟研究了随机变化。我们推导出两种从离散时间点处观察到的界标配置推断随机模型参数的方法。两种方法中的第一种方法将Fokker-Planck方程的矩与数据的矩采样匹配,而第二种方法使用基于期望最大化的算法,使用蒙特卡罗桥采样方案来优化数据可能性。我们推导和数值检验两种方法推断潜在噪声空间相关长度的能力。[1703.09971v2]

转载请注明:《FastDeRain:使用定向梯度的新型视频雨条去除方法+功能磁共振成像:预处理,分类和模式识别

发表评论