基于生成对抗神经网络的显微镜细胞分割+获胜者真的是最好的吗?对生物医学图像分析竞赛中常见研究实践的批判性分析

深入监督,为视网膜血管分割任务提供附加标签

Yishuo Zhang, Albert C. S. Chung

自动分析视网膜血液图像对于视网膜病变的诊断任务至关重要。准确分割血管是分析视网膜图像的基本步骤。然而,由于各种成像条件,低图像对比度以及诸如微动脉瘤等病变的出现,通常是困难的。在本文中,我们提出了一种新的深度神经网络方法来解决这个问题。我们利用剩余连接的U-Net来检测船只。为了获得更好的准确性,我们引入了边缘感知机制,其中我们通过在边界区域添加附加标签将原始任务转换为多任务任务。这样,网络将更加关注船舶的边界区域,并取得更好的性能,特别是在小型船舶检测中。除了,应用侧输出层以便给予深度监督,并因此有助于收敛。我们在三个数据库上训练和评估我们的模型:DRIVESTARECHASEDB1。实验结果表明,我们的方法具有与DRIVE上的97.99%的AUC相当的性能以及与最先进的方法相比有效的运行时间。[1806.02132v1]

 

多图表生成曲面建模

Heli Ben HamuHaggai MaronItay KezurerGal AvineriYaron Lipman

本文介绍了一种基于深度神经网络的三维形状生成模型。设计了一种类零零三维形状的新图像(即张量)数据表示。它基于这样的观察:复杂的形状可以通过多个参数化(图表)很好地表示,每个参数集中在形状的不同部分。新的张量数据表示被用作生成对抗网络的输入以用于3D形状生成的任务。三维形状张量表示基于具有形状覆盖性和尺度平移刚性的多图表结构。刻度平移刚度有助于高质量的3D形状学习,并保证独特的重建。多图结构使用三维形状的数据集(具有任意连通性)和它们之间的稀疏对应关系作为输入。我们的算法的输出是一个生成模型,可以学习形状分布,并能够生成新颖的形状,插入形状,并探索生成的形状空间。该方法的有效性证明了解剖形状生成的任务,包括人体和骨(牙齿)形状的生成。[1806.02143v1]

 

PieAPP:通过配对偏好进行感知图像误差评估

Ekta PrashnaniHong CaiYasamin MostofiPradeep Sen

估计图像之间的感知误差的能力在许多应用中是计算机视觉中的重要问题。然而,尽管已经进行了广泛的研究,但是目前还没有能够强有力地预测人类视觉差异的方法。先前的一些方法使用手动编码模型,但它们未能模拟人类视觉系统的复杂性。其他人使用机器学习来训练人标记数据集上的模型,但创建大型高质量数据集非常困难,因为人们无法为扭曲图像分配一致的错误标签。在本文中,我们提出了一种新的基于学习的方法,它是第一个可以像人类观察者一样预测感知图像错误的方法。由于人们比较两个给定的图像比较容易,并且识别出与参考相比更接近参考的图像,而不是将质量分数分配给每个图像,所以我们提出了新的大规模数据集,其标记有人类将一个图像优先于另一个。然后,我们使用一种新颖的成对学习框架来训练一个深度学习模型,以预测一个扭曲图像相对于另一个扭曲图像的偏好。我们的关键观察结果是,我们的训练网络可以单独使用,只有一个失真的图像和一个参考来预测其感知错误,而不需要在显式的人类感知错误标签上进行训练。我们的新度量PieAPP估计的感知误差与人类意见密切相关。此外,它明显优于现有的算法,在二进制错误率方面,在我们的测试集上击败了近3倍的水平,同时也推广到新的失真类型,这与以前的基于学习的方法不同。[1806.02067v1]

 

深度算法:网络设计

Abhejit RajagopalShivkumar ChandrasekaranHrushikesh N. Mhaskar

介绍了一种以传统算法设计为指导的神经网络设计方法。为了证明我们的观点,我们提出了两种启发式算法,并演示了一种将附加权重合并到其信号流图中的算法技术。我们表明,通过训练,这些网络的性能不仅可以超过初始网络的性能,而且可以匹配更传统的神经网络体系结构的性能。我们方法的一个关键特征是这些网络的初始化参数为给定任务上的架构提供了已知的性能阈值。[1806.02003v1]

 

余弦嵌入和循环沙漏网络的实例分割和跟踪

Christian PayerDarko SternThomas NeffHorst BischofMartin Urschler

与语义分割不同,实例分段为同一类的每个单独实例分配唯一标签。在这项工作中,我们提出了一种新颖的循环全卷积网络架构,用于跟踪这些实例分段随着时间的推移。网络体系结构将卷积门控循环单元(ConvGRU)合并到堆叠沙漏网络中以利用时间视频信息。此外,我们使用基于余弦相似性的新颖嵌入损失来训练网络,以便网络能够预测整个视频中每个实例的唯一嵌入。之后,这些嵌入在后续视频帧中聚集,以创建最终跟踪的实例分段。我们通过分割心脏的MR视频中的左心室来评估经常性沙漏网络,它的性能优于不包含视频信息的网络。此外,我们还展示了在植物静止图像上分割叶子实例的余弦嵌入损失的适用性。最后,我们评估了ISBI细胞追踪挑战的六个数据集上的实例分割和追踪框架,并显示了最先进的性能。[1806.02070v1]

 

TextRay:挖掘临床报告以获得对胸部X射线的广泛理解

Jonathan LasersonChristine Dan LantsmanMichal Cohen-SfadyItamar TamirEli GozChen BrestelShir BarMaya AtarEldad Elnekave

胸部X射线(CXR)是迄今为止最常用的用于筛查和诊断许多心脏和肺部疾病的放射学检查。世界范围内医生数量巨大,缺乏能够提供快速准确解释的研究。由超过200万个CXR报告的放射科医生驱动的分析产生了一个本体论,包括CXR40种最流行的病理学。通过手动标记一组相对较少的句子,我们能够构建一套959k研究的训练集。训练了一个深度学习模型,以预测患者正面和侧面扫描的结果。对于12项研究结果,我们将模型性能与一组放射科医师进行比较,结果显示在大多数情况下,放射科医师平均更多地使用算法而不是使用其他算法。[1806.02121v1]

 

无监督注意引导图像到图像翻译

Youssef A. MejjatiChristian RichardtJames TompkinDarren CoskerKwang In Kim

当前无监督的图像到图像转换技术努力将注意力集中在单个对象上而不改变背景或多个对象在场景内交互的方式。受到注意力在人类感知中的重要作用的驱动,我们通过引入无监督的注意机制来解决这一局限性,这些注意机制与发电机和鉴别器联合进行对抗训练。我们从质量和数量上证明,我们的方法能够在不需要监督的情况下关注图像中的相关区域,并且通过这样做可以实现与最近方法相比更现实的映射。[1806.02311v1]

 

特发性脊柱侧凸前路椎体生长调节手术的时空流形预测模型

William MandelOlivier TurcotDejan KnezStefan ParentSamuel Kadoury

前部椎体生长调节(AVBGM)是一种微创手术技术,可在保持腰部运动的同时逐渐矫正脊柱畸形。然而,潜在手术患者的选择目前基于临床判断,并且将通过在手术之前识别对AVBGM作出反应的患者来促进。我们引入了统计框架来预测特发性脊柱侧凸青少年AVBGM后的手术结果。首先构建一个判别歧管,以最大化AVBGM治疗脊柱侧凸患者的应答组和非应答组间的分离度。该模型然后使用基于关节变换的受试者特定的校正轨迹,以便将脊柱校正轮廓映射到群平均分段测地线路径。脊柱校正轨迹以分段测地方式描述,以解释随访检查的不同时间,通过二次优化过程对曲线进行回归。为了预测校正的演变,将基线重建投影到流形上,从中根据相邻示例推断的平行传输曲线从中建立时空回归模型。该模型接受了438次重建的训练,并使用后续检查中的三维脊柱重建对56名受试者进行了测试,其中概率框架得出准确结果,主曲线角度差异为2.1 +/- 0.6deg,并生成类似于生物力学模拟的模型。[1806.02285v1] 通过二次优化过程对曲线进行回归。为了预测校正的演变,将基线重建投影到流形上,从中根据相邻示例推断的平行传输曲线从中建立时空回归模型。该模型接受了438次重建的训练,并使用后续检查中的三维脊柱重建对56名受试者进行了测试,其中概率框架得出准确结果,主曲线角度差异为2.1 +/- 0.6deg,并生成类似于生物力学模拟的模型。[1806.02285v1] 通过二次优化过程对曲线进行回归。为了预测校正的演变,将基线重建投影到流形上,从中根据相邻示例推断的平行传输曲线从中建立时空回归模型。该模型接受了438次重建的训练,并使用后续检查中的三维脊柱重建对56名受试者进行了测试,其中概率框架得出准确结果,主曲线角度差异为2.1 +/- 0.6deg,并生成类似于生物力学模拟的模型。[1806.02285v1] 该模型接受了438次重建的训练,并使用后续检查中的三维脊柱重建对56名受试者进行了测试,其中概率框架得出准确结果,主曲线角度差异为2.1 +/- 0.6deg,并生成类似于生物力学模拟的模型。[1806.02285v1] 该模型接受了438次重建的训练,并使用后续检查中的三维脊柱重建对56名受试者进行了测试,其中概率框架得出准确结果,主曲线角度差异为2.1 +/- 0.6deg,并生成类似于生物力学模拟的模型。[1806.02285v1]

 

自适应特征重组和重新校准用于语义分割:在MRI中应用于脑肿瘤分割

塞尔吉奥佩雷拉,维克多阿尔维斯,卡洛斯A.席尔瓦

卷积神经网络(CNN)已成功用于脑肿瘤分割,特别是完全卷积网络(FCNs)。FCN可以一次分割一组体素,在给定位置的特征映射(FM)中的单位与相应的分类体素之间具有直接的空间对应关系。在卷积层中,FM被合并以创建新的FM,因此,通道组合是至关重要的。但是,并不是所有的FM对于给定的类都具有相同的相关性。最近,在分类问题中,已提出挤压与激励(SE)块来重新校准整体FM,并抑制较少信息的FM。然而,由于单位和体素之间的空间对应关系,这在FCN中并不是最佳的。在这篇文章中,我们通过线性扩展和压缩来提出特征重组,以创建用于语义分割的更复杂的特征。此外,我们还提出了一个分割SESegSE)块,用于特征重新校准,收集上下文信息,同时保持空间含义。最后,我们使用公开可用的数据评估所提出的脑肿瘤分割方法。[1806.02318v1]

 

通过分解透视窥视卷积神经网络的隐藏层

Uday Singh SainiEvangelos E. Papalexakis

尽管它们在各种监督学习问题中越来越受欢迎并取得了成功,但深层神经网络非常难以解释和调试:已知和已经过训练的深神经网络和一组测试输入,我们如何能够洞察这些输入如何相互作用与神经网络的不同层次?此外,我们能否基于它在不同输入上观察到的行为来表征给定的深度神经网络?在本文中,我们提出了一种新的基于因子分解的方法来理解不同的深度神经网络如何操作。在我们的初步结果中,我们确定了将分解等级(通常用作衡量无监督数据分析中的兴趣度的指标)与深度网络训练有多好或差的迷人模式。最后,我们提出的方法可以帮助提供关于高层次的视觉洞察力。网络输入的可解释模式在深层网络的隐藏层内运行。[1806.02012v1]

 

婴幼儿3D转子颅内侧脑室扩张

Marc-Antoine BoucherSarah LippeAmelie DamphousseRamy El-JalboutSamuel Kadoury

超声波(美国)可以用来评估新生儿的大脑发育,因为MRI由于固定问题而具有挑战性,并且可能需要镇静。脑部侧脑室扩张是婴儿神经发育结局较差的危险因素。因此,3D US能够评估类似于临床标准MRI的侧脑室体积,但手动分割耗时。这项研究的目的是开发一种方法量化使用3D美国,可以评估macrocephaly的严重程度的侧脑室扩张相对于总脑容量的比例。使用用于US-MRI融合的局部线性相关度量的多图集可变形配准方法实现了侧脑室的自动分割,接着是使用可变形网格模型的精化步骤。使用3D椭球建模方法估计总脑容量。对1228.5个月的婴儿进行验证,其中3D USMRI用于比较脑容量和分段侧脑室。与美国3D US自动提取的体积显示高度相关性,与地面真实测量值相比无统计学显着差异。与MRI相比,体积比率的差异为6.0 +/- 4.8%,而侧向心室分割产生70.8 +/- 3.6%的平均Dice系数和0.88 +/- 0.2mm的平均绝对距离(MAD),证明了临床这个工具在小儿超声中的好处。[1806.02305v1] 1228.5个月的婴儿进行验证,其中3D USMRI用于比较脑容量和分段侧脑室。与美国3D US自动提取的体积显示高度相关性,与地面真实测量值相比无统计学显着差异。与MRI相比,体积比率的差异为6.0 +/- 4.8%,而侧向心室分割产生70.8 +/- 3.6%的平均Dice系数和0.88 +/- 0.2mm的平均绝对距离(MAD),证明了临床这个工具在小儿超声中的好处。[1806.02305v1] 1228.5个月的婴儿进行验证,其中3D USMRI用于比较脑容量和分段侧脑室。与美国3D US自动提取的体积显示高度相关性,与地面真实测量值相比无统计学显着差异。与MRI相比,体积比率的差异为6.0 +/- 4.8%,而侧向心室分割产生70.8 +/- 3.6%的平均Dice系数和0.88 +/- 0.2mm的平均绝对距离(MAD),证明了临床这个工具在小儿超声中的好处。[1806.02305v1] 与美国3D US自动提取的体积显示高度相关性,与地面真实测量值相比无统计学显着差异。与MRI相比,体积比率的差异为6.0 +/- 4.8%,而侧向心室分割产生70.8 +/- 3.6%的平均Dice系数和0.88 +/- 0.2mm的平均绝对距离(MAD),证明了临床这个工具在小儿超声中的好处。[1806.02305v1] 与美国3D US自动提取的体积显示高度相关性,与地面真实测量值相比无统计学显着差异。与MRI相比,体积比率的差异为6.0 +/- 4.8%,而侧向心室分割产生70.8 +/- 3.6%的平均Dice系数和0.88 +/- 0.2mm的平均绝对距离(MAD),证明了临床这个工具在小儿超声中的好处。[1806.02305v1]

 

自适应相似性和空间正则化的归一化切割

Faqiang Wang, Cuicui Zhao, Jun Liu, Haiyang Huang

在本文中,我们提出了一个具有空间正则化优先级和自适应相似度矩阵的归一化切割分割算法。我们将统计中众所周知的期望最大值(EM)方法和偏微分方程(PDE)方法中的正则化技术整合到归一化切割(Ncut)中。引入的EM技术使得我们的方法能够自适应地更新相似度矩阵,这有助于我们获得比经典Ncut方法更好的分类准则。正则化的优先级可以保证所提出的算法在噪声下具有较强的性能。为了统一三种完全不同的方法,包括EM,空间正则化和谱图聚类,我们建立了一个变分框架来组合它们并得到一个通用的归一化分割分割算法。本文还给出了所提出模型的明确理论。与传统的Ncut算法和基于变分的Chan-Vese模型等现有的谱聚类方法相比,数值实验表明,该方法可以实现有前景的分割性能。[1806.01977v1]

 

使用轻量级多任务CNN的无约束脸部图像联合估计年龄和性别的移动应用程序

Jia-Hong Lee, Yi-Ming Chan, Ting-Yen Chen, Chu-Song Chen

基于不受限制的图像的自动年龄和性别分类已成为移动设备的基本技术。由于计算能力有限,如何开发一个强大的系统成为一项艰巨的任务。在本文中,我们提出了一种高效的卷积神经网络(CNN),称为轻量级多任务CNN,用于同时年龄和性别分类。轻量级多任务CNN使用深度可分离卷积来减少模型大小并节省推理时间。在公共挑战Adience数据集上,年龄和性别分类的准确性优于基线多任务CNN方法。[1806.02023v1]

 

学习图形连接的深血管分割

Seung Yeon ShinSoochahn LeeIl Dong YunKyoung Mu Lee

我们提出了一种新的基于深度学习的血管分割系统。使用CNN的现有方法主要依赖于在常规图像网格上学习的局部外观,而不考虑血管形状的图形结构。为了解决这个问题,我们将一个图卷积网络结合到一个统一的CNN架构中,最终的分割是通过组合不同类型的特征来推断的。所提出的方法可以用于扩展任何类型的基于CNN的血管分割方法以提高性能。实验表明,所提出的方法在两个视网膜图像数据集以及冠状动脉X射线血管造影数据集上优于当前最先进的方法。[1806.02279v1]

 

用于腹部多器官分割的三维全卷积网络的多尺度金字塔

霍尔格R.罗斯,称身,小田裕久,杉野隆明正弘小田,林雄一郎,三泽十成,森健作

深度学习的最新进展,如3D全卷积网络(FCNs),已经改进了医学图像密集语义分割的最新技术。然而,大多数网络架构都需要严格的下采样或裁剪图像,以满足当今GPU卡的内存限制,同时仍然考虑图像中足够的上下文以进行精确分割。在这项工作中,我们提出了一种新颖的方法,利用自动上下文在堆叠3D FCN的多尺度金字塔中以更高分辨率执行语义分割。我们在来自胃手术的377张临床CT图像的手动标注的腹部器官和血管的数据集上训练和验证我们的模型,并且实现有希望的结果,平均接近90%的骰子评分。为了进一步评估,我们对来自不同来源的数据集进行单独测试并取得竞争结果,说明模型和方法的稳健性。[1806.02237v1]

 

PointFlowNet:从点云学习三维场景流量估计的表示

Aseem BehlDespoina PaschalidouSimon GivenAndreas Geiger

尽管基于图像的3D场景流量估计取得了重大进展,但这些方法的性能尚未达到许多应用程序所要求的保真度。同时,这些应用通常不限于基于图像的估计:激光扫描仪提供了一种传统相机的流行替代方案,例如在自动驾驶汽车的情况下,因为它们直接产生3D点云。在本文中,我们提出使用深度神经网络从这种非结构化点云中估计三维场景流。在单次正向通道中,我们的模型共同预测场景中的三维场景流以及物体的三维边界框和刚体运动。尽管从非结构化点云估计3D场景流的前景看好,但这也是一项具有挑战性的任务。我们表明,刚体运动的传统全局表示禁止CNN推理,并提出一个翻译等变表示法来规避这个问题。为了训练我们的深层网络,需要大型数据集。正因为如此,我们用虚拟物体增强KITTI的实际扫描,真实地模拟遮挡和模拟传感器噪声。与传统和基于学习的技术进行彻底比较,凸显了该方法的稳健性。[1806.02170v1] 与传统和基于学习的技术进行彻底比较,凸显了该方法的稳健性。[1806.02170v1] 与传统和基于学习的技术进行彻底比较,凸显了该方法的稳健性。[1806.02170v1]

 

消声正规化:澄清与新解释

Edward T. ReehorstPhilip Schniter

正如RomanoEladMilanfar最近提出的,Denoising正则化(RED)是一种强大的新图像恢复框架,旨在从插入式图像去噪函数中构建显式正则化目标。有证据表明,RED算法确实是最先进的。然而,更仔细的检查表明,显式正则化可能无法解释这些算法的工作。在本文中,我们澄清了Romano等人的表述。只有当降噪器具有对称的雅可比矩阵时,我们才能证明这种对称性不会出现在实际的分解器中,例如非局部均值BM3DTNRDDnCNN。进一步,我们证明非对称降噪函数不能用任何显式正则化函数来模拟。鉴于这些结果,还有一个问题是如何为实际的拒识分子辩护性能良好的RED算法。作为回应,我们提出了一个名为通过降噪进行分数匹配SMD)的新框架,其旨在匹配分数(即,对数先验的梯度),而不是设计正规化器本身。我们还展示了SMD,核密度估计和约束最小均方误差去噪之间的紧密联系。最后,我们提供了对Romano等人提出的RED算法的新解释,并且我们提出了具有更快收敛性的新颖RED算法。[1806.02296v1] 对数先验的梯度)而不是设计调节器本身。我们还展示了SMD,核密度估计和约束最小均方误差去噪之间的紧密联系。最后,我们提供了对Romano等人提出的RED算法的新解释,并且我们提出了具有更快收敛性的新颖RED算法。[1806.02296v1] 对数先验的梯度)而不是设计调节器本身。我们还展示了SMD,核密度估计和约束最小均方误差去噪之间的紧密联系。最后,我们提供了对Romano等人提出的RED算法的新解释,并且我们提出了具有更快收敛性的新颖RED算法。[1806.02296v1]

 

使用深度神经网络的全膝关节成形术中的实时手术工具识别

Moazzem HossainSoichi NishioTakafumi HiranakaSyoji Kobashi

全膝关节置换术(TKA)是缓解膝关节疼痛和改善膝关节炎患者功能的常用外科手术。由于在手术阶段使用不同的手术工具,手术很复杂。实时识别手术工具可以成为简化外科医生手术过程的解决方案。此外,手术中的工具的存在和移动对于识别操作阶段和识别手术工作流程来说是至关重要的信息。因此,本研究提出了一种使用卷积神经网络(CNN)在手术期间识别手术工具的实时系统的开发。佩戴智能眼镜的外科医生可以在手术过程中看到关于工具的重要信息,这可能会减少手术的复杂性。为了评估所提出的方法的性能,我们计算并比较了平均精度(MAP)与快速R-CNN和可变形部件模型(DPM)的最新方法。我们实现了87.6%的mAP,与现有方法相比,效果更好。随着我们提出的方法的进一步改进,它可以成为未来的参考点,也是运营阶段识别的基准。[1806.02031v1]

 

鲁棒结构化多任务多视图稀疏跟踪

Mohammadreza Javanmardi, Xiaojun Qi

稀疏表示是视觉追踪的可行解决方案。在本文中,我们提出了一种结构化的多任务多视图跟踪(SMTMVT)方法,该方法利用粒子滤波框架中的稀疏外观模型跟踪不同挑战下的目标。具体来说,我们从不同视图中提取目标候选人的特征,并通过不同视图模板的线性组合来稀疏地表示它们。与传统的稀疏跟踪器不同,SMTMVT不仅可以共同考虑不同任务与不同视图之间的关系,而且还可以在强大的多任务多视图制定中保留不同视图之间的结构。我们引入一种基于近邻梯度法的数值算法,通过将优化问题分成两个子问题,用闭型解来快速有效地找到稀疏性。针对具有挑战性的图像序列的基准的定性和定量评估都证明了所提议的跟踪器针对各种最先进的跟踪器的优越性能。[1806.01985v1]

 

通过追踪零件快速且准确地进行在线视频对象分割

Jingchun Cheng, Yi-Hsuan Tsai, Wei-Chih Hung, Shengjin Wang, Ming-Hsuan Yang

在线视频对象分割是一项具有挑战性的任务,因为它需要及时和准确地处理图像序列。为了通过视频分割目标对象,已经开发了许多基于CNN的方法,通过在第一帧中严格调整对象掩模,这对于在线应用来说是耗时的。在本文中,我们提出了一种快速准确的视频对象分割算法,一旦接收图像就可以立即开始分割过程。我们首先利用基于部件的跟踪方法来处理具有挑战性的因素,如大变形,遮挡和混乱的背景。基于追踪的零件边界框,我们构建了一个感兴趣区域分割网络来生成零件蒙版。最后,通过将这些对象部分与第一帧中的可视信息进行比较来采用基于相似性的评分函数来细化这些对象部分。我们的方法在DAVIS基准数据集的准确性上优于最先进的算法,同时实现更快的运行时性能。[1806.02323v1]

 

获胜者真的是最好的吗?对生物医学图像分析竞赛中常见研究实践的批判性分析

莉娜麦尔海恩*,马蒂亚斯·艾森曼*安妮卡赖因克,思南Onogur,马科·斯坦科维奇,帕特里克·肖尔茨,塔尔阿尔贝尔,赫尔沃耶Bogunovic,安德鲁P.布拉德利,亚伦Carass,卡罗琳·费尔德曼,亚历杭德罗·F. FRANGI,彼得·全,布拉姆面包车Ginneken,艾伦·汉伯里,卡特琳Honauer,米哈尔Kozubek,贝内特A.兰德曼,基诺月,奥斯卡·迈尔,麦尔斯海恩,比约恩·H. Menze,亨宁米勒,彼得·荷尔,WIRO尼森,纳西尔Rajpoot,格雷戈里C.夏普,Korsuk Sirinukunwattana,孙燕姿SPEIDEL,基督教股票,Danail黄龙云,阿卜杜勒·阿齐兹·塔哈,冯斯希范德Sommen,庆王炜,马克安德烈·韦伯,国炎征,皮埃尔Jannin *安妮特·柯普,刀*

国际挑战已成为验证生物医学图像分析方法的标准。考虑到它们的科学影响,令人惊讶的是,对于与组织挑战有关的常见做法的批判性分析尚未实施。在本文中,我们对目前进行的生物医学图像分析挑战进行了全面分析。我们证明了挑战的重要性,并表明缺乏质量控制会产生严重后果。首先,结果的可重复性和解释通常受到阻碍,因为通常仅提供相关信息的一小部分。其次,算法的等级通常对于诸如用于验证的测试数据,应用的排名方案以及制作参考注释的观察者之类的许多变量不具有鲁棒性。为了克服这些问题,我们推荐最佳实践指南并确定将来要解决的开放式研究问题。[1806.02051v1]

 

探索DenseNet体系结构中的功能重用

安迪赫斯

密集连接的卷积网络(DenseNets)已被证明在图像分类任务上达到了最先进的结果,同时使用比竞争方法更少的参数和计算。由于此体系结构中的每个层都可以完全访问所有先前层的功能图,因此网络不必再重新学习以前有用的功能,从而减轻了消失渐变的问题。在这项工作中,我们探讨了这个问题:为了获得功能重用的好处,在多大程度上需要连接到所有先前的图层?为此,我们引入了局部密集连接的概念,并提出证据表明连通性较低,允许在固定网络容量下增加增长率,可以实现功能的更高效的重用,并在密集架构中实现更高的精度。[1806.01935v1]

 

MILD-Net:结肠组织学图像中腺体实例分割的最小信息损失扩张网络

Simon Graham, Hao Chen, Qi Dou, Pheng-Ann Heng, Nasir Rajpoot

结肠组织病理学图像中腺体形态的分析是确定结肠癌阶段的关键步骤。尽管这项任务非常重要,但手动分割费时费力,并且会受到病理学家之间的主观性的影响。计算病理学的兴起导致了腺体分割的自动化方法的发展,其目的是克服手动分割的挑战。然而,由于腺体外观的巨大变异性和区分某些腺体组织结构和非腺体组织结构的困难,这项任务并非微不足道。此外,在病理实践中,不确定性的度量对诊断决策至关重要。例如,模糊区域可能需要来自许多病理学家的进一步检查。为了应对这些挑战,我们提出了一个完全卷积神经网络,通过在网络中的多个点重新引入原始图像来对抗由最大化引起的信息丢失。我们还使用具有不同扩张速率的空间金字塔池来解决维护和多级聚合。为了结合不确定性,我们在测试时间内引入随机变换,以获得增强的分割结果,同时生成不确定性图,突出显示不明确的区域。我们证明这张图可以用来定义一个不确定性高的预测的度量。拟议的网络在GlaS挑战数据集上获得了最先进的性能,作为MICCAI 2015的一部分,以及第二个独立的结肠直肠腺癌数据集。[1806.01963v1] 我们提出了一个完全卷积神经网络,通过在网络中的多个点重新引入原始图像来对抗由最大化引起的信息丢失。我们还使用具有不同扩张速率的空间金字塔池来解决维护和多级聚合。为了结合不确定性,我们在测试时间内引入随机变换,以获得增强的分割结果,同时生成不确定性图,突出显示不明确的区域。我们证明这张图可以用来定义一个不确定性高的预测的度量。拟议的网络在GlaS挑战数据集上获得了最先进的性能,作为MICCAI 2015的一部分,以及第二个独立的结肠直肠腺癌数据集。[1806.01963v1] 我们提出了一个完全卷积神经网络,通过在网络中的多个点重新引入原始图像来对抗由最大化引起的信息丢失。我们还使用具有不同扩张速率的空间金字塔池来解决维护和多级聚合。为了结合不确定性,我们在测试时间内引入随机变换,以获得增强的分割结果,同时生成不确定性图,突出显示不明确的区域。我们证明这张图可以用来定义一个不确定性高的预测的度量。拟议的网络在GlaS挑战数据集上获得了最先进的性能,作为MICCAI 2015的一部分,以及第二个独立的结肠直肠腺癌数据集。[1806.01963v1] 我们还使用具有不同扩张速率的空间金字塔池来解决维护和多级聚合。为了结合不确定性,我们在测试时间内引入随机变换,以获得增强的分割结果,同时生成不确定性图,突出显示不明确的区域。我们证明这张图可以用来定义一个不确定性高的预测的度量。拟议的网络在GlaS挑战数据集上获得了最先进的性能,作为MICCAI 2015的一部分,以及第二个独立的结肠直肠腺癌数据集。[1806.01963v1] 我们还使用具有不同扩张速率的空间金字塔池来解决维护和多级聚合。为了结合不确定性,我们在测试时间内引入随机变换,以获得增强的分割结果,同时生成不确定性图,突出显示不明确的区域。我们证明这张图可以用来定义一个不确定性高的预测的度量。拟议的网络在GlaS挑战数据集上获得了最先进的性能,作为MICCAI 2015的一部分,以及第二个独立的结肠直肠腺癌数据集。[1806.01963v1] 我们证明这张图可以用来定义一个不确定性高的预测的度量。拟议的网络在GlaS挑战数据集上获得了最先进的性能,作为MICCAI 2015的一部分,以及第二个独立的结肠直肠腺癌数据集。[1806.01963v1] 我们证明这张图可以用来定义一个不确定性高的预测的度量。拟议的网络在GlaS挑战数据集上获得了最先进的性能,作为MICCAI 2015的一部分,以及第二个独立的结肠直肠腺癌数据集。[1806.01963v1]

 

挖掘意义:从视觉到语言,通过多种网络达成共识

Iulia DutaAndrei Liviu NicolicioiuSimion-Vlad BogolinMarius Leordeanu

在计算机视觉,自然语言处理和机器学习的交叉处,将视觉数据描述为自然语言是一项非常具有挑战性的任务。语言远远超出物理对象及其相互作用的描述,并且可以通过多种方式传达相同的抽象概念。它既是关于最高语义层次的内容,也是关于流利形式的内容。在这里我们提出一种通过在多个编码器解码器网络之间达成共识来描述自然语言视频的方法。找到这样一个共识性的语言学描述,它与一个更大的群体共享共同的属性,有更好的机会传达正确的意思。我们提出并培训几种网络架构,并使用不同类型的图像,音频和视频功能。每个模型都会生成自己对输入视频的描述,最好的模型是通过高效的两阶段共识流程来选择的。我们通过在具有挑战性的MSR-VTT数据集上获得最先进的结果来展示我们方法的优势。[1806.01954v1]

 

一个快速最小解算器,用于绝对相机姿态,具有未知焦距和四个平面点的径向失真

Magnus Oskarsson

在本文中,我们提出了一种快速最小求解器,用于从位于一个平面中的四个已知点进行绝对相机姿态估计。我们假设具有未知焦距和未知径向失真的透视相机模型。使用具有一个参数的除法模型来对径向失真进行建模。我们证明这个问题的解决方案可以从单变量六次多项式中找到。这导致了一个非常快速和数字稳定的解算器。[1805.10705v2]

 

学习最小超球能量

Weiyang Liu, Rongmei Lin, Zhen Liu, Lixin Liu, Zhiding Yu, Bo Dai, Le Song

神经网络是一类强大的非线性函数,可以在各种应用程序上进行端对端培训。虽然许多神经网络的过度参数化特性使得适应复杂函数的能力和处理具有挑战性任务的强大代表能力,但它也导致高度相关的神经元,这会伤害泛化能力并招致不必要的计算成本。因此,如何规范网络以避免不必要的表示冗余成为一个重要问题。为此,我们从物理学中一个众所周知的问题–Thomson问题中汲取灵感,在这个问题中,人们试图找到一种状态,尽可能地将N个电子分布在一个单位球上,并且具有最小势能。鉴于这种直觉,我们将冗余正则化问题简化为通用能量最小化,并提出了一个最小超球能量(MHE)目标作为神经网络的一般正则化。我们还提出了一些MHE的新颖变体,并从理论的角度提供了一些见解。最后,我们将具有MHE正则化的网络应用于几项具有挑战性的任务。通过展示MHE正则化的优越性能,大量实验证明了我们方法的有效性。[1805.09298v2] 通过展示MHE正则化的优越性能,大量实验证明了我们方法的有效性。[1805.09298v2] 通过展示MHE正则化的优越性能,大量实验证明了我们方法的有效性。[1805.09298v2]

 

基于反向传播可视化的复杂行为的理论解释

Weili Nie, Yang Zhang, Ankit Patel

已经提出基于反向传播的可视化来解释卷积神经网络(CNN),然而没有理论证明它们的行为是正确的:引导反向传播(GBP)和反卷积网络(DeconvNet)产生更多的人类可解释的但类别敏感的可视化而不是显着性地图。受此启发,我们制定了一个理论解释,揭示GBPDeconvNet本质上是在进行(部分)图像恢复,因此与网络决策无关。具体而言,我们的分析表明,由GBPDeconvNet引入的落后ReLU以及CNN中的本地连接是引人注目的可视化的两个主要原因。提供了支持理论分析的大量实验。[1805.07039v2]

 

快速计算ReLU网络的认证鲁棒性

Tsui-Wei Weng, Huan Zhang, Hongge Chen, Zhao Song, Cho-Jui Hsieh, Duane Boning, Inderjit S. Dhillon, Luca Daniel

验证通用整流线性单元(ReLU)网络的鲁棒性属性是一个NP完全问题[KatzBarrettDillJulian and Kochenderfer CAV17]。虽然找到确切的最小对抗失真很难,但可以给出最小失真的认证下限。计算这种界限的当前可用的方法要么耗时,要么提供低质量的边界,这些边界太松散而无用。在本文中,我们利用ReLU网络的特殊结构,并通过将ReLU单元与适当的线性函数进行约束,提供两种能够证明最小失真的非平凡下界的计算有效的Fast-LinFast-Lip算法Fast-林,或通过限制当地Lipschitz常量快速唇。实验表明:(1)我们提出的方法提供的接近(小间距是2-3X)精确的最小失真由Reluplex在小型MNIST网络中发现,而我们的算法速度提高了10,000倍以上2)与基于求解线性规划问题的方法相比,我们的方法对于较大的网络提供相似的边界质量(差距在35%以内,通常在10%左右;有时我们的边界甚至更好),但我们的算法是33-14,000时间更快3)我们的方法能够在单个CPU核心上在数十秒内解决多达7层的大MNISTCIFAR网络以及10,000多个神经元。另外,我们证明,事实上,没有多项式时间算法可以近似求出$ 0ReLU网络的最小$ \ ell_1 $对抗失真。除非$ \ mathsf {NP} $ = $ \ mathsf {P} $,其中$ n $是网络中神经元的数量。[1804.09699v2]

 

监视人脸识别挑战

Zhiyi Cheng, Xiatian Zhu, Shaogang Gong

人脸识别(FR)是计算机视觉中研究最广泛的问题之一。由于最近引入了更大规模的FR挑战,特别是受限的社交媒体网络图像,例如专业摄影记者拍摄的名人面部高分辨率照片,FR取得了重大进展。然而,无约束和低分辨率监视图像中更具挑战性的FR仍然大部分研究不足。为了促进更多关于开发对于低分辨率监视面部图像有效且鲁 棒的FR模型的研究,我们引入了新的监视人脸识别挑战,我们称之为QMUL-SurvFace基准。这个新的基准是我们最了解的最大,也是更重要的唯一真正的监控FR基准,其中低分辨率图像不是通过对原始高分辨率图像进行人工下采样而合成的。这项挑战包含463,50715,573个不同身份的脸部图像,可在广阔的空间和时间内捕捉到现实世界中不合作的监控场景。因此,它提出了一个极具挑战性的FR基准。我们使用五种具有代表性的深度学习人脸识别模型对FR挑战进行基准测试,并与现有基准进行比较。我们表明,目前的艺术状况还远远不能令人满意,以解决在实际法庭情况下的调查不足的监测FR问题。在监视场景中典型的开放式设置中,人脸识别通常更加困难,由于大量非目标人群(分心者)出现间隔开放的场景。很显然,在新的Surveillance FR Challenge上,MegaFace基准测试中性能卓越的CentreFace深度学习FR模型现在只能以10%的虚警率达到13.2%的成功率(Rank-20)。[1804.09691v5]

 

用于虹膜识别的演示攻击检测:对现有技术的评估

亚当Czajka,凯文W.鲍耶

虹膜识别越来越多地用于大规模应用。因此,虹膜识别的演示文稿攻击检测非常重要。本调查涵盖了有关该主题的各种研究文献。描述不同类别的演示文稿攻击并将其放置在与应用程序相关的框架中,并总结检测每类攻击的现有技术。由此得出的一个结论是,虹膜识别的呈现攻击检测尚未解决。描述可用于研究的数据集,描述近期和中期未来的研究方向以及推荐读物的简短列表。[1804.00194v2]

 

神经网络应足够广泛,以了解断开连接的决策区域

Quynh NguyenMahesh Chandra MukkamalaMatthias Hein

在最近的文献中,强调深度学习在深度学习中的重要作用。在本文中,我们认为前馈网络的足够宽度通过回答关于神经网络决策区域连接条件的简单问题同等重要。事实证明,对于一类激活函数,包括泄漏的ReLU,具有金字塔结构的神经网络,没有层具有比输入维数更多的隐藏单位,产生必然连接的决策区域。这意味着需要足够宽的隐藏层来保证网络可以产生断开的决策区域。我们讨论这个结果对神经网络构建的影响,特别是与分类器对抗操纵问题的关系。[1803

 

使用形状和运动来检测逗号形状的云以进行恶劣天气预报

Xinye Zheng, Jianbo Ye, Yukun Chen, Stephen Wistar, Jia Li, Jose A. Piedra-Fernández, Michael A. Steinberg, James Z. Wang

气象学家利用卫星图像中云的形状和运动作为几种主要类型的严重风暴的指标。卫星虚拟数据的空间和时间分辨率越来越高,因此人类不可能在预测中充分利用数据。自动卫星图像分析方法可以在发现风暴相关云图时尽快找到。我们提出了一种基于机器学习和模式识别的方法来检测卫星图像中的逗号形云,这是与旋风配方强烈相关的特定云分布模式。为了检测具有目标运动模式的区域,我们的方法通过手动注释的云示例进行训练,这些云示例由形状和运动敏感特征表示。使用不同比例的滑动窗口来确保捕捉密集的云,并且我们实施有效的选择规则以缩小这些滑动窗口中的感兴趣区域。最后,我们在持有注释的逗号形云数据集上评估该方法,并将结果与 恶劣天气数据库中记录的风暴事件进行交叉匹配。我们方法验证的效用和准确性表明协助气象学家进行天气预报的潜力很大。[1802.08937v2] 我们在持有注释的逗号形云数据集上评估该方法,并将结果与 恶劣天气数据库中记录的风暴事件进行交叉匹配。我们方法验证的效用和准确性表明协助气象学家进行天气预报的潜力很大。[1802.08937v2] 我们在持有注释的逗号形云数据集上评估该方法,并将结果与 恶劣天气数据库中记录的风暴事件进行交叉匹配。我们方法验证的效用和准确性表明协助气象学家进行天气预报的潜力很大。[1802.08937v2]

 

ScreenerNet:学习深度神经网络的自控课程

Tae-Hoon KimChoong Jonghyun

我们建议通过可附着的深层神经网络(称为ScreenerNet)来学习监督学习和深度强化学习的课程或教学大纲。具体来说,我们通过联合培训ScreenerNet和主网络以端到端的自我节奏的方式学习每个样本的权重。ScreenerNet既没有采样偏差也没有要求记住过去的学习历史。我们展示了使用ScreenerNet增强的网络在使用三种常用视觉数据集(如MNISTCIFAR10Pascal VOC2012)以及Cart-pole任务的广泛实验中使用比最先进的课程学习方法更高的准确性实现了早期收敛深入的Q学习。此外,ScreenerNet可以扩展其他课程学习方法,如优先体验重播(PER)以进一步提高准确性。[1801.00904v4]

 

基于分类的GAN分布协变量研究

Shibani SanturkarLudwig SchmidtAlexanderMądry

在生成敌对网络(GANs)的背景下,一个基本的,仍然很大程度上没有答案的问题是,它们是否真的能够捕捉到他们所接受的分布的所有基本特征。特别是,评估GAN分布的多样性具有挑战性,现有方法只能部分地理解这 个问题。在本文中,我们开发了用于评估GAN分布多样性的量化和可扩展工具。具体而言,我们采用基于分类的视角,并将多样性的损失视为GAN引入的协变变化的一种形式。我们研究了这种转变的两种具体形式:模式崩溃和边界扭曲。与之前的工作相比,我们的方法只需要最少的人工监控,并且可以很容易地应用于大型,规范数据集。使用我们的工具检查流行的GAN表明这些GAN在再现他们的训练数据集的更多分布特性方面具有重大问题。[1711.00970v7]

 

深度CNN的优化景观与表达

Quynh NguyenMatthias Hein

我们分析了具有共享权重和最大池层的实际深度卷积神经网络(CNN)的损失情况和表达性。我们表明,这样的CNN层产生线性独立特征,其具有比训练样本的数量更多的神经元。这个条件适用于VGG网络。此外,我们为全球最低标准提供了如此宽的CNN必要条件和充分条件,并且没有训练错误。对于宽层跟随完全连通层的情况,我们表明几乎经验损失的每个临界点都是具有零训练误差的全局最小值。我们的分析表明深度和宽度在深度学习中非常重要。虽然深度带来更多的代表性力量,并允许网络学习高级功能,宽度平滑了损失函数的优化格局,这是因为足够宽的网络具有良好的损失表面,几乎没有不良的局部最小值。[1710.10928v2]

 

基于生成对抗神经网络的显微镜细胞分割

Assaf ArbelleTammy Riklin Raviv

我们提出了一种新颖的显微图像细胞分割方法,它受到生成敌对神经网络(GAN)方法的启发。我们的框架建立在一对两个竞争人工神经网络上,具有独特的架构,被称为肋骨笼,它们同时训练并一起定义了最小最大游戏,从而得到对给定图像的精确分割。我们的方法有两个主要优势,类似于GAN,该方法不需要为优化过程制定损失函数。这允许以弱监督的方式训练有限数量的注释数据。介绍了真实荧光显微镜数据的有希望的分割结果。代码可在以下网址免费获取:https//github.com/arbellea/DeepCellSeg.git [1709.05860v3]

 

城市场景语义分割的课程领域适应

杨樟,菲利普大卫,哈桑弗洛什,Boging Gong

在过去的五年中,卷积神经网络(CNN)取得了超过语义分割的胜利,这是许多应用程序(如自动驾驶)的核心任务之一。然而,为了培训CNN需要大量的数据,这些数据很难收集并且难以注释。计算机图形学的最新进展使得利用计算机生成的注释在照片般逼真的合成图像上训练CNN成为可能。尽管如此,真实图像和合成数据之间的域不匹配会削弱模型的性能。因此,我们提出了一种课程式的学习方法,以尽量减少城市景观语义分割领域的差距。课程领域适应首先解决简单的任务,以推断关于目标领域的必要属性尤其是,第一项任务是学习全局标签在图像上的分布以及地标超像素上的本地分布。这些都很容易估计,因为城市场景的图像具有强烈的特质(例如建筑物,街道,汽车等的大小和空间关系)。然后,我们训练一个分割网络,同时在目标领域中对其预测进行规范,以遵循那些推断的属性。在实验中,我们的方法胜过两个数据集和两个骨干网络的基线。我们还报告了我们的方法的广泛消融研究。[1707.09465v3] 然后,我们训练一个分割网络,同时在目标领域中对其预测进行规范,以遵循那些推断的属性。在实验中,我们的方法胜过两个数据集和两个骨干网络的基线。我们还报告了我们的方法的广泛消融研究。[1707.09465v3] 然后,我们训练一个分割网络,同时在目标领域中对其预测进行规范,以遵循那些推断的属性。在实验中,我们的方法胜过两个数据集和两个骨干网络的基线。我们还报告了我们的方法的广泛消融研究。[1707.09465v3]

 

预测驾驶员关注的焦点:DR(眼睛)VE项目

Andrea PalazziDavide AbatiSimone CalderaraFrancesco SoleraRita Cucchiara

在这项工作中,我们旨在预测驾驶员关注的焦点。目标是估计一个人在驾驶时会注意什么,以及车辆周围的哪个部分对于该任务更加重要。为此,我们提出了一种基于多分支深度架构的新计算机视觉模型,该架构集成了三种信息源:原始视频,运动和场景语义。我们还介绍DR(眼睛)VE,这是驾驶场景的最大数据集,可以使用眼动追踪注释。该数据集包含超过500,000个注册帧,匹配以自我为中心的视角(来自司机佩戴的眼镜)和以车顶为视角的视角(来自屋顶安装的摄像头),并通过其他传感器测量进一步丰富。结果强调了几种注意模式在司机之间共享,并可以在一定程度上进行复制。在人车交互和驾驶员注意力分析的背景下,场景中哪些元素可能会吸引驾驶员注意力的指示可能会受益。[1705.03854v3]

 

基于局部描述子的非平坦地面检测

Kangru Wang, Lei Qu, Lili Chen, Yuzhang Gu, DongChen zhu, Xiaolin Zhang

道路和自由空间的检测对于非平面平面仍然具有挑战性,特别是随着纬度和纵向斜度的变化或在多地平面的情况下。在本文中,我们提出了一个立体视觉地平面检测框架。本文的主要贡献是在视差图像中实现的新提出的描述符以获得视差纹理图像。在视差纹理图像中可以有效地将接地平面区域与其周围环境区分开来。由于描述符是在图像的局部区域实现的,因此可以很好地解决非平面平面问题。我们还提出了一个基于卷积神经网络结构的基于视差纹理图像检测地平面区域的完整框架。[1609.08436v9]

转载请注明:《基于生成对抗神经网络的显微镜细胞分割+获胜者真的是最好的吗?对生物医学图像分析竞赛中常见研究实践的批判性分析

发表评论