CV Code | 本周新出计算机视觉开源代码汇总(南理SGE 和Intel的实时动作识别很吸引人)

 

本周新出的计算机视觉代码不是很多,但都是精品。

出自南理工的空域组增强(SGE)网络结构在图像分类和目标检测任务中均表现出一致的有效性,强烈推荐大家关注。

Intel的实时动作识别看起来很吸引人,已经是达到工业应用级别的成果了!

 

 

空域组增强(SGE),改进卷积网络中语义特征学习,出自南京理工大学。

SGE可以显著改进图像分类任务的性能,在基于ResNet50为骨干网的实验中,SGE取得了在ImageNet数据集上1.2% Top 1精度的改进,另外结合不同的检测算法中(Faster/Mask/Cascade RCNN and RetinaNet)在COCO数据集上均取得了1%-2%精度的提升。

Spatial Group-wise Enhance: Improving Semantic Feature Learning in Convolutional Networks

Xiang Li, Xiaolin Hu, Jian Yang

https://arxiv.org/abs/1905.09646v1

https://github.com/implus/PytorchInsight

 

图神经网络临域扩大

在大量的图分类评测数据集上均达到了state-of-the-art。

Neighborhood Enlargement in Graph Neural Networks

Xinhan Di, Pengqian Yu, Mingchao Sun, Rui Bu

https://arxiv.org/abs/1905.08509v1

https://github.com/CODE-SUBMIT/Neighborhood-Enlargement-in-Graph-Network

 

实时动作识别的轻量级网络架构,来自Intel,相比现有方法取得了很好的速度/精度折中,在CPU上运行达到56fps。

Lightweight Network Architecture for Real-Time Action Recognition

Alexander Kozlov, Vadim Andronov, Yana Gritsenko

https://arxiv.org/abs/1905.08711v1

https://github.com/opencv/openvino_training_extensions/tree/develop/pytorch_toolkit/action_recognition

 

半监督学习| 增广分布对齐方法

在SVHN 与 CIFAR10 数据集上分别取得了新的state-of-the-art,错误率3.54% 、 10.09%。

Semi-Supervised Learning by Augmented Distribution Alignment

Qin Wang, Wen Li, Luc Van Gool

https://arxiv.org/abs/1905.08171v1

https://github.com/qinenergy/adanet

 

图像文本联合建模 | 变分异构编码器随机生成对抗网络

在图像文本多模学习和生成的多个任务中均达到state-of-the-art 性能。

Variational Hetero-Encoder Randomized Generative Adversarial Networks for Joint Image-Text Modeling

Hao Zhang, Bo Chen, Long Tian, Zhengjue Wang, Mingyuan Zhou

https://arxiv.org/abs/1905.08622v1

(代码将开源)

 

基于单幅图像的3D Manhattan 线框重建

只需一幅图像即可完成建筑、家具等物体的3D 结构重建,在设计领域应该很有用。

Learning to Reconstruct 3D Manhattan Wireframes from a Single Image

Yichao Zhou, Haozhi Qi, Yuexiang Zhai, Qi Sun, Zhili Chen, Li-Yi Wei, Yi Ma

https://arxiv.org/abs/1905.07482v1

(代码将开源)

 

ICRA 2019

基于视觉的机械手臂操作任务的机器人学习平台,包含软硬件一体化的整套评测方案。

REPLAB: A Reproducible Low-Cost Arm Benchmark Platform for Robotic Learning

Brian Yang, Jesse Zhang, Vitchyr Pong, Sergey Levine, Dinesh Jayaraman

https://arxiv.org/abs/1905.07447v1

https://sites.google.com/view/replab/

 

更多之前代码汇总:

CV Code | 本周新出计算机视觉开源代码汇总(含语义分割、表情识别、目标跟踪、姿态估计、超分辨率等)

CV Code | 本周新出计算机视觉开源代码汇总(含目标跟踪、语义分割、姿态跟踪、少样本学习等)

CV Code | 本周新出计算机视觉开源代码汇总(含自动驾驶目标检测、医学图像分割、风格迁移、语义分割、目标跟踪等)

转载请注明:《CV Code | 本周新出计算机视觉开源代码汇总(南理SGE 和Intel的实时动作识别很吸引人)