CV日报

 

 

今日推荐:

[1].由CMU、FAIR、UIUC一起研究的视觉导航问题,涉及到在未知环境中导航到目标图像指示的位置,所提出的方法可有效解决长距离导航问题,并与之前方法相比,提高50%。

链接:https://w.url.cn/s/AtKIGFQ

 

[2].英伟达的最新研究GameGAN是一个基于50,000集PAC-MAN剧集训练出来的生成式对抗性网络,它可以在没有底层游戏引擎的情况下产生一个功能齐全的点阵式经典版本。

链接:https://mp.weixin.qq.com/s/jBj9c6zniplNWZtM8RlnSA

[3].鱼眼镜头视野广阔,但也带来了目标方向不一的问题,波士顿大学提出的新方法在三个相关数据集上打败了之前的最好方法,并开放了代码和数据集。

RAPiD源代码可用于非商业用途。

链接:https://w.url.cn/s/AEG28ih

 

 

[4].约翰霍普金斯大学的学者提出一种针对遮挡情况的上下文感知的目标检测,大幅改进了精度。相对于Faster R-CNN,将PASCAL3D+和MS-COCOCO数据集上的强列遮挡车辆的检测性能分别提高了41%和35%。

链接:https://w.url.cn/s/AEG28ih

 

 

[5].由西安交大提出的一种联合像素级(在图像上进行风格迁移)和特征级(在特征层进行域适应)的对齐框架,用于处理跨数据集的掌纹识别。与基线相比,交叉数据集识别的准确率提高了28.10%,交叉数据集验证的等效误差率(EER)降低了4.69%。

链接:https://w.url.cn/s/AzXfuQl

 

 

[6].’MMF – A modular framework for vision & language multimodal research from Facebook AI Research (FAIR)’

MMF:基于PyTorch的视觉/语言研究模块化框架,可方便进行VQA、图像描述、视觉对话、仇恨检测和其他视觉/语言任务的研究

Facebook Research

GitHub:https://github.com/facebookresearch/mmf

 

 

[7].Tesseract OCR: Text localization and detection by Adrian Rosebrock

链接:https://w.url.cn/s/A4DULdx

转载请注明:《CV日报