Transformer 视频Transformer自监督预训练新范式,复旦、微软云AI实现视频识别新SOTA(CVPR 2022) 52cv.net2022年4月25日 本文转载自机器之心。 复旦大学、微软 Cloud+AI 的研究者将视频表征学习解耦为空间信息表征学习和时间动态...
Transformer 综述-基于Transformer的视频语言预训练 52cv.net2022年4月18日 作者 | 小马 编辑 | CV君 报道 | 我爱计算机视觉(微信id:aicvml) 1. 论文和代码地址 S...
Transformer 深度好文 ICLR 2022 | cosFormer:重新思考注意力机制中的Softmax 52cv.net2022年3月28日 作者 | 多模态研究组 编辑 | CV君 报道 | 我爱计算机视觉(微信id:aicvml) 导读:Trans...
Transformer 大大刷新记录!Swin Transformer v2.0 来了,30亿参数 52cv.net2022年3月21日 本文转载自 微软研究院AI头条编者按:2021年,获得 ICCV 最佳论文奖的 Swin Transforme...
Transformer TPAMI 2022综述 | 视觉Transformer系统性测评及未来方向探讨 52cv.net2022年2月24日 作者:诺亚方舟实验室 本文转载自诺亚实验室 2021年对计算机视觉来说是非常重要的一年,各个任务的SOTA不断...
Transformer 又一任务被Transformer攻陷!NVIDIA开源HORST,用Transformer解决Early Recognition和Anticipation任务 52cv.net2022年1月25日 作者 | 小马 编辑 | CV君 报道 | 我爱计算机视觉(微信id:aicvml) 【写在前面】 赋予机器强...
Transformer 追求极致速度,极简多模态预训练模型ViLT,推理速度比UNITER快60倍!(ICML2021) 52cv.net2022年1月17日 作者 | 小马 编辑 | CV君 报道 | 我爱计算机视觉(微信id:aicvml) ▊写在前面 视觉和语言预...
Transformer 一个既能做CV任务,也能做NLP任务的Transformer模型!谷歌&UCLA提出统一的基础模型 52cv.net2022年1月6日 作者 | 小马 编辑 | CV君 报道 | 我爱计算机视觉(微信id:aicvml) 【写在前面】 在本文中,...
Transformer 《AFTrans》来自ViT的免费午餐!北大&阿里提出用于细粒度视觉识别的自适应注意多尺度融合Transformer 52cv.net2022年1月4日 作者 | 小马 编辑 | CV君 报道 | 我爱计算机视觉(微信id:aicvml) 【写在前面】 在细粒度视...
Transformer 《SemVLP》单流和双流Transformer哪个好?阿里:我全都要!提出带可插拔模块的Transformer结构 52cv.net2021年12月28日 作者 | 小马 编辑 | CV君 报道 | 我爱计算机视觉(微信id:aicvml) 【写在前面】 大规模图像...