SF
阿里云栖号
阿里云栖号
注册登录
关注博客
注册登录
主页
关于
RSS
MuLTI:高效视频与语言理解
阿里云云栖号
11 分钟前
阅读 8 分钟
多模态理解模型具有广泛的应用,比如多标签分类(Classification)、视频问答(videoQA)和文本视频检索(Retrieval)等。现有的方法已经在视频和语言理解方面取得了重大进展,然而,他们仍然面临两个巨大的挑战:
遍地开花的 Attention ,你真的懂吗?
阿里云云栖号
2019-08-09
阅读 11 分钟
阿里妹导读:曾被 paper 中各种各样的 Attentioin 搞得晕晕乎乎,尽管零零散散地整理过一些关于Attention 的笔记,重点和线索依然比较凌乱。今天,阿里巴巴工程师楠易,将 Attentioin 的知识系统性地梳理、回顾、总结,不求深刻,但求浅显,希望能帮助对 Attention 有疑惑的同学。