谷歌、DeepMind和OpenAI都在用的Transformer是如何工作的?| 干货

要说当前人工智能研究中哪个架构最火,Transformer绝对能占其一。

不论是各处霸榜的谷歌BERT、OpenAI最近的强大NLP模型GPT-2,还是DeepMind击败星际2顶尖职业玩家的AlphaStar,背后都有 Transformer的身影。

那么,它是如何工作的?

最近,毕业于MIT的开发者Giuliano Giacaglia发表了一篇博客文章,通过动画图解的形式,解读了 Transformer的工作原理,对于想要了解相关内容的人来说,是一篇不错的入门文章。

阅读 563
0 条评论