谷歌、DeepMind和OpenAI都在用的Transformer是如何工作的？| 干货 - SegmentFault 思否

谷歌、DeepMind和OpenAI都在用的Transformer是如何工作的？| 干货

发布于 2019-03-16

要说当前人工智能研究中哪个架构最火，Transformer绝对能占其一。

不论是各处霸榜的谷歌BERT、OpenAI最近的强大NLP模型GPT-2，还是DeepMind击败星际2顶尖职业玩家的AlphaStar，背后都有 Transformer的身影。

那么，它是如何工作的？

最近，毕业于MIT的开发者Giuliano Giacaglia发表了一篇博客文章，通过动画图解的形式，解读了 Transformer的工作原理，对于想要了解相关内容的人来说，是一篇不错的入门文章。

谷歌、DeepMind和OpenAI都在用的Transformer是如何工作的？| 干货

https://mp.weixin.qq.com/s/yjPQyTevsHRlQudTbrk8Ig

阅读 565

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。