Datawhale

 Datawhale分享 

最新:李沐,来源:量子位

AI大神李沐老师时隔1年多,终于回归B站“填坑”经典论文精读系列了!

没错,最新主角儿还是Llama-3.1:

在这个18分钟左右的视频中,李沐老师手把手教我们读Llama-3.1技术论文,甚至还爆料了一些八卦。(指路7分50秒左右)

他提到,Llama团队在训练最大模型时,其实一开始同时训练了MoE模型和稠密模型,但是前者后来失败了,所以最后只发了一个简单版本。

一大批研究僧们正闻风赶来,瞧瞧热一就知道大家的精神状态了:

视频地址领取

李沐Llama3.1论文精读‍‍‍‍

https://www.bilibili.com/vide...

Datawhale Llama3.1 部署及微调教程(配合李沐论文精读) https://github.com/datawhalec...\_1


Datawhale
46 声望12 粉丝

Datawhale 是一个专注于 AI 领域的开源组织,致力于构建一个纯粹的学习圈子,帮助学习者更好地成长。我们专注于机器学习,深度学习,编程和数学等AI领域内容的产出与学习。