最近,BERT¹,XLNet²,GPT-2³和Grover 等大型语言模型在生成文本和多个 NLP 任务方面取得了令人瞩目的成果。由于 Open-AI 目前尚未发布其最大型号(但已发布其 774M param 模型),他们寻求复制其 1.5B 模型,以允许其他人在他们的预训练模型上进行构建并进一步改进。
我们可以使用他们的 Google Colab 访问模型并生成文本,并且还单独提供了模型权重。
新闻来源:medium.com
最近,BERT¹,XLNet²,GPT-2³和Grover 等大型语言模型在生成文本和多个 NLP 任务方面取得了令人瞩目的成果。由于 Open-AI 目前尚未发布其最大型号(但已发布其 774M param 模型),他们寻求复制其 1.5B 模型,以允许其他人在他们的预训练模型上进行构建并进一步改进。
我们可以使用他们的 Google Colab 访问模型并生成文本,并且还单独提供了模型权重。
新闻来源:medium.com
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。