GitHub - karpathy/llm.c: 在简单的原生 C/CUDA 中进行 LLM 训练

发布于 7 月 27 日

主要观点：这是一个用纯 C/CUDA 实现的 LLM 项目，重点在预训练，可重现 GPT-2 和 GPT-3 系列模型，有 CPU 和 GPU 版本，包含快速开始指南、数据集处理、测试、教程、多 GPU 和多节点训练、实验及各种语言的移植等内容，旨在成为教育和实用训练的平台，有不同的开发组织方式和 notable forks。
关键信息：

可通过不同方式快速开始，如 1 GPU fp32 版本、CPU 版本等。
数据文件负责下载、 token 化并保存为.bin 文件。
有简单单元测试确保 C 代码与 PyTorch 代码一致。
包含多 GPU 和多节点训练的方法及相关脚本。
有多种语言的移植版本和 notable forks 列表。
开发组织方式包括 Issues、PR、Discussions 等。
重要细节：
1 GPU fp32 版本运行命令及相关脚本。
CPU 版本训练细节及输出示例。
不同语言移植版本的开发者及特点。
多 GPU 和多节点训练的不同方法及注意事项。
实验 sweep 示例及相关日志处理。
各种开发组织方式的具体用途。

阅读 65