《开源大模型食用指南》发布，7个小时，一杯奶茶速通大模型！

原创 self-llm Datawhale

Datawhale开源

开源贡献：Datawhale self-llm团队

前言

基于 AutoDL 平台（可扩展，例如阿里云）的开源 LLM 环境配置指南，针对不同模型要求提供不同的详细环境配置步骤；
针对国内外主流开源 LLM 的部署使用教程，包括 InternLM、Qwen、ChatGLM、DeepSeek 等；
开源 LLM 的部署应用指导，包括命令行调用、在线 Demo 部署、LangChain 框架集成等；
开源 LLM 的全量微调、高效微调方法，包括分布式全量微调、LoRA、ptuning 等。

开源地址： https://github.com/datawhalec...

图1.项目主页

开源初心

什么是大模型？

大模型（LLM）狭义上指基于深度学习算法进行训练的自然语言处理（NLP）模型，主要应用于自然语言理解和生成等领域，广义上还包括机器视觉（CV）大模型、多模态大模型和科学计算大模型等。

百模大战正值火热，开源LLM层出不穷。如今国内外已经涌现了众多优秀开源 LLM，国外如 LLaMA、Alpaca，国内如 ChatGLM、BaiChuan、InternLM（书生·浦语）等。开源 LLM 支持用户本地部署、私域微调，每一个人都可以在开源 LLM 的基础上打造专属于自己的独特大模型。

然而，当前普通学生和用户想要使用这些大模型，需要具备一定的技术能力，才能完成模型的部署和使用。对于层出不穷又各有特色的开源 LLM，想要快速掌握一个开源 LLM 的应用方法，是一项比较有挑战的任务。

我们希望成为 LLM 与普罗大众的阶梯，以自由、平等的开源精神，拥抱更恢弘而辽阔的 LLM 世界。

项目受众

本项目适合以下学习者：

想要使用或体验LLM，但无条件获得或使用相关 API；
希望长期、低成本、大量应用LLM；
对开源LLM感兴趣，想要亲自上手开源 LLM；
NLP在学，希望进一步学习LLM；
希望结合开源LLM，打造领域特色的私域 LLM；
以及最广大、最普通的学生群体。

项目规划及进展

本项目拟围绕开源 LLM 应用全流程组织，包括环境配置及使用、部署应用、微调等，每个部分覆盖主流及特点开源 LLM：

图2.已支持的模型

学习指南

同时，本项目对本地硬件基本没有要求，全程都需要在云服务器上运行，AutoDL租一台3090服务器，每小时需要1.66元，一杯奶茶就可以租一块3090愉快的学习7个小时！

理论上7小时就可以将本项目的所有教程全部跑通一遍（除全量微调外），一杯奶茶速通大模型，掌握开源大模型部署的核心科技。

文章最后

最后，由于贡献者团队时间仓促、精力有限，教程难免有些疏漏甚至错误，我们期望学习者在学习的同时，也能积极给我们建议，或者直接对项目进行贡献，让我们共同打磨教程，为后面的学习者提供更好的内容。

开源贡献，点赞在看↓

《开源大模型食用指南》发布，7个小时，一杯奶茶速通大模型！

前言

开源初心

项目受众

学习指南

文章最后

Datawhale

引用和评论

五月组队学习计划！

最全梳理：一文搞懂RAG技术的5种范式！

10篇R1相关的研究全面汇总，万字思考！

Manus开源复刻框架OWL，测评和使用教程来了！

用 MCP 让大模型自动批量解读文献，保姆级教程来了！

AI编程神器Cursor，保姆级教程来了！

QwQ-32B 测评和使用教程来了！

《开源大模型食用指南》发布，7个小时，一杯奶茶速通大模型！

前 言

开源初心

项目受众

学习指南

文章最后

Datawhale

引用和评论

五月组队学习计划！

最全梳理：一文搞懂RAG技术的5种范式！

10篇R1相关的研究全面汇总，万字思考！

Manus开源复刻框架OWL，测评和使用教程来了！

用 MCP 让大模型自动批量解读文献，保姆级教程来了！

AI编程神器Cursor，保姆级教程来了！

QwQ-32B 测评和使用教程来了！

前言