LeRobot v0.4.0 正式发布:全面提升开源机器人的学习能力

11 月 3 日
阅读 5 分钟
1.1k
我们非常高兴地宣布,LeRobot 迎来一系列重大升级,让开源的机器人学习比以往更强大、更可扩展、也更易用!从重构的数据集到灵活的编辑工具、新的仿真环境,以及面向硬件的全新插件系统,LeRobot 正在持续演进,以满足前沿具身智能 (Embodied AI) 不断发展的需求。
封面图

Gaia2 与 ARE:赋能社区的智能体评测

10 月 4 日
阅读 5 分钟
1.7k
在理想情况下,AI 智能体应当是可靠的助手。当接收到任务时,它们能够轻松处理指令中的歧义,构建逐步执行的计划,正确识别所需资源,按计划执行而不被干扰,并在突发事件中灵活适应,同时保持准确性,避免幻觉。
封面图

ZeroGPU Spaces 加速实践:PyTorch 提前编译全解析

9 月 9 日
阅读 8 分钟
1.9k
ZeroGPU 让任何人都能在 Hugging Face Spaces 中使用强大的 Nvidia H200 硬件,而不需要因为空闲流量而长期占用 GPU。 它高效、灵活,非常适合演示,不过需要注意的是,ZeroGPU 并不能在所有场景下完全发挥 GPU 与 CUDA 栈的全部潜能,比如生成图像或视频可能需要相当多的时间。在这种情况下,充分利用 H200 硬件,使其...
封面图

HF Papers 直播| 多模态专场

8 月 21 日
阅读 3 分钟
1.2k
由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流 等联合发起的【AI Insight Talk】系列直播活动第四场 - 多模态专场就在明天!
封面图

开源开发者须知:欧盟《人工智能法案》对通用人工智能模型的最新要求

8 月 20 日
阅读 13 分钟
1.3k
快速摘要 (TL;DR): 自 2025 年 8 月 2 日起,欧盟《人工智能法》将对通用人工智能(GPAI)模型的提供者模型提供者提出新的合规要求。但是对于用于科研目的,或者是以自由和开源许可证方式发布的模型,则可以获得全部或部分豁免。本指南旨在帮助 AI 开发者判断这些合规要求是否与自己在通用人工智能(GPAI)模型相关的工...
封面图

欢迎 GPT OSS —— 来自 OpenAI 的全新开放模型家族!

8 月 11 日
阅读 14 分钟
2.3k
GPT OSS 是 OpenAI 推出的 重量级开放模型,面向强推理、智能体任务以及多样化开发场景。该系列包含两款模型:拥有 117B 参数的 gpt‑oss‑120b 和拥有 21B 参数的 gpt‑oss‑20b。二者皆采用 Mixture‑of‑Experts(MoE)架构,并在 MoE 权重上使用 4‑bit 量化方案 MXFP4。由于 active 参数更少,它们在保持资源占用低的同时...
封面图

Hugging Face 开源 HopeJR 机器臂!今天晚上直播带你深入技术核心

7 月 17 日
阅读 1 分钟
909
HopeJR 是一款拥有 23 自由度的开源仿生机械臂系统🦾,支持遥操作控制,具备完成复杂任务的能力,适用于科研与开发场景。整个机械臂用 3D 打印即可完成构建,硬件成本仅约 500 欧元!

HF Papers 直播| AI for Science 专场

7 月 17 日
阅读 2 分钟
776
AI 科学家时代正加速到来,但科研智能体真的做好准备了吗?真实科研场景中,多模态智能体能否在推理、规划与执行等关键能力上达到人类科研人员的水平?我们又该如何准确评估它们的科学认知能力和数据分析表现?
封面图

Hugging Face 开源机器人 Reachy Mini 开启预定

7 月 9 日
阅读 3 分钟
1.3k
Reachy Mini 是一款富有表现力的开源机器人,专为人机交互、创意编程和 AI 实验而设计。它价格亲民,体积小巧,却蕴藏着无限可能。无论年龄大小,全球的 AI 开发者都可以通过它共同编程、学习与分享。Reachy Mini 完全支持 Python 编程(并即将支持 JavaScript 和 Scratch),起售价仅为 299 美元,是进入机器人 AI 世界...
封面图

开源人工智能:数字主权的基石

7 月 1 日
阅读 3 分钟
1.1k
随着人工智能正在重塑从教育到国防的方方面面,数字主权已不再是一个长期的愿景,而是一个迫在眉睫的现实需求。 为了确保各国能够对影响其社会的人工智能系统进行治理、审核和建设,开源人工智能正成为实现自主可控、激发本土创新、重建公众信任的关键支柱。什么是数字主权?数字主权是指一个国家或地区具备能力,依据自...
封面图

nanoVLM: 简洁、轻量的纯 PyTorch 视觉-语言模型训练代码库

6 月 18 日
阅读 5 分钟
1.4k
nanoVLM 是使用纯 PyTorch 训练 你自己的视觉语言模型 (VLM) 的 最简单 方式。它是一个轻量级 工具包 ,让你可以在 免费的 Colab Notebook 上启动 VLM 训练。
封面图

SmolVLA: 让机器人更懂 “看听说做” 的轻量化解决方案

6 月 5 日
阅读 8 分钟
894
今天,我们介绍了 SmolVLA,这是一个轻量级 (450M 参数) 的开源视觉 - 语言 - 动作 (VLA) 模型,专为机器人领域设计,并且可以在消费级硬件上运行。
封面图

参加 Hugging Face 组织的 Gradio & MCP 智能体主题黑客松

5 月 28 日
阅读 2 分钟
1.3k
准备好了吗?一场以智能体(Agent)和模型上下文协议(Model Context Protocol,简称 MCP)为核心的全球在线黑客松即将来袭!本次活动由 Hugging Face 举办,我们将共同探索基于 Anthropic MCP 和 AI Agentic 系统的最新可能性。
封面图

大模型评估排障指南 | 关于可复现性

5 月 13 日
阅读 3 分钟
749
这是 大模型评估排障指南 系列文章的第三篇,敬请关注系列文章:关于推理关于\( \LaTeX \)公式解析关于可复现性假设你读了一篇最近的新模型技术报告,然后心血来潮想要在本机复现他们的结果,却发现根本没法复现,这是为什么?让我们来探讨一下原因。代码库不同要想复现论文或报告的评估得分并精确到小数点,首先要确保使...
封面图

大模型评估排障指南 | 关于 LaTeX 公式解析

5 月 8 日
阅读 3 分钟
960
这是 大模型评估排障指南 系列文章的第二篇,敬请关注系列文章:关于推理关于 \( \LaTeX \) 公式解析关于可复现性解析 LaTeX 很难。这个问题在评估输出为\( \LaTeX \) 的模型时经常会遇到,例如 Hugging Face 的 数学评估基准。这个基准使用 \( \LaTeX \) 来表示数学领域的计算和符号。评估难点在于对模型输出与标准答案...
封面图

设计即合规: 开放AI生态中的用户数据治理实践

5 月 1 日
阅读 6 分钟
1.3k
Hugging Face Hub 已成为 AI 协作的核心平台,托管了数万个模型、数据集以及交互式应用程序 (Space)。 在开放生态系统中,用户知情同意的管理方式与那些更 "数据饥渴" 的科技公司的封闭产品截然不同。本文将通过分析 Hugging Face Hub 平台,探讨由官方主导项目与社区自主贡献中的用户同意实践模式。与传统的科技平台不...
封面图

大模型评估排障指南 | 关于推理

4 月 25 日
阅读 2 分钟
956
这是 大模型评估排障指南 系列文章的第一篇,敬请关注系列文章:关于推理关于 $\LaTeX$ 公式解析关于可复现性模型运行非常慢怎么办?调整 batch size如果你想要评估结果完全可复现 (在特定的输入 prompt 和硬件条件下),你可以把 batch size 可以设为 1。但如果增大 batch size (硬件条件允许的话) 将会加快推理速度。数...
封面图

让 LLM 来评判 | 技巧与提示

4 月 9 日
阅读 1 分钟
888
缺乏内部一致性:同一 prompt 输入评估模型执行多次得到的结果可能不一样 (如果温度参数不设为 0)。缓解措施:遵循 “自我一致性 (self-consistency)” 设置 prompt,输入模型执行多次并保留多数结果
封面图

Open R1 项目进展第三期

4 月 7 日
阅读 7 分钟
907
CodeForces-CoTs 数据集: 通过 R1 模型蒸馏生成近 10 万条高质量编程思维链样本,同时包含 C++ 和 Python 双语言解题方案
封面图

Open R1 项目进展第二期

4 月 1 日
阅读 5 分钟
1.1k
除此之外,我们还聊聊社区里一些让人兴奋的进展,比如怎么整理出小而精的高质量数据集来微调模型,以及如何在训练和推理时控制推理模型的“思考步数”。
封面图

Open R1 项目进展第一期

3 月 29 日
阅读 6 分钟
891
DeepSeek R1 发布已经两周了,而我们启动 open-r1 项目——试图补齐它缺失的训练流程和合成数据——也才过了一周。这篇文章简单聊聊:Open-R1 在模仿 DeepSeek-R1 流程和数据方面的进展我们对 DeepSeek-R1 的认识和相关讨论DeepSeek-R1 发布后社区搞出来的有趣项目这既是项目的最新动态,也是一些关于 DeepSeek-R1 的有趣资料...
封面图

为什么 AI 模型离科学革命还差得很远?

3 月 27 日
阅读 3 分钟
812
这个“压缩的 21 世纪”概念来自 Dario 的文章《Machine of Loving Grace》,强烈推荐大家读一读。这是一篇值得深思的好文章。文章的核心观点是,在未来一两年内,我们将拥有一个“装在数据中心里的爱因斯坦之国”,所有 21 世纪的科学发现将在短短 5 到 10 年内被一股脑地完成,从而压缩了整个世纪的科技进程。
封面图

常见的 AI 模型格式

3 月 27 日
阅读 5 分钟
1.7k
过去两年,开源 AI 社区一直在热烈讨论新 AI 模型的开发。每天都有越来越多的模型在 Hugging Face 上发布,并被用于实际应用中。然而,开发者在使用这些模型时面临的一个挑战是模型格式的多样性。
封面图

SmolVLM2: 让视频理解能力触手可及

3 月 24 日
阅读 6 分钟
2.1k
SmolVLM2 标志着视频理解技术的根本性转变——从依赖海量计算资源的巨型模型,转向可在任何设备运行的轻量级模型。我们的目标很简单: 让视频理解技术从手机到服务器都能轻松部署。
封面图

在 Hugging Face Spaces 上使用 Gradio 免费运行 ComfyUI 工作流

3 月 24 日
阅读 18 分钟
1k
在本教程中,我将逐步指导如何将一个复杂的 ComfyUI 工作流转换为一个简单的 Gradio 应用程序,并讲解如何将其部署在 Hugging Face Spaces 的 ZeroGPU 无服务器架构上,这样可以让它以无服务器的方式免费部署和运行。在本教程中,我们将使用 [Nathan Shipley 的 Flux[dev] Redux + Flux[dev] Depth ComfyUI 工作流]([链...
封面图

在 Hugging Face 上部署语音转语音模型

3 月 12 日
阅读 7 分钟
1.5k
S2S (语音到语音) 是 Hugging Face 社区内存在的一个令人兴奋的新项目,它结合了多种先进的模型,创造出几乎天衣无缝的体验: 你输入语音,系统会用合成的声音进行回复。
封面图

LayerSkip: 使用自推测解码加速大模型推理

3 月 11 日
阅读 8 分钟
997
自推测解码是一种新颖的文本生成方法,它结合了推测解码 (Speculative Decoding) 的优势和大语言模型 (LLM) 的提前退出 (Early Exit) 机制。该方法出自论文 LayerSkip: Enabling Early-Exit Inference and Self-Speculative Decoding。它通过使用 同一个模型 的早期层来生成候选词元 (token),并使用后期层进行验证,从...
封面图

从文件到块: 提高 Hugging Face 存储效率

3 月 4 日
阅读 3 分钟
1.7k
Hugging Face 在 Git LFS 仓库 中存储了超过 30 PB 的模型、数据集和 Spaces。由于 Git 在文件级别进行存储和版本控制,任何文件的修改都需要重新上传整个文件。这在 Hub 上会产生高昂的成本,因为平均每个 Parquet 和 CSV 文件大小在 200-300 MB 之间,Safetensor 文件约 1 GB,而 GGUF 文件甚至可能超过 8 GB。设想一...
封面图

让 LLM 来评判 | 设计你自己的评估 prompt

2 月 27 日
阅读 2 分钟
1.1k
这是 让 LLM 来评判 系列文章的第三篇,敬请关注系列文章:基础概念选择 LLM 评估模型设计你自己的评估 prompt评估你的评估结果奖励模型相关内容技巧与提示
封面图

AI 艺术工具通讯

2 月 22 日
阅读 4 分钟
1.5k
过去两年对开源模型和艺术创作工具而言具有里程碑意义。创意表达的 AI 工具从未像现在这般触手可及,然而这仅仅是冰山一角。让我们共同回顾 2024 年 AI 艺术领域的关键突破与创新工具,并展望 2025 年的发展趋势 (剧透预警 👀: 我们将启动月度资讯精选的订阅👇)。
封面图