如何在百度百舸部署满血版DeepSeek-V3、DeepSeek-R1模型

百度Geek说

2 月 13 日上海

阅读 1 分钟

0

百度百舸·AI异构计算平台已支持快速部署DeepSeek-V3、DeepSeek-R1及其蒸馏的Llama、Qwen等小规模dense模型。您可以登录百度百舸平台快速部署DeepSeek系列模型体验模型效果。

01 开通轻量计算实例

开通一台H20（ebc.lgn7t.c208m2048.8h20.4d）规格的计算实例并添加到百度百舸·AI异构计算平台。

02 部署vLLM

在百度百舸平台的左侧导航中选择「工具市场」页面，部署工具vLLM。

03 模型推理

vLLM部署成功，登录实例下载模型并启动vLLM服务，安装WebUl客户端。

发送请求开始对话。

04 各系列模型的推荐配置清单

在完成满血版DeepSeek模型的快速部署后，百度百舸·AI异构计算平台还能为这些在线服务提供全生命周期管理、自研框架推理加速、推理资源碎片整理等能力。在保障服务稳定性的同时，有效降低推理成本并提升推理性能。

访问百度百舸页面https://cloud.baidu.com/product/aihc.html，感受服务稳定性与成本效益的双重提升！

————END————

推荐阅读

首日调用客户破1.5万！DeepSeek-V3/R1上线背后的超低推理成本技术揭秘

唤醒 AI 算力，专有云 ABC Stack 面向企业级智算平台的 GPU 提效实践

百度APP iOS端磁盘优化实践（上）

对话AI原生｜比帮你写代码更爽的是：让Agent来打工

0 Token 间间隔 100% GPU 利用率，百度百舸 AIAK 大模型推理引擎极限优化 TPS

阅读 718发布于 2 月 13 日

百度Geek说

246 声望54 粉丝

« 上一篇

首日调用客户破1.5万！DeepSeek-V3/R1上线背后的超低推理成本技术揭秘

下一篇 »

百度网盘防雪崩架构实践

引用和评论

推荐阅读

Redis 数据恢复的月光宝盒，闪回到任意指定时间

百度Geek说阅读 79

百度 Create AI 开发者大会：李彦宏发布两大新模型、多款热门 AI 应用，帮助开发者全面拥抱 MCP

思否编辑部阅读 5.1k

千亿级打点PV的成本治理实践

百度Geek说阅读 1.6k

两连发！文心大模型4.5及X1，上线千帆！

百度Geek说阅读 670

百度大模型产品与技术生态（2025年5月）

vistart阅读 517

图灵数据洞察平台-TDF（Turing Data Finder）

百度Geek说阅读 517

名列前茅！百度文心大模型4.5及X1在中国信通院“方升”大模型基准测试中表现优异

百度Geek说阅读 504

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。