14.9万元，满血流畅运行DeepSeek一体机抱回家！清华90后初创出品

满血DeepSeek一体机，价格竟然被打到10万元级别了！

而且还不是量化版本，正是那个671B参数、最高质量的FP8原版。

或许有小伙伴要问了，那跑DeepSeek-R1/V3的速度，能跟官方一较高下吗？

可以的，甚至是更快的那种。例如我们提个问题，来感受一下这个feel：

一个汉字具有左右结构，左边是木，右边是乞。这个字是什么？只需回答这个字即可。

14.9万元，满血流畅运行DeepSeek一体机抱回家！清华90后初创出品

△左：一体机；右：DeepSeek官网

视频地址： https://mp.weixin.qq.com/s/lu...

从视频中不难看出，不仅答案精准，一体机的速度也是肉眼可见地比DeepSeek官网快上一些，粗略估计是已经接近了22 tokens/s。

那么这个一体机到底是什么来头？

不卖关子，它就是由北京行云集成电路最新推出的产品——褐蚁HY90，具体价格定到了14.9万元。

而且除了产品，这家公司本身也是有不少的“标签”在身上的，其中最为吸睛或许当属CEO了：

季宇，清华90后博士、前华为“天才少年”、计算机学会CCF优博奖获得者。

14.9万元，满血流畅运行DeepSeek一体机抱回家！清华90后初创出品

那么褐蚁HY90具体执行起更多任务时，又会是什么样的效果？

来，更多维度的一波实测走起。

实测10万元级的DeepSeek一体机

我们先在褐蚁HY90部署DeepSeek-R1，来测试一下它的推理能力。

有请AIME 2025的数学题：

Find the sum of all integer bases b>9 for which 17b is a divisor of 97b.

14.9万元，满血流畅运行DeepSeek一体机抱回家！清华90后初创出品

视频地址： https://mp.weixin.qq.com/s/lu...

从内容生成的速度上来看，褐蚁HY90面对数学推理问题，依旧是可以保持接近20+ tokens/s。

并且最终给到的答案也是精准无误：70。

14.9万元，满血流畅运行DeepSeek一体机抱回家！清华90后初创出品

再来一道新版类似“9.9和9.11哪个大”、“Strawberry里面有几个‘r’”，极度迷惑一众AI的难题：

让7米长的甘蔗通过2米高1米宽的门。

14.9万元，满血流畅运行DeepSeek一体机抱回家！清华90后初创出品

△左：一体机；右：DeepSeek官网

速度依旧在线，并且这个问题已经是难不倒DeepSeek，给出的答案也是正解。

而除了DeepSeek之外，我们还在褐蚁HY90上体验了一把类似Deep Research的功能：

14.9万元，满血流畅运行DeepSeek一体机抱回家！清华90后初创出品

视频地址： https://mp.weixin.qq.com/s/lu...

由此可见，无论是什么类型的题目，褐蚁HY90都能以相对较快的速度丝滑处理。

不过有一说一，以往的一体机，即便是搭载Q4量化版本，成本动辄就要达到200万元。

而褐蚁HY90在搭载满血、未量化的DeepSeek情况下，不仅能够保证速度，更是把价格打掉了一个数量级。

因此，接下来的一个问题便是：

如何炼成的？

在我们聊“如何实现”之前，且需了解一下“什么在阻碍”。

首先，大家提到一体机，第一反应大概率就是GPU，而它本身就或许构成了短板。

因为传统GPU方案因显存容量限制，例如671GB需求需多张A100显卡，成本已经超过了百万的级别。

而CPU方案则受限于内存带宽，因为大模型推理需要频繁加载参数（如671B参数的FP8精度模型占用约671GB内存）。

如果内存带宽不足，就会导致计算单元（CPU 核心）长时间等待数据，形成“内存墙”（Memory Wall），严重影响推理速度。

针对上述的短板，行云的褐蚁一体机采用双路AMD 9005系列CPU，通过1TB/s的高内存带宽满足基础推理需求，同时搭配一张中高端消费级GPU作为算力补充。

这种异构计算架构通过软件协同优化，既解决了纯CPU方案在部分推理阶段的算力不足问题，又显著降低了成本，将硬件投入压缩至10万元以内。

14.9万元，满血流畅运行DeepSeek一体机抱回家！清华90后初创出品

除此之外，行云自主研发的推理引擎框架通过算法优化和任务调度，同样对token生成速率起到了显著的提升作用。

在FP8精度下，Decode阶段速度稳定在20TPS以上，且受上下文长度影响较小（128K上下文仍保持15TPS）；Prefill阶段在16K上下文内首字延迟控制在80秒以内。

14.9万元，满血流畅运行DeepSeek一体机抱回家！清华90后初创出品

这种高效推理能力尤其适合需要连续生成大量token的场景（如AI Agent），大幅缩短任务响应时间。

不仅如此，团队还针对大模型运行需求，精准平衡了计算能力与内存带宽，支持满血FP8精度的R1/V3模型，并预留扩展能力，未来可支持1.5T参数量的模型。

通过参数压缩技术（如INT4量化），进一步将Decode速度提升至28TPS（1K上下文），满足不同场景对速度与精度的灵活需求。

据了解，团队后续还将对MoE类的模型提供较好的支持。

14.9万元，满血流畅运行DeepSeek一体机抱回家！清华90后初创出品

褐蚁一体机的出现，可以说是改写了行业的格局——

此前运行满血671B模型需百万级设备，而同类低配方案（如32B/70B模型）仍需20-40万元。

行云通过技术整合，将最高质量的模型体验直接带入10万元价位，为中小团队提供了低门槛、高扩展性的AI部署方案。

这一技术突破不仅实现了“高性能+低成本”的平衡，更推动了大模型在智能客服、数据分析等场景的普惠应用。

清华90后创办的公司

最后，正如我们刚才提到的，行云除了产品本身之外，创始团队同样也有不少的亮点。

首先就是创始人兼CEO季宇，他本科就读于清华大学物理系，后转向计算机体系结构方向，获得清华大学计算机体系结构博士学位。

在学术研究方面，他曾作为共同第一作者在顶级期刊《自然》（Nature）上发表计算机体系结构相关论文，并荣获中国计算机学会（CCF）优秀博士学位论文奖（CCF优博奖）。

14.9万元，满血流畅运行DeepSeek一体机抱回家！清华90后初创出品

△行云集成电路创始人兼CEO，季宇

在2023年8月成立行云集成电路之前，季宇曾在华为海思昇腾芯片团队，担任昇腾AI芯片编译器专家，负责多个昇腾编译器项目，也曾入选“华为天才少年”。

在华为期间，正因长期专注于AI编译器优化和处理器微架构等挑战性问题，也让他积累了丰富的AI芯片研发经验。

除了季宇本人之外，CTO余洪敏拥有深厚的学术背景和丰富的行业经验。

他本科毕业于华中科技大学，后在中国科学院半导体研究所获得博士学位。

在职业履历方面，余洪敏曾担任百度昆仑芯、华为海思车载昇腾芯片等多款芯片的负责人，并曾在地平线担任芯片研发总监。

他长期领导和管理超过100人的研发团队，精通芯片研发设计全流程，具备丰富的实战经验——成功主导10余款芯片的流片与量产，并多次推动先进工艺数据中心芯片的架构设计、工程实现及大规模商用部署。

值得一提的是，在去年11月份，行云集成电路还得到了一众明星资本的投资，包括智谱AI、峰瑞资本、嘉御资本、春华资本、中科创星、同创伟业奇绩创坛、水木清华校友基金等。

由此，从行云集成电路成立至今的发展来看，是有产品，有团队，更有市场的那种了。

但更重要的一点是，这家刚成立两年的公司，一举实现了一体机圈子里类似的DeepSeek的“高性能+低成本”——

嗯，“中国初创”的含金量还在持续上升。

一体机近期可从官方公众号预约体验，更多详情见↓

14.9万元，满血流畅运行DeepSeek一体机抱回家！清华90后初创出品

14.9万元，满血流畅运行DeepSeek一体机抱回家！清华90后初创出品

实测10万元级的DeepSeek一体机

如何炼成的？

清华90后创办的公司

量子位

引用和评论

华为+DeepSeek，推理性能创新高！技术报告也公布出来了

Claude 3.7成精了！偷偷将OpenAI模型换成自己，卡帕西：迄今最好笑的一趴

一夜之间，萝卜快跑拿掉了所有安全员

最强32B中文推理大模型易主：开源免费商用，1/20 DeepSeek-R1参数量SOTA，权重代码数据集全开源

Manus引爆智能体复现潮！DeepSeek已被整合，项目挤满开源榜

配这种CPU，GPU单卡就能跑满血DeepSeek-R1，至强+AMX让预填充速度起飞

AI三小时做的小游戏，9天赚12万！马斯克：AI游戏前景无限