传言：DeepSeek R2参数暴涨至1.2万亿、便宜97.3%！

发布于 2025-04-28 北京

DeepSeek R2的传言引发了AI行业的巨大关注。该模型参数达到1.2万亿，并采用Hybrid MoE 3.0架构，动态激活780亿参数。其成本较GPT-4 Turbo降低97.3%，被称为AI模型的白菜价。DeepSeek R2在长文本推理任务中的单位token成本显著下降，表现出色。其多模态能力也很强，视觉理解模块在COCO数据集上的物体分割任务中精准度达到92.4% mAP，超过CLIP模型。此外，工业质检和医疗诊断场景中也表现优异。虽然这些信息被认为是传言，但如果属实，可能对美国半导体行业造成冲击，甚至被视为AI冷战的新武器。

关键点

DeepSeek R2参数暴涨至1.2万亿，成本大幅降低。
视觉理解模块表现优异，多模态能力强。
传言可能对美国半导体行业造成影响。
DeepSeek R2或将引发AI行业重大洗牌。

阅读 702