传言:DeepSeek R2参数暴涨至1.2万亿、便宜97.3%!

北京

DeepSeek R2的传言引发了AI行业的巨大关注。该模型参数达到1.2万亿,并采用Hybrid MoE 3.0架构,动态激活780亿参数。其成本较GPT-4 Turbo降低97.3%,被称为AI模型的白菜价。DeepSeek R2在长文本推理任务中的单位token成本显著下降,表现出色。其多模态能力也很强,视觉理解模块在COCO数据集上的物体分割任务中精准度达到92.4% mAP,超过CLIP模型。此外,工业质检和医疗诊断场景中也表现优异。虽然这些信息被认为是传言,但如果属实,可能对美国半导体行业造成冲击,甚至被视为AI冷战的新武器。

关键点

  • DeepSeek R2参数暴涨至1.2万亿,成本大幅降低。
  • 视觉理解模块表现优异,多模态能力强。
  • 传言可能对美国半导体行业造成影响。
  • DeepSeek R2或将引发AI行业重大洗牌。
阅读 8
0 条评论