量子位 - SegmentFault 思否

钉钉真勇！率先接入DeepSeek，阿里系第一个吃螃蟹

2 月 7 日

阅读 3 分钟

818

阿里系第一个吃上DeepSeek“螃蟹”的出现了——钉钉：已经全面接入DeepSeek系列模型。现在，用户在钉钉上创建AI助理的时候，可以直接选择DeepSeek系列的R1、V3等三种模型！与此同时，钉钉还针对性地发布了全新模板，可以帮助用户一键创建、发布基于DeepSeek模型的AI助理。例如我们简单地在钉钉上问一句“你好，DeepSeek”，效...

OpenAI突然公开o3思维链！网友：让我们谢谢DeepSeek

2 月 7 日

阅读 4 分钟

55.4k

刚刚，OpenAI把o3-mini的推理思维链公开了。从今日起，免费用户和付费用户都可以看到模型的思维过程，OpenAI终于Open一回。评论区网友纷纷：让我们谢谢DeepSeek。在官方展示的栗子中，可以看到o3-mini的内心戏不少，还会模仿用户提问使用表情包。用户的提问是“为什么今天不少星期五”o3-mini认为这是一个幽默的评论，并认...

OpenAI联创Schulman闪电跳槽！从Anthropic转投Murati新公司

2 月 7 日

阅读 2 分钟

976

跑去隔壁Anthropic的OpenAI联创John Schulman，又又又跳槽了。《财富》爆料，Schulman新的去向，是加入原OpenAI首席技术官Mira Murati的新创业公司。此时距离他转投Anthropic，仅仅不到半年。对此，Mira公司方面拒绝置评，Schulman也尚未给出回应。但《财富》表示，两名透露此事的消息人士是通过与相关方面的第一手对话...

DeepSeek无问西东！先行者早已趟平全国产之路

2 月 7 日

阅读 5 分钟

793

平台层：像华为云、阿里云、腾讯云等云厂商先后接入DeepSeek相关大模型服务，价格不变甚至有的更便宜、性能与官方相当，直接零门槛部署API开发各种应用。

成本不到150元！李飞飞等26分钟训出个推理模型，媲美o1和R1，秘诀：用蒸馏

2 月 7 日

阅读 4 分钟

758

成本不到150元，训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型？！这不是洋葱新闻，而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作：s1。在数学和编程能力的评测集上，s1的表现比肩DeepSeek-R1和o1。而训一个这样性能的模型，团队仅仅用了16个英伟达H100，训练耗时26分钟。据Tec...

百度智能云上架DeepSeek R1/V3，上线首日超1.5万家客户调用

2 月 6 日

阅读 1 分钟

1k

2月3日百度智能云宣布 DeepSeek-R1和 DeepSeek-V3模型上架百度智能云千帆平台，并宣布提供行业领先的超低推理价格。模型上线首日，已有超1.5万家客户通过千帆平台进行模型调用。

网易有道全面拥抱DeepSeek-R1，推理大模型加速个性化教学升级

2 月 6 日

阅读 2 分钟

864

1月20日，DeepSeek震撼发布DeepSeek-R1，这款推理大模型在数学、编程及逻辑推理等多个领域展现出了与OpenAI顶尖模型比肩的实力，同时实现了API调用成本90%-95%的大幅缩减，无疑为科技界投下了一颗开年“重磅炸弹”。

大神卡帕西拿DeepSeek R1讲强化学习！最新大模型内部机制视频爆火，“没有技术背景也能看懂”

2 月 6 日

阅读 5 分钟

1.2k

发布三个半小时视频课，深入解析了ChatGPT等大语言模型的内部工作机制，其中涵盖模型开发的完整训练过程、如何在实际应用中最有效地使用它们，还有AI未来发展趋势。

没有“5年分期0利息”，都跟不上车圈蛇年价格战

2 月 6 日

阅读 4 分钟

787

开年就开卷，今年车圈卷什么？新春开工第一天，车圈新一轮“价格战”正式打响，特斯拉率先推出优惠组合套餐，小鹏、智己等多家车企同日发布优惠政策。从一口价直降，到5年0息，甚至0首付……2025年车圈刚过完春节，又是一场血雨腥风。车圈新一轮价格战打响春节假期复工首日，特斯拉第一个开炮。这一次，特斯拉祭出销售主力之...

DeepSeek点燃国产大模型斗志，RAG等核心技术被重估

2 月 6 日

阅读 3 分钟

882

一边，OpenAI和Claude都破了大防，一个声讨“窃取”，一个嘲讽“落后”，两家水火不容的对手竟然以这种戏剧性的方式，鲜有地达成了一致。

力压DeepSeek-R1！谷歌Gemini 2.0系列集体上新，全员跻身大模型竞技场前10

2 月 6 日

阅读 5 分钟

1.1k

劈柴哥亲自官宣Gemini 2.0家族更新，分别是Gemini 2.0 Flash、Gemini 2.0 Pro、Gemini 2.0 Flash-Lite。

2025，见证更多GenAI应用落实！今年的中国AIGC产业峰会来啦

2 月 6 日

阅读 3 分钟

993

从Sora带来的超写实视频生成能力，到开源大模型在性能上逐渐追平闭源模型；从多模态理解能力质的飞跃，到Agent技术在实际应用中的突破性进展。

多模态版DeepSeek-R1：评测表现超GPT-4o，模态穿透反哺文本推理能力！北大港科大出品，已开源

2 月 6 日

阅读 5 分钟

1.9k

如果把DeepSeek-R1震撼硅谷的深度推理表现，运用到多模态场景，那会怎样？此前DeepSeek自家的Janus-Pro-7B没有结合推理能力，但现在，国内有研究团队先做到了——基于自研全模态框架Align-Anything，北大联合港科大团队推出多模态版DeepSeek-R1：Align-DS-V，它在部分视觉理解表现评测集上超越GPT-4o。当图文结合地询问它...

马斯克承认FSD还搞不定中国公交车道，入华窘境核心还是技术

2 月 5 日

阅读 4 分钟

837

没想到，中国公交车道难住了FSD。特斯拉交出了一份不太乐观的财报，年销量上市13年来首次下滑，Q4净利润大跌71%，毛利率跌至2019年以来最低水平……靠卖车，特斯拉已经遇到增长瓶颈了……吗？在财报电话会议上，马斯克透露，今年预计会推出新的、更便宜的车型，车辆业务将重新恢复增长。2025年，特斯拉双管齐下，一边推出新...

热搜第一！DeepSeek百万年薪招AI人才，实习生都能月入过万

2 月 5 日

阅读 4 分钟

841

DeepSeek招人，登上热搜第一！啥？不限专业、经验，本科应届生都能年薪百万了。从BOSS平台上一开始公布的在招岗位可以看到，最高薪资达到了110k×14，本科最高也有90k×14。甚至连实习生也是500元一天起招，按每月20天算可以月入万元，最高还有一千元的日薪。难怪乎一众网友流下了羡慕的泪水。还有人连连感慨，AI就像当初...

宇树机器人成赛博科比！英伟达CMU新研究，投篮模仿篮球巨星，代码论文全开源

2 月 5 日

阅读 3 分钟

787

你以为的宇树机器人（H1）：实际上的宇树机器人（G1）：轻松来一个帅气的科比投篮。或者是像罗纳尔多那样华丽旋转跳跃。英伟达卡内基梅隆大学一起，给宇树机器人“一雪前耻”了（doge）。只通过一个训练框架，机器人就能成为“学人精”，完成各种高难度敏捷动作。从这样（下左图）变成这样（下右图）。△左图演我做运动要知道...

谁还没发现微信好友里的“卧底AI”：你以为它只会做红包封面？·

2 月 5 日

阅读 4 分钟

780

一个年过完，许多人的微信里都多了一个好友。与一些陪伴大家多年从不回复的沉默工具号不一样，这是一个事事有回应的AI助手。虽然除夕夜的发红包高峰已过去，但不断有网友晒出它的“隐藏菜单”。根据身边统计学，有人是通过做好的红包封面里附赠了对联，发现这个封面助手还有对话功能！也有人是手滑把文章链接发错给它，却...

OpenAI突遭人形机器人独角兽解约，网友：不会改用DeepSeek了吧？

2 月 5 日

阅读 2 分钟

818

就很秃然，人形机器人独角兽Figure宣布与OpenAI终止合作。创始人Brett Adcock称内部端到端机器人AI有了重大突破，将在接下来的30天展示“没人在人形机器人上见过的东西”。由于宣布的时机非常微妙，评论区网友纷纷猜测：不会是改用开源的DeepSeek模型了吧？根据Techcrunch，问题出在将AI模型集成到机器人硬件环节。比起使...

杭州超越杭州：阿里Qwen2.5-Max反超DeepSeek-V3！网友：中国AI正在快速缩小差距

2 月 4 日

阅读 4 分钟

717

刚刚，大模型竞技场榜单上再添一款国产模型——来自阿里，Qwen2.5-Max，超越了DeepSeek-V3，以总分1332的成绩位列总榜第七。同时还一举超越Claude 3.5 Sonnet、Llama 3.1 405B等模型。特别是在编程、数学等方面表现格外突出，能够与满血o1、DeepSeek-R1并列第一。Chatbot Arena是由LMSYS Org推出的大模型性能测试平台，目...

华为昇腾推理DeepSeek-R1，性能比肩高端GPU，API免费无限量

2 月 4 日

阅读 2 分钟

983

海外云厂商争相引入DeepSeek模型，国产算力也出手了！潞晨科技联合华为昇腾，发布基于国产910B的DeepSeek-R1系列推理API，以自研国产推理引擎为底座，性能追平高端GPU。同步推出云镜像服务，满足自定义需求高、需要私有化部署DeepSeek-R1系列模型的用户。而且还送上蛇年开工的第一把羊毛：当前，DeepSeek-R1系列推理API...

新研究揭示DeepSeek弱点：频繁切换思路欠思考，最短答案往往就对

2 月 3 日

阅读 3 分钟

916

在遇到高难度问题时，推理大模型可能像“三心二意的学生”一样频繁切换解题思路，却因缺乏深入探索而失败——这种现象被研究者称为Underthinking（欠思考）。

5人创业国产AI搜索火了，小红书Reddit都在推！创始人：我们比Perplexity留存更高

2 月 3 日

阅读 5 分钟

833

自Perplexity官宣引入广告后，AI搜索再次成为关注焦点。而我们国内创业团队这边，也传来了新消息——Hika AI，一个仅由5人打造的AI搜索，上线不久竟能和国外当红顶流同台竞技了？！据similar web公开数据显示，上线不到1个月，它在获取用户注意力（包括平均停留时长、跳出率、每次访问页数）方面已经超过Perplexity、秘塔...

OpenAI紧急加播：ChatGPT上新深度搜索，持续思考30分钟输出1万字，刷榜“人类最后的考试”

2 月 3 日

阅读 4 分钟

899

就在开源的DeepSeek-R1被整合进各路AI搜索工具之际，OpenAI临时举行小型发布会。4点27通知，8点开始直播。ChatGPT上新“Deep Research”，把推理大模型的思考能力用于联网搜索。据介绍，Deep Research功能可在数十分钟完成人类专家需要几个小时的复杂研究任务。在“人类最后的考试”上，Deep Research刷新了最高分，比o3-min...

国产AI搜索接入DeepSeek-R1，深度试玩报告抢先出炉：正愁用不上官方联网搜索

2 月 3 日

阅读 5 分钟

918

DeepSeek千般好，万般好，就是联网搜索还用不了（愁.jpg）。但先别急，这块拼图也被国产AI搜索玩家用自己的能力补全了：就在刚刚，秘塔AI搜索宣布融合了DeepSeek-R1满血版。这意味着现在起，R1推理能力已经可以链接全网实时信息一起用了！也意味着从今天开始，DeepSeek-R1还链接上了秘塔AI搜索背后数千万的高质量论文信...

DeepSeek华为火线联手！硅基流动首发即限流，全国产API白菜价，零门槛部署

2 月 2 日

阅读 4 分钟

1.6k

华为DeepSeek联手，全套国产——国产大模型云服务平台SiliconCloud（硅基流动），首发上线了基于华为云昇腾云服务的DeepSeek-V3、DeepSeek-R1。Web端/手机端均可用，价格非常便宜，春节期间还打折，目前使用成本如下：DeepSeek-V3：输入只需1块钱/M tokens，输出2块钱/M tokensDeepSeek-R1：输入4块钱/M tokens，输出16块...

首个OpenAI免费推理模型o3-mini发布！DeepSeek让奥特曼反思：不开源我们错了

2 月 1 日

阅读 5 分钟

1.2k

DeepSeek真算是给大模型圈提了个速——就在刚刚，OpenAI深夜紧急发布了最新推理模型，o3-mini系列。一共包含三个版本：low、medium和high。其中o3-mini和o3-mini-high已经上线：根据官方口径，o3系列模型，目标是推动低成本推理的边界。ChatGPT Plus、团队和Pro用户从今天起可以访问OpenAI o3-mini，企业级访问将在一周后...

英伟达微软带头接入Deepseek，OpenAI急筹2800亿新融资

1 月 31 日

阅读 4 分钟

1.3k

DeepSeek冲击下，硅谷可太精彩了。昨天OpenAI、Anthropic还在带头冲锋，想方设法使绊子。一夜间，基础设施厂商们却纷纷“真香”了起来。在微软之后，英伟达、AWS也加急上线DeepSeek模型托管服务。正如英伟达官推评论区网友评价的，“打不过，就加入”。咱们且一桩桩一件件把这瓜捋上一捋。先说个新消息，OpenAI这边的最新应...

大模型训练开销还能更小！微软推出首个FP4训练框架，训练效果与BF16相当

1 月 30 日

阅读 3 分钟

764

首个FP4精度的大模型训练框架来了，来自微软研究院！在相同超参数的设置下，可以达到与FP8以及BF16相当的训练效果。这意味着所需的存储和计算资源可以更少。用这种方法训练的模型规模最高可达130亿参数规模，训练Tokens数量也达到千亿级别。而且用的还不是真·FP4，而是通过FP8来模拟，如果采用真的FP4，效果还能进一步提...

硅谷掀桌！DeepSeek遭OpenAI和Anthropic围剿，美国网友都看不下去了

1 月 30 日

阅读 5 分钟

1.1k

具体来说，他们发现了DeepSeek“蒸馏”OpenAI模型的迹象。即使用更大模型的输出来提高较小模型的性能，从而以较低成本在特定任务上取得类似结果。

清华NLP开源RAG开箱即用框架，自动适配知识库无需纠结模型选型

1 月 29 日

阅读 4 分钟

1.3k

近日，针对以上痛点，清华大学THUNLP团队联合东北大学NEUIR、面壁智能及9#AISoft团队共同推出了UltraRAG框架，该框架革新了传统RAG系统的开发与配置方式，极大降低了学习成本和开发周期。

21

21