钉钉真勇!率先接入DeepSeek,阿里系第一个吃螃蟹

2 月 7 日
阅读 3 分钟
818
阿里系第一个吃上DeepSeek“螃蟹”的出现了——钉钉:已经全面接入DeepSeek系列模型。现在,用户在钉钉上创建AI助理的时候,可以直接选择DeepSeek系列的R1、V3等三种模型!与此同时,钉钉还针对性地发布了全新模板,可以帮助用户一键创建、发布基于DeepSeek模型的AI助理。例如我们简单地在钉钉上问一句“你好,DeepSeek”,效...

OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek

2 月 7 日
阅读 4 分钟
55.4k
刚刚,OpenAI把o3-mini的推理思维链公开了。从今日起,免费用户和付费用户都可以看到模型的思维过程,OpenAI终于Open一回。评论区网友纷纷:让我们谢谢DeepSeek。在官方展示的栗子中,可以看到o3-mini的内心戏不少,还会模仿用户提问使用表情包。用户的提问是“为什么今天不少星期五”o3-mini认为这是一个幽默的评论,并认...

OpenAI联创Schulman闪电跳槽!从Anthropic转投Murati新公司

2 月 7 日
阅读 2 分钟
976
跑去隔壁Anthropic的OpenAI联创John Schulman,又又又跳槽了。《财富》爆料,Schulman新的去向,是加入原OpenAI首席技术官Mira Murati的新创业公司。此时距离他转投Anthropic,仅仅不到半年。对此,Mira公司方面拒绝置评,Schulman也尚未给出回应。但《财富》表示,两名透露此事的消息人士是通过与相关方面的第一手对话...

DeepSeek无问西东!先行者早已趟平全国产之路

2 月 7 日
阅读 5 分钟
793
平台层:像华为云、阿里云、腾讯云等云厂商先后接入DeepSeek相关大模型服务,价格不变甚至有的更便宜、性能与官方相当,直接零门槛部署API开发各种应用。

成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏

2 月 7 日
阅读 4 分钟
758
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。在数学和编程能力的评测集上,s1的表现比肩DeepSeek-R1和o1。而训一个这样性能的模型,团队仅仅用了16个英伟达H100,训练耗时26分钟。据Tec...

百度智能云上架DeepSeek R1/V3,上线首日超1.5万家客户调用

2 月 6 日
阅读 1 分钟
1k
2月3日百度智能云宣布 DeepSeek-R1和 DeepSeek-V3模型上架百度智能云千帆平台,并宣布提供行业领先的超低推理价格。模型上线首日,已有超1.5万家客户通过千帆平台进行模型调用。

网易有道全面拥抱DeepSeek-R1,推理大模型加速个性化教学升级

2 月 6 日
阅读 2 分钟
864
1月20日,DeepSeek震撼发布DeepSeek-R1,这款推理大模型在数学、编程及逻辑推理等多个领域展现出了与OpenAI顶尖模型比肩的实力,同时实现了API调用成本90%-95%的大幅缩减,无疑为科技界投下了一颗开年“重磅炸弹”。

大神卡帕西拿DeepSeek R1讲强化学习!最新大模型内部机制视频爆火,“没有技术背景也能看懂”

2 月 6 日
阅读 5 分钟
1.2k
发布三个半小时视频课,深入解析了ChatGPT等大语言模型的内部工作机制,其中涵盖模型开发的完整训练过程、如何在实际应用中最有效地使用它们,还有AI未来发展趋势。

没有“5年分期0利息”,都跟不上车圈蛇年价格战

2 月 6 日
阅读 4 分钟
787
开年就开卷,今年车圈卷什么?新春开工第一天,车圈新一轮“价格战”正式打响,特斯拉率先推出优惠组合套餐,小鹏、智己等多家车企同日发布优惠政策。从一口价直降,到5年0息,甚至0首付……2025年车圈刚过完春节,又是一场血雨腥风。车圈新一轮价格战打响春节假期复工首日,特斯拉第一个开炮。这一次,特斯拉祭出销售主力之...

DeepSeek点燃国产大模型斗志,RAG等核心技术被重估

2 月 6 日
阅读 3 分钟
882
一边,OpenAI和Claude都破了大防,一个声讨“窃取”,一个嘲讽“落后”,两家水火不容的对手竟然以这种戏剧性的方式,鲜有地达成了一致。

力压DeepSeek-R1!谷歌Gemini 2.0系列集体上新,全员跻身大模型竞技场前10

2 月 6 日
阅读 5 分钟
1.1k
劈柴哥亲自官宣Gemini 2.0家族更新,分别是Gemini 2.0 Flash、Gemini 2.0 Pro、Gemini 2.0 Flash-Lite。

2025,见证更多GenAI应用落实!今年的中国AIGC产业峰会来啦

2 月 6 日
阅读 3 分钟
993
从Sora带来的超写实视频生成能力,到开源大模型在性能上逐渐追平闭源模型;从多模态理解能力质的飞跃,到Agent技术在实际应用中的突破性进展。

多模态版DeepSeek-R1:评测表现超GPT-4o,模态穿透反哺文本推理能力!北大港科大出品,已开源

2 月 6 日
阅读 5 分钟
1.9k
如果把DeepSeek-R1震撼硅谷的深度推理表现,运用到多模态场景,那会怎样?此前DeepSeek自家的Janus-Pro-7B没有结合推理能力,但现在,国内有研究团队先做到了——基于自研全模态框架Align-Anything,北大联合港科大团队推出多模态版DeepSeek-R1:Align-DS-V,它在部分视觉理解表现评测集上超越GPT-4o。当图文结合地询问它...

马斯克承认FSD还搞不定中国公交车道,入华窘境核心还是技术

2 月 5 日
阅读 4 分钟
837
没想到,中国公交车道难住了FSD。特斯拉交出了一份不太乐观的财报,年销量上市13年来首次下滑,Q4净利润大跌71%,毛利率跌至2019年以来最低水平……靠卖车,特斯拉已经遇到增长瓶颈了……吗?在财报电话会议上,马斯克透露,今年预计会推出新的、更便宜的车型,车辆业务将重新恢复增长。2025年,特斯拉双管齐下,一边推出新...

热搜第一!DeepSeek百万年薪招AI人才,实习生都能月入过万

2 月 5 日
阅读 4 分钟
841
DeepSeek招人,登上热搜第一!啥?不限专业、经验,本科应届生都能年薪百万了。从BOSS平台上一开始公布的在招岗位可以看到,最高薪资达到了110k×14,本科最高也有90k×14。甚至连实习生也是500元一天起招,按每月20天算可以月入万元,最高还有一千元的日薪。难怪乎一众网友流下了羡慕的泪水。还有人连连感慨,AI就像当初...

宇树机器人成赛博科比!英伟达CMU新研究,投篮模仿篮球巨星,代码论文全开源

2 月 5 日
阅读 3 分钟
787
你以为的宇树机器人(H1):实际上的宇树机器人(G1):轻松来一个帅气的科比投篮。或者是像罗纳尔多那样华丽旋转跳跃。英伟达卡内基梅隆大学一起,给宇树机器人“一雪前耻”了(doge)。只通过一个训练框架,机器人就能成为“学人精”,完成各种高难度敏捷动作。从这样(下左图)变成这样(下右图)。△左图演我做运动要知道...

谁还没发现微信好友里的“卧底AI”:你以为它只会做红包封面?·

2 月 5 日
阅读 4 分钟
780
一个年过完,许多人的微信里都多了一个好友。与一些陪伴大家多年从不回复的沉默工具号不一样,这是一个事事有回应的AI助手。虽然除夕夜的发红包高峰已过去,但不断有网友晒出它的“隐藏菜单”。根据身边统计学,有人是通过做好的红包封面里附赠了对联,发现这个封面助手还有对话功能!也有人是手滑把文章链接发错给它,却...

OpenAI突遭人形机器人独角兽解约,网友:不会改用DeepSeek了吧?

2 月 5 日
阅读 2 分钟
818
就很秃然,人形机器人独角兽Figure宣布与OpenAI终止合作。创始人Brett Adcock称内部端到端机器人AI有了重大突破,将在接下来的30天展示“没人在人形机器人上见过的东西”。由于宣布的时机非常微妙,评论区网友纷纷猜测:不会是改用开源的DeepSeek模型了吧?根据Techcrunch,问题出在将AI模型集成到机器人硬件环节。比起使...

杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距

2 月 4 日
阅读 4 分钟
717
刚刚,大模型竞技场榜单上再添一款国产模型——来自阿里,Qwen2.5-Max,超越了DeepSeek-V3,以总分1332的成绩位列总榜第七。同时还一举超越Claude 3.5 Sonnet、Llama 3.1 405B等模型。特别是在编程、数学等方面表现格外突出,能够与满血o1、DeepSeek-R1并列第一。Chatbot Arena是由LMSYS Org推出的大模型性能测试平台,目...

华为昇腾推理DeepSeek-R1,性能比肩高端GPU,API免费无限量

2 月 4 日
阅读 2 分钟
983
海外云厂商争相引入DeepSeek模型,国产算力也出手了!潞晨科技联合华为昇腾,发布基于国产910B的DeepSeek-R1系列推理API,以自研国产推理引擎为底座,性能追平高端GPU。同步推出云镜像服务,满足自定义需求高、需要私有化部署DeepSeek-R1系列模型的用户。而且还送上蛇年开工的第一把羊毛:当前,DeepSeek-R1系列推理API...

新研究揭示DeepSeek弱点:频繁切换思路欠思考,最短答案往往就对

2 月 3 日
阅读 3 分钟
916
在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败——这种现象被研究者称为Underthinking(欠思考)。

5人创业国产AI搜索火了,小红书Reddit都在推!创始人:我们比Perplexity留存更高

2 月 3 日
阅读 5 分钟
833
自Perplexity官宣引入广告后,AI搜索再次成为关注焦点。而我们国内创业团队这边,也传来了新消息——Hika AI,一个仅由5人打造的AI搜索,上线不久竟能和国外当红顶流同台竞技了?!据similar web公开数据显示,上线不到1个月,它在获取用户注意力(包括平均停留时长、跳出率、每次访问页数)方面已经超过Perplexity、秘塔...

OpenAI紧急加播:ChatGPT上新深度搜索,持续思考30分钟输出1万字,刷榜“人类最后的考试”

2 月 3 日
阅读 4 分钟
899
就在开源的DeepSeek-R1被整合进各路AI搜索工具之际,OpenAI临时举行小型发布会。4点27通知,8点开始直播。ChatGPT上新“Deep Research”,把推理大模型的思考能力用于联网搜索。据介绍,Deep Research功能可在数十分钟完成人类专家需要几个小时的复杂研究任务。在“人类最后的考试”上,Deep Research刷新了最高分,比o3-min...

国产AI搜索接入DeepSeek-R1,深度试玩报告抢先出炉:正愁用不上官方联网搜索

2 月 3 日
阅读 5 分钟
918
DeepSeek千般好,万般好,就是联网搜索还用不了(愁.jpg)。但先别急,这块拼图也被国产AI搜索玩家用自己的能力补全了:就在刚刚,秘塔AI搜索宣布融合了DeepSeek-R1满血版。这意味着现在起,R1推理能力已经可以链接全网实时信息一起用了!也意味着从今天开始,DeepSeek-R1还链接上了秘塔AI搜索背后数千万的高质量论文信...

DeepSeek华为火线联手!硅基流动首发即限流,全国产API白菜价,零门槛部署

2 月 2 日
阅读 4 分钟
1.6k
华为DeepSeek联手,全套国产——国产大模型云服务平台SiliconCloud(硅基流动),首发上线了基于华为云昇腾云服务的DeepSeek-V3、DeepSeek-R1。Web端/手机端均可用,价格非常便宜,春节期间还打折,目前使用成本如下:DeepSeek-V3:输入只需1块钱/M tokens,输出2块钱/M tokensDeepSeek-R1:输入4块钱/M tokens,输出16块...

首个OpenAI免费推理模型o3-mini发布!DeepSeek让奥特曼反思:不开源我们错了

2 月 1 日
阅读 5 分钟
1.2k
DeepSeek真算是给大模型圈提了个速——就在刚刚,OpenAI深夜紧急发布了最新推理模型,o3-mini系列。一共包含三个版本:low、medium和high。其中o3-mini和o3-mini-high已经上线:根据官方口径,o3系列模型,目标是推动低成本推理的边界。ChatGPT Plus、团队和Pro用户从今天起可以访问OpenAI o3-mini,企业级访问将在一周后...

英伟达微软带头接入Deepseek,OpenAI急筹2800亿新融资

1 月 31 日
阅读 4 分钟
1.3k
DeepSeek冲击下,硅谷可太精彩了。昨天OpenAI、Anthropic还在带头冲锋,想方设法使绊子。一夜间,基础设施厂商们却纷纷“真香”了起来。在微软之后,英伟达、AWS也加急上线DeepSeek模型托管服务。正如英伟达官推评论区网友评价的,“打不过,就加入”。咱们且一桩桩一件件把这瓜捋上一捋。先说个新消息,OpenAI这边的最新应...

大模型训练开销还能更小!微软推出首个FP4训练框架,训练效果与BF16相当

1 月 30 日
阅读 3 分钟
764
首个FP4精度的大模型训练框架来了,来自微软研究院!在相同超参数的设置下,可以达到与FP8以及BF16相当的训练效果。这意味着所需的存储和计算资源可以更少。用这种方法训练的模型规模最高可达130亿参数规模,训练Tokens数量也达到千亿级别。而且用的还不是真·FP4,而是通过FP8来模拟,如果采用真的FP4,效果还能进一步提...

硅谷掀桌!DeepSeek遭OpenAI和Anthropic围剿,美国网友都看不下去了

1 月 30 日
阅读 5 分钟
1.1k
具体来说,他们发现了DeepSeek“蒸馏”OpenAI模型的迹象。即使用更大模型的输出来提高较小模型的性能,从而以较低成本在特定任务上取得类似结果。

清华NLP开源RAG开箱即用框架,自动适配知识库无需纠结模型选型

1 月 29 日
阅读 4 分钟
1.3k
近日,针对以上痛点,清华大学THUNLP团队联合东北大学NEUIR、面壁智能及9#AISoft团队共同推出了UltraRAG框架,该框架革新了传统RAG系统的开发与配置方式,极大降低了学习成本和开发周期。