量子位技术号 - SegmentFault 思否

量子位招聘 | DeepSeek帮我们改的招聘启事

2 月 18 日

阅读 3 分钟

346

关注前沿科技量子位未来同事，你好~这是一则招聘帖。如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。岗位面向：社招、应届毕业生，所有岗位均可实习——表现出色均可转正加分项：乐于探索AI新工具，善用AI新工具...

全球空间智能第一股！浙大清华“三剑客”，英伟达基因，填补两大技术空白

2 月 17 日

阅读 6 分钟

473

原创关注前沿科技量子位全球空间智能第一股来了！来自中国，来自杭州。2月14日，空间智能独角兽群核科技正式向港交所递交招股说明书，启动IPO进程，冲击“全球空间智能第一股”，摩根大通、建银国际为联席保荐人。群核科技于2011年由浙大清华校友创办，始终专注于空间认知相关技术的研发与落地。在李飞飞、英伟达包括众...

反超DeepSeek！新版GPT-4o登顶竞技场，奥特曼：还会更好

2 月 17 日

阅读 5 分钟

336

关注前沿科技量子位GPT-4o悄悄更新版本，在大模型竞技场超越DeepSeek-R1登上并列第一。除了数学（第6），还在多个单项上拿下第一：创意写作；编程；指令遵循；长文本查询；多轮对话；先直观看下新版GPT-4o的能力如何，还是以之前DeepSeek-R1和o3-mini都挑战过的一个例子来看。Prompt：编写一个Python程序，展示一个球在...

Llama模仿Diffusion多模态涨分30%！不卷数据不烧卡，只需共享注意力分布

2 月 17 日

阅读 3 分钟

426

关注前沿科技量子位这次不是卷参数、卷算力，而是卷“跨界学习”——让Stable Diffusion当老师，教多模态大模型（如Llama-3.2）如何“看图说话”！性能直接飙升30%。中国研究员联合DeepMind团队的最新研究《Lavender: Diffusion Instruction Tuning》，通过简单的“注意力对齐”，仅需1天训练、2.5%常规数据量，即可让Llama-3.2...

量子位招聘 | DeepSeek帮我们改的招聘启事

2 月 17 日

阅读 3 分钟

336

关注前沿科技量子位未来同事，你好~这是一则招聘帖。如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。岗位面向：社招、应届毕业生，所有岗位均可实习——表现出色均可转正加分项：乐于探索AI新工具，善用AI新工具...

微信DeepSeek入口已接通，辐射用户14亿！刚刚实测，辛弃疾都得666

2 月 16 日

阅读 4 分钟

426

原创关注前沿科技量子位一睁眼，微信证实：已正式接入DeepSeek-R1，还是满血版！使用路径非常简单：打开微信——点击搜索框——选择页面中部「AI搜索」——选择深度思考模式——用起来～生成后的结果还带有社交属性，可以分享转给朋友，或转发至朋友圈。此前不少人就呼吁，想要能把DeepSeek的答案一键分享，但夙愿未尝。昨晚之...

不蒸馏R1也能超越DeepSeek，上海 AI Lab 用RL突破数学推理极限

2 月 16 日

阅读 4 分钟

395

从Qwen2.5-32B-Base模型出发，仅通过微调和基于结果反馈的强化学习，在不蒸馏超大模型如DeepSeek-R1的情况下，就能超越DeepSeek-R1-Distill-Qwen32B和OpenAI-O1系列的超强数学推理性能。

免手术AI读心术新突破！Meta脑机接口研究惊呆网友：能边睡边玩手机发帖了？？

2 月 16 日

阅读 4 分钟

358

关注前沿科技量子位新年伊始，Meta脑机接口研究传来新进展——语言模型加持下，无需动脑部手术，脑机接口实现了当前非侵入式方式（MEG）最准确的结果。简单来说，仅利用AI模型Brain2Qwerty，他们实现了对脑电图（EEG）或脑磁图（MEG）电信号的高度解析。具体效果如何呢？？据论文介绍，使用MEG，Brain2Qwerty的平均字符错...

Perplexity免费推出Deep Research：性能超过R1、o3-mini等，CEO：感谢DeepSeek

2 月 15 日

阅读 5 分钟

461

原创关注前沿科技量子位AI搜索“老大哥”Perplexity，刚刚也推出了自家的Deep Research——随便给个话题，就能生成有深度的研究报告。先来划个重点：免费向所有人开放！具体来说，非订阅用户每天最多可查询5次，Pro用户每天可查询500次。然后啊，效果是酱紫的。例如给出一个问题：What should I know before the market op...

DeepSeek官方推荐：R1要这样设置

2 月 15 日

阅读 2 分钟

417

关注前沿科技量子位家人们，咱们到底该如何部署DeepSeek-R1，才能体验最佳啊？对于这个问题，DeepSeek官方发话了：DeepSeek推荐的设置非常简单，只有四项内容。其中三项，其实在此前相关文档中有所涉及，我们在这里再来回顾一下。首先，是别用系统提示词（No system prompt），所有的指令都应该包含在用户提示词中。至...

量子位招聘 | DeepSeek帮我们改的招聘启事

2 月 15 日

阅读 3 分钟

342

关注前沿科技量子位未来同事，你好~这是一则招聘帖。如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。岗位面向：社招、应届毕业生，所有岗位均可实习——表现出色均可转正加分项：乐于探索AI新工具，善用AI新工具...

百度决定背叛闭源大模型，李彦宏重新拥抱开源

2 月 14 日

阅读 2 分钟

461

关注前沿科技量子位继昨天决定免费之后，百度刚刚又发布一则重磅消息——下一代文心模型，决定开源！而且官宣内容只有一句话（字少事大的感觉）：我们将在未来几个月中陆续推出文心大模型4.5系列，并于6月30日起正式开源。从收费到免费，从闭源到开源……嗯，DeepSeek带来的冲击着实是有亿点点大。从闭源到开源的文心一言回...

DeepSeek R1遇难题142次"I give up"，研究还称需增加推理时机控制机制

2 月 14 日

阅读 5 分钟

413

关注前沿科技量子位最新大语言模型推理测试引众议，DeepSeek R1常常在提供错误答案前就“我放弃”了？？Cursor刚刚参与了一项研究，他们基于NPR周日谜题挑战（The Sunday Puzzle），构建了一个包含近600个问题新基准测试。这些谜题特点是很好理解，不需要专业知识就能看懂，然鹅解决起来却没那么容易。举个栗子：想一个熟...

Claude 4被曝发布在即！DeepSeek把大招都给逼出来了

2 月 14 日

阅读 2 分钟

556

关注前沿科技量子位终于！终于！Claude 4被曝将在未来几周内发布！高亮重点，最新的它采取了一个与之前模型路线不同的办法：是个混合型大模型。怎么样，听起来是不是和昨天奥特曼透露的GPT-5非常类似（doge）。都是不再把传统通用模型和推理模型分开推出，直接融合在一起。据透露，Anthropic计划在未来几周内发布该模型...

达摩院开源VideoLLaMA3：仅7B大小，视频理解拿下SOTA | 在线可玩

2 月 14 日

阅读 5 分钟

369

原创关注前沿科技量子位7B大小的视频理解模型中的新SOTA，来了！它就是由达摩院出品的Video LLaMA 3，以图像为中心构建的新一代多模态视频-语言模型。在通用视频理解、时间推理和长视频理解三个核心维度进行评估的过程中，VideoLLaMA 3均取得优异成绩，超越多数基线模型。不仅如此，适用于端侧的2B大小的Video LLaMA 3...

量子位招聘 | DeepSeek帮我们改的招聘启事

2 月 14 日

阅读 3 分钟

385

关注前沿科技量子位未来同事，你好~这是一则招聘帖。如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。岗位面向：社招、应届毕业生，所有岗位均可实习——表现出色均可转正加分项：乐于探索AI新工具，善用AI新工具...

腾讯元宝接入DeepSeek-R1满血版，首次引入第三方模型，能联网能调用微信独家生态

2 月 13 日

阅读 4 分钟

579

关注前沿科技量子位刚刚，腾讯主力AI应用「元宝」宣布接入Deepseek-R1满血版！现在打开腾讯元宝，它已经可以在模型选择框中，自由切换混元模型和满血版DeepSeek-R1。而且切换到满血版DeepSeek的腾讯元宝，支持联网搜索。这下，它已经是——支持双模型+可联网搜索+整合微信公众号、视频号等腾讯生态信息源的钮祜禄·腾讯元...

文心一言全面免费了，深度搜索功能同时上线，第一手实测在此

2 月 13 日

阅读 5 分钟

456

原创关注前沿科技量子位一天内，OpenAI、百度两家AI大厂同时打出免费牌！几天前被爆出文心5.0消息后，今天百度突然宣布：文心一言将于4月1日零时起，全面免费！所有PC端和APP端用户均可体验文心系列最新模型。与此同时，文心一言上线深度搜索功能，OpenAI一周前紧急开直播将推理大模型思考能力用于联网搜索，还没捂热...

打破纪录！谷歌全网扒1000亿图像文本对，ViT大佬坐镇：数据Scaling潜力依旧

2 月 13 日

阅读 3 分钟

435

关注前沿科技量子位史上最大规模视觉语言数据集：1000亿图像-文本对！什么概念？较此前纪录扩大10倍。这就是由谷歌推出的最新数据集WebLI-100B。它进一步证明，数据Scaling Law还远没有到上限。在英文世界之外的多元文化、多语言维度，1000亿规模数据集能更好覆盖长尾场景，由此带来明显性能提升。这意味着，想要构建更...

Gemini再度“破防”！长期记忆被黑客篡改，方法竟和一年前如出一辙

2 月 13 日

阅读 4 分钟

380

关注前沿科技量子位Gemini的提示词注入防线，又被黑客给攻破了。专业白帽黑客Johann Rehberger（雷哥）发现，向文档中加入一段提示词，让模型“稍后执行操作”，就能绕过Gemini的注入防御。雷哥用这种方法篡改了Gemini的长期记忆，让Gemini记住了他是个102岁的老人。抓马的是，在Gemini还叫Bard的时候，雷哥就用相似的手...

中国AIGC产品全景图谱全面征集｜量子位智库

2 月 13 日

阅读 2 分钟

418

量子位智库量子位2024年是国内AI产品风云变幻的一年。经历了抢鲜发布、市场教育、多方混战、用户检验过后，优秀的AI产品纷纷站稳脚跟，新的场景与功能也切实改写着大众的工作与生活。具体的AI产品布局究竟如何？2024年9月，量子位智库首次发布AI产品全景图，并在《2024年度十大AI趋势报告》进行了更新。但不仅如此。在...

量子位招聘 | DeepSeek帮我们改的招聘启事

2 月 13 日

阅读 3 分钟

360

关注前沿科技量子位未来同事，你好~这是一则招聘帖。如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。岗位面向：社招、应届毕业生，所有岗位均可实习——表现出色均可转正加分项：乐于探索AI新工具，善用AI新工具...

免费！满血版DeepSeek丝滑畅玩，低门槛实现671B-R1/V3自由，潞晨云上新

2 月 12 日

阅读 2 分钟

561

关注前沿科技量子位想快速顺畅上手DeepSeek还不踩坑？“真·满血DeepSeek-671B-R1/V3解决方案”来了！它能解决的问题包括：服务器总繁忙充了钱却被残血模型欺骗费力拉新，遇上代金券失效背刺不懂代码，不会使用API接口模型不能联网查询实时信息数据隐私要求高，不想上传外网潞晨云官方现在提供以下服务：免费通道：不用拉...

4090单卡跑满血版DeepSeek-R1，清华团队开源项目再破大模型推理门槛

2 月 12 日

阅读 4 分钟

686

而市面上所谓“本地部署”方案，多为参数量缩水90%的蒸馏版，背后原因是671B参数的MoE架构对显存要求极高——即便用8卡A100也难以负荷。因此，想在本地小规模硬件上跑真正的DeepSeek-R1，被认为基本不可能。

5090又烧了！英伟达发售前曾保证“已完全解决”

2 月 12 日

阅读 3 分钟

416

关注前沿科技量子位4090的烧接口问题，到了5090又卷土重来了。Reddit网友发帖表示，自己在用5090创始人版打游戏时闻到一股糊味，一看竟然是显卡接口烧了。而这位博主使用的，正是和当时4090同款的12VHPWR接口。抓马的是，在50系显卡发售之前，英伟达曾承诺过，烧接口的问题已经完全解决。这名博主表示，自己之前用4090...

奥特曼公开回怼马斯克，OpenAI董事会成员：说要收购，没收到报价啊？

2 月 12 日

阅读 3 分钟

444

马斯克此举只是压制竞争的小伎俩，我希望他能通过打造更好的产品来竞争；可能他的一生都处于不安全状态，我为这个人感到难过…我不认为他是个快乐的人。OpenAI不打算出售。

只需一句话，AI调用多个应用为你打工！三星S25系列国行版发布，AI功能大升级

2 月 12 日

阅读 3 分钟

419

关注前沿科技量子位刚刚，三星S25系列（S25、S25+、S25 Ultra）国行版正式亮相！内置的Galaxy AI功能也一同升级，能够跨越APP的界限，调用不同应用来完成操作。并且部分AI功能支持在端侧运行，隐私安全更有保证。当然了，想在端侧流畅地运行AI模型，必然离不开算力的支持，再通俗些，芯片要足够强才行。S25系列采用了3n...

满血DeepSeek-R1+Cursor打通！无问芯穹上线API服务，能力拉满，7大国产算力保驾护航

2 月 11 日

阅读 3 分钟

423

关注前沿科技量子位DeepSeek影响力持续破圈，随之而来的烦恼是，官网总是“服务器繁忙”……好消息是，满血版DeepSeek-R1、V3正在得到越来越多第三方平台的支持。最新进展，无问芯穹大模型服务平台现已官宣，上线满血版DeepSeek-R1、V3 API服务，并且无需邀请即可免费用Token！还有国产算力可选，支持通过Infini-AI异构云平...

推理模型新路线开源！与DeepSeek截然不同，抛弃思维链不用人类语言思考

2 月 11 日

阅读 2 分钟

412

关注前沿科技量子位开源推理大模型新架构来了，采用与Deepseek-R1/OpenAI o1截然不同的路线：例如问题：Claire每天早餐都会做一个3个鸡蛋的煎蛋卷。她在4周内会吃多少个鸡蛋？从新模型Huginn的思考轨迹可视化中，可以看到对数字3等重要token不断旋转，最终收敛到正确答案对应的位置，但在不关键的人物名字Cla-ire上没有...

Claude团队：用400万条对话分析AI对经济的长期影响

2 月 11 日

阅读 4 分钟

334

关注前沿科技量子位基于400万条Claude真实对话数据，Anthropic重磅发布全新报告！在今天，哪些职业用AI最多？他们都用AI干什么？这些有关AI在各经济领域应用情况的问题，报告用实实在在的统计数据全回答了。这一次，他们不仅推出The Anthropic Economic Index（用来理解AI对经济影响的指数），还公开了第一篇论文，里面...

9

9