量子位招聘 | DeepSeek帮我们改的招聘启事

2 月 18 日
阅读 3 分钟
346
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

全球空间智能第一股!浙大清华“三剑客”,英伟达基因,填补两大技术空白

2 月 17 日
阅读 6 分钟
473
原创 关注前沿科技 量子位全球空间智能第一股来了!来自中国,来自杭州。2月14日,空间智能独角兽群核科技正式向港交所递交招股说明书,启动IPO进程,冲击“全球空间智能第一股”,摩根大通、建银国际为联席保荐人。群核科技于2011年由浙大清华校友创办,始终专注于空间认知相关技术的研发与落地。在李飞飞、英伟达包括众...

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好

2 月 17 日
阅读 5 分钟
336
关注前沿科技 量子位GPT-4o悄悄更新版本,在大模型竞技场超越DeepSeek-R1登上并列第一。除了数学(第6),还在多个单项上拿下第一:创意写作;编程;指令遵循;长文本查询;多轮对话;先直观看下新版GPT-4o的能力如何,还是以之前DeepSeek-R1和o3-mini都挑战过的一个例子来看。Prompt:编写一个Python程序,展示一个球在...

Llama模仿Diffusion多模态涨分30%!不卷数据不烧卡,只需共享注意力分布

2 月 17 日
阅读 3 分钟
426
关注前沿科技 量子位这次不是卷参数、卷算力,而是卷“跨界学习”——让Stable Diffusion当老师,教多模态大模型(如Llama-3.2)如何“看图说话”!性能直接飙升30%。中国研究员联合DeepMind团队的最新研究《Lavender: Diffusion Instruction Tuning》,通过简单的“注意力对齐”,仅需1天训练、2.5%常规数据量,即可让Llama-3.2...

量子位招聘 | DeepSeek帮我们改的招聘启事

2 月 17 日
阅读 3 分钟
336
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

微信DeepSeek入口已接通,辐射用户14亿!刚刚实测,辛弃疾都得666

2 月 16 日
阅读 4 分钟
426
原创 关注前沿科技 量子位一睁眼,微信证实:已正式接入DeepSeek-R1,还是满血版!使用路径非常简单:打开微信——点击搜索框——选择页面中部「AI搜索」——选择深度思考模式——用起来~生成后的结果还带有社交属性,可以分享转给朋友,或转发至朋友圈。此前不少人就呼吁,想要能把DeepSeek的答案一键分享,但夙愿未尝。昨晚之...

不蒸馏R1也能超越DeepSeek,上海 AI Lab 用RL突破数学推理极限

2 月 16 日
阅读 4 分钟
395
从Qwen2.5-32B-Base模型出发,仅通过微调和基于结果反馈的强化学习,在不蒸馏超大模型如DeepSeek-R1的情况下,就能超越DeepSeek-R1-Distill-Qwen32B和OpenAI-O1系列的超强数学推理性能。

免手术AI读心术新突破!Meta脑机接口研究惊呆网友:能边睡边玩手机发帖了??

2 月 16 日
阅读 4 分钟
358
关注前沿科技 量子位新年伊始,Meta脑机接口研究传来新进展——语言模型加持下,无需动脑部手术,脑机接口实现了当前非侵入式方式(MEG)最准确的结果。简单来说,仅利用AI模型Brain2Qwerty,他们实现了对脑电图(EEG)或脑磁图(MEG)电信号的高度解析。具体效果如何呢??据论文介绍,使用MEG,Brain2Qwerty的平均字符错...

Perplexity免费推出Deep Research:性能超过R1、o3-mini等,CEO:感谢DeepSeek

2 月 15 日
阅读 5 分钟
461
原创 关注前沿科技 量子位AI搜索“老大哥”Perplexity,刚刚也推出了自家的Deep Research——随便给个话题,就能生成有深度的研究报告。先来划个重点:免费向所有人开放!具体来说,非订阅用户每天最多可查询5次,Pro用户每天可查询500次。然后啊,效果是酱紫的。例如给出一个问题:What should I know before the market op...

DeepSeek官方推荐:R1要这样设置

2 月 15 日
阅读 2 分钟
417
关注前沿科技 量子位家人们,咱们到底该如何部署DeepSeek-R1,才能体验最佳啊?对于这个问题,DeepSeek官方发话了:DeepSeek推荐的设置非常简单,只有四项内容。其中三项,其实在此前相关文档中有所涉及,我们在这里再来回顾一下。首先,是别用系统提示词(No system prompt),所有的指令都应该包含在用户提示词中。至...

量子位招聘 | DeepSeek帮我们改的招聘启事

2 月 15 日
阅读 3 分钟
342
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

百度决定背叛闭源大模型,李彦宏重新拥抱开源

2 月 14 日
阅读 2 分钟
461
关注前沿科技 量子位继昨天决定免费之后,百度刚刚又发布一则重磅消息——下一代文心模型,决定开源!而且官宣内容只有一句话(字少事大的感觉):我们将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。从收费到免费,从闭源到开源……嗯,DeepSeek带来的冲击着实是有亿点点大。从闭源到开源的文心一言回...

DeepSeek R1遇难题142次"I give up",研究还称需增加推理时机控制机制

2 月 14 日
阅读 5 分钟
413
关注前沿科技 量子位最新大语言模型推理测试引众议,DeepSeek R1常常在提供错误答案前就“我放弃”了??Cursor刚刚参与了一项研究,他们基于NPR周日谜题挑战(The Sunday Puzzle),构建了一个包含近600个问题新基准测试。这些谜题特点是很好理解,不需要专业知识就能看懂,然鹅解决起来却没那么容易。举个栗子:想一个熟...

Claude 4被曝发布在即!DeepSeek把大招都给逼出来了

2 月 14 日
阅读 2 分钟
556
关注前沿科技 量子位终于!终于!Claude 4被曝将在未来几周内发布!高亮重点,最新的它采取了一个与之前模型路线不同的办法:是个混合型大模型。怎么样,听起来是不是和昨天奥特曼透露的GPT-5非常类似(doge)。都是不再把传统通用模型和推理模型分开推出,直接融合在一起。据透露,Anthropic计划在未来几周内发布该模型...

达摩院开源VideoLLaMA3:仅7B大小,视频理解拿下SOTA | 在线可玩

2 月 14 日
阅读 5 分钟
369
原创 关注前沿科技 量子位7B大小的视频理解模型中的新SOTA,来了!它就是由达摩院出品的Video LLaMA 3,以图像为中心构建的新一代多模态视频-语言模型。在通用视频理解、时间推理和长视频理解三个核心维度进行评估的过程中,VideoLLaMA 3均取得优异成绩,超越多数基线模型。不仅如此,适用于端侧的2B大小的Video LLaMA 3...

量子位招聘 | DeepSeek帮我们改的招聘启事

2 月 14 日
阅读 3 分钟
385
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

腾讯元宝接入DeepSeek-R1满血版,首次引入第三方模型,能联网能调用微信独家生态

2 月 13 日
阅读 4 分钟
579
关注前沿科技 量子位刚刚,腾讯主力AI应用「元宝」宣布接入Deepseek-R1满血版!现在打开腾讯元宝,它已经可以在模型选择框中,自由切换混元模型和满血版DeepSeek-R1。而且切换到满血版DeepSeek的腾讯元宝,支持联网搜索。这下,它已经是——支持双模型+可联网搜索+整合微信公众号、视频号等腾讯生态信息源的钮祜禄·腾讯元...

文心一言全面免费了,深度搜索功能同时上线,第一手实测在此

2 月 13 日
阅读 5 分钟
456
原创 关注前沿科技 量子位一天内,OpenAI、百度两家AI大厂同时打出免费牌!几天前被爆出文心5.0消息后,今天百度突然宣布:文心一言将于4月1日零时起,全面免费! 所有PC端和APP端用户均可体验文心系列最新模型。与此同时,文心一言上线深度搜索功能,OpenAI一周前紧急开直播将推理大模型思考能力用于联网搜索,还没捂热...

打破纪录!谷歌全网扒1000亿图像文本对,ViT大佬坐镇:数据Scaling潜力依旧

2 月 13 日
阅读 3 分钟
435
关注前沿科技 量子位史上最大规模视觉语言数据集:1000亿图像-文本对!什么概念?较此前纪录扩大10倍。这就是由谷歌推出的最新数据集WebLI-100B。它进一步证明,数据Scaling Law还远没有到上限。在英文世界之外的多元文化、多语言维度,1000亿规模数据集能更好覆盖长尾场景,由此带来明显性能提升。这意味着,想要构建更...

Gemini再度“破防”!长期记忆被黑客篡改,方法竟和一年前如出一辙

2 月 13 日
阅读 4 分钟
380
关注前沿科技 量子位Gemini的提示词注入防线,又被黑客给攻破了。专业白帽黑客Johann Rehberger(雷哥)发现,向文档中加入一段提示词,让模型“稍后执行操作”,就能绕过Gemini的注入防御。雷哥用这种方法篡改了Gemini的长期记忆,让Gemini记住了他是个102岁的老人。抓马的是,在Gemini还叫Bard的时候,雷哥就用相似的手...

中国AIGC产品全景图谱全面征集|量子位智库

2 月 13 日
阅读 2 分钟
418
量子位智库 量子位2024年是国内AI产品风云变幻的一年。经历了抢鲜发布、市场教育、多方混战、用户检验过后,优秀的AI产品纷纷站稳脚跟,新的场景与功能也切实改写着大众的工作与生活。具体的AI产品布局究竟如何?2024年9月,量子位智库首次发布AI产品全景图,并在《2024年度十大AI趋势报告》进行了更新。但不仅如此。在...

量子位招聘 | DeepSeek帮我们改的招聘启事

2 月 13 日
阅读 3 分钟
360
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

免费!满血版DeepSeek丝滑畅玩,低门槛实现671B-R1/V3自由,潞晨云上新

2 月 12 日
阅读 2 分钟
561
关注前沿科技 量子位想快速顺畅上手DeepSeek还不踩坑?“真·满血DeepSeek-671B-R1/V3解决方案”来了!它能解决的问题包括:服务器总繁忙充了钱却被残血模型欺骗费力拉新,遇上代金券失效背刺不懂代码,不会使用API接口模型不能联网查询实时信息数据隐私要求高,不想上传外网潞晨云官方现在提供以下服务:免费通道:不用拉...

4090单卡跑满血版DeepSeek-R1,清华团队开源项目再破大模型推理门槛

2 月 12 日
阅读 4 分钟
686
而市面上所谓“本地部署”方案,多为参数量缩水90%的蒸馏版,背后原因是671B参数的MoE架构对显存要求极高——即便用8卡A100也难以负荷。因此,想在本地小规模硬件上跑真正的DeepSeek-R1,被认为基本不可能。

5090又烧了!英伟达发售前曾保证“已完全解决”

2 月 12 日
阅读 3 分钟
416
关注前沿科技 量子位4090的烧接口问题,到了5090又卷土重来了。Reddit网友发帖表示,自己在用5090创始人版打游戏时闻到一股糊味,一看竟然是显卡接口烧了。而这位博主使用的,正是和当时4090同款的12VHPWR接口。抓马的是,在50系显卡发售之前,英伟达曾承诺过,烧接口的问题已经完全解决。这名博主表示,自己之前用4090...

奥特曼公开回怼马斯克,OpenAI董事会成员:说要收购,没收到报价啊?

2 月 12 日
阅读 3 分钟
444
马斯克此举只是压制竞争的小伎俩,我希望他能通过打造更好的产品来竞争;可能他的一生都处于不安全状态,我为这个人感到难过…我不认为他是个快乐的人。OpenAI不打算出售。

只需一句话,AI调用多个应用为你打工!三星S25系列国行版发布,AI功能大升级

2 月 12 日
阅读 3 分钟
419
关注前沿科技 量子位刚刚,三星S25系列(S25、S25+、S25 Ultra)国行版正式亮相!内置的Galaxy AI功能也一同升级,能够跨越APP的界限,调用不同应用来完成操作。并且部分AI功能支持在端侧运行,隐私安全更有保证。当然了,想在端侧流畅地运行AI模型,必然离不开算力的支持,再通俗些,芯片要足够强才行。S25系列采用了3n...

满血DeepSeek-R1+Cursor打通!无问芯穹上线API服务,能力拉满,7大国产算力保驾护航

2 月 11 日
阅读 3 分钟
423
关注前沿科技 量子位DeepSeek影响力持续破圈,随之而来的烦恼是,官网总是“服务器繁忙”……好消息是,满血版DeepSeek-R1、V3正在得到越来越多第三方平台的支持。最新进展,无问芯穹大模型服务平台现已官宣,上线满血版DeepSeek-R1、V3 API服务,并且无需邀请即可免费用Token!还有国产算力可选,支持通过Infini-AI异构云平...

推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考

2 月 11 日
阅读 2 分钟
412
关注前沿科技 量子位开源推理大模型新架构来了,采用与Deepseek-R1/OpenAI o1截然不同的路线:例如问题:Claire每天早餐都会做一个3个鸡蛋的煎蛋卷。她在4周内会吃多少个鸡蛋?从新模型Huginn的思考轨迹可视化中,可以看到对数字3等重要token不断旋转,最终收敛到正确答案对应的位置,但在不关键的人物名字Cla-ire上没有...

Claude团队:用400万条对话分析AI对经济的长期影响

2 月 11 日
阅读 4 分钟
334
关注前沿科技 量子位基于400万条Claude真实对话数据,Anthropic重磅发布全新报告!在今天,哪些职业用AI最多?他们都用AI干什么?这些有关AI在各经济领域应用情况的问题,报告用实实在在的统计数据全回答了。这一次,他们不仅推出The Anthropic Economic Index(用来理解AI对经济影响的指数),还公开了第一篇论文,里面...