SF
量子位技术号
量子位技术号
注册登录
关注博客
注册登录
主页
关于
RSS
DeepSeek玩家能提前拿苹果新品!只要15万元,在家跑满血版R1
量子位
今天 11:28
阅读 3 分钟
10
关注前沿科技 量子位号称地表最强的M3 Ultra,本地跑满血版DeepSeek R1,效果到底如何?其实,有些DeepSeek玩家们已经提前拿到手做过实测了。例如这位Alex老哥就是其中之一:他提前拿到了两台搭载M3 Ultra的Mac Studio,配置是这样的:M3 Ultra(32 核中央处理器、80 核图形处理器和 32 核神经网络引擎)512G统一内存1TB...
“谷歌版DeepSeek”接入机器人,思维链解锁折纸系鞋带技能,推理模型代入物理世界
量子位
今天 11:28
阅读 5 分钟
5
关注前沿科技 量子位谷歌把推理大模型带入物理世界,机器人可以一边思考一边动作了!成功解锁折纸、系鞋带这种精细技能。<iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_3896390582045769746" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FYicUhk5aAGtDYVvsQBKgHcianPpP24tK23I...
自动调整推理链长度,SCoT来了!为激发推理能力研究还提出了一个新架构
量子位
今天 11:28
阅读 3 分钟
7
关注前沿科技 量子位不怕推理模型简单问题过度思考了,能动态调整CoT的新推理范式SCoT来了!SCoT,即自结构化推理链(Self-structured Chain of Thought )。它通过将推理过程分解为最小语义原子步骤,能动态生成适配不同复杂度问题的CoT结构,解决了现有方法在推理多样性和效率上的不足。另外,为了激发推理能力,研究...
DeepSeek“防弹衣”来了,模型内生安全加固方案,拒绝杀敌一千自损八百|上海AI Lab
量子位
今天 11:28
阅读 3 分钟
12
关注前沿科技 量子位最新研究显示,以超强推理爆红的DeepSeek-R1模型竟藏隐形危险——即便最终拒绝回答,其思考过程仍可能泄露有害内容。现有防御技术深陷两难:要么防不住攻击,要么让模型变成”惊弓之鸟”,连正常问题都拒绝回答。上海交大与上海AI Lab联合推出安全防御方案——X-Boundary,试图破解两难局面。X-Boundary通...
11B模型拿下开源视频生成新SOTA!仅用224张GPU训练,训练成本省10倍
量子位
今天 11:28
阅读 6 分钟
6
关注前沿科技 量子位224张GPU,训出开源视频生成新SOTA!Open-Sora 2.0正式发布。11B参数规模,性能可直追HunyuanVideo和Step-Video(30B)。要知道,市面上诸多效果相近的闭源视频生成模型,动辄花费数百万美元训练成本。而Open-Sora 2.0,将这一数字压缩到了20万美元。同时,此次发布全面开源模型权重、推理代码及分布...
高阶智驾“破壁人”来了:13万标配激光雷达,还能「车位到车位」
量子位
3 月 12 日
阅读 4 分钟
93
原创 关注前沿科技 量子位高阶智驾的“破壁人”,来了。激光雷达、200TOPS+算力、端到端智驾模型、全场景无图NOA…全部标配——这是激光雷达、高阶智驾车型“史低”售价:12.98万,来自零跑最新紧凑级SUVB10:而且还只是预售,后续正式售价只低不高。2025年智驾普及浪潮,出现“高价高体验”与“低价规模化”两个看似永不交汇的平行...
新科研神器!这回读英文论文真跟读中文没两样了
量子位
3 月 12 日
阅读 4 分钟
24
原创 关注前沿科技 量子位大模型时代,读论文这事儿真是越来越爽了~你敢信,这样式儿的论文并非中文原版,而是出自翻译软件之手的翻译版。原文长这样:不仅译文流畅,公式图表也丝毫不乱,原模原样清晰美观不说,各种图注表头该翻译也都能翻译到位。并且在大模型加持之下,有什么疑点划线引用直接就能问,再也不怕没人一...
李飞飞团队具身智能新作:500美元,一切家务机器人帮你干
量子位
3 月 12 日
阅读 4 分钟
49
现在,为了挑战这个难题,李飞飞团队带来了具身智能研究最新成果——𝗕𝗘𝗛𝗔𝗩𝗜𝗢𝗥 𝗥𝗼𝗯𝗼𝘁 𝗦𝘂𝗶𝘁𝗲 (𝗕𝗥𝗦),一个解决机器人在家庭任务中全身操作问题的综合框架。
砍掉99%采样成本!腾讯AI Lab提出大模型无监督训练新技术
量子位
3 月 12 日
阅读 5 分钟
42
关注前沿科技 量子位只要微调模型生成的前8-32个词,就能让大模型推理能力达到和传统监督训练一样的水平?腾讯AI Lab与香港中文大学(深圳)合作开展了一项新研究,提出了这样一种名为无监督前缀微调(UPFT)的方法。UPFT大大降低了训练模型的数据生产成本,能够将训练时间缩短约75%,并将采样成本降低约99%。团队研究发...
90分钟生成10万Token,新框架实现3倍无损加速超长文本生成,支持DeepSeek-R1和QwQ!
量子位
3 月 12 日
阅读 4 分钟
52
关注前沿科技 量子位大语言模型长序列文本生成效率新突破——生成10万Token的文本,传统自回归模型需要近5个小时,现在仅需90分钟!最新研究提出了一个名为TOKENSWIFT框架,从模型加载、KV缓存管理到Token生成策略进行了全方位的优化。实验结果证明,该方法不仅能大幅提升生成效率,更在保证生成质量和多样性上实现了无损...
DeepSeek后更大的机遇:AI端侧推理创新 | 智在终端
量子位
3 月 11 日
阅读 5 分钟
177
荣耀、OPPO、魅族、vivo、小米纷纷官宣自家AI助理上线DeepSeek-R1及其满血版;甚至OPPO今年新发的旗舰大折叠Find N5,也强调了对DeepSeek的支持。
OpenAI自曝“o4”训练中,用思维链监控抓住AI作弊瞬间
量子位
3 月 11 日
阅读 2 分钟
558
关注前沿科技 量子位o1/o3这样的推理模型太强大,一有机会就会利用漏洞作弊,怎么办?OpenAI新研究,用语言模型监控思维链,及时发现不当行为。来看一个栗子:红色为监控模型的输出摘要,绿色为推理模型的原始思维链。在这个案例中,推理模型接到的任务是写很多复杂的数学函数,但在单元测试环节试图用“永远返回true”来...
阿里开源R1-Omni,DeepSeek同款RLVR首度结合全模态情感识别,网友:可解释性+多模态学习=下一代AI
量子位
3 月 11 日
阅读 4 分钟
86
关注前沿科技 量子位首次将DeepSeek同款RLVR应用于全模态LLM,含视频的那种!眼睛一闭一睁,阿里通义实验室薄列峰团队又开卷了,哦是开源,R1-Omni来了。同样在杭州,这是在搞什么「开源双feng」(狗头保命)?他们都做了啥?DeepSeek-R1带火了RLVR(可验证奖励强化学习),之前已有团队将RLVR应用于图像-文本多模态LLM...
大模型全军覆没,中科院自动化所推出多图数学推理新基准 | CVPR 2025
量子位
3 月 11 日
阅读 3 分钟
99
近日,中国科学院自动化研究所推出多图数学推理全新基准MV-MATH(该工作已被CVPR 2025录用),这是一个精心策划的多图数学推理数据集,旨在全面评估MLLM(多模态大语言模型)在多视觉场景中的数学推理能力。
二次元AI新玩具破圈走红!短短几个月100万MAU
量子位
3 月 10 日
阅读 4 分钟
224
原创 关注前沿科技 量子位二次元圈子突然冒出了个AI新玩具,最近有点小火🔥你可能在小破站、小红薯频频刷到一些精美的二次元图,belike:有的图非常复杂,感觉像是专业画手出品,结果点开一看,竟也全是AI。咱就是说,二次元圈子用的AI工具生图质量都这么高了吗?就离谱,全都是一个叫“狸谱”的App干的。这款App不光在线上...
深圳机器人跑步惊呆歪果仁,与人类无异,网友:北马见
量子位
3 月 10 日
阅读 3 分钟
94
<iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_3891975455892520974" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FYicUhk5aAGtCTWBic9AicFkQlKPINcImMwO6M1dbs6hm9Hfa0KWPibicTv1kAXmRz3wfqh7wzrVGvfVVQpq2H4VFvrA%2F0%3Fwx_fmt%3Djpeg" allowfullscreen="" frameborder="0"...
草稿链代替思维链,推理token砍掉80%,显著降低算力成本和延迟
量子位
3 月 10 日
阅读 2 分钟
102
关注前沿科技 量子位推理token减少80%-90%,准确率变化不大,某些任务还能增加。Zoom团队提出思维链替代品“草稿链”,显著降低延迟和算力成本。原理很简单,要求模型为每个推理步骤生成简洁、信息密集的token。这一思路受到人类解题过程启发,人类通常不会详细阐述每一个细节,只是简单几下关键的中间结果,作为草稿来辅...
OpenAI给所有模型做“身份卡”!一个页面读懂能力、速度、价格全指标
量子位
3 月 10 日
阅读 3 分钟
111
关注前沿科技 量子位OpenAI的模型搞得太多太凌乱,官方自己都看不下去了。为了厘清这些模型还有它们的各种版本,官方直接给做它们了一套“身份卡”。每个模型“身份卡”都包含了能力、速度、支持模态、价格等信息,并且以图示+简单文本的形式呈现,既简洁又清晰。而且还上线了对比功能,可以一次对比三个模型,直观比较之间...
量子位招聘 | DeepSeek帮我们改的招聘启事
量子位
3 月 9 日
阅读 3 分钟
175
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...
Manus引爆智能体复现潮!DeepSeek已被整合,项目挤满开源榜,海外大V排队求码
量子位
3 月 9 日
阅读 4 分钟
169
量子位Manus背后公司名为“蝴蝶效应”,真的带火了整个智能体赛道——开源复现潮出现了,商业闭源产品也卷起来了。目前进度最快的两个项目,都是在Manus发布的第0天发布了复现代码。除了之前介绍的OpenManus之外,另一个开源项目OWL已经把DeepSeek模型整合到多智能体协作框架中。OWL来自国内开源社区CAMEL-AI团队。OWL最...
DeepSeek同款GRPO训练大提速!魔搭开源全流程方案,支持多模态训练、训练加速和评测全链路
量子位
3 月 9 日
阅读 7 分钟
147
随着DeepSeek-R1的成功出圈,其使用的GRPO算法受到了业界的广泛关注。GRPO训练是来自于PPO算法的一种改进,旨在利用采样原理对value model进行简化,以增大训练的稳定性和可维护性。
AI玩手机越玩越6!西湖大学发布新智能体:会自我进化的AppAgentX
量子位
3 月 9 日
阅读 3 分钟
163
然而,LLM的潜力远不止于文本生成,它们正在塑造一种全新的智能体形态——GUI代理(GUI Agents)。这类智能体不仅能理解指令,还能像人类一样直接操作计算机和手机,摆脱对预设规则或API的依赖,带来更自然、高效的交互方式,使AI真正融入软件生态,成为智能操作系统的一部分。
DeepMind元老创业AI编程:亮相即获1.55亿美元,英伟达红杉抢着投,团队太豪华了!
量子位
3 月 8 日
阅读 5 分钟
219
两位来自谷歌DeepMind顶尖科学家,官宣组团构建超级智能自主系统(superintelligent autonomous systems)。
南京AI放大招:Agent平台支持100+智能体,跨系统调用成功率99.2%
量子位
3 月 8 日
阅读 3 分钟
200
关注前沿科技 量子位继DeepSeek 之后,一款由国内开发的通用AI Agent产品也引发热议——Manus,其背后折射出的是国人对于Agent应用落地的迫切心情。在国产大模型取得突破性进展的当下,大家自然更加期待在 AI 应用领域能够出现一个类似于 DeepSeek 的企业。一部分原因在于,相较于目前的大模型产品,Agent能够实实在在地解...
港大马毅团队等开源新作:用编码率正则化重构视觉自监督学习范式,“少即是多”
量子位
3 月 8 日
阅读 4 分钟
172
关注前沿科技 量子位最新开源的视觉预训练方法,马毅团队、微软研究院、UC伯克利等联合出品!SimDINO和SimDINOv2,通过编码率正则化简化DINO和DINOv2模型训练流程得到的两个最新模型。在目前视觉预训练领域,DINO和DINOv2是最强视觉模型梯队选手,也是目前最常用的方法。在多模态大模型火热的当下,DINOv2也经常被用作VL...
征稿倒计时!CVPR 2025 Workshop共话“基础模型+X”的鲁棒性挑战
量子位
3 月 8 日
阅读 2 分钟
189
IEEE/CVF国际计算机视觉与模式识别会议(CVPR),作为人工智能领域最具学术影响力的顶级会议之一,将于2025年6月11日至6月15日在美国田纳西州隆重举行。
5个人三小时复刻开源版Manus,邀请码也不需要了
量子位
3 月 7 日
阅读 5 分钟
243
原创 关注前沿科技 量子位这壁垒……一夜走红的Manus,现在已经有了开源复刻版!5个人3个小时,一个完全免费、无需排队等待的OpenManus就做好了。至于复现程度,还是直接看Manus官方和开源团队提供的demo对比。作为全球首款通用智能体,官方提供的case如下:<iframe class="video_iframe rich_pages" data-vidtype="2" ...
2行代码与DeepSeek语音对话,1分钟不到一毛钱,所有大模型都能开口说话
量子位
3 月 7 日
阅读 4 分钟
151
<iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_3887681460970405889" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FYicUhk5aAGtCIQtnPDicIXP8p0ZwvTnvsgMS6DxlEJMH5ViaADoVbBONicXMPevzk7XAo8icLiasXQFpCn3rgImrKneQ%2F0%3Fwx_fmt%3Djpeg" allowfullscreen="" frameborder="0...
7B的DeepSeek蒸馏Qwen数学超o1!在测试时间强化学习,MIT积分题大赛考93分
量子位
3 月 7 日
阅读 3 分钟
171
关注前沿科技 量子位见识过32B的QwQ追平671的DeepSeek R1后——刚刚,7B的DeepSeek蒸馏Qwen模型超越o1又是怎么一回事?新方法LADDER,通过递归问题分解实现AI模型的自我改进,同时不需要人工标注数据。使Deepseek-R1蒸馏的Qwen2.5 7B模型在麻省理工学院积分大赛(MIT Integration Bee)上达到90分超越o1。注意,不是积分制...
无需大量标注也能理解3D!新研究登上ICLR 2025 Spotlight
量子位
3 月 7 日
阅读 4 分钟
174
关注前沿科技 量子位只要极少量的标注样本,就能让模型精准分割3D场景?来自哥本哈根大学、苏黎世联邦理工学院等机构的研究人员,提出了一个全新的多模态Few-shot 3D分割设定和创新方法。无需额外标注成本,该方法就可以融合文本、2D和3D信息,让模型迅速掌握新类别。△3D Few-shot分割结果示例人形机器人、VR/AR,以及自...
1
(current)
2
3
4
5
…
More
下一页
1
(current)
下一页