语音界Deepseek!百度最新跨模态端到端语音交互,成本最高降90%

4 月 2 日
阅读 5 分钟
314
关注前沿科技 量子位没想到,文小言接入推理模型的大更新背后,百度还藏了一手“质变”级技术大招???Talk is cheap,直接来看Demo:<iframe class="video_iframe rich_pages" data-src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&amp;action=mpvideo&amp;auto=0&amp;vid=wxv...

从DeepSeek崛起到下一个亿级销量市场,这份硬核报告说明白了

4 月 1 日
阅读 8 分钟
310
原创 关注前沿科技 量子位我们正在进入AI创新的「中国时间」。2025第一季度刚刚过完,中国大模型“国产之光”已经可以预定一个年度关键词了。从DeepSeek走红全网,到Manus一夜爆火,再到宇树为代表的机器人让中外网友连连惊呼……毫无疑问,中国前沿科技,正在2025年成为全世界热议和肯定的焦点。△LeCun评DeepSeek但问题是:...

两位华人76页论文解决量子领域核心问题:首次证明伪随机性真实存在

4 月 1 日
阅读 3 分钟
288
关注前沿科技 量子位量子领域的一个核心开放问题,就这样被两位华人研究员解决了?!事情是这样的。一直以来,量子的随机性在计算和密码学中极为有用。一方面,它可以用来提升算法效率、优化复杂系统模拟,还能验证量子计算结果的可靠性;另一方面,量子随机性可用于生成真正随机的密钥,增强密钥分发的安全性,从而保障...

免费的「网页版Cursor」!新版DeepSeek-V3加持,秒秒钟编出一个游戏/APP

4 月 1 日
阅读 3 分钟
279
关注前沿科技 量子位借助新版DeepSeek-V3,任何人现在可以一次性创建任何应用或游戏了——而且是一边开发一边看效果的那种。在Hugging Face中,这个名为DeepSite的应用火了。有网友直呼,这不就是网页版“Cursor”!划个重点,不仅开箱即用,而且免费。Hugging Face联创Thomas Wolf也激情转发。与此同时,新版DeepSeek-V3的...

让机器人在人群中穿梭自如,港科广&港科大突破社交导航盲区 | ICRA 2025

4 月 1 日
阅读 4 分钟
313
先简单介绍下,社交导航 (SocialNav,Social navigation) 是指在人机共存的环境中,机器人在遵循社会规范的前提下执行导航任务。

量子位招聘 | DeepSeek帮我们改的招聘启事

4 月 1 日
阅读 3 分钟
273
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

国产AI起号两周就开始自己赚钱了,全球首个“边想边干”的Agent | 免费无限次

3 月 31 日
阅读 5 分钟
251
原创 关注前沿科技 量子位什么?!用AI Agent搞的小红书账号,竟然14天狂吸5000粉,还开始赚钱了???你没看错,这是真事。据说啊,你只需要跟这个Agent说一个想讨论的话题,例如“怎么选咖啡”、“化妆品成分对比”等等,它就可以自己去小红书、知乎等平台上搜索上百个信源做总结。而且是可以出一个完整报告的那种,可想而...

5.28亿融资砸向杭州具身智能公司,清华叉院机器人天才坐镇,被称为“中国版Figure”

3 月 31 日
阅读 4 分钟
309
关注前沿科技 量子位好好好,具身智能领域又有公司宣布融资新动态了!就在今天上午,具身智能创业公司千寻智能 (Spirit AI)官宣完成5.28亿元人Pre-A轮融资。这是该公司对外披露的第四轮融资。该公司创办于去年2月,截至去年12月中旬,已快速完成三轮融资,其中种子轮+天使轮2亿。据官方公开的资料来看,这一轮Pre-A的...

中科大提出动作价值表征学习新方法,率先填补长期决策信息的缺失

3 月 31 日
阅读 3 分钟
277
来自中科大的研究人员在信息瓶颈(Information Bottleneck)框架下,提出了一种新颖的鲁棒动作价值表征学习方法ROUSER。

量子位招聘 | DeepSeek帮我们改的招聘启事

3 月 31 日
阅读 3 分钟
282
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

AIGC第一股年报详解:AIGC业务暴涨88.5%营收2.2亿,95%智能硬件交付出海,跑通规模化「软件订阅+出海」

3 月 30 日
阅读 5 分钟
374
原创 关注前沿科技 量子位上市一年后,港股AIGC第一股交出了第一份、也是足够亮眼的一份年终财报。出门问问日前发布2024年度业绩报告,关键数字如下:AIGC业务营收突破2.2亿,同比增长88.5%;全年毛利2亿元,毛利率达52.1%;AIGC注册用户超1000万,付费用户超100万;海外业务收入1.63亿元,占全年总收入的41.8%。作为AIG...

业界突破多模态泛化推理能力,OPPO研究院&港科广提出OThink-MR1技术

3 月 30 日
阅读 3 分钟
272
来自OPPO研究院和港科广的科研人员提出了一项新技术——OThink-MR1,将强化学习扩展到多模态语言模型,帮助其更好地应对各种复杂任务和新场景。

13.8倍吞吐提升!浙大上海AI Lab等提出视觉生成新范式,从“下一个token”到“下一个邻域”

3 月 30 日
阅读 3 分钟
321
来自浙大、上海AI Lab等机构的研究人员提出了一种全新的视觉生成范式——邻近自回归建模(Neighboring Autoregressive Modeling, NAR)。与传统的“下一个token预测”不同,NAR模型采用了“下一个邻域预测”的机制,将视觉生成过程视为一种逐步扩展的“外绘”过程。

迈向群体智能 | 智源发布首个跨本体具身大小脑协作框架与开源具身大脑

3 月 29 日
阅读 5 分钟
357
3月29日,智源研究院在2025中关村论坛“未来人工智能先锋论坛”上发布首个跨本体具身大小脑协作框架RoboOS与开源具身大脑RoboBrain,可实现跨场景多任务轻量化快速部署与跨本体协作,推动单机智能迈向群体智能,为构建具身智能开源统一生态加速场景应用提供底层技术支持。

“计算机视觉被GPT-4o终结了”(狗头)

3 月 29 日
阅读 3 分钟
260
关注前沿科技 量子位一夜之间,CV被大模型“解决”了(狗头)。一个男友回头表情包,可以秒变语义分割图。也可以秒变深度图。这下不光上一代AI画图工具和设计师,计算机视觉研究员也哭晕在厕所了。这是NASA前工程师测试特斯拉自动驾驶系统的伪装“隐形墙”,在GPT-4o面前也无所遁形。这下OpenAI应用研究主管Boris Power已经...

自动驾驶首次应用测试时计算!港大英伟达等新技术让AI边开边学,无人车遇变道自如应对

3 月 29 日
阅读 2 分钟
314
与之类似,自动驾驶汽车在上述场景中,更会表现得像个谨小慎微的”新手司机”,这是因为模型的决策往往依赖于工程师预设的固定规则,进而导致“不求无功,但求无过”的驾驶风格,但过多的无故急刹、过度避让反而会引发额外的安全隐患。

单张照片生成360°3D场景,支持灵活视角漫游|人大&北师大&字节

3 月 28 日
阅读 4 分钟
270
<iframe class="video_iframe rich_pages" style="border-radius: 4px;" frameborder="0" data-src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&amp;action=mpvideo&amp;auto=0&amp;vid=wxv_3916882069992767488" data-mpvid="wxv_3916882069992767488" data-vidtype="2" data...

港大开源博士级AI智能体,独立完成三篇算法研究,一站式科研6小时搞定

3 月 28 日
阅读 5 分钟
375
随着人工智能技术的迅猛发展,OpenAI提出的五级模型(涵盖从对话系统到协作管理者)已成为行业发展的重要参考框架。其中,“自主研究智能体”(Autonomous Research Agent)作为第三至第四阶段的核心技术,正受到全球范围内越来越多的关注。

专抓AI“看图说谎”,谷歌哥大用三类陷阱触发幻觉,打造可随技术发展动态演进的评估框架

3 月 28 日
阅读 5 分钟
359
幻觉(Hallucination),即生成事实错误或不一致的信息,已成为视觉-语言模型 (VLMs)可靠性面临的核心挑战。随着VLMs在自动驾驶、医疗诊断等关键领域的广泛应用,幻觉问题因其潜在的重大后果而备受关注。

量子位招聘 | DeepSeek帮我们改的招聘启事

3 月 28 日
阅读 3 分钟
258
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

3D版DeepSeek卷起开源月:两大基础模型率先SOTA!又是VAST

3 月 28 日
阅读 7 分钟
401
原创 关注前沿科技 量子位3D生成版DeepSeek再上新高度!国产、易用、性能强且开源——新模型一露面就刷新SOTA,并且第一时间加入开源全家桶。顺时针转个圈圈给大家看,效果是这样:加上“皮肤”是这样:再来一个,效果是这样:肉眼可见,这次妥妥升级变成了更细节的细节控~以上效果,都来自3D大模型明星初创公司VAST,其刚...

AI Agent来,传统BI危

3 月 28 日
阅读 5 分钟
340
原创 关注前沿科技 量子位在互联网时代,数据已成为企业发展的必经之路。从电商平台的用户行为记录,到工业传感器的实时监测,数据渗透在商业活动的每个环节,成为驱动决策的基础资源。然而数据的价值并不在于简单的堆砌,未经梳理与解读的原始数据如同散落的拼图碎片,既无法呈现完整图景,也难以支撑业务判断。商业智...

7B模型搞定AI视频通话,阿里最新开源炸场,看听说写全模态打通,开发者企业免费商用

3 月 27 日
阅读 8 分钟
262
原创 关注前沿科技 量子位深夜重磅!阿里发布并开源首个端到端全模态大模型——通义千问Qwen2.5-Omni-7B,来了。仅靠一个一体式模型,就能搞定文本、音频、图像、视频全模态,并实时生成文本和自然语音。堪称7B模型的全能冠军。你的iPhone搭载的很可能就是它!现在打开Qwen Chat,就能直接和它实时进行视频或语音交互:话...

英伟达要买下贾扬清公司LeptonAI!老黄花数亿美元加码算力租赁

3 月 27 日
阅读 2 分钟
329
关注前沿科技 量子位贾扬清创业公司LeptonAI,要卖给英伟达了?具体金额尚未可知,大概这个数:数亿美元。Lepton AI成立于2023年,种子轮融资1100万美元,致力于为企业提供高效、可扩展的AI应用平台,可以让没有AI领域知识的普通开发者调用2~3行命令就能部署AI模型。创始团队来自阿里巴巴,包括阿里巴巴前VP贾扬清、领...

长视频理解新突破!Mamba混合架构让显存消耗腰斩,处理10万视频token不费力

3 月 27 日
阅读 3 分钟
262
关注前沿科技 量子位Mamba混合架构视频模型来了,不再对视频token进行压缩——而是通过改进模型架构设计的方式提升模型在训练及推理预填充阶段处理视频token的效率。滑铁卢大学陈文虎团队与多伦多大学、零一万物、向量学院以及M-A-P的研究人员提出了一种新的Mamba-Transformer混合模型Vamba。通过大量实验验证,研究团队发...

Agent太火!看这一篇综述,知识就不会学杂了丨华东师大&东华大学出品

3 月 27 日
阅读 6 分钟
371
来自华东师大和东华大学的研究团队发表了“A Survey on the Optimization of Large Language Model-based Agents(大模型智能体的优化方法综述)”,首次从系统化视角对LLM智能体优化策略进行了全面梳理与分析。

量子位招聘 | DeepSeek帮我们改的招聘启事

3 月 27 日
阅读 3 分钟
281
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

量子位招聘 | DeepSeek帮我们改的招聘启事

3 月 26 日
阅读 3 分钟
324
关注前沿科技 量子位未来同事,你好~这是一则招聘帖。如果你与我们志同道合,对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣,我们正在招聘这些领域的原创作者。以下岗位均为全职,工作地点:北京中关村。岗位面向:社招、应届毕业生,所有岗位均可实习——表现出色均可转正加分项:乐于探索AI新工具,善用AI新工具...

对话2025最火具身智能团队:2个自动驾驶第一人带队,1.2亿美元天使融资震动江湖

3 月 26 日
阅读 13 分钟
269
量子位获悉,一家2025年2月才低调出发的创业公司,团队还很精简,技术和产品也才刚刚立项,就在投资市场引发了追逐风暴:大牌投资机构抢着竞购,最后罕见在春节前后完成超募,甚至有些动作不够快的投资机构,只能排到下一轮。

中国顶流无人驾驶提速出海:安全久经考验,外国big name实名好评

3 月 26 日
阅读 3 分钟
289
这两天,新加坡副总理王瑞杰Heng Swee Keat访华,期间专程带队到访了百度Apollo park,与百度创始人李彦宏会谈,并在北京高峰时段的开放道路上试乘了萝卜快跑第六代无人驾驶汽车。