新架构RNN反超Transformer:每个隐藏状态都是一个模型,一作:从根本上改变语言模型

2024-07-09
阅读 5 分钟
10
原创 关注前沿科技 量子位新架构,再次向Transformer发起挑战!核心思想:将RNN中的隐藏状态换成可学习的模型。甚至在测试时都可以学习,所以该方法称为TTT(Test-Time Training)。共同一作UC伯克利的Karen Dalal表示:我相信这将从根本上改变语言模型。一个TTT层拥有比RNN表达能力更强的隐藏状态,可以直接取代Transfo...

无人车团队跨维进军好莱坞!推出电影级视觉AI特效,“新时代皮克斯”

2024-07-09
阅读 4 分钟
6
<iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_3538450598923173891" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FYicUhk5aAGtCiaq5lJibKUrNzcEfl3Yb6KIJiaHUT0tYP2U4PtgW2ibg39mjRicVAG3EGnJh28CR43pdz7E3oM5WiaIsQ%2F0%3Fwx_fmt%3Djpeg" allowfullscreen="" frameborder="...

Wolfram之父直播采访机器人,一小时30多个问题对答如流,还有网友在线提问

2024-07-09
阅读 5 分钟
6
关注前沿科技 量子位人类采访了机器人,足足一个多小时,还是对答如流的那种!干出此等花活的,正是Wolfram之父Stephen Wolfram——他接连提问30多个问题,话题内容也是非常广泛,从人类社会常识到机器人意识等等。采访完之后,Stephen对机器人的表现印象深刻,甚至打趣说正在重新适应人类。网友也表示,这是自己见过最wei...

AI太火,量子位今年更缺人了 (含实习)

2024-07-09
阅读 3 分钟
6
关注前沿科技 量子位AI太火了!眼睛一睁一闭,一大堆新鲜出炉的前沿科技进展已经塞满未读列表。于是,今年的量子位,比以往更加缺人。这不到金三银四了,是时候拿出喇叭大喊一声:量子位招!人!啦!量子位编辑智能车编辑汽车视频工作室主理人量子位短视频主编量子位视频后期量子位商务经理智库分析师知乎微博新媒体运营...

混元单日调用tokens达千亿后,腾讯大模型战略露出全貌

2024-07-08
阅读 5 分钟
12
关注前沿科技 量子位大模型之争,到了不只是拼技术的时刻。最新的行业风向是:谁能大范围应用落地?谁能笑到最后?谁能真正产生价值?对大模型行业玩家的评判标准也不再只看技术。战略布局、落地进展、未来判断……成为了更被重视的维度。无论“杨植麟们”还是大厂高管,公开探讨大模型的频率越来越高,包括一直低调的腾讯。...

苹果Vision Pro国行版首体验:百度网盘所有资源均可200寸大屏播放,一口气看个爽

2024-07-08
阅读 5 分钟
8
原创 关注前沿科技 量子位百度网盘实锤看片神器,重度爱好者也想不到,有一天它的打开方式会是酱婶儿的——只要是百度网盘里的视频资源,全部能实现在3D空间中200寸大屏播放。或者,你还可以置身360度全景视频之中,身临其境般沉浸式体验自然风光、风土人情,支持4K的那种:哦吼~这是哪门子的百度网盘?此等科技与狠活出...

院士领衔推出大模型的第3种记忆:比参数存储和RAG都便宜,2.4B模型越级打13B

2024-07-08
阅读 4 分钟
7
原创 关注前沿科技 量子位给大模型加上第三种记忆格式,把宝贵的参数从死记硬背知识中解放出来!中科院院士鄂维南领衔,上海算法创新研究院等团队推出Memory3,比在参数中存储知识以及RAG成本都更低,同时保持比RAG更高的解码速度。在实验中,仅有2.4B参数的Memory3模型不仅打败了许多7B-13B的模型,在专业领域任务如医...

支付宝医疗大模型亮相!中英文考试超GPT4,已落地江浙沪一线医院

2024-07-08
阅读 3 分钟
21
关注前沿科技 量子位支付宝医疗大模型亮相!中英文医疗考试、基准测试达到甚至超过GPT-4水准。此外,其医疗专业能力在中文医疗LLM评测榜单promptCBLUE中,位列A榜第一,B榜第二。模型在识别报告、药品、毛发等图像准确率中达90%以上。WAIC现场,支付宝还联合人民卫生出版社、北京大学医学部、浙江省卫生健康委等20家机构...

半小时教你手搓AI视频通话,还有懒人版代码已开源

2024-07-08
阅读 5 分钟
8
关注前沿科技 量子位GPT-4o的“AI视频通话”一鸽再鸽,但网友却是急不可耐想要体验。于是,一位名叫Santiago(我们叫他三哥)的博主,用160行Python代码尝试了复刻。虽然技术路线和《Her》有所差别,但从直观效果来看,也算得上是给网友们带来了新的玩具。而且不仅是炫技,三哥是真的在试图把网友教会,用了半个多小时的时...

英伟达AMD差点合并,老黄提了个条件,结果黄了

2024-07-07
阅读 6 分钟
9
关注前沿科技 量子位在AI浪潮中赢麻了的英伟达,如今市值已达3.1万亿,远超另外两家芯片巨头AMD和英特尔。但一则内幕爆料引起热议:英伟达当年差点就被卖给了AMD。爆料人是一位AMD老员工,名为Hemant Mohapatra。他透露AMD曾几乎一度要买下英伟达,然鹅,当时老黄开出的条件是:他要成为新合并公司的CEO,否则英伟达,不...

北大千问团队推出数学专用版CriticGPT,“找茬”让大模型进步更快

2024-07-07
阅读 3 分钟
7
OpenAI就用这个思路造了个“找茬模型”CriticGPT。非常巧合的是,就在CriticGPT放出的前几天,北大联合千问等团队以类似的思路设计出了“数学专用版”CriticGPT。

AI太火,量子位今年更缺人了 (含实习)

2024-07-07
阅读 3 分钟
6
关注前沿科技 量子位AI太火了!眼睛一睁一闭,一大堆新鲜出炉的前沿科技进展已经塞满未读列表。于是,今年的量子位,比以往更加缺人。这不到金三银四了,是时候拿出喇叭大喊一声:量子位招!人!啦!量子位编辑智能车编辑汽车视频工作室主理人量子位短视频主编量子位视频后期量子位商务经理智库分析师知乎微博新媒体运营...

千呼万唤的可灵网页版来了!基础模型重磅升级,新功能“炸场”WAIC

2024-07-07
阅读 5 分钟
12
原创 关注前沿科技 量子位“这可能是本届WAIC上欢呼声最多的一场发布”在刚刚闭幕的世界人工智能大会(WAIC)上,快手晒出了可灵发布一个月以来的成绩单:“超50万人申请,已开放给超30万用户使用,生成超700万条短视频。”作为全球首个用户可用的真实影像级视频生成大模型,可灵一经问世便引发了强烈反响,连外国网友都纷纷...

AI写公文,到底靠不靠谱?

2024-07-06
阅读 6 分钟
9
原创 关注前沿科技 量子位什么?现在公务员处理政务,也都能用上模型了???没错,就在这次的世界人工智能大会(WAIC)上,金山办公便首次发布了一款别具一格的自研模型——金山政务办公模型1.0。话不多说,我们直接来看下效果。例如想要了解最近关于“新质生产力”的讲话,那么公务员现在只需一个“问”的动作即可:但问答这...

2分钟,需求文档变产品,国产大模型开发神器火爆WAIC

2024-07-06
阅读 4 分钟
7
原创 关注前沿科技 量子位两分钟端到端从需求到应用,WAIC上这个国产开发神器火了!而你唯一所做的,就是扔给它一个需求文件。它叫做星辰大模型·软件工厂,由中电信人工智能科技有限公司和中国电信人工智能研究院(TeleAI)联合发布。有了它,每个人都能完成应用的开发。整个过程你甚至也不用想提示词、跟大模型对话。要...

扩散模型也能推荐短视频!港大腾讯提出新范式DiffMM

2024-07-06
阅读 7 分钟
9
关注前沿科技 量子位想象一下你在刷短视频,系统想要推荐你可能会喜欢的内容。但是,如果系统只知道你过去看过什么,而不了解你喜欢视频的哪些方面(比如是画面、文字描述还是背景音乐),那么推荐可能就不会那么精准。对此,来自港大和腾讯的研究人员推出了全新多模态推荐系统范式——DiffMM。简单来说,DiffMM创建了一个...

AI太火,量子位今年更缺人了 (含实习)

2024-07-06
阅读 3 分钟
7
关注前沿科技 量子位AI太火了!眼睛一睁一闭,一大堆新鲜出炉的前沿科技进展已经塞满未读列表。于是,今年的量子位,比以往更加缺人。这不到金三银四了,是时候拿出喇叭大喊一声:量子位招!人!啦!量子位编辑智能车编辑汽车视频工作室主理人量子位短视频主编量子位视频后期量子位商务经理智库分析师知乎微博新媒体运营...

中国版GPT-4o炸场:国内首个流式多模态交互模型,现场实时且丝滑

2024-07-05
阅读 5 分钟
6
<iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_3532694630687326208" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FYicUhk5aAGtATxwIsb9Sj7SqvUibjrcOhGXORt2nct8Ze0OTcQawgQI0IInYjVfgbZL1VfULU0n3oqSKu5icPd7sQ%2F0%3Fwx_fmt%3Djpeg" allowfullscreen="" frameborder="0" d...

AI视频创作一条龙!达摩院“寻光”平台炸场WAIC,突破可控编辑难题

2024-07-05
阅读 4 分钟
7
关注前沿科技 量子位AIGC时代,视频创作这事儿真的不一样了。就像这样,轻轻一圈,选定目标立刻变身单独图层,再丝滑嵌入不同的背景视频,场景变换so easy~想要调整一下镜头角度,交给AI,同样能一键完成:还能一键消除、修改目标:后期再也不用加班加到手抽筋(doge)。划!重!点!这还不是实验室里的单一技术demo,而...

贾佳亚团队新作:10k数据让大模型数学能力超GPT-4

2024-07-05
阅读 4 分钟
7
关注前沿科技 量子位只要10k数据,就能让大模型的数学成绩增长5.6%。港中文贾佳亚团队推出了基于推理步骤的大模型优化策略,能够像老师教学生一样优化大模型。利用这种方法,72B Qwen模型的数学成绩超越了GPT-4、Gemini1.5-Pro和Claude3-Opus等一众闭源模型。老师在纠正学生错误时,不会只告诉学生最终答案错了,还会告...

阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种

2024-07-05
阅读 5 分钟
15
关注前沿科技 量子位OpenAI迟迟不上线GPT-4o语音助手,其它音频生成大模型成果倒是一波接着一波发布,关键还是开源的。刚刚,阿里通义实验室也出手了——最新发布开源语音大模型项目FunAudioLLM,而且一次包含两个模型:SenseVoice和CosyVoice。SenseVoice专注高精度多语言语音识别、情感辨识和音频事件检测,支持超过50种...

AI太火,量子位今年更缺人了 (含实习)

2024-07-05
阅读 3 分钟
7
关注前沿科技 量子位AI太火了!眼睛一睁一闭,一大堆新鲜出炉的前沿科技进展已经塞满未读列表。于是,今年的量子位,比以往更加缺人。这不到金三银四了,是时候拿出喇叭大喊一声:量子位招!人!啦!量子位编辑智能车编辑汽车视频工作室主理人量子位短视频主编量子位视频后期量子位商务经理智库分析师知乎微博新媒体运营...

突破不可解释性!视频异常新检测框架精度90.67%拿下SOTA|华科&百度&密歇根大学

2024-07-04
阅读 4 分钟
10
关注前沿科技 量子位大模型当上福尔摩斯,学会对视频异常进行检测了。来自华中科技大学、百度、密歇根大学的研究团队,提出了一种可解释性的视频异常检测框架,名为Holmes-VAD。Holmes-VAD不仅能给出精确的视频异常定位,还能够对检测到的异常提供解释和分析。比如,给它看一段监控视频,询问它视频中是否有任何异常迹象...

AI太火,量子位今年更缺人了 (含实习)

2024-07-04
阅读 3 分钟
6
关注前沿科技 量子位AI太火了!眼睛一睁一闭,一大堆新鲜出炉的前沿科技进展已经塞满未读列表。于是,今年的量子位,比以往更加缺人。这不到金三银四了,是时候拿出喇叭大喊一声:量子位招!人!啦!量子位编辑智能车编辑汽车视频工作室主理人量子位短视频主编量子位视频后期量子位商务经理智库分析师知乎微博新媒体运营...

上海WAIC大会现场“大闹天宫”:模型够猛,产品够酷,公司够强

2024-07-04
阅读 5 分钟
8
原创 关注前沿科技 量子位今年上海世界人工智能大会,谁最受关注?展区现场,有个挤得水泄不通的互动——像孙猴子一样在全世界大闹天宫的AI大模型,而且真的和《大闹天宫》联动!只需一张真人正面图片,就能get天庭打工人寸照;在测出属于你的《大闹天宫》版MBTI的同时,玉帝老儿还会赏咱个天上的官儿当当,何不美哉?这个...

首个国产全功能GPU的万卡集群来了!“中国英伟达”出品

2024-07-04
阅读 4 分钟
15
原创 关注前沿科技 量子位纯国产GPU的万卡集群,它来了!而且还是国内首个全功能GPU,兼容CUDA的那种。这个集结了超过10000张高性能GPU的超复杂工程,它的算力有多大?不卖关子,直接揭晓答案——总算力超万P,专为万亿参数级别的复杂大模型训练而设计。规模还只是它的特点之一,其它亮眼的地方还包括:有效计算效率(MFU...

教育科技风向标!猿力科技亮相WAIC 2024,自研教育大模型全面产品化落地

2024-07-04
阅读 3 分钟
10
7月4日,2024世界人工智能大会(WAIC 2024)在上海召开,主题为“以共商促共享 以善治促善智”,层级、规模相比前六届升级扩容,其中参展企业数、亮点展品数、首发新品数均达历史最高。谷歌、特斯拉、百度等国内外科技巨头齐聚现场,展示大模型技术与“人工智能+”创新应用的最新成果。

Kimi论文自曝推理架构,80%流量都靠它承担

2024-07-04
阅读 4 分钟
10
关注前沿科技 量子位月之暗面和清华KVCache.ai团队的最新论文,首次揭秘了Kimi背后的推理架构!要知道Kimi是国产大模型的当红炸子鸡,火到可以说从来没缺过流量,甚至还经常出现过载。而随着论文的发布,这泼天的流量到底如何被Kimi接住的问题,也有了答案。Kimi背后的推理架构名叫Mooncake(月饼),主要特点是采取了分...

吃个瓜而已,AI居然写了份研究报告??

2024-07-03
阅读 4 分钟
7
原创 关注前沿科技 量子位救命,本来只是想随手吃个瓜,没想到AI较真起来,写了份完整研究报告。一口气查几百篇资料,从中精选出42篇参考,十几秒内洋洋洒洒3000多字。而且这个AI不光把问题本身答好,还主动挑选了相关话题做拓展延伸。既然是老马和Neuralink的员工生孩子,那顺便也了解一下Neuralink技术有什么新进展吧...

让编程更简单,豆包MarsCode面向开发者免费开放

2024-07-03
阅读 3 分钟
8
对于开发者来说,编码是一个既复杂又精细的过程。如何让这个过程变得更简单、更智能?如何进一步提升开发效率?豆包 MarsCode 近日正式发布,针对这些问题给出了新的答案。