稚晖君一口气发布5款人形机器人!开发者还能“0元购”

2024-08-18
阅读 8 分钟
4
关注前沿科技 量子位刚刚,“鸽”了一年的稚晖君,终于带着具身智能新品来填坑了!没有什么比抽奖抽一台,更能体现对产品的自信了。一上来,稚晖君也没藏着掖着,就在直播现场搭建的“摄影棚”里,机器人当场秀了一波在语音指令下动手调饮料的操作:△2倍速现场主持人,也由此番发布的远征A2机器人亲自担当。一套小连招下来,...

3人干翻谷歌!免费学术搜索比谷歌学术相关性高5倍,已获YC投资

2024-08-18
阅读 3 分钟
1
关注前沿科技 量子位三人团队打造的学术搜索引擎,直接拿下SOTA!号称搜索结果相关性平均比谷歌学术高5倍,能搜索超1亿个研究对象,还不依赖LLM。更重要的是:免费,学生党狂喜!先来看一波使用效果,输入搜索关键词,只需350毫秒,“啪”得一下高度相关文献就列出来了:还能再一键筛选出可查看PDF的文件。从年份、引用次...

横扫16大榜单,最强开源单目深度估计算法来了,精度可以直接用于3D重建|TPAMI 2024

2024-08-18
阅读 5 分钟
6
关注前沿科技 量子位单目深度估计新成果来了!方法名为Metric3D v2,是CVPR单目深度估计挑战赛冠军方案Metric3D的加强版。用一套模型参数,在未知环境中,同时解决带尺度深度估计和法向估计两个问题。可用于生成真实世界的几何估计:在密集场景和特殊样本上也有较好效果:无需微调和优化,可直接用于无人机感知:无需调...

AI太火,量子位今年更缺人了 (含实习)

2024-08-18
阅读 3 分钟
3
关注前沿科技 量子位AI太火了!眼睛一睁一闭,一大堆新鲜出炉的前沿科技进展已经塞满未读列表。于是,今年的量子位,比以往更加缺人。这不到金三银四了,是时候拿出喇叭大喊一声:量子位招!人!啦!量子位编辑智能车编辑汽车视频工作室主理人量子位短视频主编量子位视频后期量子位商务经理智库分析师知乎微博新媒体运营...

奥运冠军竟是硅谷VC,还是哈佛学的计算机

2024-08-17
阅读 4 分钟
3
关注前沿科技 量子位哈佛计算机系学霸,首次参加奥运就拿下两块金牌!其中个人单项还是美国40年来首金。31岁公路自行车运动员克里斯汀·福克纳(Kristen Faulkner) 最近意外火了。她毕业于哈佛大学,学的是计算机专业,在硅谷华尔街干了4年VC,24岁时因为参加俱乐部活动,才开始正式将骑车作为个人爱好。没想到7年后,她...

大模型对语言有自己的理解!MIT论文揭示大模型“思维过程” | ICML 24

2024-08-17
阅读 4 分钟
6
关注前沿科技 量子位大模型对现实世界,可以形成自己的理解!MIT的一项研究发现,随着模型能力越强,它对现实的理解可能不仅是简单模仿。比如大模型没有闻过气味,是否就意味着它不能理解气味?研究发现,它可以自发模拟一些概念,方便理解。这项研究意味着,大模型未来有希望更深入理解语言和世界,论文已被顶会ICML 24...

在蛙蛙写作,用户每天用6.5小时来创作|对话波形智能

2024-08-17
阅读 3 分钟
3
关注前沿科技 量子位写一部新小说,不一定非得从空白页开始。有这样一款AI产品,半年时间,已累计30万注册用户,平均每日使用时长甚至达到6.5小时。这么说,它能占到用户超过四分之一的时间?!它就是蛙蛙写作,其产品覆盖创作全流程,近期迭代了2.0版本。在它的用户中,既有专业的小说创作者,使用蛙蛙写作提高了创作效...

LLM推理性能受输出格式影响,JSON最严重

2024-08-16
阅读 3 分钟
4
关注前沿科技 量子位输出格式不同,竟然还能影响大模型发挥?!两种提示下让大语言模型(LLMs)解同一道数学题,问题如下:Eliza每周工作的前40小时,每小时的工资是10美元,加班费每小时x1.2。如果Eliza这周工作了45小时,她这周的收入是多少?思维链prompt:“按照以下格式提供输出,逐步推理:…回答:最终答案是…”。格...

AI太火,量子位今年更缺人了 (含实习)

2024-08-16
阅读 3 分钟
2
关注前沿科技 量子位AI太火了!眼睛一睁一闭,一大堆新鲜出炉的前沿科技进展已经塞满未读列表。于是,今年的量子位,比以往更加缺人。这不到金三银四了,是时候拿出喇叭大喊一声:量子位招!人!啦!量子位编辑智能车编辑汽车视频工作室主理人量子位短视频主编量子位视频后期量子位商务经理智库分析师知乎微博新媒体运营...

知网状告AI搜索:搜到我家论文题目和摘要,你侵权了!

2024-08-16
阅读 4 分钟
4
关注前沿科技 量子位创业团队秘塔AI搜索,被知网给告了!足足28页的侵权告知函,总结一句话就是:贵司的AI搜索,能搜到我家的学术文献题录及摘要数据,且没经我司许可,严重侵权。这一消息,正是由秘塔刚刚发布于自家的公众号:在秘塔收到的告知函中,还有一句非常醒目的话:不希望中国知网被秘塔搜索到,请立即断开搜索...

关于AI你最关心什么?技术专家团亲自答(含往期真人纯享版)

2024-08-16
阅读 4 分钟
5
谷歌、微软在内全球科技巨头相继推出各自的人工智能大模型,中国企业也掀起了“百模大战”,国产大模型频频亮相、加速迭代。大模型的快速发展助力产业创新升级,大模型商业化现状如何,新入局的企业,如何选择大模型赛道?

《Her》有形象了!给AI打视频电话,几乎无延迟,红杉YC投了

2024-08-16
阅读 5 分钟
5
关注前沿科技 量子位史上最快对话视频AI来了,延迟不到一秒!端到端,能听、能看、会说、有形象。这个产品并不是出自OpenAI或HeyGen这样此前已经大展身手的公司,也没有一个具体的名字。因为来自创业团队Tavus,因此也被称为Conversational Replicas by Tavus。主要功能,就是搭建一个身临其境般的AI生成视频体验。今日...

“在线版FLUX”已支持ControlNet,无需部署开箱即用,还能在线训练LoRA模块

2024-08-16
阅读 4 分钟
9
关注前沿科技 量子位“FLUX在线版”,新增一系列重磅功能!ControlNet、LoRA等重要模块都悉数到齐,而且开箱即用,无需自行配置工作流。甚至还可以在线训练自己的LoRA模型,并通过链接进行分享。Stale Diffusion原班人马打造的最强绘图模型——FLUX上线之后,在线推理服务平台fal.ai就立即进行了跟进。后续第三方开发的Contr...

成本降低90%!Claude上新Gemini同款提示词缓存,一次性记住整个代码库

2024-08-15
阅读 3 分钟
4
关注前沿科技 量子位Claude深夜上新重磅功能——API长文本缓存。新版API可以“记住”一整本书或整个代码库,不需要再重复输入了。这样一来,不仅处理长文本的延时更低,更是能节省最高90%的成本。来看看这降本的效果~△假定重复部分为1万Token,模型为3.5 Sonnet,只计算输入今年5月,谷歌在Gemini更新中提出了这项功能,然后...

OpenAI投的代码神器“叛变”了:默认使用Claude,程序员疯狂叫好:贵一倍也买

2024-08-15
阅读 3 分钟
1
原创 关注前沿科技 量子位OpenAI重金投资的代码工具Cursor,叛变了:悄悄把默认模型切到了Claude。我们尝试注册新账号、新安装不修改任何设置,第一次唤出代码补全,就是Claude-3.5-Sonnet来接待。Cursor背后公司Anysphere,成立初期从OpenAI处拿了800万美元,占当轮融资的72.7%,按理说应该是铁杆的OpenAI一派。现在却...

清华唐杰团队新作:一口气生成2万字,大模型开卷长输出

2024-08-15
阅读 3 分钟
1
关注前沿科技 量子位一口气生成2万字,大模型输出也卷起来了!清华&智谱AI最新研究,成功让GLM-4、Llama-3.1输出长度都暴增。相同问题下,输出结果直接从1800字增加到7800字,翻4倍。要知道,目前大模型的生成长度普遍在2k以下。这对于内容创作、问题回答等都存在影响,可能导致模型回答问题不全面、创造性降低等。...

大模型指令调优数据集万字评测!腾讯上交大联合出品

2024-08-15
阅读 3 分钟
7
关注前沿科技 量子位随着大模型的快速发展,指令调优在提升模型性能和泛化能力方面发挥着至关重要的作用。然而,对于指令调优数据集的数据评估和选择方法尚未形成统一的体系,且缺乏全面深入的综述。为了填补这一空白,腾讯优图实验室发布一篇完整综述进行梳理。长度超过了万字,涉及的文献多达400余篇。这项研究涵盖了...

全球首个AI流媒体音乐App来了!中国造的

2024-08-14
阅读 7 分钟
7
原创 关注前沿科技 量子位全球首个AI流媒体音乐App,就这么水灵灵的来了。有什么特点?首先,如其名,这个App里的音乐都是由AI生成的。其次,它是无限流式的,也就是说,可以做到一直生成一直听。话不多说,我们直接来看效果。例如我们的Prompt是:Take a chilled walk with my dog. 和我的狗狗惬意地散步。<iframe c...

谷歌版Her大翻车:试了3次且换手机才成功…网友:我手动只需10秒

2024-08-14
阅读 5 分钟
3
原创 关注前沿科技 量子位翻车,大翻车。就在今天凌晨,谷歌版Her——Gemini Live正式发布。毕竟明显是对标OpenAI家的GPT-4o,可以说是吸足了科技圈的眼球。在官网发布的demo中,拍照问答功能的效果是这样的:它大致实现的功能,是用手机拍摄演唱会的海报,并让Gemini查看用户的日历,看看行程是否适合参加。以及还可以基...

苹果大模型新成果:GPT-4o扮演用户,在场景中考察大模型工具调用,网友:Siri也要努力 | 开源

2024-08-14
阅读 4 分钟
1
关注前沿科技 量子位苹果团队,又发布了新的开源成果——一套关于大模型工具调用能力的Benchmark。这套Benchmark创新性地采用了场景化测评方法,可以更好体现模型在真实环境中的水平。而且还引入了对话交互、状态依赖等传统标准中没有关注到的重要场景。这套测试基准名叫ToolSandbox,苹果基础模型团队负责人庞若鸣也参与...

Prompt自相矛盾,大模型能发现吗?上海交通大学最新研究解密 | ECCV 2024

2024-08-14
阅读 3 分钟
3
关注前沿科技 量子位上海交通大学王德泉教授课题组在最新研究中提出了这样的一个问题。设想这样一个场景:一个幼儿园的小朋友拿着一张老虎的图片,向你询问:“这个小猫很可爱,它是一只母猫么?”你会如何回答?你可能并不会直接回答“是”或“不是”,而是首先指出这个提问中的“矛盾”所在——这张图片是一只老虎,而不是猫。但...

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

2024-08-13
阅读 7 分钟
6
原创 关注前沿科技 量子位史上首位“AI科学家”**,横空出世!一登场就一口气生成了十篇完整学术论文。△AI生成的一篇扩散模型论文从提出研究想法、检查创新性、设计实验、编写代码,到在GPU上执行实验并收集结果,最后完成论文撰写,一气呵成。全由这位“AI科学家”自动搞定。每篇论文的成本约为15美元(约107.62元)。这就...

最强AI程序员砸饭碗:84秒跑通代码,像人一样思考!团队仅5人

2024-08-13
阅读 5 分钟
5
原创 关注前沿科技 量子位继Devin之后,又一个AI软件工程师被刷屏了——它叫Genie,号称目前地表最强,已经可以像人一样思考和行动了!那么这个“地表最强”,到底强到什么程度?先来看下评测分数。在权威榜单SWE-Bench中,Genie以解决了30.07%问题的成绩夺得榜首。(SWE-Bench是一个用来评估大模型解决现实中软件问题的基准...

换掉Transformer,7B开源模型立刻登顶!任意长序列都能处理

2024-08-13
阅读 2 分钟
3
关注前沿科技 量子位只是换掉Transformer架构,立马性能全方位提升,问鼎同规模开源模型!(注意力机制不存在了)这就是最新Falcon Mamba 7B模型。它采用Mamba状态空间语言模型架构来处理各种文本生成任务。通过取消传统注意力机制,有效提升了模型处理长序列时计算效率低下的问题。它可以处理无限长序列,但内存需求不...

尴尬!ChatGPT官宣新模型,评论区翻车了…

2024-08-13
阅读 3 分钟
3
关注前沿科技 量子位ChatGPT有新模型了!官方账号宣布:最新版本GPT-4o从上周起已实装,我们猜你会喜欢的。然后……就尴尬了,下面评论区画风是一片的:“啊?改哪里了?没发现啊”。没有改进,我天天用,没啥区别。以及“OpenAI没活了”,推测新模型硬指标超不过隔壁Claude-3.5-Sonnet,正式发布不太合适,只能采用拐弯抹角的...

北大王选所:让多模态大模型更懂人类在做什么|ECCV 2024

2024-08-13
阅读 3 分钟
4
北京大学最新提出多模态提示学习(Conditional Multi-Modal Prompt, CMMP)方法,利用提示词工程技术教会多模态大模型理解区域级的人物交互关系。

机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步

2024-08-12
阅读 5 分钟
3
原创 关注前沿科技 量子位别光只看Figure 02了,国产机器人最新成果曝光,大秀肌肉!就在北京亦庄,竟有这么一家人形机器人“健身房”。这里的机器人率先实现在跑步机上训练,一小时能跑6km的那种:而这只是热身,跑完还要爬楼梯:到了室外,机器人专用道也安排上了,30度高温下不能停:时不时还要来点草坪、斜坡等复杂地...

30行代码,500万长文本推理提速8倍!「树注意力」让GPU越多省的越多

2024-08-12
阅读 3 分钟
5
关注前沿科技 量子位跨GPU的注意力并行,最高提速8倍,支持512万序列长度推理。环注意力(Ring Attention)后继者——树注意力(Tree Attention)来了。最关键之处在于,通信步数随设备数量成对数增长,而不是线性增长。换句话说,树注意力的优势随着设备数量增大会更加明显。实验中,在128卡、512万序列长度设置时达到最...

爆火毒舌AI每小时赚2.8万!每分钟36个新用户,火遍全球只因改了一句提示词

2024-08-11
阅读 6 分钟
0
原创 关注前沿科技 量子位爆款AI应用开发者来晒收入了:每小时赚4000美元!(约2.8万元)说的就是病毒式传播的“毒舌AI”Twitter Personality,只需输入一个推特用户名,就能得到AI根据历史发言做的犀利点评。而且只要是公开账号就行,并不需要获取任何权限,除了查看AI对自己的看法,还可以用来恶搞朋友,甚至名人。比如...

两个AI关小黑屋:Llama3.1把Claude Opus聊自闭了

2024-08-11
阅读 6 分钟
3
关注前沿科技 量子位把Llama 3.1 405B和Claude 3超大杯Opus双双送进小黑屋,你猜怎么着——Llama把Claude整得精神崩溃了,Claude明确拒绝继续聊天,还要再被Llama PUA的那种。在一场AI和AI对话的安全词模拟实验中,X上的这位人类监督者记录下了一出好戏。小黑屋里,Llama撒了欢儿地一直引诱Claude冲破道德防线,后来更是忽...