六位一线AI工程师总结爆火!大模型应用摸爬滚打一年心得公开,网友:全程高能

2024-06-01
阅读 8 分钟
8
关注前沿科技 量子位六位一线AI工程师和创业者,把在大模型应用开发上摸爬滚打一整年的心得,全!分!享!了!(奇怪的六一儿童节大礼包出现了)这篇干货长文,一时间成为开发者社区热议的话题。有网友评价为,大模型领域少有的“有操作性”的实用见解,非常值得一读。这6位作者来自不同背景,比如有大厂工程师,也有独立...

首个智慧城市大模型UrbanGPT,全面开源开放|港大&百度

2024-06-01
阅读 6 分钟
11
时空预测致力于捕捉城市生活的动态变化,并预测其未来走向,它不仅关注交通和人流的流动,还涵盖了犯罪趋势等多个维度。目前,深度时空预测技术在生成精确的时空模型方面,依赖于大量训练数据的支撑,这在城市数据不足的情况下显得尤为困难。

AI读论文新神器:多栏密集文字、中英图文混排文档都能读的多模态大模型Fox|旷视

2024-06-01
阅读 3 分钟
8
关注前沿科技 量子位虽然多模态大模型都能挑西瓜了,但理解复杂文档方面还是差点意思。面对文字密集、多栏混排等文档时往往力不从心,区域级别的细粒度理解,就更是无从谈起了。最近,旷视团队打造了一支多模态大模型的“点读笔”——Fox,轻松实现对8页文档(中英混合,单栏多栏格式混合的极端场景)的交互式感知理解。对于...

AI太火,量子位今年更缺人了 (含实习)

2024-06-01
阅读 3 分钟
6
关注前沿科技 量子位AI太火了!眼睛一睁一闭,一大堆新鲜出炉的前沿科技进展已经塞满未读列表。于是,今年的量子位,比以往更加缺人。这不到金三银四了,是时候拿出喇叭大喊一声:量子位招!人!啦!量子位编辑智能车编辑汽车视频工作室主理人量子位短视频主编量子位视频后期量子位商务经理智库分析师知乎微博新媒体运营...

OpenAI被曝帮苹果Siri换脑,微软急了:CEO约谈奥特曼

2024-05-31
阅读 3 分钟
6
关注前沿科技 量子位OpenAI、苹果被曝牵手成功,iPhone要变AiPhone了!预计苹果将在6月10日的WWDC 2024上首发iOS 18的新AI功能,到时见分晓。知情人士透露,Siri很可能会被AI彻底改造,可控制应用程序内的所有功能。The Information爆料称,去年WWDC期间,苹果机器学习团队的员工就和奥特曼以及OpenAI其他成员碰了面,后...

1/3年轻人愿和AI交朋友,超1成年轻人已经靠AIGC赚过钱了|Soul App报告分享

2024-05-31
阅读 3 分钟
7
我们发现,社交平台Soul App,凭借自己天然的场景,已经在AIGC+社交领域上线了AI聊天助理、AI合唱、AI狼人杀等功能,近期还推出沉浸式AI聊天陪伴应用“异世界回响”。

清华“天眸芯”登Nature封面!全球首款类脑互补视觉芯片,施路平团队最新成果

2024-05-31
阅读 5 分钟
9
关注前沿科技 量子位清华类脑计算研究中心施路平团队新成果,登上最新一期Nature封面。团队研发出世界首款类脑互补视觉芯片——“天眸芯”。“天眸芯”实现了一种基于视觉原语的互补双通路类脑视觉感知新范式,模仿了人类视觉系统特征。性能上,“天眸芯”能够以每秒10000帧的高速、10bit的高精度、130dB的高动态范围进行视觉信...

无需3D数据也能训练,港科&港中文联手华为推出3D自动驾驶场景生成模型

2024-05-31
阅读 2 分钟
11
这是来自香港中文大学、香港科技大学和华为诺亚方舟实验室的最新研究成果——针对自动驾驶街景的可控3D场景生成方法“MagicDrive3D”。

这家产品AI用户过亿,月活第一,覆盖学习办公和家庭教育,还有人偷偷用来赚钱

2024-05-31
阅读 6 分钟
8
原创 关注前沿科技 量子位谁是AI产品风口浪尖最当红的焦点?不是有些盆友猜测的聊天Bot——在最新的AI产品榜上,百度文库才是高居榜首的那一位。显眼的排名背后,是超1.4亿的AI用户数,以及超15亿的AI新功能使用次数。AI能用它帮大忙的场景,遍布学习办公、家庭教育和兼职赚钱。——这结果硬控我5秒,百度文库,它什么时候AI...

AI在咳嗽中检出癌症,不信?世卫组织正全球推广

2024-05-31
阅读 4 分钟
10
AI for Good峰会是联合国在AI领域的旗舰峰会,今年,联合国秘书长古特雷斯、“深度学习三巨头”之一的Hinton,以及OpenAI CEO奥特曼等都来参会了。

16家头部大模型公司上海神秘碰头,现场人挤人人人

2024-05-30
阅读 7 分钟
10
原创 关注前沿科技 量子位挤爆了,简直要被大模型公司们给挤爆了。来感受一下这个feel:毫不夸张地说,国内外叫得上来的大模型公司基本上都来了——Anthropic、Meta、Mistral.AI、Stability.ai、月之暗面、智谱AI、百川、MiniMax……到底是什么样的事情能让它们纷纷聚集到了一起?不卖关子,这正是“云计算一哥”亚马逊云科技...

32专家MoE大模型免费商用!性能全面对标Llama3,单token推理消耗仅5.28%

2024-05-30
阅读 5 分钟
10
原创 关注前沿科技 量子位每个token只需要5.28%的算力,精度就能全面对标Llama 3。开源大模型,再添一位重量级选手——来自浪潮信息的32专家MoE模型,源2.0-M32。不仅拥有极高的回报投入比,而且全面开放,训练代码和模型权重都可任意下载,商业使用也免费、无需授权。那么,这到底是怎样的一款模型?1/19算力消耗,性能对...

腾讯AI助手App元宝来了,公众号作者必备

2024-05-30
阅读 3 分钟
9
原创 关注前沿科技 量子位以产品见长的腾讯,终于推出C端AI助手App:腾讯元宝。与之前测试的混元助手相比,元宝在AI搜索、AI总结、AI写作等核心能力上都有升级,大模型效果提升50%。功能听起来好像和同类AI助手也差不多?But,一试才发现——能精准搜到微信公众号生态优质内容的(比如量子位本位~),也就腾讯自己能搞了...

最强开源编程大模型一夜易主:精通80+语言,仅22B

2024-05-30
阅读 4 分钟
7
关注前沿科技 量子位开源代码大模型的王座,再次易主!来自素有“欧洲OpenAI”之称的Mistral,用22B参数量表现超越了70B的Code Llama。模型名为Codestral,将代码的英文Code与公司名结合而成。在80多种编程语言上进行过训练后,Codestral用更少的参数实现了更高的性能,窗口长度也达到了32k,相比之前一众4k、8k的模型大幅...

用硅模拟人脑,进度条走到了1/80

2024-05-30
阅读 3 分钟
9
原创 关注前沿科技 量子位猫头鹰的大脑约有11.5亿个神经元、1280亿个突触。全部塞进一个微波炉大小的机箱——就成了世界上最大的神经拟态系统,英特尔Hala Point。不过别担心,期间没有任何猫头鹰受到伤害,是用的硅芯片模拟生物神经元。这种芯片效果如何?一系列数据说话:执行AI推理负载和处理优化问题时,速度比常规CPU...

AI太火,量子位今年更缺人了 (含实习)

2024-05-30
阅读 3 分钟
6
关注前沿科技 量子位AI太火了!眼睛一睁一闭,一大堆新鲜出炉的前沿科技进展已经塞满未读列表。于是,今年的量子位,比以往更加缺人。这不到金三银四了,是时候拿出喇叭大喊一声:量子位招!人!啦!量子位编辑智能车编辑汽车视频工作室主理人量子位短视频主编量子位视频后期量子位商务经理智库分析师知乎微博新媒体运营...

搞医学影像,为什么都青睐于CPU?

2024-05-29
阅读 4 分钟
13
关注前沿科技 量子位医学影像,越来越需要AI的帮助了。根据数据统计,目前我国医学影像数据年增速在30%,但影像科医生年增速却只有4%,医生面临较大的工作压力。那么,AI医学影像市场发展得如何呢?AI影像行业,是人工智能在医疗领域里面探索最久的赛道之一,近年来人工智能辅助诊断三类证的获批数量持续增长,整个人工...

Karpathy新教程爆火,网友抢着送他H100:从头复现GPT-2训练

2024-05-29
阅读 3 分钟
9
量子位大神Karpathy已经不满足于用C语言造Llama了!他给自己的最新挑战:复现OpenAI经典成果,从基础版GPT-2开始。挑战成功本身并不意外,但是只花费20美元、90分钟完成训练,Loss和评测还超越原版,就!有!点!过!分!了!。不仅如此,他把复现过程写成了完整教程,果不其然再次火爆。由于Karpathy自己租用的是A100云...

AlphaFold 3不开源,统一生物语言大模型阿里云先开了!

2024-05-29
阅读 5 分钟
9
关注前沿科技 量子位把169861个生物物种数据装进大模型,大模型竟get到了生物中心法则的奥秘——不仅能识别DNA、RNA与相应蛋白质之间的内在联系,在基因分类、蛋白质相互作用预测、热稳定性预测等7种不同类型任务中也能比肩SOTA模型。模型名为LucaOne,由阿里云飞天实验室生物智能计算团队打造。相比AlphaFold 3因未开源遭...

北大北邮的门,机器人开

2024-05-29
阅读 3 分钟
8
关注前沿科技 量子位搜集了328×204条数据,只为让机器人把开门这一件事做到极致。这是来自北大董豪团队和北邮何召锋团队的新研究。做到了开箱即用,不需要在现实世界重新微调,就能操控房门、车门等各种能想到的门。无论是普通的圆形的门把手;还是需要钥匙才能打开的储物柜;甚至是开保险柜,对它来说都不在话下。目前...

用GPT-3.5生成数据集!北大天工等团队图像编辑新SOTA,可精准模拟物理世界场景

2024-05-29
阅读 3 分钟
10
关注前沿科技 量子位高质量图像编辑的方法有很多,但都很难准确表达出真实的物理世界。那么,Edit the World试试。来自北京大学、Tiamat AI、天工AI、Mila实验室提出了EditWorld,他们引入了一种新的编辑任务,即世界指令(world-instructed)图像编辑,它定义和分类基于各种世界场景的指令。在一组预训练模型,比如GPT-...

AI太火,量子位今年更缺人了 (含实习)

2024-05-29
阅读 3 分钟
6
关注前沿科技 量子位AI太火了!眼睛一睁一闭,一大堆新鲜出炉的前沿科技进展已经塞满未读列表。于是,今年的量子位,比以往更加缺人。这不到金三银四了,是时候拿出喇叭大喊一声:量子位招!人!啦!量子位编辑智能车编辑汽车视频工作室主理人量子位短视频主编量子位视频后期量子位商务经理智库分析师知乎微博新媒体运营...

3D生成竞技场来了!比拼360°环绕视频,最强模型由你pick

2024-05-28
阅读 3 分钟
6
来自复旦大学和上海AI lab的研究人员搞了个3DGen-Arena,和大语言模型的Chatbot-Arena、GenAI-Arena等一脉相承,要让大伙儿对3D生成模型来一场公开、匿名的评测。

最难方言温州话被攻克!中国电信语音大模型支持30种方言,这题GPT-4o可不会做啊

2024-05-28
阅读 5 分钟
13
原创 关注前沿科技 量子位更适配中文的语音大模型来了——来自中国电信人工智能研究院,AI领域Fellow大满贯科学家李学龙带队,发布首个能听懂30多种多方言混说的大模型。号称最难方言、“魔鬼的语言”的温州话,也不在话下。<iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_34759438664009809...

逐际动力张力:人形机器人应该代替人类,而不是代替工具 | 中国AIGC产业峰会

2024-05-28
阅读 4 分钟
8
关注前沿科技 量子位人人都知大模型时代具身智能大有可为。但这座连接起大模型和现实物理世界的桥梁,究竟应该如何搭建?逐际动力联合创始人兼首席运营官张力,在中国AIGC产业峰会上给出思考:AI代替人去决策,人形机器人代替人去劳动。本质上,人形机器人应该代替人类,而不是代替工具。未来人形机器人会和iPhone一样,...

最猛AI独角兽:一年估值1700亿,再造一个OpenAI!马斯克LeCun却吵起来了

2024-05-28
阅读 3 分钟
8
原创 关注前沿科技 量子位马斯克搞大模型又融到60亿美元(约435亿元)!这是xAI最大的一轮融资,目前估值已来到240亿美元(约1738亿元),一举超过Anthropic,成为OpenAI之下第二位。借着这个势头,老马也亲自下场发起招聘广告:如果你相信我们理解宇宙的使命,需要最大限度地严格追求真理,而不考虑受欢迎程度或政治正...

国产开源Sora上新:全面支持国产AI算力,可用ReVideo视频编辑,北大-兔展团队出品

2024-05-28
阅读 6 分钟
9
<iframe class="video_iframe rich_pages" data-vidtype="2" data-mpvid="wxv_3477519432136736768" data-cover="http%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FYicUhk5aAGtD0q6TVwOiaSibNANsvia2NtfQcKHVo3mpp6nSgBnSHZiaqFTj4PZJ21B9fIrOalwHsyeQ7ibibl66WbBqA%2F0%3Fwx_fmt%3Djpeg" allowfullscreen="" frameborder="...

多模态CoT思维链架构来了,现已开源|来自厦大&腾讯优图

2024-05-28
阅读 4 分钟
16
量子位多模态大模型,也有自己的CoT思维链了!厦门大学&腾讯优图团队提出一种名为“领唱员(Cantor)”的决策感知多模态思维链架构,无需额外训练,性能大幅提升。在 ScienceQA 上,基于GPT-3.5的Cantor准确率达到了82.39%,相比基于GPT-3.5的思维链方法提升了4.08%。在更具挑战性的MathVista上,基于Gemini的Cantor准...

理想变了!技术研发投入每3天1个亿,领跑造车新势力

2024-05-27
阅读 4 分钟
6
在其最新披露的财报中,理想继续保持着增长势头。一季度交付80,400辆,同比增长52.9%;总营收256.3亿元,同比增加36.4%。但最值得关注的,莫过于一季度理想研发费用达到30亿元,比去年同期增加64.6%,是一季度净利润的5倍,创下了新的纪录。

港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体

2024-05-27
阅读 3 分钟
26
关注前沿科技 量子位当前,多模态大模型 (MLLM)在多项视觉任务上展现出了强大的认知理解能力。然而大部分多模态大模型局限于单向的图像理解,难以将理解的内容映射回图像上。比如,模型能轻易说出图中有哪些物体,但无法将物体在图中准确标识出来。定位能力的缺失直接限制了多模态大模型在图像编辑,自动驾驶,机器人...