无需参数访问!CMU用大模型自动优化视觉语言提示词 | CVPR’24

2024-11-06
阅读 4 分钟
视觉语言模型(如 GPT-4o、DALL-E 3)通常拥有数十亿参数,且模型权重不公开,使得传统的白盒优化方法(如反向传播)难以实施。那么,有没有更轻松的优化方法呢?就在最近,卡内基梅隆大学(CMU)的研究团队对于这个问题提出了一种创新的“黑盒优化”策略——通过大语言模型自动调整自然语言提示词,使视觉语言模型在文生图...

ControlNet作者新作:AI打光玩得更溜了!细节保留能力远高于SD1.5

2024-11-06
阅读 3 分钟
ControlNet作者“敏神”(张吕敏),刚刚上新了一个新项目——名叫IC-Light V2,可以说是把AI打光这事儿玩得溜溜的。IC-Light是此前张吕敏开发的图像处理工具,可以通过AI技术精确控制图像中的光照效果。而此次的V2版本则是一系列基于FLUX的IC-Light型号,具有16通道VAE和原生高分辨率。话不多说,直接来看效果。例如随意输...

洗衣新生代强势崛起 石头科技洗衣机技术品鉴会北京场圆满落幕

2024-11-05
阅读 3 分钟
11月5日,石头科技洗衣机技术品鉴会在北京石头总部正式召开。作为一家专注于技术创新的智能硬件厂商,诞生以来,石头科技以“为用户打造极致体验的产品,用科技简化生活”为目标,在智能清洁机器人领域取得巨大成功基础上,将业务拓展到洗衣机赛道,以石头分子筛洗烘一体机成为行业的“破局者”。品鉴会上,石头科技展示了洗...

每天入职2174人,比亚迪在招聘季杀疯了

2024-11-05
阅读 3 分钟
3个月招聘200000人,什么概念?平均每天大约有2174人加入。这是过去的三个月,比亚迪在整车和零部件的招聘数据。全球汽车行业频频被曝降薪裁员,比亚迪这边,却在持续大规模招聘。截至9月份,比亚迪已经拥有超过90万名员工,在5300多家A股上市公司中,员工总数排在第一,比第二名高出近40万人。招聘浪潮的背后,是比亚迪...

OpenAI未来猛料全曝光!奥特曼承认自己最大弱点是产品

2024-11-05
阅读 9 分钟
40分钟的采访过程中,奥特曼除了聊OpenAI未来模型发展方向、Agent、和最尊敬的竞争对手(就是此前碎片式走漏风声的几个问题)外,还就Scaling Law、半导体供应链、基础模型竞争成本、该雇佣什么年龄段的员工等十多个问题进行了快问快答。

有生命的AI?AI Agent的应用可不只游戏NPC|对话超参数科技

2024-11-05
阅读 2 分钟
过去,AI在游戏中不断训练升级,电子游戏、象棋、围棋都曾是AI的训练场。如今,AI已然参与到游戏设计的各个环节之中。不但能够提升游戏制作的效率,AI还可以赋予游戏角色更为蓬勃的生命力,让NPC如同拥有了鲜活的灵魂一般“活”过来。

腾讯3D大模型全面开源,文本图像10秒转3D资产,模型权重、推理代码全开放

2024-11-05
阅读 4 分钟
3D生成开源界首个同时支持文字、图像转3D的模型来了,效果还是SOTA级别。就在刚刚,腾讯宣布推出Hunyuan3D-1.0,一口气开源轻量版和标准版两个模型。最快10秒就能端到端生成。先生成6个多视角图像,再进行多视角重建,“啪”的一下360度无死角的3D资产就造出来了。无论是人物形象:还是像下面这样婶儿的葡萄等复杂结构生成...

All in端到端后元戎获7亿融资,被曝长城独投!用L2+直达Robotaxi

2024-11-05
阅读 4 分钟
All in端到端的元戎启行,刚刚对外官宣完成了1亿美元最新融资。折合人民币约为7亿元,这是今年国内数额最大的智驾供应商单笔融资。元戎启行表示,这笔融资来自国内头部主机厂,但没有详细说明是哪家,只围绕最新融资,展开谈了谈商业化进展和出海规划,并透露:明年Thor上车,端到端模型进化,未来基于此用量产车就能做R...

Llama版o1来了,来自上海AI Lab,强化学习代码已开源,基于AlphaGo Zero范式

2024-11-05
阅读 3 分钟
复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发布之前,团队就开始探索蒙特卡洛树搜索提高大模型数学能力,积累了一些关注。这次最新...

1000个智能体打造《我的世界》,北大校友35页技术报告揭秘

2024-11-05
阅读 4 分钟
北大校友打造的1000个智能体「我的世界」,背后原理揭晓了!团队全新公开35页技术报告,详尽解密AI智能体如何产生专业化分工、社交互动、甚至传播虚拟宗教……其中最精彩的,当数团队整活儿:让牧师NPC引入虚拟宗教,最后发现该宗教在500个智能体(横跨6大城乡)中进行了广泛传播。据介绍,项目整体由一个名为PIANO的架构...

ChatGPT搜索搞不定勾股定理新证明,但国产AI可以!

2024-11-05
阅读 6 分钟
万万没想到,现在的国产AI搜索,竟然让我成功读懂了陶哲轩推荐的论文。事情是这样的。前几天陶哲轩在自己的主页上推荐了一篇关于勾股定理新证明的研究,引发了一波不小的讨论。毕竟2500多年的数学定理,竟然还能出现“新玩法”,而且是两个高中生搞出来的。带着好奇,去翻阅了一下论文,结果……(试图唤醒尘封的记忆……以失...

昆仑万维重磅发布天工AI高级搜索功能,做最懂金融投资、科研学术的AI搜索

2024-11-05
阅读 7 分钟
2023年4月17日,昆仑万维发布自研双千亿级大语言模型「天工1.0」正式奠定了国产大模型崛起之路;同年8月23日,正式推出国内第一款融入大语言模型的搜索引擎——天工AI搜索。过去一年多的时间,我们全身心投入打磨产品,持续提升模型能力。

英伟达团队机器训练新方法!仅5次演示让机器生成1000个新demo,李飞飞高徒与徒孙联手出品

2024-11-05
阅读 4 分钟
人类只需要演示五次,就能让机器人学会一项复杂技能。英伟达实验室,提出了机器人训练数据缺乏问题的新解决方案——DexMimicGen。五次演示之后,DexMimicGen就可以直接模仿出1000个新的demo。而且可用性强,用这些新demo训练出的机器人,在仿真环境中的任务成功率可以高达97%,比用真人数据效果还要好。参与此项目的英伟达...

¥9.99租英伟达H800!双十一算力羊毛真香,闲置卡也能挂机变现

2024-11-04
阅读 3 分钟
双十一大促没有羊毛可薅?不如来看看算力吧(doge)。A800价格低至5.88元/卡时,H800价格低至9.99元/卡时。限量开抢,先到先得!还有充值返现活动:充5000返900,充3000返500,充1000返150。不管你是AI开发者、AI小白、还是AI业务人员,甚至你有闲置算力想要出租变现,现在都能来潞晨云看一看。作为一家专注于AI应用的算...

奥迪确认用华为智驾:问界阿维塔同款,纯燃油实现「有路就能开」

2024-11-04
阅读 3 分钟
在绝对的技术优势面前,“祖上再阔”也只能从善如流。老牌豪华车企奥迪,确认上车华为智驾,搭载车型新A5L:是华为的一个里程碑:首次上车合资、首次上车纯燃油。业务拓展和工程落地的示范作用不言自明。更是合资车企的转折点:自力更生的转型宣告失利,现在必须考虑新的模式、新的伙伴。华为智驾,上车奥迪奥迪官宣,新款...

慢思考准确率反降30%!普林斯顿揭示思维链某些任务上失效的秘密

2024-11-04
阅读 3 分钟
OpenAI o1彻底带火慢思考和思维链(CoT)方法,但CoT在某些任务上反而会降低模型表现。比如给生造的词分类任务,GPT-4在zero-shot提示下的准确率高达94%,换成CoT的准确率却断崖式下跌到64.4%。内置CoT的o1-preview准确率更是只有57.7%。CoT究竟会“搞砸”哪些任务,在学术界仍是一个悬而未决的问题。现在,普林斯顿计算机...

商汤徐冰最新访谈:商汤最近在做什么?数万亿AI投资能回本吗?

2024-11-04
阅读 4 分钟
商汤科技联合创始人、执行董事徐冰出席香港金融科技周活动,并与前福布斯记者Olivia Kinghorst做现场对谈。在近20分钟的对话中,双方讨论了AI云平台市场趋势、投资判断、超级应用、竞争格局等话题。

明星飞行汽车破产:巅峰市值700亿,腾讯多轮投资,烧光100亿仍难载人试飞

2024-11-03
阅读 5 分钟
成立9年以来,Lilium累计筹集了14.5亿美元(约103亿元)的资金,腾讯是主要投资人之一。过去的十多轮融资,腾讯至少参与了七轮,其中由腾讯领投的三轮融资,为Lilium总共募集到5.7亿美元(约40亿元)。

微软清华改进Transformer:用降噪耳机原理升级注意力,一作在线答疑

2024-11-03
阅读 5 分钟
Transformer自问世后就大放异彩,但有个小毛病一直没解决:总爱把注意力放在不相关的内容上,也就是信噪比低。现在微软亚研院、清华团队出手,提出全新改进版Differential Transformer,专治这个老毛病,引起热议。论文中介绍,整体思路类似差分放大电路或降噪耳机,用两个信号的差值来滤除共模噪声。具体到在语言模型中...

大模型玩你画我猜:Claude6局3胜,GPT-4o表现迷惑

2024-11-03
阅读 4 分钟
就像下面这张图展示的,由Grok画长颈鹿,一堆大模型根据生成内容猜答案。参赛选手包括GPT-4o、Claude、Llama、Gemini、Grok等。

全国第二!智平方荣获第十三届全国创新创业大赛初创型企业全国总决赛第二名(新一代信息技术赛道)

2024-11-03
阅读 1 分钟
日前,智平方(深圳)科技有限公司在第十三届中国创新创业大赛新一代信息技术全国赛中成功跻身全国总决赛,并荣获初创型企业全国第二名,成为唯一获奖的具身智能初创企业。

2mm芯片植入视网膜,盲人重获阅读能力还能打牌,马斯克老部下创业成果来了

2024-11-02
阅读 2 分钟
把一块2mm大小的芯片植入视网膜,搭配一幅带摄像头的眼镜,就能成功让盲人恢复视力!不仅重拾阅读能力,甚至还能打牌。这是来自美国加州的脑机接口公司Science的最新进展。而这家公司,正是由马斯克的前部下创立。Science的CEO Max Hodak曾是Neuralink联创兼总裁。2021年,Hodak离开了Neuralink并创立了Science公司,该...

3B模型打通机器人任督二脉!冲咖啡叠衣服都能干,7种形态适配,OpenAI也投了

2024-11-02
阅读 6 分钟
只要一个3B参数的大模型,就能控制机器人,帮你搞定各种家务。叠衣服冲咖啡都能轻松拿捏,而且全都是由模型自主控制,不需要遥控。关键是,这还是个通用型的机器人控制模型,不同种类的机器人都能“通吃”。这些操作背后的大模型叫做π0,参数量只有3B,来自今年刚成立的初创公司Physical Intelligence(简称π)。创立之后...

时代变了!英伟达纳入道琼斯指数,英特尔被取代

2024-11-02
阅读 3 分钟
见证历史!最新消息,英伟达将在2024年11月8日替代英特尔成为道琼斯工业平均指数的组成成员。这是历史最悠久的美国市场指数之一,只有30家能代表美国工商业的上市公司有资格入选。消息释出,英伟达股价上涨2.9%,英特尔股价下跌1.85%,道琼斯指数下跌0.9%。这一变动意味着,英特尔将结束在道琼斯指数中25年的任期,半导...

比亚迪营收首次超越特斯拉,但市值仍差6倍

2024-11-02
阅读 4 分钟
比亚迪第三季度的财报显示,公司第三季度营业收入突破2000亿大关,首次超过了特斯拉的营收,后者第三季度营收为251.82亿美元,大约是1793亿元。

OpenAI回应一切,o1/GPT年前升级!奥特曼:别嫌慢,问就是缺算力

2024-11-01
阅读 5 分钟
具体阵容包括,首席产品官Kevin Weil、高级研究副总裁Mark Chen、工程副总裁Srinivas Narayanan和首席科学家Jakub Pachocki。

科研版AI搜索来了!知乎直答接入正版论文库,一手实测在此

2024-11-01
阅读 4 分钟
人在知乎,正经搞科研,这事儿越来越有谱了(doge)。想了解下学术热点,直接一搜,AI不仅一步到位给出总结,连参考文献都列好了。想要进一步跟大模型探讨论文内容,也无需跳转,将论文一键选入暂存区,就能愉快开聊。最新消息,知乎版AI搜索知乎直答,已正式上线“专业搜索”功能。并且,是国内首家提供AI搜索与正版论文...

豆包大模型团队开源RLHF框架,训练吞吐量最高提升20倍

2024-11-01
阅读 1 分钟
强化学习(RL)对大模型复杂推理能力提升有关键作用,但其复杂的计算流程对训练和部署也带来了巨大挑战。近日,字节跳动豆包大模型团队与香港大学联合提出 HybridFlow。这是一个灵活高效的 RL/RLHF 框架,可显著提升训练吞吐量,降低开发和维护复杂度。实验结果表明,HybridFlow 在各种模型规模和 RL 算法下,训练吞吐量...

大模型安全PK,怎么就让车厂拿了一等奖?

2024-11-01
阅读 5 分钟
一家车厂,冲进了大模型安全第一梯队。最近,中国计算机学会(CCF)举办了大模型安全挑战赛,参赛者包括一众大模型安全公司,知名研究机构等。激烈的角逐后,成绩放榜,让人意外:第一梯队的玩家里,竟然有一家车厂,而且还是一家成立不到10年的新势力,理想。为什么一家车厂能冲进大模型安全第一梯队?大模型安全都有哪些...

ChatGPT终于变AI搜索引擎了!网页/手机/桌面版同时上线,即将人人可用

2024-11-01
阅读 2 分钟
衡宇 梦晨 发自 凹非寺量子位 | 公众号 QbitAI终于!从今天起,ChatGPT新增搜索功能,摇身一变成AI搜索了!背后支撑该功能的是OpenAI旗舰模型GPT-4o的微调版本。网页版、手机版、桌面版同时上线。也就是说,SearchGPT的Chrome扩展大变样了,变成了bot内可用的ChatGPT Search。CEO奥特曼介绍这一新功能时,喜爱之情溢于言...