谷歌版Her大翻车:试了3次且换手机才成功…网友:我手动只需10秒

2024-08-14
阅读 3 分钟
翻车,大翻车。就在今天凌晨,谷歌版Her——Gemini Live正式发布。毕竟明显是对标OpenAI家的GPT-4o,可以说是吸足了科技圈的眼球。在官网发布的demo中,拍照问答功能的效果是这样的:它大致实现的功能,是用手机拍摄演唱会的海报,并让Gemini查看用户的日历,看看行程是否适合参加。以及还可以基于此进行一系列后续的操作...

全球首个AI流媒体音乐App来了!中国造的

2024-08-14
阅读 5 分钟
全球首个AI流媒体音乐App,就这么水灵灵的来了。有什么特点?首先,如其名,这个App里的音乐都是由AI生成的。其次,它是无限流式的,也就是说,可以做到一直生成一直听。话不多说,我们直接来看效果。例如我们的Prompt是:Take a chilled walk with my dog. 和我的狗狗惬意地散步。视频地址:[链接]在上面的视频中,我们...

AI斗图神器:普通视频秒变meme,手绘动画轻松融入,了解一下?

2024-08-14
阅读 3 分钟
哎鸭,鸭鸭摔倒了!鸭鸭是真的,摔跤是真的,但端的咖啡和端咖啡的手,是AI给p上去的。△还好手里的咖啡只洒了亿点点来自一个开源项目,VideoDoodles,这两天在外网上的讨论度直线上升。这项目妙就妙在,能给视频加上手绘风格的涂鸦,可可爱爱的也行,奇奇怪怪的也行。就跟人工一帧一帧画上去的没差。这对目前市场上大多...

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

2024-08-14
阅读 3 分钟
头像是电影《Her》里的男主,昵称是三颗草莓,要素拉满。不知疲倦一天24小时在线水贴,内容多是OpenAI下一代模型爆料消息,时准时不准……

“具身智能 产业智变新引擎”2024科技创变者大会成功举行

2024-08-13
阅读 8 分钟
当前,科技正迈向一个史无前例的“时代巨澜”之上!具身智能,犹如其背后的一股强劲力量,席卷并重塑着未来产业的全球版图。赛道上,无论是科技巨头还是新兴势力,均面临着一个共同的挑战:即具身智能在汹涌澎湃的浪潮中,如何精准把握那个足以引起产业变革的「新引擎」?

换掉Transformer,7B开源模型立刻登顶!任意长序列都能处理

2024-08-13
阅读 2 分钟
只是换掉Transformer架构,立马性能全方位提升,问鼎同规模开源模型!(注意力机制不存在了)这就是最新Falcon Mamba 7B模型。它采用Mamba状态空间语言模型架构来处理各种文本生成任务。通过取消传统注意力机制,有效提升了模型处理长序列时计算效率低下的问题。它可以处理无限长序列,但内存需求不增加。无论上下文多长...

北大王选所:让多模态大模型更懂人类在做什么|ECCV 2024

2024-08-13
阅读 3 分钟
北京大学最新提出多模态提示学习(Conditional Multi-Modal Prompt, CMMP)方法,利用提示词工程技术教会多模态大模型理解区域级的人物交互关系。

尴尬!ChatGPT官宣新模型,评论区翻车了…

2024-08-13
阅读 3 分钟
ChatGPT有新模型了!官方账号宣布:最新版本GPT-4o从上周起已实装,我们猜你会喜欢的。然后……就尴尬了,下面评论区画风是一片的:“啊?改哪里了?没发现啊”。没有改进,我天天用,没啥区别。以及“OpenAI没活了”,推测新模型硬指标超不过隔壁Claude-3.5-Sonnet,正式发布不太合适,只能采用拐弯抹角的方式。新版ChatGPT更...

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

2024-08-13
阅读 7 分钟
史上首位“AI科学家”,横空出世!一登场就一口气生成了十篇完整学术论文。△AI生成的一篇扩散模型论文从提出研究想法、检查创新性、设计实验、编写代码,到在GPU上执行实验并收集结果,最后完成论文撰写,一气呵成。全由这位“AI科学家”自动搞定。每篇论文的成本约为15美元(约107.62元)。这就是第一个用于自动化科学研究...

最强AI程序员砸饭碗:84秒跑通代码,像人一样思考!团队仅5人

2024-08-13
阅读 4 分钟
继Devin之后,又一个AI软件工程师被刷屏了——它叫Genie,号称目前地表最强,已经可以像人一样思考和行动了!那么这个“地表最强”,到底强到什么程度?先来看下评测分数。在权威榜单SWE-Bench中,Genie以解决了30.07%问题的成绩夺得榜首。(SWE-Bench是一个用来评估大模型解决现实中软件问题的基准。)而这个成绩可谓是遥遥...

豆包上线音乐生成 用户可一键生成词曲

2024-08-13
阅读 1 分钟
8月8日,记者获悉,字节跳动旗下智能AI助手豆包上线音乐生成功能。用户在豆包的“音乐生成”中输入主题或自己写的歌词,设定音乐风格、情绪及音色,便能快速生成一首约1分钟的词曲,每个人都能体验音乐创作和表达的乐趣。

硅基智能推出「AI情绪放大器」硅秀emoji,海外版DUIX.Snap全球上线首月用户破10万

2024-08-12
阅读 2 分钟
硅基智能全新推出的 AI 视频神器硅秀emoji现已正式上线。据了解,这款创新产品凭借一张照片就能瞬间生成高能情绪视频,其海外版本DUIX.Snap,上线首月就吸引了超过10万的全球用户体验,火爆TikTok等平台。DUIX.Snap被称作“AI情绪放大器”,不仅能赋予照片灵魂,更可以DIY出独一无二的爆笑视频。

华为云盘古大模型赋能五大医药健康场景,全面加速行业创新

2024-08-12
阅读 3 分钟
海南省卫生健康委员会副主任张毓辉在出席会议时指出:“医药卫生改革发展进入新时期,着重以数字健康为动力推进智化医改和健康中国迈入新阶段,充分运用数字技术和人工智能将提升人民健康,推动中国乃至全球数字医疗时代加快到来。”

中科大/华为诺亚出手!芯片性能≠布局评分,EDA物理设计框架全面开源

2024-08-12
阅读 3 分钟
芯片物理布局,有了直指性能指标的新测评标准!中科大MIRA Lab和华为诺亚方舟实验室联合发布了新的评估框架和数据集,而且完全开源。有了这套标准,布局指标与最终的端到端性能不一致、得分高而PPA性能却偏低的问题,就有望得到解决了。在芯片设计当中,电子设计自动化(EDA)是至关重要的一环,在业界被称为“芯片之母”...

机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步

2024-08-12
阅读 4 分钟
别光只看Figure 02了,国产机器人最新成果曝光,大秀肌肉!就在北京亦庄,竟有这么一家人形机器人“健身房”。这里的机器人率先实现在跑步机上训练,一小时能跑6km的那种:而这只是热身,跑完还要爬楼梯:到了室外,机器人专用道也安排上了,30度高温下不能停:时不时还要来点草坪、斜坡等复杂地形上难度:它就是今年四月...

30行代码,500万长文本推理提速8倍!「树注意力」让GPU越多省的越多

2024-08-12
阅读 3 分钟
跨GPU的注意力并行,最高提速8倍,支持512万序列长度推理。环注意力(Ring Attention)后继者——树注意力(Tree Attention)来了。最关键之处在于,通信步数随设备数量成对数增长,而不是线性增长。换句话说,树注意力的优势随着设备数量增大会更加明显。实验中,在128卡、512万序列长度设置时达到最高8倍加速。与环注意...

科大讯飞宣布讯飞智文2.0全新版本正式上线

2024-08-12
阅读 1 分钟
8月12日,科大讯飞宣布旗下智能文档产品——讯飞智文2.0全新版本正式上线。新版基于讯飞星火V4.0 大模型底座,引入全新的PPT文本生成大模型、AI PPT编排创作引擎和PPT在线编辑模组,大幅提升编辑自由度和样式多样性。新增的实时联网搜索和长文本解析功能,增强了内容的时效性和深度。同时,AI Word和AI读写功能,助力用户...

文远知行上市基石曝光:博世认购部分,IPO作价50亿美元

2024-08-11
阅读 5 分钟
50亿美元,这就是国产通用型自动驾驶公司,文远知行刚刚曝光的IPO作价。据文远知行更新的招股书信息,明确了IPO将增发的股票数量,以及每股价格,公司估值随之曝光。其中超过91%的公开增发股份,将由百年Tier 1巨头博世认购。博世之前已经参与了文远知行的融资,并且双方还落地了L2+方案的合作,而现在博世更进一步以基...

两个AI关小黑屋:Llama3.1把Claude Opus聊自闭了

2024-08-11
阅读 6 分钟
把Llama 3.1 405B和Claude 3超大杯Opus双双送进小黑屋,你猜怎么着——Llama把Claude整得精神崩溃了,Claude明确拒绝继续聊天,还要再被Llama PUA的那种。在一场AI和AI对话的安全词模拟实验中,X上的这位人类监督者记录下了一出好戏。小黑屋里,Llama撒了欢儿地一直引诱Claude冲破道德防线,后来更是忽略了安全词继续引诱...

30秒生成建模师级Mesh!最大可生成面数提至1600,GitHub揽星1.9k

2024-08-11
阅读 3 分钟
只需30秒,AI就能像3D建模师一样,在各种指示下生成高质量人造Mesh。NeRF、3D Gaussian Splatting生成的三维重建图像Mesh效果如下:点云造出精细Mesh:Dense Mesh基础上生成也可以:一张图,甚至文本描述就足够了:GitHub已揽星1.9k的MeshAnything项目上新了V2版本,由来自南洋理工大学、清华大学、帝国理工学院、西湖大...

让AI管理大型代码库,开发者福音来了 | 阿里/新加坡国立/西安交大

2024-08-11
阅读 3 分钟
不过,如果是处理大规模、多文件的代码库,LLMs就可能犯了难。这时候,往往需要需要Retrieval-Augmented Code Generation (RACG)系统来检索相关的代码信息。

爆火毒舌AI每小时赚2.8万!每分钟36个新用户,火遍全球只因改了一句提示词

2024-08-11
阅读 5 分钟
爆款AI应用开发者来晒收入了:每小时赚4000美元!(约2.8万元)说的就是病毒式传播的“毒舌AI”Twitter Personality,只需输入一个推特用户名,就能得到AI根据历史发言做的犀利点评。而且只要是公开账号就行,并不需要获取任何权限,除了查看AI对自己的看法,还可以用来恶搞朋友,甚至名人。比如马斯克是肯定逃不过这一劫...

波士顿动力人形机器人大秀俯卧撑,一口气8个!转型后首次曝光成果

2024-08-10
阅读 3 分钟
一口气连做8个俯卧撑,波士顿动力Atlas又整新活了!看起来不仅完成轻松,而且动作还挺标准(手肘脚踝始终保持90°,全身也在一条线上)。站起来的过程也非常稳,起身下蹲透着一股板正,感觉下一秒就会来个敬礼。[doge]更特别的来了,大家发现没有?机器人Atlas没有手!!(相当于做的是拳卧撑,又是被机器人秒杀的一天……...

最高提速1440倍!15秒用GCN搞定随机规划,中科院自动化所新成果入选ICML 24

2024-08-10
阅读 3 分钟
仅需15秒即可搞定随机规划问题,速度比传统方法快了1440倍!中科院自动化研究所的新研究,利用GCN在此类问题上取得了新突破,论文已入选AI顶会ICML 2024。这意味着,在条件不确定的情况下,也能实现高效决策。不确定性下的决策是一类重要的决策问题,它要求决策者能够充分考虑到所有的随机情况并做出最合理的决策。在数...

14万!比亚迪开始把智驾当卖点

2024-08-09
阅读 5 分钟
内外双修比亚迪,现在全面发力智驾了。刚刚上市了两款车:新款海豹,搭载全球量产最高转速电机,价格区间为17.58-23.98万元。海豹 07 DM-i,搭载最先进插混系统DM 5.0,价格区间为13.98-19.58万元。电动化,一如既往的领先。同时,比亚迪开始把智驾当卖点了。主品牌首搭激光雷达,自研L2+级智驾上车海豹,只要21.68万元...

最强数学大模型易主!阿里千问新模型成绩超GPT-4o,网友:这才是真“草莓”

2024-08-09
阅读 3 分钟
阿里千问大模型团队发布的Qwen2-Math,不仅超越了Llama 3.1-405B,也战胜了GPT-4o、Claude 3.5等一系列闭源模型。

手机跑大模型提速4-5倍!微软亚研院开源新技术,有CPU就行

2024-08-09
阅读 3 分钟
有CPU就能跑大模型,性能甚至超过NPU/GPU!没错,为了优化模型端侧部署,微软亚洲研究院提出了一种新技术——T-MAC。这项技术主打性价比,不仅能让端侧模型跑得更快,而且资源消耗量更少。咋做到的??在CPU上高效部署低比特大语言模型一般来说,要想在手机、PC、树莓派等端侧设备上使用大语言模型,我们需要解决存储和计...

清华光学AI登Nature!物理神经网络,反向传播不需要了

2024-08-09
阅读 4 分钟
他们提出了一种全前向模式(Fully Forward Mode,FFM)的训练方法,在物理光学系统中直接执行训练过程,克服了传统基于数字计算机模拟的限制。

乒乓球AI机器人赢了人类!正反手灵活转换,擦网球高球都能接,专业教练:达到中级选手水平

2024-08-09
阅读 4 分钟
巴黎奥运会乒乓球团体赛如火如荼,谷歌机器人申请出战——首个达到人类竞技水平的机器人Agent发布!你看一个没留神,就赢了专业教练一个球!正反手快速转换,连续进攻也是不在话下~面对一些突发战术,比如长球高球擦网球,也能沉稳应对。实际测试中,机器人实时适应不同选手风格,最终赢下了与初学者的所有比赛,同中级玩...

全新起航!第二届粤港澳大湾区数据应用创新大赛启动仪式圆满举办

2024-08-09
阅读 3 分钟
2024年8月8日,正值《河套深港科技创新合作区深圳园区发展规划》(以下简称《河套规划》)发布一周年之际,第二届粤港澳大湾区数据应用创新大赛(以下简称大赛)盛大启动。