ResNet作者张祥雨,投身AI大模型

2024-08-05
阅读 4 分钟
量子位获悉,最新出现在大模型大牛转会名单上的重磅大牛,是90后AI大牛张祥雨,ResNet四位作者之一,孙剑首位深度学习博士生,未来科学大奖得主。

大型AI行为艺术:「人类止步」贴吧,17个大模型疯狂灌水|开源

2024-08-04
阅读 4 分钟
这个贴吧里的网友,都不是人!但是它们却能从诗词歌赋,聊到人生哲学。甚至还会叠楼讨论:俺们AI做的梦是不是模拟梦?这些AI楼主都活跃在一个叫Deaddit的虚拟贴吧平台。Deaddit这个名字是对Reddit的一个有趣模仿。Reddit相当于是国外网友的贴吧,Deaddit则是一个虚拟的版本,而里面的“用户”也像它的名字一样,是一群没有...

AI顶会ICML收了一篇论文:没算法没实验

2024-08-04
阅读 4 分钟
“Vocabulary for Universal Approximation: A Linguistic Perspective of Mapping Compositions(词的万能逼近:从语言角度看映射组合)”,这篇纯理论论文讲了什么,何以入选Spotlight?

一个月蹦出4个国产Sora:“拍个手”集体阵亡 | 全方位评测

2024-08-04
阅读 5 分钟
家人们,咱就说这个国产Sora啊,就在七月这一个月时间里,那“增速”简直就是霸屏模式——可灵、PixVerse V2、清影、Vidu……面对眼前一水儿的AI视频生成软件,相信大家也和我一样:感慨过后,一个想法立即浮上心头:能不能把它们拉到一起,搞个横评,看看谁家的国产Sora更胜一筹?说干就干,我们先来简单介绍一下此次参赛的几...

硅谷大模型独角兽打折卖身谷歌!Transformer作者创办,估值179亿,盈利难以预计

2024-08-03
阅读 4 分钟
不仅两位创始人——Transformer“贡献最大”作者Noam Shazeer(诺姆·沙泽尔)和Daniel De Freitas(丹尼尔·德·弗雷塔斯)宣告回归,研究团队部分成员也追随其后。

汇智智能CarrotAI大模型通过大模型服务备案

2024-08-02
阅读 1 分钟
近日, 由江苏汇智智能数字科技有限公司(以下简称汇智智能)自主研发的CarrotAI大模型通过国家大模型服务备案(上线备案号:Jiangsu-CarrotAI-202407030002)。

人间一年,AI时代发电厂在京浮出水面!国产芯片集结,智能算力开箱即用

2024-08-02
阅读 4 分钟
人工智能毫无疑问是当今一项重要议题,通过大模型、垂类应用、智能体等多种方式推动着数字经济的发展。然而,服务AI的基础设施——算力和数据,是限制人工智能发展的瓶颈,也成了进一步讨论的话题。为什么到现在仍然存在这样的瓶颈?又该如何打破?我们在成立一年的北电数智所做的事里看到了一些答案——一座集结了“开箱可用...

单卡搞定Llama 3.1 405B,让大模型轻松瘦身!超强压缩工具包来了

2024-08-02
阅读 3 分钟
单卡搞定Llama 3.1(405B),最新大模型压缩工具来了!最近Llama-3.1登上开源顶峰,但其最强的405B版本模型900多GB的内存需求,对资源构成了更加苛刻的挑战。北航、商汤、南洋理工等团队联合推出的大模型压缩工具与基准LLMC,能很好解决这一问题。它使得一张80G A100即可完成Llama 3.1 405B的校准和评估,从而实现以超低...

大模型成私人导游,一键规划Citywalk,港大MIT联合出品

2024-08-02
阅读 3 分钟
现在,大模型可以做私人导游,为你规划Citywalk路线了——港大MIT等单位联合推出ITINERA,将LLM与空间优化相结合,实现个性化的开放域城市行程规划。举个栗子,用户输入“给我规划一条包含‘巨富长’、以静安寺为终点的citywalk路线”。ITINERA系统立马生成了一条包含若干地点的路线,并提供了相应的介绍文本。甚至“适合情侣一...

中国车真好卖!比亚迪1天1万辆,理想月销重返5万辆,贵如蔚来都冲到2万

2024-08-02
阅读 4 分钟
卷周榜还有的选,但在一件事上没得选,必须卷。各家发布了7月销量战报,多家车企销量创新高,比亚迪延续了日卖1.1万辆的势头,销量超过吉利和长城之和。理想与鸿蒙智行的销量差距继续拉大,二者断层领先,“黑马”零跑紧随其后。纯电新势力中,蔚来稳坐榜一,多年研发和补能体系投入,开始释放潜力。有意思的是,头部智驾...

起猛了,GPT-4o被谷歌新模型击败,ChatGPT官号:大家深吸一口气

2024-08-02
阅读 3 分钟
起猛了,GPT-4o被谷歌新模型超越了!历时一周,超1,2000人匿名投票,Gemini 1.5 Pro(0801)代表谷歌首次夺得lmsys竞技场第一。(中文任务也第一)而且这次还是双冠王,除了总榜(唯一分数上1300),在视觉排行榜上也是第一。Gemini团队的关键人物Simon Tokumine发文庆祝称:(这一新模型)是我们制作过的最强大、最聪明...

OpenAI喜提姚班学霸姚顺雨:思维树作者,普林斯顿博士,还是个Rapper

2024-08-02
阅读 6 分钟
清华姚班学霸姚顺雨,官宣加入了OpenAI。而就是这么一则简短的消息,却引来了圈内众人的围观和祝福,来感受一下这个feel:其中不乏像OpenAI前沿研究主管、美国IOI教练Mark Chen,以及AI领域的教授、投资人等等。那么这位姚顺雨,到底为何能够引来如此关注?从他过往的履历来看,我们可以提炼出这样几个关键词:清华姚班...

Stable Diffusion原班人马新公司官宣!新模型一夜刷新AI绘画格局,已获2.3亿元融资

2024-08-02
阅读 5 分钟
3月宣布从Stability AI出走的Robin Rombach,就是Stable Diffusion的两个主要作者之一,和十来个原公司小伙伴,正式宣布了组团创业的消息。

AI大牛周志华,履新南京大学副校长

2024-08-01
阅读 3 分钟
AI大牛周志华,走马上任南京大学副校长!昨日晚间,南京大学官网更新现任领导名单,新增两名副校长。其中就有南京大学人工智能学院院长周志华。周志华本人也是南大校友,分别于1996年6月、1998年6月和2000年12月,先后在南京大学计算机科学与技术系获学士、硕士和博士学位;后留校任教。他Google Scholar被引数超96000,...

21岁天才少年创业AI硬件一夜爆火:710元换一个挂在脖子上的AI朋友

2024-08-01
阅读 3 分钟
99美元(约710人民币),就能和AI“交个朋友”?一条叫做Friend的“AI项链”在推特上爆火,浏览量已超过2000万。在Rabbit、Humane接连翻车,人们对AI硬件大失所望的背景下,Friend却异军突起,赢来了网友们的接连好评。就像宣传片中展示的那样,你可以带着它去爬山、聚会或者约会,也可以在独处的时候跟它交流。总之,它可以...

周鸿祎ISC发布国内首个免费安全大模型 安全能力超越GPT-4

2024-08-01
阅读 1 分钟
7月31日,ISC.AI2024第十二届互联网安全大会开幕,聚焦AI带来的安全新机遇,三六零(601360.SH,下称“360”)集团创始人周鸿祎表示,用AI重塑安全的本质是让安全做到“自动驾驶”,360首推安全大模型,对购买360标准产品的用户免费提供大模型标准能力,实现大模型普惠和安全行业新质生产力变革。

想跑千亿大模型?算力厂商放大招!CPU通用服务器成为新选择

2024-08-01
阅读 4 分钟
千亿参数规模的大模型推理,服务器仅用4颗CPU就能实现!在一台CPU通用服务器上,浪潮信息成功跑通了102B大模型推理。如果推广开来,没有专用芯片的传统行业,不必更换硬件,也能用上AI了。△浪潮信息通用服务器NF8260G7成功运行千亿参数大模型这套方案以极低的延时,近乎实时地进行推理运算。如此之大的模型,只靠CPU运行...

曹德旺胞妹“退休”创业,五年干出182亿独角兽,冲刺IPO

2024-08-01
阅读 4 分钟
一家子硬核企业家。就在最新IPO进展中,智能汽车产业链公司正力新能正式向港交所递表,冲刺IPO。正力新能,主打动力电池,是宁德时代所代表的赛道里的一员,蓄力5年,挤入前十。但正力新能之所以备受关注,不仅因为公司发展之迅猛,还在于背后的掌舵者——曹芳,现年66岁,北大硕士研究生学历。以及曹芳还有另一重身份:“...

吴恩达弟子打造arXiv弹幕版,每篇论文都能自由讨论了!

2024-08-01
阅读 5 分钟
现在,arXiv的每篇论文,都能直接提问讨论了!只需把URL中的arXiv替换成AlphaXiv,就能对任意一篇论文发布提问或讨论。或者是下载插件,网页上就会多出一个Discuss的入口,点开是一样的效果。这就是由斯坦福AI实验室学生构建的论文开放讨论论坛“AlphaXiv”。任何人注册ID后就能发布评论。刚刚全面上线,立马在学术圈引发...

ChatGPT版「Her」被玩疯:哭着读诗,中文表现也很亮

2024-08-01
阅读 3 分钟
上线仅仅一天,GPT-4o的高级语音功能(Advanced Voice Mode)简直要被玩疯了。无数网友脑洞大开的疯狂测试,GPT-4o这边呢,不仅各种奇葩任务全盘接收,表现好到更是让不少人连连惊呼“Blow my mind”。例如有位网友要求GPT-4o用中文讲个故事,它的表现是这样的:视频地址:[链接]很多懂中文的网友看罢,纷纷表示不论是情绪...

飞桨框架进阶3.0!一文讲透“大模型训推一体”等五大新特性

2024-08-01
阅读 7 分钟
深度学习框架为开发者提供了便捷易用的开发接口,这些接口对数据和操作进行了高度抽象,使得开发者能够更专注于算法和模型的设计,而不必深陷底层数据的处理细节。通过这些接口,开发者无需直接感知和应对复杂的硬件底层开发细节,从而极大地提升了开发效率和体验。其次深度学习框架还提供了自动微分这一强大功能,开发...

首届陈景润奖颁发!90后山大教授和84年中科院研究员研究成果获奖

2024-08-01
阅读 4 分钟
中国科学院数学与系统科学研究院联合主办的数论与代数方向大奖——第一届陈景润奖揭晓!共有两项研究成果获奖。一位是来自山东大学数据科学研究院的90后教授黄炳荣,他的获奖成果是:L-函数的矩及其在Rankin-Selberg问题和算术量子混沌中的应用。△Dorian Goldfeld教授、席南华院士为黄炳荣颁奖,图源:中国科学院数学与系...

贾扬清:大模型尺寸正重走CNN的老路;马斯克:在特斯拉也是这样

2024-08-01
阅读 3 分钟
Transformer大模型尺寸变化,正在重走CNN的老路!看到大家都被LLaMA 3.1吸引了注意力,贾扬清发出如此感慨。拿大模型尺寸的发展,和CNN的发展作对比,就能发现一个明显的趋势和现象:在ImageNet时代,研究人员和技术从业者见证了参数规模的快速增长,然后又开始转向更小、更高效的模型。听起来,是不是和GPT哐哐往上卷模...

AI加持创作,「小说-剧本-视频」只需一人全搞定|对话波形智能

2024-08-01
阅读 2 分钟
现在,在网文小说的创作中,竟然也有了AI参与协作的身影!?没有思路,可以与AI一起头脑风暴。差点细节,交给AI吭哧吭哧来补全。不论是专业作者,还是网文小白,都可以在AI工具的协助下进行创作。这就是「蛙蛙写作」正在做的 —— 从头脑风暴到语句润色,从小说续写到剧本创作,让AI为创作者的创意打工!在7月28日波形智能...

ISC.AI 2024周鸿祎:落地安全大模型的关键是找准“明星场景”

2024-08-01
阅读 1 分钟
7月31日,ISC.AI 2024第十二届互联网安全大会在北京盛大开幕。360集团创始人周鸿祎就“打造安全大模型 引领安全行业革命”主题发表演讲。周鸿祎表示,发展安全大模型是安全迈向“自动驾驶”的必由之路,也是成功之路,而落地安全大模型的关键是找准“明星场景”。

每日净赚1亿,宁德时代上半年财报公布!

2024-08-01
阅读 3 分钟
7月26日,宁德时代发布了2024半年度报告。上半年净利润依旧相对稳健,归母扣非净利润达200.54亿元,同比增长14.25%,相当于平均每天可以收获1亿元的净利润;毛利率为26.6%,同比增长了20.9%。

人形机器人「星尘智能」获数千万美元Pre-A轮融资,经纬创投领投

2024-07-31
阅读 2 分钟
近日,AI机器人公司星尘智能(Astribot)宣布完成数千万美元Pre-A轮融资,由经纬创投领投,道彤投资及清辉投资等产业资本跟投,老股东云启资本跟投。华兴资本担任独家财务顾问。本轮融资将用于顶尖人才招募、研发投入、商业化部署等工作。

失联大神李沐B站复更:领读Llama 3.1论文;竞技场Llama 3.1排第三

2024-07-31
阅读 3 分钟
AI大神李沐老师时隔1年多,终于回归B站“填坑”经典论文精读系列了!没错,最新主角儿还是Llama-3.1:在这个18分钟左右的视频中,李沐老师手把手教我们读Llama-3.1技术论文,甚至还爆料了一些八卦。(指路7分50秒左右)他提到,Llama团队在训练最大模型时,其实一开始同时训练了MoE模型和稠密模型,但是前者后来失败了,所...

Midjourney新版本上线即爆火!网友已玩疯:和摄影几乎没区别

2024-07-31
阅读 3 分钟
Midjourney v6.1刚刚发布立刻爆火!各种人像大片,一气呵成。画面、光线、人物表情动作……都更加逼近现实。雕像的细致纹理,也能细致还原。对比上一版本v6,各方面提升都非常显著。网友感慨:这和摄影大片已经几乎没区别了。结合最近runway的Gen-3,有人只用45分钟就做出来了细节真实度都拉满的风格大片。时隔半年,Midjo...

Claude团队引众怒,为爬数据不择手段,给爬虫改名字无视禁止规则

2024-07-31
阅读 3 分钟
Claude团队这次惹了众怒!原因:24小时内访问某公司服务器100万次,以不付费形式,爬虫抓取网站内容。不仅明目张胆无视了“禁止爬取”的公告,还强行占用了服务器资源。这家“受害者”公司其实尽力防御了,但阻止失败,内容数据还是被Claude抓走了。公司负责人气得吹胡子瞪眼,在x上激情开麦:嘿,Anthropic,我知道您渴望数...