匹配正确率提升187.9%!华中科技大学CGCL实验室用自监督学习助力胶囊内窥镜图像拼接,「天眼」里也可看肠胃健康

10 月 28 日
阅读 5 分钟
433
在全球范围内,肠胃病正成为一个严峻的公共卫生挑战。据世界卫生组织国际癌症研究机构统计,胃病在人群中的发病率高达 80%,而在中国,肠胃病患者人数更是达到了 1.2 亿之多,且呈现出明显的年轻化趋势,关注肠胃健康迫在眉睫。
封面图

极速体验最新版 Gradio 5!超 200 万用户使用;入选 ACCV’24,LoLI-Street 低光照图像增强数据集上线

10 月 25 日
阅读 5 分钟
422
Gradio 自推出以来,每月已有超 200 万用户使用,在 AI 开发生态系统中扮演着关键角色。其简洁的代码和直观的界面,使得复杂的机器学习模型也能轻松转化为用户友好的 Web 应用,同时确保应用的安全性和可访问性。
封面图

最大开源机器人数据集!DeepMind联手21家机构,整合60个数据集,发布Open X-Embodiment,具身智能时代来临

10 月 25 日
阅读 4 分钟
488
近日,一段「机器狗当挑夫勇闯泰山」的视频火爆全网,这个「机器狗」不仅能够轻松驮载沉重物资,还能在泰山的陡峭山路上「健步如飞」,从山脚到山顶仅用两小时!中国外交部副部长华春莹也为它点赞:「机器狗在雄伟的泰山上充当搬运工,科技造福人类。」
封面图

【Triton 教程】融合 Softmax (Fused Softmax)

10 月 24 日
阅读 8 分钟
398
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。
封面图

医疗领域基准测试超越Llama 3、接近GPT-4,上海交大团队发布多语言医学大模型,覆盖6国语言

10 月 24 日
阅读 5 分钟
343
随着医疗信息化的普及,医疗数据从规模到质量都实现了不同程度的提升。进入大模型时代以来,面向精准医疗、诊断辅助、医患交互等不同场景的各类大模型层出不穷。
封面图

诺奖和图灵奖双料得主坐镇,CuspAI种子轮融资高达3千万美元,致力于应对全球气候变化

10 月 23 日
阅读 5 分钟
331
近日,2024 年诺贝尔奖揭晓,诺贝尔物理学奖授予美国科学家 John Joseph Hopfield 和加拿大科学家 Geoffrey Everest Hinton,表彰他们「通过人工神经网络实现机器学习的基础性发现和发明」。Geoffrey Hinton 也因此成为首个图灵奖+诺贝尔物理学奖的「双料」得主!
封面图

入选ECCV 2024!浙江大学联合微软亚洲研究院提出统一医学图像预训练框架UniMedI,打破医学数据异构化藩篱

10 月 22 日
阅读 6 分钟
473
让 AI 在某些条件下具备类似人类的反应能力,从而代替人类高效地从事特定工作,是 AI 领域研究人员孜孜不倦的追求。正如在医学图像和人工智能的交叉领域,基于视觉语言预训练的深度模型 (Visual-Language Pre-training, VLP) 凭借其自动化的特点,可以在大量图像及对应文本的数据集上进行预训练,并学会自动从新的图像中...
封面图

【TVM 教程】内联及数学函数

10 月 22 日
阅读 8 分钟
304
尽管 TVM 支持基本的算术运算,但很多时候,也需要复杂的内置函数,例如 exp 取指函数。这些函数是依赖 target 系统的,并且在不同 target 平台中可能具有不同的名称。本教程会学习到如何调用这些 target-specific 函数,以及如何通过 TVM 内联 API 统一接口。
封面图

线下活动丨AI for Science学术论坛重磅来袭,上海交大/浙江大学/清华大学/OpenBayes等专家齐聚北京

10 月 18 日
阅读 4 分钟
371
COSCon'24 第九届中国开源年会暨开源社十周年嘉年华,将于 2024 年 11 月 2-3 日在中关村国家自主创新示范区会议中心举办。HyperAI超神经将作为联合出品社区,在大会期间举办 AI for Science 方向的开源 AI 论坛。
封面图

【Triton 教程】向量相加

10 月 17 日
阅读 6 分钟
264
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。
封面图

抢先体验上海交大最新大模型Agent心理诊所!论文一作深度解读角色扮演Agent前沿进展

10 月 17 日
阅读 3 分钟
295
在当今社会的快节奏生活下,人们对于心理健康的关注度也在持续提升。然而,如今的心理健康医疗资源明显不足,尤其是在低收入和中等收入国家。同时,相关医疗资源的分布也主要集中在城市和大型机构,这种分配不平衡导致大量饱受抑郁障碍等精神障碍折磨的患者,难以及时获取相应的医疗辅助。
封面图

基于944种材料数据,日本东北大学联合MIT发布GNNOpt模型,成功识别数百种太阳能电池和量子候选材料

10 月 17 日
阅读 7 分钟
302
LED、太阳能电池、光电探测器和光子集成电路 (PIC) 等光电设备是现代通信、照明和能源转换技术的核心。 这些设备的性能和效率在很大程度上取决于材料的光学特性,因此,深入理解这些特性对于推动技术进步和满足日益增长的科学及工业需求至关重要。为了应对这一挑战,实验和计算领域的研究人员通过积极开展高通量筛选工作...
封面图

在线教程 | 打败 GPT-4V?超强开源多模态大模型 LLaVA-OneVision 正式上线!

10 月 16 日
阅读 3 分钟
294
大语言模型(Large Language Model,简称 LLM)与多模态大模型(Large Multimodal Model,简称 LMM)是人工智能领域的两个核心发展方向。 LLM 主要致力于处理和生成文本数据,而 LMM 则更进一步,它旨在整合和理解包括文本、图片、视频在内的多种数据类型。如今,LLM 已经相对成熟,ChatGPT 等在文字理解方面已经「对答...
封面图

AI助力RNA病毒研究历史性突破,中山大学等用深度学习模型,发现超过16万种新病毒

10 月 16 日
阅读 6 分钟
407
2020 年初,新冠病毒的阴影迅速笼罩全球。在这场与时间的赛跑中,我们见证了无数英勇的个体和团队挺身而出,社会体系经历了一次次严峻考验,也为全球的公共卫生领域敲响了警钟。
封面图

【TVM 教程】规约(reduce)

10 月 16 日
阅读 11 分钟
220
Apache TVM 是一个端到端的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →[链接]作者:Tianqi Chen本文介绍如何在 TVM 中规约(reduce)。关联规约算子(如 sum/max/min)是线性代数运算的典型构造块。
封面图

入选NeurIPS 24!浙大团队提出全新去噪蛋白质语言模型DePLM,突变效应预测优于SOTA模型

10 月 15 日
阅读 5 分钟
326
作为生物功能的主要载体,蛋白质结构和功能在数十亿年的进化中所展示出的多样性,为药物发现和材料科学等领域的进步提供了重要机遇,然而,现有蛋白质的固有特性(如热稳定性)在许多情况下往往无法满足实际需求。因此,研究人员致力于通过优化蛋白质来增强其特性。
封面图

首个完整 Triton 中文文档上线!开启 GPU 推理加速新时代

10 月 14 日
阅读 3 分钟
914
2019 年,Philippe Tillet 等人在论文「Triton: An Intermediate Language and Compiler for Tiled Neural Network Computations」中首次提出 Triton。2020 年,Philippe Tillet 加入 OpenAI,继续领导着 Triton 项目的开发,并于 2021 年首次公开发布了 Triton 编译器。
封面图

抢先体验上海交大最新大模型Agent心理诊所!论文一作深度解读角色扮演Agent前沿进展

10 月 12 日
阅读 3 分钟
396
在当今社会的快节奏生活下,人们对于心理健康的关注度也在持续提升。然而,如今的心理健康医疗资源明显不足,尤其是在低收入和中等收入国家。同时,相关医疗资源的分布也主要集中在城市和大型机构,这种分配不平衡导致大量饱受抑郁障碍等精神障碍折磨的患者,难以及时获取相应的医疗辅助。
封面图

5.2k星!突破 OCR 困境的超级变革者来了;多语言医疗大模型开源,语料库和基准数据集已提供下载

10 月 12 日
阅读 5 分钟
348
在当今数字化进程飞速发展的时代,OCR(光学字符识别)技术虽已普及,但仍存在诸多瓶颈。传统 OCR 模型在面对复杂多变的情况时,识别准确率会大打折扣,且处理流程和操作步骤颇为繁琐,极大地降低了工作效率。
封面图

国家海洋环境预报中心李本霞:全国首个海浪智能预报系统已投入业务化运行,AI助力海浪预报多项突破

10 月 11 日
阅读 5 分钟
299
近日,在第 20 届 CCF HPC China 2024 大会中,第六届海洋数值预报与高性能计算论坛圆满举办。在本次大会上,国家海洋环境预报中心海浪预报室主任李本霞以「人工智能在海浪预报中的应用」为主题展开演讲, HyperAI超神经在不违原意的前提下,整理了该演讲的核心内容,以下为演讲实录。
封面图

AlphaFold加冕诺奖,DeepMind CEO获奖感言:最优秀的科学家与AI配合,将完成令人难以置信的工作

10 月 10 日
阅读 4 分钟
342
北京时间 10 月 9 日,瑞典皇家科学院宣布了 2024 年诺贝尔化学奖的归属,一半授予 David Baker, 以表彰其在计算蛋白设计方面的贡献;另一半共同授予谷歌 DeepMind 首席执行官 Demis Hassabis 和高级科学家 John M. Jumper, 以表彰二人在蛋白质结构预测方面的成就。奖金共 1,100 万瑞典克朗,约合人民币 750 万元。
封面图

实现蛋白质动态对接预测!上海交大/星药科技/中山大学等联合推出几何深度生成模型DynamicBind

10 月 10 日
阅读 8 分钟
359
蛋白质是生命的物质基础,其功能与蛋白质结构、构象的动态性紧密相关,并且受配体调节。蛋白质-配体的相互作用研究对于药物的发现与筛选,具有重要意义。纵观其研究进程,AlphaFold 的面世是一个里程碑式突破,能够预测单个蛋白质的空间三维结构,为研究蛋白质–配体相互作用提供了结构基础。
封面图

【TVM 教程】TVM 中的 Schedule 原语

10 月 9 日
阅读 14 分钟
252
Apache TVM 是一个端到端的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 → [链接]作者:Ziheng JiangTVM 是一种用于高效构建内核的领域特定语言。本教程展示了如何通过 TVM 提供的各种原语来调度计算。 {代码...} 计算相同结果的方法众多,然而,不同的方法会导致局部性和性能各...
封面图

Agent心理诊所上线!基于1.3K抑郁症问诊对话,上海交大团队搭建大模型对话Agent,可初诊抑郁症

10 月 9 日
阅读 5 分钟
288
心理健康问题是当今社会最大的挑战之一,根据 WHO 的世界心理健康报告,约有 2 亿 4,600 万人患有抑郁障碍,平均每 10 万人中就有 3,153 个案例,可以说,这是最常见的精神障碍之一。
封面图

Jeff Dean点赞谷歌新研究:鲸鱼生物声学模型,可识别8种鲸类

10 月 8 日
阅读 5 分钟
336
鲸鱼声音识别对于保护海洋生态具有重要意义,科学家可以通过分析鲸鱼的声音,了解其种类、迁徙路线、繁殖习惯和社会结构,从而制定更加有效的保护政策。
封面图

一键拯救废片!3个在线教程,实现光线重塑、表情迁移、模糊图像修复

10 月 8 日
阅读 2 分钟
286
每逢国庆「黄金周」,都是旅游业的高光时刻。根据研判,今年国庆假期全社会跨区域人员流动量将达到 19.4 亿人次,平均每天 2.77 亿人次。
封面图

在线教程|LivePortrait 实现超逼真表情迁移,让虚拟偶像活起来!

10 月 8 日
阅读 2 分钟
292
LivePortrait 在最新版本中通过精确的画像编辑和视频编辑等功能,极大地简化了这一过程。创作者可以精确控制图像中的细微动作,生成高质量、细节丰富的动态视频,为创意和内容制作提供了极大的灵活性和便利。
封面图

数据集汇总|18个电影/音乐数据集汇总,覆盖影片/歌曲推荐、电影评价、歌词识别、音乐流派······

10 月 8 日
阅读 4 分钟
1.1k
每年的国庆档,电影院都会迎来一波观影高峰。据报道,去年国庆档的电影市场总票房累计 27.34 亿,超 2022 年同期 83%,总观影人次超 6511.4 万。
封面图

登 Nature 子刊!论文一作详解蛋白质语言模型的小样本学习方法,解决湿实验数据匮乏难题

10 月 6 日
阅读 9 分钟
746
在「Meet AI4S」系列直播第三期中,我们有幸邀请到了上海交通大学自然科学研究院 & 上海国家应用数学中心博士后周子宜, 他所在的上海交通大学洪亮课题组研究方向主要为 AI 蛋白和药物设计、分子生物物理。该课题组研究成果颇丰,截止目前共发表研究论文 77 篇,其中多篇登顶 Nature 期刊。
封面图

Meta 首个多模态大模型一键启动!首个多针刺绣数据集上线,含超 30k 张图片

10 月 6 日
阅读 4 分钟
290
小扎在 Meta Connect 2024 主题演讲中宣布推出首个多模态大模型 Llama 3.2 vision!该模型有 11B 和 90B 两个版本,成为首批支持多模态任务的 Llama 系列模型,根据官方数据,这两个开原模型的性能已超越闭源模型。
封面图