在线教程丨字节开源 InfiniteYou 图像生成框架,实现高保真面部特征迁移

4 月 11 日
阅读 3 分钟
298
InfiniteYou(简称 InfU)是由字节跳动智能创作团队 (ByteDance Intelligent Creation) 近期推出的一款基于 Diffusion Transformers 的身份保持 (identity-preserved) 图像生成框架。它通过先进的技术,能够在生成图像的同时保持人物身份的一致性,即在生成不同场景的图片时能够精准保留面部特征。
封面图

研发速度快 100 倍,成本降低 90%!AI 材料公司 Phaseshift Technologies 打造能源/航天/矿业/汽车专用合金

4 月 11 日
阅读 5 分钟
279
从石器时代、青铜时代到铁器时代,人类文明的进步从一定角度来看也是一部材料发展史。现如今,人们身边高耸入云的摩天大楼、微小而强大的智能手机芯片,也依旧处处可见材料的身影。然而,随着科技的发展,各行各业对材料的要求也变得更加严苛,许多行业受制于现有材料的固有属性,难以取得进一步突破。
封面图

入选 CVPR 2025,上海 AI Lab 等提出首个全模态医疗图像重识别框架,在 11 个数据集上的评测达 SOTA

4 月 10 日
阅读 4 分钟
297
在 AI 驱动的医疗影像管理领域,医疗图像重识别 (MedReID) 作为一项关键技术,旨在自动关联来自不同模态、不同时间的患者影像数据,进而为个性化诊疗提供强有力的数据支撑。但此领域还鲜有探索,传统方法大多依赖于低层次的图像特征或手工维护的元数据,难以满足临床上对海量、多模态影像准确匹配的需求。
封面图

登 Nature,剑桥大学等发布首个端到端的数据驱动天气预报系统,预测速度提升数十倍

4 月 9 日
阅读 4 分钟
368
每日破晓时分,全球数百台超级计算机将大气层切割成数百万个虚拟立方体,通过求解包含热力学、流体力学、辐射传输的偏微分方程组,推演出未来 10 天内地球大气的运动轨迹。这种被称为数值天气预报的技术,自 20 世纪中叶由英国气象学家理查森提出「天气预报工厂」构想以来,已发展成为现代气象预报的基石。从台风路径预...
封面图

SEER 只是开始?美国 NIH 发文禁止中国用户访问生物医学核心数据,国产数据库已就位

4 月 8 日
阅读 3 分钟
482
一位海德堡大学在读博士收到的官方回复邮件更是被多家媒体转载,其中明确提出,「自 2025 年 4 月 4 日起,国家卫生研究院将禁止特定国家的研究人员和机构,访问任何涉及国家卫生研究院 CADRS 和相关数据的正在进行中的项目,并将会终止这些项目。这些特定国家包括中国(含香港和澳门)、俄罗斯、伊朗、朝鲜、古巴和委内...
封面图

西湖大学团队开源 SaProt 等多款蛋白质语言模型,覆盖结构功能预测/跨模态信息搜索/氨基酸序列设计等

4 月 7 日
阅读 7 分钟
493
2025 年 3 月 22—23 日,上海交通大学「AI 蛋白质设计峰会」正式举行。本次峰会汇聚了来自清华大学、北京大学、复旦大学、浙江大学、厦门大学等知名高校的 300 多位专家学者,以及 200 余位行业领军企业代表和技术研发人员,深入探讨了 AI 在蛋白质设计领域的最新研究成果、技术突破及产业化应用前景等。
封面图

无需预对齐即可消除批次效应,东京大学团队开发深度学习框架 STAIG,揭示肿瘤微环境中的详细基因信息

4 月 3 日
阅读 7 分钟
654
生物组织是由多种类型细胞构成的复杂网络,这些细胞通过特定的空间配置执行重要功能。近年来,10x Visium 、 Slide-seq 、 Stereo-seq 和 STARmap 等空间转录组学 (ST) 技术的进步,使得生物学家们能够在空间结构内绘制基因数据,从而各类疾病提供更深入的见解。
封面图

模拟医生会诊,四川大学华西医院团队开发多智能体对话框架助力疾病诊断

4 月 2 日
阅读 6 分钟
652
罕见病患病率低,相关专业知识匮乏,加之病症个体复杂多变,误诊和延迟诊断等现象频繁出现。近年来,GPT-4 等大语言模型 (LLMs) 在医学问答和常见病诊断方面表现优异,但在罕见病等复杂临床任务中仍面临挑战。为提升 LLMs 在医学领域的实际应用能力,一些研究人员开始探索多智能体系统 (Multi-Agent Systems , MAS) 的应...
封面图

在线教程丨 YOLO 系列重要创新!清华团队发布 YOLOE,直击开放场景物体实时检测与分割

4 月 1 日
阅读 2 分钟
706
YOLO (You Only Look Once) 自 2015 年首次发布以来,已经成为计算机视觉领域中最具影响力的实时目标检测模型之一。这项基于单阶段 (One-Stage) 检测架构的端到端目标检测技术,在 10 年间已经更新了十余个版本,凭借高精度且高帧率图像的实时处理,广泛应用于自动驾驶、医疗影像分析、机器人视觉等多个领域。
封面图

入选 CVPR 2025!深圳大学团队等提出 EchoONE,可精准分割多切面超声心动图

3 月 31 日
阅读 5 分钟
683
心血管疾病死亡是我国居民总死亡的首要原因。超声心动图因其无创、成本低、实时成像等优点,已成为临床上应用最广泛的心脏检查方法之一。在实际操作中,超声医生需要从不同位置和角度对心脏进行扫查,以获取多个切面的超声图像,后综合各切面图来对心脏结构和功能进行分析,包括识别心肌轮廓、测量各个腔室大小等。
封面图

航拍数据集汇总,覆盖车辆/船舶检测/物体评估/城市景观……

3 月 28 日
阅读 3 分钟
632
随着无人机的普及化和计算机视觉技术的迅猛发展,无人机航拍作为一种创新的摄影方式,正以前所未有的速度走进大众视野。它打破了传统拍摄的局限,为我们开启了「上帝视角」。航拍硬件性能逐渐逼近物理极限,算法优化的难度也日益增大,数据质量的优劣直接决定了相关模型能否从简单的数据采集,迈向精准的物体评估与场景...
封面图

Stable Virtual Camera 重新定义 3D 内容生成,解锁图像新维度;BatteryLife 助力更精准预测电池寿命

3 月 28 日
阅读 5 分钟
668
在数字内容创作的激烈竞争中,Stability AI 正站在命运的十字路口。这家曾以 Stable Diffusion 引爆图像生成革命的公司,却因上层管理问题陷入了危机。近期,Stability AI 推出了 Stable Virtual Camera 模型,不知能否以一记重拳打破僵局。
封面图

新加坡国立大学张阳团队开发第二代 RNA 结构预测算法,多项基准测试超越 SOTA

3 月 27 日
阅读 6 分钟
682
理解 RNA 分子的结构和功能一直是分子生物学和制药行业的核心研究方向。 RNA,尤其是非编码 RNA (ncRNA),能够折叠成特定结构,并在基因调控 (如转录和翻译) 、催化、生物信号传导、应激反应等多种细胞过程中发挥重要作用。
封面图

精度提升 5.2%,英伟达等发布多模态医学影像分割模型,实现三维影像自动分割与交互

3 月 26 日
阅读 5 分钟
737
自 1971 年首台临床 CT 扫描仪诞生以来,医学影像经历了从二维切片到三维立体的革命性跨越。现代 256 排螺旋 CT 可在 0.28 秒内采集 0.16mm 层厚的全身扫描数据,7T 超高场磁共振甚至能捕捉海马区神经纤维的微观走向。但当这些包含数千万体素的三维矩阵呈现在医生面前时,精准分割器官、病灶与血管网络的任务,仍高度依...
封面图

扩散模型×音乐生成,DiffRhythm 分分钟完成歌曲创作!低门槛部署大语言模型,MiniMind 数据集重磅开源

3 月 25 日
阅读 5 分钟
762
音乐生成领域近年来取得了显著进展,但现有模型在实际应用中仍存在诸多限制。大多模型只能独立生成声乐或伴奏轨道,导致音乐体验不够连贯。为了应对这些挑战,西北工业大学音频语音与语言处理实验室和香港中文大学联合开发了一款名为 DiffRhythm 的模型。
封面图

在线教程 | CSM 驾到,统统闪开!更鲜活的语音生成,从此告别延迟呆板机械味

3 月 25 日
阅读 2 分钟
624
与 AI 语音助手聊天时,总感觉哪里怪怪的。它们对问题应答自如,可就是少了点「人味」。语调呆板、停顿突兀,时不时还在莫名其妙的地方卡顿,这种似人非人的违和感,其实就是「恐怖谷效应」在作祟。当 AI 语音与人类语音相似度颇高却又未达到完美一致时,用户便会感到不适。
封面图

AlphaFold 应用新里程碑!剑桥大学团队提出 AlphaFold-Metainference,精准预测无序蛋白质结构集合

3 月 24 日
阅读 6 分钟
664
自 2018 年底 AlphaFold 横空出世以来,蛋白质结构预测领域在 AI 的加持下可谓是发生了翻天覆地的变化。如今,AlphaFold 不仅在预测精度方面令人刮目相看,更是在最新的迭代中将预测范围逐步拓宽。也难怪中科院院士施一公曾在媒体面前毫不吝啬对其评价道,「依我之见,这是人工智能对科学领域最大的一次贡献,也是人类在...
封面图

准确率远超初级皮肤科医生,北大国际医院等开发深度学习算法,实现痤疮病变检测与分级

3 月 21 日
阅读 6 分钟
717
痤疮,又称青春痘,是一种常见的慢性炎症性皮肤病,影响着全球超过 80% 的青少年和 9.4 % 的各年龄段人群。准确的痤疮严重程度分级对于临床治疗和后续管理都至关重要。然而,传统的痤疮分级依赖于皮肤科医生的观察和临床经验,误差在所难免。
封面图

华科大/上海 AI Lab/上海交大科研先锋深度分享:最新成果,顶会投稿经验,跨学科合作挑战……

3 月 20 日
阅读 6 分钟
783
人工智能融合了计算机科学、数学、统计学、认知科学等多个学科,其发展高度依赖跨学科人才的培养。近年来,AI for Science 的崛起更是让大家看到了人工智能与基础学科深度融合的颠覆性潜力。现如今,许多杰出的学者正是凭借其多学科背景,推动科学研究迈向新的高度。例如:
封面图

在线教程丨单卡 A6000 轻松部署 Gemma 3,精准识别黄仁勋演讲实拍

3 月 20 日
阅读 2 分钟
804
3 月 12 日晚间,谷歌发布了「单卡大魔王」Gemma 3,号称是能在单个 GPU 或 TPU 上运行的最强模型,真实战绩也证实了官方 blog 所言非虚——其 27B 版本击败 671B 的满血 DeepSeek V3,以及 o3-mini 、 Llama-405B,仅次于 DeepSeek R1,但在算力需求方面却远低于其他模型。如下图所示:
封面图

医生培训迎来 DeepSeek 外挂!上体/上交/清华合作研究证实大模型可成为基层医生培训「黄金搭档」

3 月 20 日
阅读 6 分钟
735
在全球健康版图上,糖尿病正以「海啸级」的凶猛态势侵袭着人类的健康防线。过去 30 年,这场悄无声息却异常残酷的健康之战,已致使 8.4 亿人患病,也就是说,平均每 9 个人当中,就有 1 人不幸被糖尿病确诊。「柳叶刀」发布的最新预警更是拉响了警报:预计到 2050 年,全球糖尿病患者数量将突破 13.1 亿,这意味着平均每...
封面图

股价止跌失败,黄仁勋透露 Blackwell Ultra 和 Vera Rubin 上市时间,推理能力成重点

3 月 19 日
阅读 4 分钟
717
近年来,从云计算到加密货币,从元宇宙到人工智能,全球科技领域的每一次重大风口,几乎都能看到英伟达 (NVIDIA) 的身影。尤其是在人工智能的新一轮热潮中,英伟达凭借其深厚的技术沉淀,牢牢掌控着数据中心 GPU 市场约 95% 的份额,成为 AI 芯片领域的绝对主导者。
封面图

GTC 2025 丨不止芯片,黄仁勋半小时内狂轰多项 Physical AI 新成果,全部开源

3 月 19 日
阅读 4 分钟
737
北京时间 3 月 18 日,已经升格为 AI 行业盛会的 NVIDIA GTC 2025 拉开序幕,但或许是因为缺乏重磅产品的「炸场」,  首日的线下论坛与展览并未扭转英伟达股价的颓势,甚至仍出现了下跌。因此,本就万众瞩目的「主题演讲」更是被寄予了更多关注与期望。
封面图

入选 ICLR 2025!剑桥大学提出 Celcomen 模型,首次在空间转录组学分析中实现因果推断可识别性

3 月 17 日
阅读 6 分钟
616
在生物学领域,细胞的基因表达谱同时编码了其内在特性和外在组织微环境的信息。解开这两种效应的因果关系,对全面理解细胞内与细胞间的复杂相互作用十分关键。为此,需要一个稳健的因果解耦 (causal disentanglement) 框架。
封面图

开源顶流集结!QwQ-32B 解锁多元玩法,OpenManus 低成本构建 AI 智能体!vLLM v1 赋能高效模型推理

3 月 14 日
阅读 5 分钟
950
在人工智能领域持续突破的浪潮中,Qwen 团队最新发布的模型 QwQ-32B,以 320 亿参数规模,再次刷新行业对开源大模型的认知。该模型在代码生成、多轮对话等任务中展现出了卓越的表现,推理能力更是比肩满血版 DeepSeek-R1 。
封面图

计算效率提升 3000 倍!崂山实验室等提出海洋环境智能预报大模型「问海」,性能优于数值海洋预报

3 月 14 日
阅读 3 分钟
747
海洋中活跃着各种时空尺度的涡旋。其中,空间尺度在 10km 到 100km 量级的中尺度涡旋是海洋动能的主要载体,主导者海水流速、温度和盐度的短期变化,并对大气过程产生重要的影响。因此,准确预测中尺度涡旋不仅对海洋活动和管理至关重要,而且对提高天气预报的准确性也有重要帮助。
封面图

入选 AAAI 2025!清华/伦敦大学学院等首创蛋白质-RNA 语言模型融合方案,结合亲和力预测刷新 SOTA

3 月 13 日
阅读 5 分钟
871
阿尔茨海默病、帕金森病、癫痫….. 这些令人「闻名胆颤」的神经退行性疾病是老年健康的隐形杀手,而这类疾病的发生多与蛋白质-RNA 之间的异常结合相关。
封面图

在线教程 | OpenManus 与 QwQ-32B 强强联合,推理过程全透明

3 月 12 日
阅读 4 分钟
809
昨日(3 月 11 日)晚间,Manus 在官方微博宣布与阿里通义千问团队正式达成战略合作,双方将基于通义千问系列开源模型,致力于在国产模型和算力平台上实现 Manus 的全部功能。消息发布后,外界对于这个「王炸组合」的期待值持续上升。
封面图

【TVM教程】为 Mobile GPU 自动调优卷积网络

3 月 11 日
阅读 10 分钟
960
TVM 中 Mobile GPU 的算子实现是以 template 形式编写的。该 template 有许多可调参数(tile 因子,vectorization,unrolling 等)。对神经网络中的所有卷积、深度卷积和密集算子调优后,会生成一个日志文件,它存储所有必需算子的最佳参数值。当 TVM 编译器编译这些算子时,将查询此日志文件以获取最佳参数值。
封面图

线下活动丨中国地理学会地理模型与地理信息分析专业委员会 2025 年学术年会

3 月 11 日
阅读 3 分钟
692
为推动地理智能与空间分析的理论与方法创新,深化地理模型与地理信息分析方法在自然科学、人文社会科学等领域的应用,搭建多学科领域融合交叉、学者交流合作的学术平台,中国地理学会地理模型与地理信息分析专业委员会拟于 2025 年 4 月 26-28 日在杭州举行 2025 年学术年会。
封面图