【vLLM 学习】Disaggregated Prefill Lmcache

6 月 18 日
阅读 4 分钟
140
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →[链接]*在线运行 vLLM 入门教程:零基础分步指南源码 examples/offline_inference/disaggregated_prefill_lmcache.py {代码...}
封面图

整合多源植物转录组数据,山东理工大学等构建 PlantLncBoost 模型,跨物种 lncRNA 预测准确率最高达 96%

6 月 18 日
阅读 6 分钟
183
在植物科学领域,长非编码 RNA(lncRNA)的研究正逐渐成为焦点。 2020 年发表的一篇关于植物 lncRNA 研究的论文指出,lncRNA 在植物的生长发育和环境适应过程中发挥着关键作用。例如,有研究发现,某些 lncRNA 能够通过与蛋白质相互作用来调控植物的开花时间,从而影响植物的繁殖策略。这种精细的调控机制对于理解植物如...
封面图

【TVM 教程】如何使用 TVM Pass Instrument

6 月 17 日
阅读 27 分钟
280
可以通过向 tvm.transform.PassContext 提供 tvm.ir.instrument.PassInstrument 实例列表来检测 Pass。我们提供了一个用于收集计时信息的 pass 工具(tvm.ir.instrument.PassTimingInstrument),可以通过 tvm.instrument.pass_instrument() 装饰器使用扩展机制。
封面图

【Triton 教程】triton_language.cat

6 月 17 日
阅读 1 分钟
298
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。
封面图

早鸟票倒计时|TVM/Triton/TileLang 同台炫技,Meet AI Compiler 邀你一同解锁 AI 编译器的无限可能!

6 月 17 日
阅读 4 分钟
232
HyperAI 超神经将于 7 月 5 日在北京市中关村举办第 7 期 Meet AI Compiler 技术沙龙。本次活动邀请了来自 AMD 、沐曦集成电路、字节跳动、北京大学的 4 位资深专家,从底层编译到上层应用,多视角探索 AI 编译器的前沿实践。此外,上海创智学院助理教授、 Apache TVM PMC 冯思远将担任圆桌环节的主持人,与众位讲师一起...
封面图

从石英到铁电材料,哈佛大学提出等变机器学习框架,加速材料大规模电场模拟

6 月 16 日
阅读 5 分钟
259
计算材料科学作为现代材料科学领域的前沿研究方向,承担着解析材料微观结构与预测宏观性能的关键使命。该学科以第一性原理为基石,基于量子力学等基础物理定律,致力于精确预测真实材料的可实验测量性质,从而深入理解材料在外部刺激下的响应机制。这些响应特性涵盖线性、非线性及耦合效应,是决定电介质、铁电体、多铁...
封面图

训练成本砍半!OmniConsistency 用 2.6k 张图实现 SOTA 效果;Wan2.1-VACE-14B 解锁视频生成新维度

6 月 16 日
阅读 7 分钟
207
在数字视觉技术蓬勃发展的今天,开源模型在图像风格化上取得了显著突破。然而在风格化一致性方面仍与商业模型存在明显差距。为突破这一技术瓶颈,Show Lab 创新性地推出了 OmniConsistency,这是一种基于大规模扩散变换器构建的一致性插件,旨在弥合开源方法与商业模型之间的性能差距。
封面图

【vLLM 学习】Data Parallel

6 月 13 日
阅读 5 分钟
347
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →[链接]*在线运行 vLLM 入门教程:零基础分步指南源码 examples/offline_inference/data_parallel.py {代码...}
封面图

在线教程丨刷新 TTS 模型 SOTA,OpenAudio S1 基于 200 万小时音频数据训练,深刻理解情感及语音细节

6 月 13 日
阅读 3 分钟
364
近年来,TTS(Text-to-Speech,文本转语音)模型经历了从拼接式语音合成到统计参数合成,再到神经网络 TTS(Neural TTS)的迭代,在技术层面呈现出端到端、模块融合的趋势,在应用层面呈现出多语言、高自然度、丰富情感变化的效果升级。
封面图

基于 8.6 万蛋白质结构数据,融合量子力学计算的机器学习方法挖掘 69 个全新氮-氧-硫键

6 月 12 日
阅读 7 分钟
467
在细胞这个「工厂」中,氮-氧-硫(NOS)键就像一个可逆的「智能开关」,能够根据环境中的氧化还原变化调节酶活性。 2021 年,来自德国哥廷根乔治奥古斯特大学的团队,通过研究淋病奈瑟氏球菌的转醛醇酶,发现了存在于赖氨酸和半胱氨酸之间的 NOS 键。这项研究超越了单一病原体和酶的研究范畴,为跨学科的蛋白质科学、药...
封面图

入选 ICML 2025,清华/人大提出统一生物分子动力学模拟器 UniSim

6 月 11 日
阅读 5 分钟
517
清华大学刘洋老师组、人民大学高瓴人工智能学院黄文炳老师组共同提出了一种统一的生物分子时间粗化(time-coarsened)动力学模拟器 UniSim 。该方法在大量 3D 分子结构数据上通过去噪 + 力场混合预训练获得统一的全原子表示模型,基于随机差值(stochastic interpolant)生成式框架学习分子在长时间步长下的转移向量场(...
封面图

【Triton 教程】triton_language.arange

6 月 10 日
阅读 1 分钟
563
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。
封面图

活动预告 | AMD/沐曦/字节/北京大学/上海创智齐聚北京,从底层编译到场景应用的多视角探索

6 月 10 日
阅读 4 分钟
519
在 AI 变革千行百业的时代,一场关于效率、可部署性与算力可持续性的技术革命正悄然发生。作为承上启下的关键中间件,AI 编译器串联起了底层硬件与上层应用。无论是已在业界广泛应用的 TVM,还是近年来快速崛起的 Triton,亦或是今年年初才崭露头角的算子编程语言 TileLang,编译技术已不仅仅是让模型「跑得起来」的基本...
封面图

【TVM 教程】如何使用 TVM Pass Infra

6 月 9 日
阅读 20 分钟
633
随着 Relay/tir 中优化 Pass 数的增加,手动执行并维护它们的依赖关系变得难以处理。因此我们引入了一个基础架构来管理优化 Pass,并使其适用于 TVM 堆栈中 IR 的不同层。
封面图

8k 长序列建模,蛋白质语言模型 Prot42 仅利用目标蛋白序列即可生成高亲和力结合剂

6 月 9 日
阅读 6 分钟
672
蛋白质结合剂(如抗体、抑制肽)在疾病诊断、成像分析及靶向药物递送等关键场景中发挥着不可替代的作用。传统上,高特异性蛋白质结合剂的开发高度依赖噬菌体展示、定向进化等实验技术,但这类方法普遍面临资源消耗巨大、研发周期冗长的挑战,且受限于蛋白质序列组合复杂性的固有瓶颈。
封面图

【vLLM 学习】Cpu Offload Lmcache

6 月 6 日
阅读 2 分钟
860
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →[链接]*在线运行 vLLM 入门教程:零基础分步指南源码 examples/offline_inference/cpu_offload_lmcache.py {代码...}
封面图

获 1.3 亿美元融资,NewLimit 利用机器学习指导表观遗传程序设计,延长人类健康寿命研究已有初级成果

6 月 6 日
阅读 5 分钟
824
盛年不重来,一日难再晨。一直以来,「时间」似涓涓流水,永不停息且难以逆转, 时光流转所带来的衰老困扰着一代又一代人。古有秦始皇、汉武帝、唐太宗等伟大帝王寻仙问道追求长生,亦有传说中的亚瑟王圣杯得之即可返老还童。当时代的指针落在 21 世纪,随着人们对于生命科学的研究不断深入,虽然已经鲜有人提及「永生」...
封面图

告别代码烦恼!Seed-Coder 解锁高效编程;Mixture-of-Thoughts 涵盖多领域数据,实现高质量推理

6 月 6 日
阅读 7 分钟
808
在大模型竞争日益激烈、不断「卷技术、卷规模」的趋势下,如何提升模型实际可用性和任务表现,成为了更关键的问题。其中,代码能力是衡量大模型可用性和任务表现的重要指标。基于此,字节跳动 Seed 团队发布了轻量级但功能强大的开源代码大语言模型——Seed-Coder-8B-Instruct 。
封面图

获 1.3 亿美元融资,NewLimit 利用机器学习指导表观遗传程序设计,延长人类健康寿命研究已有初级成果

6 月 6 日
阅读 5 分钟
872
盛年不重来,一日难再晨。一直以来,「时间」似涓涓流水,永不停息且难以逆转, 时光流转所带来的衰老困扰着一代又一代人。古有秦始皇、汉武帝、唐太宗等伟大帝王寻仙问道追求长生,亦有传说中的亚瑟王圣杯得之即可返老还童。当时代的指针落在 21 世纪,随着人们对于生命科学的研究不断深入,虽然已经鲜有人提及「永生」...
封面图

【Triton 教程】triton_language.num_programs

6 月 5 日
阅读 1 分钟
889
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。
封面图

在线教程|新加坡国立大学 Show Lab 发布 OmniConsistency 模型,实现即插即用的图像风格迁移

6 月 5 日
阅读 2 分钟
978
图像风格化旨在通过风格化模型,将一幅图像在保持语义内容不变的同时从一种风格转换到另一种风格。近年随着扩散模型的出现,主流图像风格化方法从基于深度神经网络,转向了通过低秩适配(Low-Rank Adaptation, LoRA)微调的方法,并结合图像一致性模块,显著提升了风格化质量。
封面图

覆盖 2 亿分子质谱图,捷克科学院发布 DreaMS 模型,构建全球最大规模质谱数据集 GeMS

6 月 5 日
阅读 6 分钟
927
据统计,人类目前所探索的天然小分子化学空间尚不足其总量的 10%,而非靶向代谢组学实验中,超过 90% 的质谱图因缺乏可靠的注释而沦为「数据废墟」。
封面图

AI 编译器技术沙龙丨 AMD/北京大学/沐曦/上海创智齐聚北京,TVM/Triton/TileLang 各展所长

6 月 4 日
阅读 3 分钟
952
在 AI 变革千行百业的时代,一场关于效率、可部署性与算力可持续性的技术革命正悄然发生。作为承上启下的关键中间件,AI 编译器串联起了底层硬件与上层应用。无论是已在业界广泛应用的 TVM,还是近年来快速崛起的 Triton,亦或是今年年初才崭露头角的算子编程语言 TileLang,编译技术已不仅仅是让模型「跑得起来」的基本...
封面图

【TVM 教程】编写自定义 Pass

6 月 3 日
阅读 4 分钟
976
TVM 是一个抽象出机器学习加速器异质性的框架,有时用户希望自定义一些分析和 IR 转换,使得 TVM 适应自己的专用硬件。本教程介绍如何在 TVM 中编写自定义 Pass。
封面图

深度强化学习赋能城市消防优化,中国科学院团队提出 DRL 新方法破解设施配置难题

6 月 3 日
阅读 4 分钟
1.2k
在城市建设与发展中,地理空间优化至关重要。从工业园区选址,到公共服务设施布局,它都发挥着关键作用。但传统求解方法存在诸多局限,如今,深度学习技术为其带来了新的转机。
封面图

一键部署丨 DeepSeek-R1 新版本小幅升级便登顶开源王座,多项评测超越 Qwen3

5 月 30 日
阅读 3 分钟
1.4k
近日,DeepSeek 官宣其 R1 模型进行「小幅」版本升级,发布 DeepSeek-R1-0528 。在此次更新中,DeepSeek R1 通过提升计算资源配置并在后训练阶段引入算法优化机制,显著提升了其推理能力。该模型在数学、编程与通用逻辑等多项基准评测中表现出色,全面超越了 Qwen3-235B 和 DeepSeek-R1,堪称是「跨越一小步」便登顶开源...
封面图

Orpheus TTS 告别机械感,实时对话像朋友一样自然;OpenCodeReasoning 海量数据开源,解锁编程推理新高度

5 月 29 日
阅读 6 分钟
1.2k
文本转语音模型近几年取得了显著进展,但现有模型在实际应用中仍有很多局限。大多数模型只能生成单一音色的语音,无法生成富有情感的语音。为了应对这一挑战,Canopy Labs 开源了文本转语音模型 Orpheus-TTS 。
封面图

内含教程丨微软 Aurora 计算速度提升 5000 倍,可预测极端天气/空气质量/海浪/气旋路径等

5 月 29 日
阅读 3 分钟
1.2k
随着全球气候变化和自然灾害频发,精确可靠的地球系统预测对于减轻灾害影响、支持人类社会进步都至关重要。传统的数值模型虽然功能强大,但计算成本极高,限制了其广泛应用。近年来,人工智能在环境预测领域展现出巨大潜力,特别是在提高预测性能和效率方面。然而,在地球系统多个关键领域,AI 的潜力仍未得到充分探索。
封面图

【vLLM 学习】Chat With Tools

5 月 28 日
阅读 5 分钟
1.3k
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →[链接]*在线运行 vLLM 入门教程:零基础分步指南源码 examples/offline_inference/chat_with_tools.py {代码...}
封面图

入选 ICML 2025,清华/人大/字节提出首个跨分子种类统一生成框架 UniMoMo,实现多类型药物分子设计

5 月 28 日
阅读 5 分钟
1.4k
清华大学刘洋老师组、人民大学高瓴人工智能学院黄文炳老师组、字节跳动 AI 制药团队共同提出了一种跨分子种类统一生成框架 UniMoMo 。该框架基于分子片段(block)对不同种类的分子进行统一表示,使用变分自编码器对每个 block 的全原子构象进行压缩,并在压缩后的隐空间进行几何扩散建模(diffusion),从而实现对同一...
封面图