头图

上周,HyperAl超神经更新了 AlphaFold3 依赖数据库,但很多小伙伴都反映数据太大,部署困难。

本周,hyper.ai 官网上线了「AlphaFold3 蛋白质预测 Demo」,相关数据和模型已经安装配置完毕,占用个人存储不到 300 MB,仅需单卡 A6000 即可快速部署并使用 AlphaFold3 预测蛋白质。

在线使用:https://go.hyper.ai/KHIRR

12 月 16 日-12 月 20 日,hyper.ai 官网更新速览:

  • 优质公共数据集:10 个
  • 优质教程精选:3 个
  • 社区文章精选:4 篇
  • 热门百科词条:5 条
  • 1 月截稿顶会:9 个

访问官网:hyper.ai

公共数据集精选

1. Drone Detection 无人机检测数据集

该数据集由超 10k 个无人机图像组成,每架无人机周围都有带注释的边界框。边界框提供精确的定位信息,可在各种背景和环境中检测和跟踪无人机。该数据集适用于训练和评估用于物体检测任务的计算机视觉模型,特别是在监视、无人机检测和自主跟踪等应用中。

直接使用:https://go.hyper.ai/686JV

在这里插入图片描述

数据集示例

2. 360Motion-Dataset 运动捕捉数据集

这个数据集的 V1 版本包含了 72k 个视频,这些视频涵盖了 50 种不同的实体,如各种动物,以及 6 个虚幻引擎 (UE) 场景,包括 1 个沙漠场景和 2 个 HDRI 场景。此外,数据集还包含了 121 个不同的轨迹模板,为研究者提供了丰富的运动模式和行为变化。

直接使用:https://go.hyper.ai/rsmeQ

在这里插入图片描述

数据集示例

3. Brain tumor dataset 脑肿瘤医学数据集

该数据集为使用各种模型对脑肿瘤进行分类和分割的数据集,共包含 7,153 个图像,其中有 1,621 个神经胶质瘤图像,1,775 个脑膜瘤图像,1,757 个垂体图像,2,000 个无肿瘤(大脑健康)图像。

直接使用:https://go.hyper.ai/zgX7A

在这里插入图片描述

数据集示例

4. LAION-SG 大规模高质量图像理解数据集

LAION-SG 包含 540,005 个带有对象、属性和关系注释的场景图-图像对,这些数据被分为训练集、验证集和测试集。数据集的图像来源于 LAION-Aesthetics V2 (6.5+) 数据集,注释过程使用了 GPT-4o 进行自动化注释。

直接使用:https://go.hyper.ai/HHT6V

在这里插入图片描述

数据集示例

5. Clothing Attributes Dataset 服装属性数据集

该数据集包含 1,856 张图像,具有 26 个基本服装属性,例如 long-sleeves(长袖)、has collar(有领子)和 striped pattern(条纹图案)。标签是使用 Amazon Mechanical Turk 收集的。

直接使用:https://go.hyper.ai/7f3ej

在这里插入图片描述

数据集示例

6. Detect Al-Generated Faces 面部检测数据集

该数据集包含 3,203 张真实人脸和 AI 生成的合成人脸的高质量图像,其中真实图像有 2202 张,AI 生成的图像有 1,001 张,专为机器学习和深度学习应用而设计。旨在提供区分真实面部和 AI 生成的面部图像资源,适合深度伪造检测、图像真实性验证和面部图像分析等任务,可支持尖端研究和应用。

直接使用:https://go.hyper.ai/SwMXL

在这里插入图片描述

数据集示例

7. U-MATH 数学推理数据集

该数据集包含了 1.1k 个未公开的大学水平数学问题,这些问题来源于真实的教学材料,并涵盖了 6 个核心数学主题:初等数学、代数、微分学、积分学、多变量微积分以及序列与级数。

直接使用:https://go.hyper.ai/FcNc2

8. Open01-SFT 监督微调数据集

OpenO1-SFT 数据集是一个专注于使用监督微调 (SFT) 方法激活语言模型的链式思维 (Chain-of-Thought) 能力的数据集,旨在增强模型生成连贯逻辑推理序列的能力。它包含了 77,685 条记录,这些记录不仅覆盖了中文,也包括了英文,使得数据集在多语言环境下都能发挥作用。

直接使用:https://go.hyper.ai/KlyzY

9. QwQ-LongCoT-130K 微调数据集

QwQ-LongCoT-130K 数据集是一个专为训练类似 O1 这样的大语言模型 (LLMs) 而设计的 SFT (Supervised Fine-Tuning) 数据集。这个数据集包含了大约 130k 个实例,每个实例都是使用 QwQ-32B-Preview 模型生成的响应。

直接使用:https://go.hyper.ai/kE9aG

10. ML in healthcare patent 医疗保健专利数据集

该数据集是使用搜索查询「机器学习和医疗保健」从 Google Patents 中整理出来的,其中包括医学成像、诊断工具、AI 驱动的治疗建议等各个领域授予的专利。

直接使用:https://go.hyper.ai/8p1M5

公共教程精选

1. AlphaFold3 蛋白质预测 Demo

AlphaFold3 是由谷歌 DeepMind 公司于 2024 年开发的人工智能 (AI) 工具。AlphaFold 3 模型采用了基于扩散的架构,不仅能够预测蛋白质结构,还能精确预测包括核酸、小分子、离子和修饰残基在内的复合物结构。

该教程将介绍如何快速部署并使用 AlphaFold3 预测蛋白质,仅需单卡 A6000 即可运行体验。

在线运行:https://go.hyper.ai/KHIRR

在这里插入图片描述

可视化展示

2. RMBG-2.0:开源背景去除模型

RMBG-2.0 是一个开源背景去除模型,旨在有效地将各种类别和图像类型的前景与背景分开。

该模型已将环境和依赖配置完毕,进入 API 地址即可体验一键抠图。

在线运行:https://go.hyper.ai/FF10L

在这里插入图片描述

模型示例

3. DePLM:用去噪的语言模型优化蛋白质(小样本)

去噪蛋白质语言模型 (DePLM),可以将蛋白质语言模型捕捉到的进化信息视为与优化目标特性相关和无关的混合体,其中无关信息被视为「噪音」并消除,进而提高模型在预测蛋白质适应性景观时的准确性,帮助识别功能最优序列以进行优化。

该教程为浙江大学发布的训练和推理去噪蛋白质语言模型 (DePLM),相关成果已入选「NeurIPS 24」。平台已将所需要的环境与数据集配置完成,大家可通过直接执行教程所给出的命令进行训练和推理。

在线运行:https://go.hyper.ai/ktd87

社区文章精选

1. 受屠呦呦启发,美国 AI 制药企业的首个候选药物进入临床试验,曾 5 年获 8 轮融资

近期,美国的一家 AI 制药初创公司 Enveda 宣布已经完成 1.3 亿美元的 C 轮融资,总融资金额达 3.6 亿美元。除此之外,今年 10 月底,使用 Enveda 平台发现的第一个候选药物 ENV-294 获得了美国 FDA 的 IND 批准 ,进入 I 期临床试验阶段。本文是对该企业的详细报道。

查看完整报道:https://go.hyper.ai/rMk2U

2. 直击青藏高原数据匮乏难题!浙江大学团队提出 GeoAI 新模型,解释青藏高原地表热流分布

青藏高原由于其特殊的地理位置,一些地势险峻区域的地表热流数据十分匮乏。为解决这一问题,浙江大学地球科学学院提出具有增强可解释性的地理神经网络加权回归模型,为全面理解青藏高原的热流分布及其地球动力学机制提供了全新的研究框架和技术支持。本文是对论文的详细解读与分享。

查看完整报道:https://go.hyper.ai/vqQDi

3. 分享 NeurIPS 2024 投稿经验!浙大团队用 DePLM 模型助力蛋白质优化,论文一作在线展示 demo

在 Meet AI4S 第五期直播中,浙江大学知识引擎实验室的博士研究生王泽元分享了入选 NeurlPS 2024 的一项成果,并演示了 demo,同时还介绍了自己的投稿经验,干货满满,点击速看。

查看完整报道:https://go.hyper.ai/PLyBo

4. DeepMind 与 Google Research 齐发力,多技术路线打造 AI 天气预报的「六边形战士」

Google 旗下的 DeepMind 与 Google Research 面向天气预报领域发布了多项成果,兼顾短/中/长期预报,融合传统方法与 AI,逐步打造天气预报的「六边形战士」。

查看完整报道:https://go.hyper.ai/Cvzkc

热门百科词条精选

1. 倒数排序融合 RRF

2. 掩码语言建模 MLM

3. 核范数 Nuclear Norm

4. Kolmogorov-Arnold 表示定理

5. 数据增强 Data Augmentation

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://go.hyper.ai/wiki

在这里插入图片描述

一站式追踪人工智能学术顶会:https://go.hyper.ai/event


以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!


超神经HyperAI
1.3k 声望8.8k 粉丝