公共资源速递
5 个数据集:
- 年龄检测-人脸识别数据集
- DeepSymNet 深度符号网数据集
- PAWS-X 释义识别跨语言对抗数据集
- FewJoint 小样本联合学习基准数据集
- AceMath Instruct Training Data 数学推理数据集
1 个模型:
- MatterGen
3 个教程:
- TANGO 数字人生成
- 一键部署 Cosmos 世界基础模型
- lammps 入门教程:npt 控温估计 FCC Cu 熔点
访问官网立即使用:http://openbayes.com
公共数据集
该数据集是来自不同年龄段的人的图像的集合,专门为年龄预测和面部识别任务而设计的,包含不同的人口统计数据、种族和性别。
直接使用:
https://go.openbayes.com/05dsr
数据集示例
DeepSymNet 是一个可以表示任何表达式的完整网络,该数据集展示了 DeepSymNet 的整体框架,第一层为数据,中间层是隐藏层,最后一层是输出层。
直接使用:
https://go.openbayes.com/KEd1t
该数据集包含 23,659 个人工翻译的 PAWS 评估对和 296,406 个机器翻译的训练对,采用 6 种类型不同的语言:法语、西班牙语、德语、中文、日语和韩语。
直接使用:
https://go.openbayes.com/NELgU
该数据集是来自于讯飞 AIUI 开放平台上真实用户语料和专家构造的语料(比例约为 3:7),包含 59 个真实领域,是目前域最多的对话数据集之一。该数据集可以避免构造模拟域,非常适合小样本和元学习方法。
直接使用:
https://go.openbayes.com/ssHZm
5. AceMath Instruct Training Data 数学推理数据集
该数据集是由 NVIDIA 于 2025 年发布的一个用于训练 AceMath 模型的数据集,旨在提升模型在数学推理任务中的表现。
直接使用:
https://go.openbayes.com/4kPXG
公共模型
发布机构: 微软
MatterGen 是一个用于跨周期表设计无机材料的生成模型,可以通过微调来引导生成满足各种属性约束的材料。其原理主要是基于扩散架构,先将原子类型、原子位置、周期性晶格逐步破坏为随机结构,然后训练一个模型反向完成这一过程,让模型学习如何从随机噪声逐步还原回原始材料结构。
直接使用:
https://go.openbayes.com/AT80C
公共教程
TANGO 是一个专注于声音驱动的全身数字人生成的开源框架。该技术能够根据目标语音音频生成与之同步的全身手势视频,突破了传统数字人技术仅支持面部或上半身动作的局限性。
该项目通过 Gradio 接口可以生成前端交互界面,相关模型和依赖已经部署完毕,一键启动即可生成全身数字人。
在线运行:
https://go.openbayes.com/nIBWP
模型演示示例
Cosmos 世界基础模型是经数百万小时的驾驶和机器人视频数据训练的先进模型。在 CES 2025 大会上,NVIDIA 推出第一批 Cosmos 世界基础模型,该模型可以预测和生成虚拟环境未来状态的物理感知视频的神经网络,以帮助开发者构建新一代机器人和自动驾驶汽车 (AV)。
该项目通过 Gradio 接口可以生成前端交互界面,一键启动,复制 API 地址即可体验。
在线运行:
https://go.openbayes.com/hRLME
生成视频示例
3. lammps 入门教程:npt 控温估计 FCC Cu 熔点
LAMMPS 可用于固态材料(金属、半导体)和生物分子、聚合物等多种材料的建模,能够为不同材料提供多种粒子相互作用模型。
该教程为 LAMMPS 入门教程:npt 控温估计 FCC Cu 熔点,使用 CPU 版本的 LAMMPS 即可运行,快速上手分子动力学模拟。
在线运行:
https://go.openbayes.com/pRouD
效果示例
以上就是小贝上周在 OpenBayes 的全部更新内容啦~
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。