头图

公共资源速递

This Weekly Snapshots !

5 个数据集:

  • OMat24 无机材料数据集
  • Cityscapes 城市场景数据集
  • MedCalc-Bench 医疗计算数据集
  • Omni-MATH 数学推理基准数据集
  • C2A 灾难场景中的人类检测数据集

2 个模型:

  • F5-TTS
  • Ministral-8B-Instruct-2410

3 个教程:

  • 一键部署 MMed-Llama-3-8B
  • 唤醒老照片 (FLUX.1 + LivePortrait)
  • Linly-Dubbing 一键视频下载+翻译+配音+字幕

访问官网立即使用:http://openbayes.com

公共数据集

1. OMat24 无机材料数据集

OMat24 是 Meta 开源的一个大规模无机材料数据集,包含约 1.1 亿个数据点,这些数据点是通过高精度的密度泛函理论 (DFT) 计算得到的,涵盖了多样性的结构和成分。

直接使用:

https://go.openbayes.com/zrCDA

在这里插入图片描述

数据集示例图片

2. Cityscapes 城市场景数据集

Cityscapes 数据集是一个专门针对城市街道场景的语义理解图片数据集,它包含了来自 50 个不同城市的街道场景,总共包含约 25k 张图像,其中有 5k 张是高质量像素级精细标注的图像,另外还有 20k 张是带有粗糙标注的图像。

直接使用:

https://go.openbayes.com/pNQwX

在这里插入图片描述

数据集示例图片

3. MedCalc-Bench 医疗计算数据集

MedCalc-Bench 是一个专门用于评估大语言模型 (LLMs) 在医疗计算能力方面的数据集。它包含了 10,055 个训练实例和 1,047 个测试实例,涵盖了 55 种不同的计算任务。每个实例都包括患者的笔记、一个计算特定临床值的问题、最终答案值以及逐步解决方案。

直接使用:

https://go.openbayes.com/NtRN2

在这里插入图片描述

数据集示例图片

4. Omni-MATH 数学推理基准数据集

Omni-MATH 是一个奥林匹克级别的数学推理基准数据集,包含了 4,428 个经过严格人工标注的竞赛级数学问题,涵盖了 33 个子领域和超过 10 个不同的难度级别。

直接使用:

https://go.openbayes.com/tNgRF

在这里插入图片描述

数据集结构及数据示例

5. C2A 灾难场景中的人类检测数据集

C2A 数据集包含 4 种灾难场景类型(火灾/烟雾、洪水、倒塌的建筑物/瓦砾和交通事故)和 5 种人体姿势类别(弯腰、跪下、躺下、坐下和直立)的共 10,215 张高分辨率图像,以及超过 36 万个带注释的人类实例。

直接使用:

https://go.openbayes.com/qJYR0

在这里插入图片描述

数据集示例图片

公共模型

1. F5-TTS

发布机构: 上海交通大学、剑桥大学、吉利汽车研究院(宁波)有限公司

F5-TTS 是一款高性能文本到语音 (TTS) 系统,这一系统能够在没有额外监督的情况下,通过零样本学习快速生成自然、流畅且忠实于原文的语音。它还具备情感控制功能,能根据文本内容调整合成语音的情感表现,并支持速度控制,允许用户根据需要调整语音的播放速度。

直接使用:

https://go.openbayes.com/Cnwvs

2. Ministral-8B-Instruct-2410

发布机构: Mistral AI

该模型是一款专为边缘设备和边缘计算场景设计的语言模型,能够执行多项任务,包括回答问题、翻译不同语言的文字、制作文档摘要、帮助撰写文章和报告等。它采用了交错滑动窗口注意力模式,这种设计不仅提高了模型的推理速度,还显著降低了内存使用,使其非常适合在资源受限的边缘设备上运行。

直接使用:

https://go.openbayes.com/4nacC

公共教程

1. 一键部署 MMed-Llama-3-8B

MMed-Llama-3-8B 是一个多语言医学大语言模型。它的构建基于大规模多语言医学语料库 MMedC,该语料库包含约 255 亿个与医学相关的 token,涵盖英语、中文、日语、法语、俄语和西班牙语等 6 种主要语言。MMedC 语料库的构建,旨在为通用大型语言模型提供自回归领域的适应能力。该教程已经将模型和相关环境安装完毕,直接克隆并打开 API 地址即可运行模型,轻松处理非英语医学问题。

在线运行:

https://go.openbayes.com/KpNfD

在这里插入图片描述

效果示例

2. 唤醒老照片 (FLUX.1 + LivePortrait)

该教程利用最新的 Flux.1 对老照片进行修复,上色,最后使用 LivePortrait 生成视频实现照片动态化。该教程现已上线 OpenBayes 公共教程界面,只需一键克隆启动,即可唤醒尘封已久的照片。

在线运行:

https://go.openbayes.com/PVpZu

在这里插入图片描述

Demo 示例

3. Linly-Dubbing 一键视频下载+翻译+配音+字幕

Linly-Dubbing 是一个智能视频多语言 AI 配音和翻译工具,它能够自动将视频内容翻译成多种语言,并生成字幕。这个工具通过集成先进的 AI 技术,提供了包括语音识别、语音合成、字幕翻译、声音分离和口型同步等功能,以支持视频内容的国际化和本地化。点击下方链接,立即开启创作之旅,实现视频多语言 AI 配音与翻译。

在线运行:

https://go.openbayes.com/huQQ8

在这里插入图片描述

功能预览

以上就是小贝上周在 OpenBayes 的全部更新内容啦~


OpenBayes
6 声望1 粉丝

贝式计算是中国领先的高性能计算服务提供商,通过为新一代异构芯片嫁接经典软件生态及机器学习模型,向工业企业及高效科研院所提供更加快速、易用的数据科学计算产品。