OpenBayes 一周速览丨视频创作神器 Linly-Dubbing 在线使用；OMat24 无机材料数据集上线

2024-10-29 河北

阅读 3 分钟

0

公共资源速递

This Weekly Snapshots ！

5 个数据集：

OMat24 无机材料数据集
Cityscapes 城市场景数据集
MedCalc-Bench 医疗计算数据集
Omni-MATH 数学推理基准数据集
C2A 灾难场景中的人类检测数据集

2 个模型：

F5-TTS
Ministral-8B-Instruct-2410

3 个教程：

一键部署 MMed-Llama-3-8B
唤醒老照片 (FLUX.1 + LivePortrait)
Linly-Dubbing 一键视频下载+翻译+配音+字幕

访问官网立即使用：http://openbayes.com

公共数据集

1. OMat24 无机材料数据集

OMat24 是 Meta 开源的一个大规模无机材料数据集，包含约 1.1 亿个数据点，这些数据点是通过高精度的密度泛函理论 (DFT) 计算得到的，涵盖了多样性的结构和成分。

直接使用：

https://go.openbayes.com/zrCDA

在这里插入图片描述

数据集示例图片

2. Cityscapes 城市场景数据集

Cityscapes 数据集是一个专门针对城市街道场景的语义理解图片数据集，它包含了来自 50 个不同城市的街道场景，总共包含约 25k 张图像，其中有 5k 张是高质量像素级精细标注的图像，另外还有 20k 张是带有粗糙标注的图像。

直接使用：

https://go.openbayes.com/pNQwX

在这里插入图片描述

数据集示例图片

3. MedCalc-Bench 医疗计算数据集

MedCalc-Bench 是一个专门用于评估大语言模型 (LLMs) 在医疗计算能力方面的数据集。它包含了 10,055 个训练实例和 1,047 个测试实例，涵盖了 55 种不同的计算任务。每个实例都包括患者的笔记、一个计算特定临床值的问题、最终答案值以及逐步解决方案。

直接使用：

https://go.openbayes.com/NtRN2

在这里插入图片描述

数据集示例图片

4. Omni-MATH 数学推理基准数据集

Omni-MATH 是一个奥林匹克级别的数学推理基准数据集，包含了 4,428 个经过严格人工标注的竞赛级数学问题，涵盖了 33 个子领域和超过 10 个不同的难度级别。

直接使用：

https://go.openbayes.com/tNgRF

在这里插入图片描述

数据集结构及数据示例

5. C2A 灾难场景中的人类检测数据集

C2A 数据集包含 4 种灾难场景类型（火灾/烟雾、洪水、倒塌的建筑物/瓦砾和交通事故）和 5 种人体姿势类别（弯腰、跪下、躺下、坐下和直立）的共 10,215 张高分辨率图像，以及超过 36 万个带注释的人类实例。

直接使用：

https://go.openbayes.com/qJYR0

在这里插入图片描述

数据集示例图片

公共模型

发布机构： 上海交通大学、剑桥大学、吉利汽车研究院（宁波）有限公司

F5-TTS 是一款高性能文本到语音 (TTS) 系统，这一系统能够在没有额外监督的情况下，通过零样本学习快速生成自然、流畅且忠实于原文的语音。它还具备情感控制功能，能根据文本内容调整合成语音的情感表现，并支持速度控制，允许用户根据需要调整语音的播放速度。

直接使用：

https://go.openbayes.com/Cnwvs

2. Ministral-8B-Instruct-2410

发布机构： Mistral AI

该模型是一款专为边缘设备和边缘计算场景设计的语言模型，能够执行多项任务，包括回答问题、翻译不同语言的文字、制作文档摘要、帮助撰写文章和报告等。它采用了交错滑动窗口注意力模式，这种设计不仅提高了模型的推理速度，还显著降低了内存使用，使其非常适合在资源受限的边缘设备上运行。

直接使用：

https://go.openbayes.com/4nacC

公共教程

1. 一键部署 MMed-Llama-3-8B

MMed-Llama-3-8B 是一个多语言医学大语言模型。它的构建基于大规模多语言医学语料库 MMedC，该语料库包含约 255 亿个与医学相关的 token，涵盖英语、中文、日语、法语、俄语和西班牙语等 6 种主要语言。MMedC 语料库的构建，旨在为通用大型语言模型提供自回归领域的适应能力。该教程已经将模型和相关环境安装完毕，直接克隆并打开 API 地址即可运行模型，轻松处理非英语医学问题。

在线运行：

https://go.openbayes.com/KpNfD

在这里插入图片描述

效果示例

2. 唤醒老照片 (FLUX.1 + LivePortrait)

该教程利用最新的 Flux.1 对老照片进行修复，上色，最后使用 LivePortrait 生成视频实现照片动态化。该教程现已上线 OpenBayes 公共教程界面，只需一键克隆启动，即可唤醒尘封已久的照片。

在线运行：

https://go.openbayes.com/PVpZu

在这里插入图片描述

Demo 示例

3. Linly-Dubbing 一键视频下载+翻译+配音+字幕

Linly-Dubbing 是一个智能视频多语言 AI 配音和翻译工具，它能够自动将视频内容翻译成多种语言，并生成字幕。这个工具通过集成先进的 AI 技术，提供了包括语音识别、语音合成、字幕翻译、声音分离和口型同步等功能，以支持视频内容的国际化和本地化。点击下方链接，立即开启创作之旅，实现视频多语言 AI 配音与翻译。

在线运行：

https://go.openbayes.com/huQQ8

在这里插入图片描述

功能预览

以上就是小贝上周在 OpenBayes 的全部更新内容啦~

数据库机器学习人工智能深度学习自然语言处理

阅读 474发布于 2024-10-29

OpenBayes

6 声望2 粉丝

贝式计算是中国领先的高性能计算服务提供商，通过为新一代异构芯片嫁接经典软件生态及机器学习模型，向工业企业及高效科研院所提供更加快速、易用的数据科学计算产品。

« 上一篇

OpenBayes 教程上新 | 重回霸主地位，Stable Diffusion 3.5 轻松生成多元化风格图像

下一篇 »

包日、包周、包月功能上线，超优惠！

引用和评论

推荐阅读

OpenBayes 一周速览｜TransPixeler 实现透明化文本到视频生成；统一图像定制框架 DreamO 上线

OpenBayes阅读 175

一文掌握 MCP 上下文协议：从理论到实践

陈明勇赞 6阅读 2.1k

被 Manus 带火的 MCP 是什么｜一文看懂

Bytebase赞 3阅读 4.2k

AI Agent爆火后，MCP协议为什么如此重要！

程序员海军赞 5阅读 932

2025年医疗大模型各医疗场景赋能实践研究报告130+份汇总解读|附PDF下载

拓端tecdat阅读 33.7k

AdventureX 2025 正式启动：五天四夜，120小时极限创造！一起在杭州点燃青年创新之火！

思否编辑部赞 2阅读 5.7k

MCP 协议为何不如你想象的安全？从技术专家视角解读

Baihai_IDP赞 2阅读 698

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。