头图

公共资源速递

This Weekly Snapshots !

5 个数据集:

  • Human Faces Dataset 人脸数据集
  • MMedc 大规模多语言医疗语料库
  • MMedBench 多语言医学能力基准数据集
  • MMMLU 多语言多任务语言理解数据集
  • FRAMES-benchmark 检索增强生成测试集

1 个模型:

  • Llama-3.2-11B-Vision-Instruct

3 个教程:

  • 一键部署 YOLOv11
  • Whisper-large-v3-turbo 语音识别、翻译 Demo
  • ScribblePrompt 医学图像分割工具

访问官网立即使用:http://openbayes.com

公共数据集

1. Human Faces Dataset 人脸数据集

该数据集包含约 9.6k 张人脸图像,其中 5k 张真实人脸图像,4.63k 张 AI 生成的人脸图像。

直接使用:

https://go.openbayes.com/ZvF6R

在这里插入图片描述

数据集图像示例

2. MMedc 大规模多语言医疗语料库

该数据集包含了约 255 亿个 tokens 的医疗预料数据,涵盖了 6 种主要语言:英语、中文、日语、法语、俄语和西班牙语,并且对更多语言的支持仍在不断更新和扩展中。

直接使用:

https://go.openbayes.com/ux6dX

在这里插入图片描述

MMedC 数据集统计概览

3. MMedBench 多语言医学能力测试基准数据集

该数据集旨在评估医学领域多语言模型的发展,涵盖了 6 种语言和 21 种医学子领域。MMedBench 的所有问题直接来源于各国的医学考试题库,确保了评测的准确性和可靠性,避免了由于不同国家医疗实践指南差异导致的诊断理解偏差。

直接使用:

https://go.openbayes.com/uQytk

在这里插入图片描述

MMedBench 数据集统计概览

4. MMMLU 多语言多任务语言理解数据集

MMMLU 旨在评估和提升人工智能模型在不同语言、认知和文化背景下的性能。该数据集建立在大规模多任务语言理解 (MMLU) 基准的基础上,包含 57 个不同学科领域的任务,涵盖了从初级知识到法律、物理、历史和计算机科学等高级专业学科。

直接使用:

https://go.openbayes.com/BUGAr

5. FRAMES-benchmark 检索增强生成测试集

该数据集包含 824 个具有挑战性的多跳问题,这些问题需要从 2 到 15 篇维基百科文章中获取信息。问题涵盖了历史、体育、科学、动物、健康等多个主题,并且每个问题都标有推理类型,如数值、表格、多重约束、时间性和后处理。数据集还提供了每个问题的黄金答案和相关的维基百科文章。

直接使用:

https://go.openbayes.com/grc7K

公共模型

1. Llama-3.2-11B-Vision-Instruct

发布机构: Meta

该模型为 Llama 3.2-Vision 的 11B 参数大小的指令微调模型,针对视觉识别、图像推理、字幕和回答有关图像的一般问题进行了优化,支持英语、德语、法语等 8 种语言。

直接使用:

https://go.openbayes.com/CQIbR

公共教程

1. 一键部署 YOLOv11

YOLOv11 在准确性、速度和效率方面进行了显著提升,与以前的 YOLO 模型版本相比,在架构和训练方法上进行了重大改进。该教程为 YOLOv11 一键部署 Demo,包含 5 种功能:物体检测、实例分割、图像分类、姿态估计和定位物体检测,模型和相关环境已经安装完毕,直接克隆并打开 API 地址即可进行模型推理。

在线运行:

https://go.openbayes.com/GSxf1

在这里插入图片描述

效果示例

2. Whisper-large-v3-turbo 语音识别、翻译 Demo

Whisper large-v3-turbo 语音转录模型是 OpenAI 发布的 large-v3 的优化版本,并且只有 4 层解码器层 (Decoder Layers),所需的 VRAM 仅为 6 GB。教程通过最新的 Gradio 5 稳定版,克隆并打开 API 地址即可进行模型推理。

在线运行:

https://go.openbayes.com/r925k

在这里插入图片描述

效果示例

3. ScribblePrompt 医学图像分割工具

ScribblePrompt 的主要目标是简化医学图像的分割过程,这在肿瘤检测、器官轮廓描绘等应用中至关重要。相比依赖大量人工标注数据,该工具允许用户通过少量输入(例如简单的涂鸦或点位)来引导模型优化分割结果。点击下方链接直接克隆,并打开 API 地址即可对医学图像进行分割处理。

在线运行:

https://go.openbayes.com/Dzk0v

在这里插入图片描述

效果示例

以上就是小贝上周在 OpenBayes 的全部更新内容啦\~

小贝还建立了「Stable Diffusion 教程交流群」,欢迎小伙伴们入群探讨各类技术问题、分享应用效果\~扫描下方二维码添加小贝总微信(微信号:OpenBayes001),备注「SD 教程交流」,即可加入群聊。

在这里插入图片描述


OpenBayes
6 声望1 粉丝

贝式计算是中国领先的高性能计算服务提供商,通过为新一代异构芯片嫁接经典软件生态及机器学习模型,向工业企业及高效科研院所提供更加快速、易用的数据科学计算产品。