头图

公共资源速递

This Weekly Snapshots !
5 个数据集:

  • Character Codex 人物角色数据集
  • Magpie-Filtered 高质量对齐数据集
  • OmniMedVQA 医学 VQA 评测数据集
  • Persona Hub 10 亿个不同角色数据集
  • M2Lingual 多语言多轮次指令微调数据集

2 个模型:

  • 寒武纪 1 号 Cambrian-1
  • 腾讯混元 HunyuanDiT

3 个教程:

  • 在线运行寒武纪 1 号 Cambrian-1 Demo
  • 一键部署 Gemma-2-9B-Chinese-Chat
  • ComfyUI Stable Diffusion 3 工作流在线教程

访问官网立即使用:http://openbayes.com

公共数据集

1. Character Codex 人物角色数据集

Character Codex 是一个综合数据集,包含来自各种媒体类型和流派的热门角色。每个条目都包含有关角色、媒体来源和涉及角色场景的详细信息。对于需要利用丰富角色描述的任务来说非常有价值。

直接使用:

https://go.openbayes.com/VwTnh

2. Magpie-Pro-300K-Filtered 高质量对齐数据集

该数据集是使用 Magpie 方法合成的高质量指令数据集,它是从 Llama-3 70B 中提取的。这个数据集包含约 300k 条高质量的对话,是通过一个自动化的自合成过程生成的,该过程利用了对齐的 LLMs 的自回归特性来生成用户查询和相应的回复。

直接使用:

https://go.openbayes.com/gXcIo

3. OmniMedVQA 大规模医学 VQA 评测数据集
该数据集包含 118,010 张不同的图片,涵盖 12 种不同的模态,涉及超过 20 个不同的人体器官和部位,解决了现有医学图像数据集在多样性和真实性方面的不足。

直接使用:

https://go.openbayes.com/RHXQo

4. Persona Hub 网络数据中自动整理的 10 亿个不同角色数据集

该数据集是腾讯西雅图人工智能实验室推出的一个从网络数据中自动整理的 10 亿个不同角色的集合。这些角色作为世界知识的分布式载体,能够触及 LLM 中包含的几乎所有视角。

直接使用:

https://go.openbayes.com/zeTlv

5. M2Lingual 多语言多轮次指令微调数据集

该数据集涵盖了 70 种不同的语言,为低资源语言提供了更多的训练数据,旨在提升大型语言模型在遵循指令方面的性能。

直接使用:

https://go.openbayes.com/2CleT

公共模型

1. 寒武纪 1 号 Cambrian-1

Cambrian-1 是由谢赛宁和 Yann LeCun 团队开发的一系列以视觉为中心的多模态大型语言模型 (MLLMs)。这个项目的核心目标是探索和评估不同的视觉表征,以及它们如何与大型语言模型相结合,从而推动视觉表示学习的进步,并提供对模型和架构的新见解。

直接使用:

https://go.openbayes.com/pYlbh

2. 腾讯混元 HunyuanDiT

该模型是腾讯公司自研的一个大型多模态人工智能模型,支持文学创作、文本摘要、角色扮演等能力,能够输出流畅、规范、中立、客观的内容。

直接使用:

https://go.openbayes.com/qIf38

公共教程

1. 在线运行寒武纪 1 号 Cambrian-1 Demo

Cambrian-1 引入了一个新的以视觉为中心的基准 CV-Bench,以改善视觉基础。该模型在多个基准测试中取得了最先进的性能,特别是在视觉中心任务中表现出色。本教程已经搭建好了相关环境,只需按教程输入指令即可体验 Demo。
在线运行:

https://go.openbayes.com/SG3nx

2. 一键部署 Gemma-2-9B-Chinese-Chat

该模型是由清华大学的 AI 博士生王慎执推出的一款基于 Gemma-2-9B 微调模型,显著减少了「中文问题带英文答案」和中英文混合的问题。点击下方链接,克隆容器后打开 API 地址即可进行推理体验。

在线运行:

https://go.openbayes.com/J7HqL

3. ComfyUI Stable Diffusion 3 工作流在线教程

Stable Diffusion 3 是一种多模态扩散变换器 (MMDiT) 文本到图像模型,其在图像质量、排版、复杂提示理解和资源效率方面的性能得到了极大提高。该教程是使用 ComfyUI 工作流运行 Stable Diffusion 3,克隆容器即可打开 API 地址运行模型。
在线运行:

https://go.openbayes.com/3UB90

以上就是小贝上周在 OpenBayes 的全部更新内容啦~


OpenBayes
6 声望1 粉丝

贝式计算是中国领先的高性能计算服务提供商,通过为新一代异构芯片嫁接经典软件生态及机器学习模型,向工业企业及高效科研院所提供更加快速、易用的数据科学计算产品。