头图

公共资源速递

This Weekly Snapshots !

5 个数据集:

  • 耶鲁人脸数据库
  • PASCAL VOC 目标检测数据集
  • Visual7W 视觉问答数据集
  • 水果新鲜程度分类数据集
  • Orca-Math-200K 微软数学问题数据集

1 个模型:

  • Qwen1.5-7B-Chat

3 个教程:

  • 在线运行 Open-Sora-Plan Demo
  • Mixtral:8x22b-instruct Demo
  • 使用 NLTK 进行自然语言处理

访问官网立即使用:openbayes.com

公共数据集

1 . 耶鲁面部数据库

耶鲁人脸数据库是一个面部表情数据集,主要用于身份鉴定,包含 15 个主题,其中每个主题有 11 张图像共计 165 个 GIF 格式的灰度图像,每个主题包含不同的面部表情:中心光、带眼镜、快乐、左光、没有眼镜、正常、右光、悲伤、困、惊讶和眨眼。

直接使用:

https://go.openbayes.com/2iS8M

2. PASCAL VOC 目标检测数据集

PASCAL VOC 数据集是包含 2007 年和 2012 年的两个版本,可用于图像分类和对象检测任务。

直接使用:

https://go.openbayes.com/KubnT

3.Visual7W 视觉问答数据集

Visual7W 是一个图像内容理解数据集,通过对图像区域的文字描述和互相之间的关联,进行视觉问答任务,数据集中不仅包含图像本身,还包括图像区域内容相关的问答。

直接使用:

https://go.openbayes.com/qUWHD

4.水果新鲜程度分类数据集

该数据集包含三种水果的图像:苹果、橙子和香蕉。每个水果类别都有单独的文件夹,并分别提供了新鲜和腐烂的不同子文件夹,表示新鲜度状态。

直接使用:

https://go.openbayes.com/fSVjg

5. Orca-Math-200K 微软数学问题数据集

Orca-Math-200K 是微软创建的一个高质量的合成数据集,包含约 20 万小学数学题目,此数据集中的所有答案都是使用 Azure GPT4-Turbo 生成的。

直接使用:

https://go.openbayes.com/LkTBl

公共模型

1. Qwen1.5-7B-Chat

Qwen1.5 是 Qwen2 的 beta 版本,Qwen2 是一种基于 Transformer 的解码器语言模型,在大量数据上进行了预训练。该模型为 Qwen1.5 的 7B 规模大小的聊天模型。

直接使用:

https://go.openbayes.com/ae1gv

公共教程

1. 在线运行 Open-Sora-Plan Demo

Open-Sora-Plan 是一个开源项目,旨在复现 OpenAI 的 Sora(T2V 模型),并构建关于 Video-VQVAE (VideoGPT) + DiT 的知识。该项目由北京大学和兔展智能公司联合发起。现在在 OpenBayes 就可以克隆体验啦!

在线运行:

https://go.openbayes.com/NzRxd

2. Mixtral:8x22b-instruct Demo

Mixtral:8x22B 是一个稀疏专家混合 (SMoE) 模型,该教程使用了 Ollama 和 Open WebUI 来部署 Mixtral:8x22B 模型,为大模型的使用提供了方便的使用方法。

在线运行:

https://go.openbayes.com/rSwxi

3. 使用 NLTK 进行自然语言处理

本教程介绍了如何使用 NLTK 在文本处理阶段进行各种 NLP 操作,并借助一些用于情感分析文本分类的 NLTK 工具创建 Keras 模型。

在线运行:

https://go.openbayes.com/dBWzn

以上就是小贝上周在 OpenBayes 的全部更新内容啦~

此外,OpenBayes 平台还提供超过 500 个精选公共数据集、模型、教程等优质资源, 并已经整合到「公共资源」模块中。OpenBayes 平台支持一键 Input,开箱即用!

图片


OpenBayes
6 声望1 粉丝

贝式计算是中国领先的高性能计算服务提供商,通过为新一代异构芯片嫁接经典软件生态及机器学习模型,向工业企业及高效科研院所提供更加快速、易用的数据科学计算产品。