OpenBayes 一周速览丨立即体验复现 Sora！Visual7W 视觉问答数据集上线

公共资源速递

This Weekly Snapshots ！

5 个数据集：

耶鲁人脸数据库
PASCAL VOC 目标检测数据集
Visual7W 视觉问答数据集
水果新鲜程度分类数据集
Orca-Math-200K 微软数学问题数据集

1 个模型：

Qwen1.5-7B-Chat

3 个教程：

在线运行 Open-Sora-Plan Demo
Mixtral:8x22b-instruct Demo
使用 NLTK 进行自然语言处理

访问官网立即使用：openbayes.com

公共数据集

1 . 耶鲁面部数据库

耶鲁人脸数据库是一个面部表情数据集，主要用于身份鉴定，包含 15 个主题，其中每个主题有 11 张图像共计 165 个 GIF 格式的灰度图像，每个主题包含不同的面部表情：中心光、带眼镜、快乐、左光、没有眼镜、正常、右光、悲伤、困、惊讶和眨眼。

直接使用：

https://go.openbayes.com/2iS8M

2. PASCAL VOC 目标检测数据集

PASCAL VOC 数据集是包含 2007 年和 2012 年的两个版本，可用于图像分类和对象检测任务。

直接使用：

https://go.openbayes.com/KubnT

3.Visual7W 视觉问答数据集

Visual7W 是一个图像内容理解数据集，通过对图像区域的文字描述和互相之间的关联，进行视觉问答任务，数据集中不仅包含图像本身，还包括图像区域内容相关的问答。

直接使用：

https://go.openbayes.com/qUWHD

4.水果新鲜程度分类数据集

该数据集包含三种水果的图像：苹果、橙子和香蕉。每个水果类别都有单独的文件夹，并分别提供了新鲜和腐烂的不同子文件夹，表示新鲜度状态。

直接使用：

https://go.openbayes.com/fSVjg

5. Orca-Math-200K 微软数学问题数据集

Orca-Math-200K 是微软创建的一个高质量的合成数据集，包含约 20 万小学数学题目，此数据集中的所有答案都是使用 Azure GPT4-Turbo 生成的。

直接使用：

https://go.openbayes.com/LkTBl

公共模型

1. Qwen1.5-7B-Chat

Qwen1.5 是 Qwen2 的 beta 版本，Qwen2 是一种基于 Transformer 的解码器语言模型，在大量数据上进行了预训练。该模型为 Qwen1.5 的 7B 规模大小的聊天模型。

直接使用：

https://go.openbayes.com/ae1gv

公共教程

1. 在线运行 Open-Sora-Plan Demo

Open-Sora-Plan 是一个开源项目，旨在复现 OpenAI 的 Sora（T2V 模型），并构建关于 Video-VQVAE (VideoGPT) + DiT 的知识。该项目由北京大学和兔展智能公司联合发起。现在在 OpenBayes 就可以克隆体验啦！

在线运行：

https://go.openbayes.com/NzRxd

2. Mixtral:8x22b-instruct Demo

Mixtral:8x22B 是一个稀疏专家混合 (SMoE) 模型，该教程使用了 Ollama 和 Open WebUI 来部署 Mixtral:8x22B 模型，为大模型的使用提供了方便的使用方法。

在线运行：

https://go.openbayes.com/rSwxi

3. 使用 NLTK 进行自然语言处理

本教程介绍了如何使用 NLTK 在文本处理阶段进行各种 NLP 操作，并借助一些用于情感分析文本分类的 NLTK 工具创建 Keras 模型。

在线运行：

https://go.openbayes.com/dBWzn

以上就是小贝上周在 OpenBayes 的全部更新内容啦~

此外，OpenBayes 平台还提供超过 500 个精选公共数据集、模型、教程等优质资源， 并已经整合到「公共资源」模块中。OpenBayes 平台支持一键 Input，开箱即用！

OpenBayes 一周速览丨立即体验复现 Sora！Visual7W 视觉问答数据集上线

OpenBayes

引用和评论

OpenBayes 一周速览｜TransPixeler 实现透明化文本到视频生成；统一图像定制框架 DreamO 上线

一文掌握 MCP 上下文协议：从理论到实践

2025年医疗大模型各医疗场景赋能实践研究报告130+份汇总解读|附PDF下载

AI Agent爆火后，MCP协议为什么如此重要！

AdventureX 2025 正式启动：五天四夜，120小时极限创造！一起在杭州点燃青年创新之火！

MCP 协议为何不如你想象的安全？从技术专家视角解读

🔥吐血整理 Bolt.diy 部署与应用攻略