公共资源速递
This Weekly Snapshots !
5 个数据集:
- 耶鲁人脸数据库
- PASCAL VOC 目标检测数据集
- Visual7W 视觉问答数据集
- 水果新鲜程度分类数据集
- Orca-Math-200K 微软数学问题数据集
1 个模型:
- Qwen1.5-7B-Chat
3 个教程:
- 在线运行 Open-Sora-Plan Demo
- Mixtral:8x22b-instruct Demo
- 使用 NLTK 进行自然语言处理
访问官网立即使用:openbayes.com
公共数据集
1 . 耶鲁面部数据库
耶鲁人脸数据库是一个面部表情数据集,主要用于身份鉴定,包含 15 个主题,其中每个主题有 11 张图像共计 165 个 GIF 格式的灰度图像,每个主题包含不同的面部表情:中心光、带眼镜、快乐、左光、没有眼镜、正常、右光、悲伤、困、惊讶和眨眼。
直接使用:
https://go.openbayes.com/2iS8M
2. PASCAL VOC 目标检测数据集
PASCAL VOC 数据集是包含 2007 年和 2012 年的两个版本,可用于图像分类和对象检测任务。
直接使用:
https://go.openbayes.com/KubnT
3.Visual7W 视觉问答数据集
Visual7W 是一个图像内容理解数据集,通过对图像区域的文字描述和互相之间的关联,进行视觉问答任务,数据集中不仅包含图像本身,还包括图像区域内容相关的问答。
直接使用:
https://go.openbayes.com/qUWHD
4.水果新鲜程度分类数据集
该数据集包含三种水果的图像:苹果、橙子和香蕉。每个水果类别都有单独的文件夹,并分别提供了新鲜和腐烂的不同子文件夹,表示新鲜度状态。
直接使用:
https://go.openbayes.com/fSVjg
5. Orca-Math-200K 微软数学问题数据集
Orca-Math-200K 是微软创建的一个高质量的合成数据集,包含约 20 万小学数学题目,此数据集中的所有答案都是使用 Azure GPT4-Turbo 生成的。
直接使用:
https://go.openbayes.com/LkTBl
公共模型
1. Qwen1.5-7B-Chat
Qwen1.5 是 Qwen2 的 beta 版本,Qwen2 是一种基于 Transformer 的解码器语言模型,在大量数据上进行了预训练。该模型为 Qwen1.5 的 7B 规模大小的聊天模型。
直接使用:
https://go.openbayes.com/ae1gv
公共教程
1. 在线运行 Open-Sora-Plan Demo
Open-Sora-Plan 是一个开源项目,旨在复现 OpenAI 的 Sora(T2V 模型),并构建关于 Video-VQVAE (VideoGPT) + DiT 的知识。该项目由北京大学和兔展智能公司联合发起。现在在 OpenBayes 就可以克隆体验啦!
在线运行:
https://go.openbayes.com/NzRxd
2. Mixtral:8x22b-instruct Demo
Mixtral:8x22B 是一个稀疏专家混合 (SMoE) 模型,该教程使用了 Ollama 和 Open WebUI 来部署 Mixtral:8x22B 模型,为大模型的使用提供了方便的使用方法。
在线运行:
https://go.openbayes.com/rSwxi
3. 使用 NLTK 进行自然语言处理
本教程介绍了如何使用 NLTK 在文本处理阶段进行各种 NLP 操作,并借助一些用于情感分析文本分类的 NLTK 工具创建 Keras 模型。
在线运行:
https://go.openbayes.com/dBWzn
以上就是小贝上周在 OpenBayes 的全部更新内容啦~
此外,OpenBayes 平台还提供超过 500 个精选公共数据集、模型、教程等优质资源, 并已经整合到「公共资源」模块中。OpenBayes 平台支持一键 Input,开箱即用!
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。