公共资源速递
5 个数据集:
- COIG-CQIA 中文指令微调数据集
- Pinocchio 匹诺曹评估数据集
- FineFake 多领域假新闻检测数据集
- Leaf Diseases 番茄叶病图像数据集
- Chinese-Poetry 中文诗歌古典文集数据库
1 个模型:
- C4AI Command-R 模型
3 个教程:
- 一键运行 Qwen1.5-MoE 模型 demo
- ComfyUI Stable Cascade 工作流在线教程
- 在 Python 中生成随机数字
访问官网立即使用: openbayes.com
公共数据集
1. COIG-CQIA 高质量中文指令微调数据集
COIG-CQIA 是一个开源的高质量中文指令微调数据集,数据来源不仅有问答社区(如知乎、思否、豆瓣、小红书、弱智吧等等),还有维基类的知识平台,各种类型的考试资料,以及现存的 NLP 数据集。
直接使用: https://go.openbayes.com/kj1Pb
2. Pinocchio 匹诺曹事实知识评估数据集
该数据集涵盖了 2 万个各式各样的事实问题,这些问题涉及到不同的来源、时间线、领域、地区和语言,可用于测试 LLMs 在多事实推理、处理结构化与非结构化知识、识别细微事实差异以及抵御对抗性示例等方面的能力。
直接使用: https://go.openbayes.com/tMnmQ
3.FineFake 细粒度多领域假新闻检测数据集
FineFake 是由北京航空航天大学和北京邮电大学联合创建的,用于细粒度多领域假新闻检测的数据集。该数据集共有 16,909 个数据样本,覆盖了 6 个语义主题和 8 个不同的平台。每个新闻样本都包含了多种形式的内容,包括文本、图片和潜在的社交环境信息。
直接使用: https://go.openbayes.com/E6Ibw
4.Leaf Diseases 番茄叶病图像检测数据集
该数据集为番茄叶病图像检测数据集,图像分为以下几类:健康、细菌斑、早疫病、健康、晚疫病、叶霉病**、目标点和黑点。图像是用 YOLO v5 PyTorch 格式注释的。
直接使用: https://go.openbayes.com/Q7d9d
5.Chinese-Poetry 最全中文诗歌古典文集数据库
该数据集是最全的中华古典文集数据库,包含 5.5 万首唐诗、 26 万首宋词、 2.1 万首宋词等古典文集。
直接使用: https://go.openbayes.com/xNe5i
公共模型
1.C4AI Command-R 模型
该模型是由 Cohere 和 Cohere For AI 联合开发的 350 亿参数的高性能生成式模型。多语言生成能力和高性能 RAG** 能力的结合,使 Command-R 在跨语言任务和知识密集型任务上具有独特优势。
直接使用: https://go.openbayes.com/pRwfU
公共教程
1. 一键运行 Qwen1.5-MoE 模型 demo
Qwen1.5-MoE-A2.7B 是通义千问团队推出 Qwen 系列的首个 MoE 模型,该教程为其 Demo 容器,一键克隆即可使用 Gradio 链接体验大模型。
在线运行: https://go.openbayes.com/zzJdV
2. ComfyUI Stable Cascade 工作流在线教程**
「ComfyUI Stable Cascade 工作流在线教程」现已上线至 OpenBayes** 公共教程。该教程已将环境搭建完毕,内置 Stable Cascade 默认文生图工作流,大大减少了复杂的部署步骤,仅需 2s 即可生成你想要的图片。
在线运行: https://go.openbayes.com/b6Of0
3. 在 Python 中生成随机数字
PyTorch 是一个强大的 Python 库,用于构建深度学习模型,简化了定义、训练和推理神经网络的过程。本教程将介绍如何加载 CSV 数据集,定义多层感知器模型,并在 PyTorch 中进行训练和评估,为创建深度学习神经网络模型提供指导。
在线运行: https://go.openbayes.com/tFZ7u
以上就是小贝上周在 OpenBayes 的全部更新内容啦~
此外,OpenBayes 平台还提供超过 500 个精选公共数据集、模型、教程等优质资源, 并已经整合到「公共资源」模块中。OpenBayes 平台支持一键 Input,开箱即用!
更多详细教程,请观看:
https://www.bilibili.com/video/BV1zF411y7AU/?spm_id_from=333....
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。