头图

公共资源速递

This Weekly Snapshots !

5 个数据集:

  • COCONut 大规模图像分割数据集
  • THUCNews新闻数据集
  • DuConv 对话数据集
  • 安徽电信知道问答数据集
  • Sentiment Analysis 中文情感分析数据集

2 个模型:

  • OpenELM-3B-Instruct
  • OpenWebUI 代码库

3 个教程:

  • GeneFace++ 数字人 Demo
  • 农作物病害图像分类教程
  • 使用 PyTorch 逐步开发神经网络

访问官网立即使用: openbayes.com

公共数据集

1 . COCONut 大规模全景图像分割数据集

COCONut 是由字节跳动发布的首个大规模人工标注的全景图像分割数据集,包含约 383K 个图像和 518 万个经过人工标注的全景分割掩码。该成果已入选 CVPR 2024 。

直接使用:

https://go.openbayes.com/F6w8w

2. THUCNews 新闻数据集

THUCNews 是根据新浪新闻 RSS 订阅频道在 2005~2011 年间的历史数据筛选过滤生成的,包含 74 万篇新闻文档,均为 UTF-8 纯文本格式。研究团队在原始新浪新闻分类体系的基础上,重新整合划分出了 14 个候选类别:财经、彩票、房产、股票、家居等。

直接使用:

https://go.openbayes.com/QbwNT

3. DuConv 对话数据集

DuConv 是一个基于电影和明星领域的数据集,包括票房、导演、评论等信息。该数据集包括 30k 个对话,大约 120k 个对话回合。

直接使用:

https://go.openbayes.com/ebHmd

4. 安徽电信知道问答数据集

该数据集包含 15.6 万条安徽电信问答数据,包括用户提问、网友回答、最佳回答,数据集来源为百度知道,适用于 FAQ 问答系统。

直接使用:

https://go.openbayes.com/htHuT

5. Sentiment Analysis 中文情感分析数据集

该数据集包括了四个领域的中文评论:笔记本电脑、汽车、相机和手机,可被用作于自然语言处理中情感分类任务。

直接使用:

https://go.openbayes.com/cQsMP

公共模型

1. OpenELM-3B-Instruct

OpenELM 是苹果研究团队推出的一种先进的开源语言模型。该模型为 OpenELM 3B 规模大小的指令调整模型。

直接使用:

https://go.openbayes.com/FCtPq

2. OpenWebUI 代码库

Open WebUI 是一个仿照 ChatGPT** 界面的开源项目,它满足了模型 Web 服务部署的多样化需求,尤其为与 LLM 交互任务提供了解决方案。

直接使用:

https://go.openbayes.com/IWrtT

公共教程

1. 教程上新|特朗普与霉霉联动,GeneFace++ 用 3 分钟视频快速训练数字人

GeneFace++ 是一个只需训练一段人物视频,再导入喜欢的音频,就能轻松制作出唇形同步的全新人物视频的项目。「GeneFace++ 数字人 Demo」教程现已在 OpenBayes 平台上线,该教程为大家搭建好了环境,无需任何复杂的前期准备,点击克隆即可一键启动,快来利用「科技魔法」创造你专属的 AI 数字人分身吧~

在线运行:

https://go.openbayes.com/kn3Rr

2. 农作物病害图像分类教程

该教程为使用 PyTorch 进行农作物病害图像分类,有助于训练机器学习模型来检测植物疾病、或开发自动植物诊断算法学习。

在线运行:

https://go.openbayes.com/iPnDS

3. 使用 PyTorch 逐步开发神经网络

PyTorch 可以用于构建深度学习模型,简化了定义、训练和推理神经网络的过程。本教程将介绍如何加载 CSV 数据集,定义多层感知器模型,并在 PyTorch 中进行训练和评估,为创建深度学习神经网络模型提供指导。

在线运行:

https://go.openbayes.com/hpKjW

以上就是小贝上周在 OpenBayes 的全部更新内容啦~

此外,OpenBayes 平台还提供超过 500 个精选公共数据集、模型、教程等优质资源, 并已经整合到「公共资源」模块中。OpenBayes 平台支持一键 Input,开箱即用!

更多详细教程,请观看:

https://www.bilibili.com/video/BV13G411R7ya/?spm_id_from=333....


OpenBayes
6 声望1 粉丝

贝式计算是中国领先的高性能计算服务提供商,通过为新一代异构芯片嫁接经典软件生态及机器学习模型,向工业企业及高效科研院所提供更加快速、易用的数据科学计算产品。