头图

公共资源速递

This Weekly Snapshots !

5 个数据集

  • FewJoint 基准数据集
  • 今日头条文本分类数据集
  • 序列猴子开源数据集 1.0
  • 蝴蝶图像分类数据集
  • Skin Types 油性、干性和正常皮肤类型数据集

2 个教程:

使用迁移学习进行花卉分类 (DesNet121)

量化 Vision Transformers(Vit)以实现高效部署:策略和最佳实践

访问官网立即使用: openbayes.com

公共数据集

1 . FewJoint 基准数据集

FewJoint 基准数据集是来自于讯飞 AIUI 开放平台上真实用户语料和专家构造的语料(比例约为 3:7),包含 59 个真实领域,是目前域最多的对话数据集之一。该数据集可以避免构造模拟域,非常适合小样本和元学习方法。

直接使用: https://my5353.com/FewJoint

2. 今日头条文本分类数据集

该数据集为今日头条中文新闻(短文本)分类数据集,数据来源为今日头条客户端。共包含 15 个分类,382,688 条文本,采集时间为 2018 年 5 月。

直接使用: https://my5353.com/toutiao

3. 序列猴子开源数据集 1.0

序列猴子是出门问问提供的超大规模语言模型,序列猴子数据集是用于训练序列猴子模型的数据集合,现抽取了部分数据集向公众开放:涉及领域包括:中文通用文本语料、古诗今译语料、文本生成语料。

直接使用: https://my5353.com/monkey

4. 蝴蝶图像分类数据集

该数据集包含 75 种不同类别的蝴蝶。该数据集包含大约 1,000 多个标记图像,包括验证图像。每张图像仅属于一个蝴蝶类别。每个图像的标签保存在 Training_set.csv 中。

直接使用: https://my5353.com/butterfl

5. Skin Types 油性、干性和正常皮肤类型数据集

该数据集包含 23,659 个人工翻译的 PAWS 评估对和 296,406 个机器翻译的训练对,采用六种类型不同的语言:法语、西班牙语、德语、中文、日语和韩语。所有翻译对均源自 PAWS-Wiki 中的示例。

直接使用: https://my5353.com/skint

公共教程

1. 使用迁移学习进行花卉分类 (DesNet121)

该教程演示了如何使用迁移学习在一组花卉图像数据集上执行图像分类。教程中利用了一个预训练的卷积神经网络 (CNN) 作为特征提取器,并在其上构建一个自定义分类器来预测花卉的种类。

一键克隆: https://my5353.com/DesNet121

2. 量化 Vision Transformers (Vit) 以实现高效部署:策略和最佳实践

本教程全面探讨了 Vision Transformer 架构、关键组件以及使它们的基本原理。在教程的最后,通过代码演示讨论了一些优化策略,使模型更加紧凑,以便于部署。

一键克隆: https://my5353.com/DeiT1

以上就是小贝上周在 OpenBayes 的全部更新内容啦~

此外,OpenBayes 平台还提供超过 500 个精选公共数据集、模型、教程等优质资源, 并已经整合到「公共资源」模块中。OpenBayes 平台支持一键 Input,开箱即用!

为了让大家快速上手,OpenBayes贝式计算也为大家录制了视频教程,登录 B 站关注 「OpenBayes」即可查看视频~


OpenBayes
6 声望1 粉丝

贝式计算是中国领先的高性能计算服务提供商,通过为新一代异构芯片嫁接经典软件生态及机器学习模型,向工业企业及高效科研院所提供更加快速、易用的数据科学计算产品。