头图

9月,OpenDataLab 全新版本上线,支持用户自主发布原创数据集,同时升级了 CLI/SDK 工具、数据集详情页,让 AI 数据集开源更方便、展示更清晰。还有创作领好礼活动,快来看看吧!

(注意!旧版 CLI 工具将于近期停止运维,请大家及时安装最新版本,避免影响使用)

一、轻松开源你的数据集

选择一个好用的 AI 数据发布平台,将对开源成果推广起到事半功倍的效果。

使用 OpenDataLab 一键发布原创数据集,立享 3 大优势:
● 无需网站开发和维护,节省各类运维成本;
● 规范的审核机制和开源流程,保护数据和版权安全;
● 超大存储容量和网络加速,无需科学上网,即刻畅享国内外高速传输体验。

现在,只需简单4步:注册作者账号→创建数据集仓库→上传数据→提交并公开,轻松完成你的原创数据集发布与分享。
详细操作步骤,请见文档:
https://openxlab.org.cn/docs/datasets/数据集创建流程.html

对于限制开放的敏感数据,平台上线了审批功能,允许用户向作者提交申请,签署使用协议,由作者同意后开放下载。(如需审批设置,请联系OpenDataLab小助手手动添加)

平台内嵌严格的“算法+人工”审核机制,可有效识别和处理高风险、高敏感数据,最大程度确保数据得以安全、规范地上传、使用。同时欢迎大家积极纠错与举报。

二、CLI/SDK一键获取和分享数据

OpenDataLab 命令行界面(CLI,Command Line Interface)是一个非常方便的工具,用户可以对 OpenDataLab 上的公开数据集进行下载,同时它支持Windows,Linux和Mac平台,饱受用户好评。

为了提升体验,此次发布了全新的 CLI命令行和 Python SDK 工具,新增数据集上传、管理功能,您可以使用指令一键查看、创建、上传、下载、编辑开源数据集。断点续传功能加持,让数据传输更稳定、更快速。

立即安装最新版本 CLI / SDK 、完成相应鉴权配置,即可使用。每个数据集下载指令可在详情页获取。

数据集CLI(命令行工具) 详细说明:
https://openxlab.org.cn/docs/developers/数据集/数据集CLI(命令行工具).html

数据集Python SDK 详细说明:
https://openxlab.org.cn/docs/developers/数据集/数据集python%20SDK.html


(数据集详情页,下载指令获取示意)

三、详情页展示更丰富

全新升级的数据集详情页,除了原有的数据集标签栏、发布信息栏外,新增数据集介绍、数据集详情、设置板块。

(数据集详情页示意)

●“数据集介绍”
作者可以 Markdown 格式灵活、个性地编辑介绍信息,添加封面、引文、统计图表、URL链接等,搭建特色的数据集展示页面;

●“数据详情”
上传的图片格式文件可自动被解析,在数据详情作为样例预览和统计,让数据结构一目了然;

●“数据文件”
作者可从网页端选择以文件、文件夹、压缩包等三种不同形式上传数据;如果选择"压缩包",系统将会在上传后自动解压您的文件;

●“设置”
数据集作者可以自由设置数据集状态,“私有”或“公开”。创建的数据集默认“私有”状态,仅作者可见,需手动公开后用户可访问,以方便维护管理。

四、创作领好礼

图片右下角联系小助手,回复“报名”参与活动
9月8日12:00前,前20位成功提交原创数据集链接者
赠送价值100元大礼包,快来报名吧

更多公开数据集,欢迎访问OpenDataLab官网查看与下载:
https://opendatalab.org.cn/


OpenDataLab
4 声望3 粉丝

浦数丨人工智能开放数据平台,作为上海人工智能实验室九大开源项目之一,以统一标准构建开放数据集互通互联网络,是下一代人工智能交叉创新和技术发展的数据底座。平台已集结3,500+优质公开数据集、覆盖1,300+任...