头图

6 大经典机器学习数据集,3w+ 用户票选得出,建议收藏

内容一览:本期汇总了超神经下载排名众多的 6 个数据集,涵盖图像识别、机器翻译、遥感影像等领域。这些数据集质量高、数据量大,经历人气认证值得收藏码住。
关键词:数据集 机器翻译 机器视觉

数据集是机器学习模型训练的基础,优质的公开数据集对于模型训练效果、研究成果可靠度等具有重要意义。

HyperAI超神经自上线以来,为数据科学从业者提供了大量优质的公开数据集。 本期内容分享,我们筛选出了 6 个热门数据集,其总下载次数已达到 32,569 次。 希望这些数据集能进一步为广大开发者服务~

注:本文梳理的数据集均来自为数据科学家服务的网站——超神经
https://hyper.ai/datasets

第 6 名:Tanks Temple 3D 重建数据集
在这里插入图片描述

在这里插入图片描述

Tanks Temple 图像数据集提供高分辨率的视频,研究人员可以从视频中采集图像,依据图像进行三维重建。 该数据集包括训练数据和测试数据两类,其中测试数据分为中级组和高级组。

第 5 名:DOTA 航拍图像数据集
在这里插入图片描述

在这里插入图片描述

DOTA 全称为 A Large-scale Dataset for Object DeTection in Aerial Images,是一个包含 2,806 张航拍图的图像数据集,被用于在航拍图像中进行目标检测,发现和评估图像中的物体。

这些图像来源包含不同传感器和平台。每张图像的像素尺寸在 800800 到 40004000 的范围内,其中包含不同尺度、方向和形状的物体。

往期推送请访问:
DOTA 数据集:2806 张遥感图像,近 19 万个标注实例

第 4 名:VGG-Face2 人脸识别数据集
在这里插入图片描述

在这里插入图片描述

VGG-Face2 是一个人脸图像数据集,包含共计 9131 个人的面部数据,图像均来自 Google 的图片搜索。数据集中的人在姿势、年龄、种族和职业方面有很大差异。 该数据集由牛津大学的工程科学系视觉几何组于 2015 年发布,相关论文有《Deep Face Recognition》。

第 3 名:UCAS-AOD 遥感影像数据集

在这里插入图片描述

在这里插入图片描述

UCAS-AOD 是一个遥感影像数据集,用于飞机和车辆检测。 该数据集由国科大于 2014 年首次发布,并于 2015 年补充,相关论文有《Orientation Robust Object Detection in Aerial Images Using Deep Convolutional Neural Network》

第 2 名:OpenMantra 漫画机器翻译数据集

在这里插入图片描述

在这里插入图片描述

OpenMantra 是一个针对日文漫画的机器翻译评估数据集,包含五种不同风格(fantacy、romance、battle、mystery、slice of life)的漫画。数据集中共包含 1593 个句子,848 个场景画面和 214 页漫画, 由东京大学 Mantra 团队发布。

往期推送请查看:
漫画翻译、嵌字 AI,东京大学论文被 AAAI’21 收录

第 1 名:ImageNet 10 图像识别数据集
在这里插入图片描述

在这里插入图片描述

ImageNet 是目前世界上最大的图像识别数据库,由斯坦福大学教授李飞飞等人创建。 主要用于机器视觉领域的图像分类和目标检测。

数据集根据 WordNet 层次结构组织,其中每个节点(也称为类别)由数百甚至数千张图像组成。该数据集共包含 2.2 万个图像类别,约 1500 万张图片。

往期推送请访问:
当年这个决定,让李飞飞奠定 AI 江湖的女王地位

以上就是本期推荐的 6 个 hyper.ai 高频下载数据集,更多数据科学优质公开数据集,可访问以下链接下载:https://hyper.ai/datasets

—— 完 ——


超神经HyperAI
AI 行业实验媒体,站在科技与人文的交叉口,看懂人工智能。微信公众号:HyperAI
1.1k 声望
8.8k 粉丝
0 条评论
推荐阅读
编译 ONNX 模型
本篇文章译自英文文档 Compile ONNX Models — tvm 0.13.dev0 documentation作者是 Joshua Z. Zhang更多 TVM 中文文档可访问 →TVM 中文站。本文将介绍如何用 Relay 部署 ONNX 模型。首先安装 ONNX 包,最便捷的方...

超神经HyperAI

封面图
定档 6 月!SegmentFault AI Hackathon 杭州站启动
AI 掀起巨浪,你我应是冲浪者。创业团队、互联网大厂、国家队的大模型角力如火如荼,各类开源模型、垂直模型的出现也推动着越来越多 AGI 应用的陆续落地。

SegmentFault思否7阅读 58.9k评论 2

封面图
算法可视化:一文弄懂 10 大排序算法
在本文中,我们将通过动图可视化加文字的形式,循序渐进全面介绍不同类型的算法及其用途(包括原理、优缺点及使用场景)并提供 Python 和 JavaScript 两种语言的示例代码。除此之外,每个算法都会附有一些技术说...

破晓L8阅读 969

封面图
思否 CTO 祁宁:社区问答是激荡高级智慧的头脑风暴
在祁宁家里,有一套完整的赛车模拟器,他甚至还请人到国外代购了最新的 VR 设备。作为沉浸式赛车游戏发烧友,除了享受速度与激情带来的愉悦感,祁宁在玩的过程中更多的是思考如何将技术能力进行产品化的问题。

万事ONES6阅读 13k评论 1

封面图
使用 🧨 Diffusers 实现 ControlNet 高速推理
自从 Stable Diffusion 风靡全球以来,人们一直在寻求如何更好地控制生成过程的方法。ControlNet 提供了一个简单的迁移学习方法,能够允许用户在很大程度上自定义生成过程。通过 ControlNet,用户可以轻松地使用...

HuggingFace4阅读 3.5k

封面图
用 AI 生成漂亮小姐姐(一)——Stable Diffusion 小白搭建教程
最近 AIGC、ChatGPT 等话题持续发酵,热门程度不亚于之前的 “元宇宙”。抖音、小红书到处都是机器对话、AI 绘图的视频。我看见别人生成的漂亮小姐姐图片眼馋得不行,终于按捺不住自己的好奇心,也尝试一下搭建。本...

WalkerD15阅读 1.7k评论 3

Science AI 大潮已至,科技部亲自下场出大动作
生成式 AI 爆火,中国如何在 AI 时代实现弯道超车?对此,科技部亲自给出答案:启动 AI for Science 专项部署工作。可以预见,AI for Science 新一轮大潮即将来临。

超神经HyperAI3阅读 80k

封面图
1.1k 声望
8.8k 粉丝
宣传栏