kk - SegmentFault 思否

SPOTS-10：含50,000张32×32灰度图像，专注十种动物图案识别，用于评估机器学习算法。

数据猎手小k

3 月 19 日

阅读 3 分钟

456

2024-10-28，由英国林肯大学工程与物理科学学院创建SPOTS-10，数据集主要解决夜间图像中基于动物独特体纹识别的复杂计算机视觉任务，为机器学习算法提供了宝贵的评估资源。

SciER：首个大规模科学文档中的实体和关系抽取数据集

数据猎手小k

3 月 19 日

阅读 2 分钟

471

2024-10-28，为科学文档中的实体和关系抽取领域带来了突破，提供了一个包含106篇完整科学出版物、超过24,000个实体和12,000个关系的大规模数据集，这对于构建科学知识图谱和促进科学信息抽取技术的发展具有重要意义。

AutoBench-V：一个专为大型视觉语言模型基准测试而设计的全自动框架

数据猎手小k

3 月 19 日

阅读 3 分钟

466

2024-10-29，由美国圣母大学、MBZUAI和KAUST联合创建了AutoBench-V，意义在于提供了一个自动化的框架，能够根据模型能力的特定方面对大型视觉语言模型（LVLMs）进行基准测试，从而减少人为成本，提高评估的灵活性和效率。

AIDOVECL：包含超过15000张AI生成的车辆图像数据集，目的解决旨在解决眼水平分类和定位问题。

数据猎手小k

3 月 19 日

阅读 3 分钟

519

2024-11-01，由伊利诺伊大学厄巴纳-香槟分校的研究团队创建的AIDOVECL数据集，通过AI生成的车辆图像，显著减少了手动标注工作，为自动驾驶、城市规划和环境监测等领域提供了丰富的眼水平车辆图像资源。

AndroidLab:一个系统化的Android代理框架，包含操作环境和可复现的基准测试，支持大型语言模型和多模态模型。

数据猎手小k

3 月 19 日

阅读 3 分钟

417

2024-10-31，由清华大学和北京大学共同创建的AndroidLab数据集，为安卓自主代理的训练和评估提供了一个包含操作环境、行动空间和可复现基准的系统框架，这对于推动安卓代理技术的发展具有重要意义。

GS-Blur数据集：首个基于3D场景合成的156,209对多样化真实感模糊图像数据集。

数据猎手小k

3 月 19 日

阅读 3 分钟

585

2024-10-31，由韩国首尔国立大学的研究团队创建的GS-Blur数据集，通过3D场景重建和相机视角移动合成了多样化的真实感模糊图像，为图像去模糊领域提供了一个大规模、高覆盖度的新工具，显著提升了去模糊算法在真实世界场景中的泛化能力。

SOEBench：一个包含4000个小目标对象，专门用于评估基于文本的小目标生成和编辑性能。

数据猎手小k

3 月 19 日

阅读 3 分钟

442

2024-11-03，由浙江工业大学、香港大学、悉尼大学等联合创建SOEBench，为量化评估基于文本的小目标生成提供了一个标准化的基准，这对于推动AI和计算机视觉领域中精确图像生成技术的发展具有重要意义。

Dyn-VQA：含1452动态问题的视觉问答数据集，需灵活提供知识检索方案，查询、工具与检索时间皆可变。

数据猎手小k

3 月 19 日

阅读 4 分钟

529

2024-11-05，由阿里巴巴集团创建Dyn-VQA数据集，它包含三种类型的“动态”问题，需要复杂的知识检索策略，这些问题的查询、工具和时间都是可变的。这个数据集的创建对于推动mRAG研究和解决现有VQA数据集无法充分反映启发式mRAGs在获取复杂知识方面的刚性问题具有重要意义。

免费数据集网站（不定期更新）

数据猎手小k

3 月 19 日

阅读 3 分钟

1.3k

遇见数据集索引了国内外的大部分网站。首页有最新的数据集推荐：GitHub、Hugging Face、arXiv这些热门站点，都属于日级别的更新。

HyperGlobal-450K：全球最大规模的高光谱图像数据集

数据猎手小k

3 月 19 日

阅读 4 分钟

546

2024-06-17，由武汉大学领衔的国际研究团队创建了HyperGlobal-450K，这是迄今为止最大规模的高光谱图像数据集。该数据集的构建不仅推动了高光谱图像（HSI）处理技术的发展，还为遥感图像的智能化解析提供了强大的数据支撑，具有重要的科学和应用价值。

UAV-VisLoc：一个包含中国11个地点、6742张无人机图像和11幅卫星地图的大规模视觉定位数据集。

数据猎手小k

3 月 19 日

阅读 3 分钟

606

2024-05-16，由中科院、北京邮电大学和香港城市大学联合创建了UAV-VisLoc数据集，这个数据集通过收集中国11个不同地点的无人机图像和卫星地图，为无人机在失去全球导航卫星系统(GNSS)信号时提供精确的经纬度坐标定位，具有重要的实际应用意义。

SCB-Dataset3：首个涵盖从幼儿园到大学的多行为类别学生课堂行为检测数据集

数据猎手小k

3 月 19 日

阅读 3 分钟

637

2023-10-04，由成都东软学院创建首个涵盖从幼儿园到大学的多行为类别学生课堂行为检测数据集（SCB-dataset3），这个数据集通过提供丰富的学生行为图像和标签，为自动检测学生课堂行为提供了重要的资源，有助于分析学生课堂表现和提高教学效果。

CMACD：首个融合用户个性特征（MBTI）和六种情感及微情感的强度标签的中文情感计算数据集。

数据猎手小k

3 月 19 日

阅读 3 分钟

505

2024-11-12，北京理工大学信息与电子学院和中国电子工程设计研究院有限公司共同创建了首个融合个性与情绪强度标签的中文情感计算数据集（CMACD）。这个数据集不仅填补了中文情感数据集的空白，还为心理学、教育、市场营销、金融和政治等领域的研究提供了宝贵的数据支持，推动了机器对复杂人类情感的识别能力。

INQUIRE：新型基准数据集含五百万张自然图像,专为专家级文本到图像检索设计。

数据猎手小k

3 月 18 日

阅读 3 分钟

524

2024-11-05 ，由麻省理工学院、伦敦大学学院等联合创建了Inquire数据集，这是一个包含五百万自然世界图像的文本到图像检索基准测试，目的是挑战多模态视觉-语言模型在专家级查询上的表现。这个数据集的创建，不仅填补了现有数据集在专家级检索任务上的空白，还为AI在生态学和生物多样性研究中的应用提供了新的挑战和机遇。

Leopard-Instruct：百万高质量多模态指令数据，专处理多文本图像的新型多模态大模型。

数据猎手小k

3 月 18 日

阅读 3 分钟

400

2024-11-08，由腾讯 AI 西雅图实验室和圣母大学联合创建的 Leopard-Instruct，数据集主要解决多张富含文本的图像在理解和推理上的挑战，为多模态大型语言模型（MLLMs）的发展提供了新的方向和高质量的训练数据。

DAHL：利用由跨越 29 个类别的 8,573 个问题组成的基准数据集，评估大型语言模型在生物医学领域长篇回答的事实准确性。

数据猎手小k

3 月 18 日

阅读 3 分钟

497

2024-11-14，由首尔国立大学创建的DAHL数据集，为评估大型语言模型（LLMs）在生物医学领域长文本生成中的幻觉问题提供了一个重要的工具，这对于提高模型的准确性和可靠性具有重要意义。

OpenLSD是一个自适应开源数据集，旨在支持逻辑综合中的多种机器学习任务。

数据猎手小k

3 月 18 日

阅读 3 分钟

427

2024-11-14，由中国科学院计算技术研究所、鹏城实验室和北京大学等联合创建OpenLSD数据集，目的为逻辑综合过程中的机器学习任务提供一个自适应的数据集生成框架。该数据集的核心研究问题是如何在逻辑综合的三个基本步骤——布尔表示、逻辑优化和技术映射中，通过机器学习方法提升效率和质量。

M3SciQA：由耶鲁大学和Allen Institute for AI共同创建首个多模态多文档科学问答基准，全面评估基础模型。

数据猎手小k

3 月 18 日

阅读 3 分钟

525

2024-11-07，由耶鲁大学和Allen Institute for AI共同创建的M3SciQA数据集，目的评估基础模型在多模态和多文档科学问答任务中的表现。M3SCIQA的创建旨在填补现有基准主要关注单文档、纯文本任务的空白，通过模拟研究人员在理解单篇论文时需要的多模态和多文档数据处理流程，提供了一个更全面的评估平台。

Chinese SimpleQA：包含3000个高质量问题，用来评估大型语言模型中文事实性能力的基准测试.

数据猎手小k

3 月 18 日

阅读 3 分钟

701

2024-11-12, 由阿里巴巴集团旗下的淘宝和天猫团队创建的Chinese SimpleQA数据集，是首个全面评估语言模型回答简短问题事实性能力的中文基准测试。该数据集的创建，为理解和提升大型语言模型在中文环境下的事实性回答能力提供了重要的工具和标准。

PCBS：由麻省理工学院和Google联合创建，揭示1.2M短文本间的相似性的大规模图聚类数据集。

数据猎手小k

3 月 18 日

阅读 3 分钟

511

2024-11-15，由麻省理工学院和Google联合创建的ParClusterers Benchmark Suite (PCBS)数据集，为图聚类算法的评估带来了革命性的意义。这个数据集不仅规模宏大，包含1.2M短文本，而且通过精确的50-最近邻图构建，为聚类算法提供了一个真实且具有挑战性的测试平台，从而推动了图聚类技术的发展和优化。