SPOTS-10:含50,000张32×32灰度图像,专注十种动物图案识别,用于评估机器学习算法。

3 月 19 日
阅读 3 分钟
456
2024-10-28,由英国林肯大学工程与物理科学学院创建SPOTS-10,数据集主要解决夜间图像中基于动物独特体纹识别的复杂计算机视觉任务,为机器学习算法提供了宝贵的评估资源。
封面图

SciER:首个大规模科学文档中的实体和关系抽取数据集

3 月 19 日
阅读 2 分钟
471
2024-10-28,为科学文档中的实体和关系抽取领域带来了突破,提供了一个包含106篇完整科学出版物、超过24,000个实体和12,000个关系的大规模数据集,这对于构建科学知识图谱和促进科学信息抽取技术的发展具有重要意义。
封面图

AutoBench-V:一个专为 大型视觉语言模型基准测试而设计的全自动框架

3 月 19 日
阅读 3 分钟
466
2024-10-29,由美国圣母大学、MBZUAI和KAUST联合创建了AutoBench-V,意义在于提供了一个自动化的框架,能够根据模型能力的特定方面对大型视觉语言模型(LVLMs)进行基准测试,从而减少人为成本,提高评估的灵活性和效率。
封面图

AIDOVECL:包含超过15000张AI生成的车辆图像数据集,目的解决旨在解决眼水平分类和定位问题。

3 月 19 日
阅读 3 分钟
519
2024-11-01,由伊利诺伊大学厄巴纳-香槟分校的研究团队创建的AIDOVECL数据集,通过AI生成的车辆图像,显著减少了手动标注工作,为自动驾驶、城市规划和环境监测等领域提供了丰富的眼水平车辆图像资源。
封面图

AndroidLab:一个系统化的Android代理框架,包含操作环境和可复现的基准测试,支持大型语言模型和多模态模型。

3 月 19 日
阅读 3 分钟
417
2024-10-31,由清华大学和北京大学共同创建的AndroidLab数据集,为安卓自主代理的训练和评估提供了一个包含操作环境、行动空间和可复现基准的系统框架,这对于推动安卓代理技术的发展具有重要意义。
封面图

GS-Blur数据集:首个基于3D场景合成的156,209对多样化真实感模糊图像数据集。

3 月 19 日
阅读 3 分钟
585
2024-10-31,由韩国首尔国立大学的研究团队创建的GS-Blur数据集,通过3D场景重建和相机视角移动合成了多样化的真实感模糊图像,为图像去模糊领域提供了一个大规模、高覆盖度的新工具,显著提升了去模糊算法在真实世界场景中的泛化能力。
封面图

SOEBench:一个包含4000个小目标对象,专门用于评估基于文本的小目标生成和编辑性能。

3 月 19 日
阅读 3 分钟
442
2024-11-03,由浙江工业大学、香港大学、悉尼大学等联合创建SOEBench,为量化评估基于文本的小目标生成提供了一个标准化的基准,这对于推动AI和计算机视觉领域中精确图像生成技术的发展具有重要意义。
封面图

Dyn-VQA:含1452动态问题的视觉问答数据集,需灵活提供知识检索方案,查询、工具与检索时间皆可变。

3 月 19 日
阅读 4 分钟
529
2024-11-05,由阿里巴巴集团创建Dyn-VQA数据集,它包含三种类型的“动态”问题,需要复杂的知识检索策略,这些问题的查询、工具和时间都是可变的。这个数据集的创建对于推动mRAG研究和解决现有VQA数据集无法充分反映启发式mRAGs在获取复杂知识方面的刚性问题具有重要意义。
封面图

免费数据集网站(不定期更新)

3 月 19 日
阅读 3 分钟
1.3k
遇见数据集索引了国内外的大部分网站。首页有最新的数据集推荐:GitHub、Hugging Face、arXiv这些热门站点​,都属于日级别的更新。
封面图

HyperGlobal-450K:全球最大规模的高光谱图像数据集

3 月 19 日
阅读 4 分钟
546
2024-06-17,由武汉大学领衔的国际研究团队创建了HyperGlobal-450K,这是迄今为止最大规模的高光谱图像数据集。该数据集的构建不仅推动了高光谱图像(HSI)处理技术的发展,还为遥感图像的智能化解析提供了强大的数据支撑,具有重要的科学和应用价值。
封面图

UAV-VisLoc:一个包含中国11个地点、6742张无人机图像和11幅卫星地图的大规模视觉定位数据集。

3 月 19 日
阅读 3 分钟
606
2024-05-16,由中科院、北京邮电大学和香港城市大学联合创建了UAV-VisLoc数据集,这个数据集通过收集中国11个不同地点的无人机图像和卫星地图,为无人机在失去全球导航卫星系统(GNSS)信号时提供精确的经纬度坐标定位,具有重要的实际应用意义。
封面图

SCB-Dataset3:首个涵盖从幼儿园到大学的多行为类别学生课堂行为检测数据集

3 月 19 日
阅读 3 分钟
637
2023-10-04,由成都东软学院创建首个涵盖从幼儿园到大学的多行为类别学生课堂行为检测数据集(SCB-dataset3),这个数据集通过提供丰富的学生行为图像和标签,为自动检测学生课堂行为提供了重要的资源,有助于分析学生课堂表现和提高教学效果。
封面图

CMACD:首个融合用户个性特征(MBTI)和六种情感及微情感的强度标签的中文情感计算数据集。

3 月 19 日
阅读 3 分钟
505
2024-11-12,北京理工大学信息与电子学院和中国电子工程设计研究院有限公司共同创建了首个融合个性与情绪强度标签的中文情感计算数据集(CMACD)。这个数据集不仅填补了中文情感数据集的空白,还为心理学、教育、市场营销、金融和政治等领域的研究提供了宝贵的数据支持,推动了机器对复杂人类情感的识别能力。
封面图

INQUIRE:新型基准数据集含五百万张自然图像,专为专家级文本到图像检索设计。

3 月 18 日
阅读 3 分钟
524
2024-11-05 ,由麻省理工学院、伦敦大学学院等联合创建了Inquire数据集,这是一个包含五百万自然世界图像的文本到图像检索基准测试,目的是挑战多模态视觉-语言模型在专家级查询上的表现。这个数据集的创建,不仅填补了现有数据集在专家级检索任务上的空白,还为AI在生态学和生物多样性研究中的应用提供了新的挑战和机遇。
封面图

Leopard-Instruct:百万高质量多模态指令数据,专处理多文本图像的新型多模态大模型。

3 月 18 日
阅读 3 分钟
400
2024-11-08,由腾讯 AI 西雅图实验室和圣母大学联合创建的 Leopard-Instruct,数据集主要解决多张富含文本的图像在理解和推理上的挑战,为多模态大型语言模型(MLLMs)的发展提供了新的方向和高质量的训练数据。
封面图

DAHL:利用由跨越 29 个类别的 8,573 个问题组成的基准数据集,评估大型语言模型在生物医学领域长篇回答的事实准确性。

3 月 18 日
阅读 3 分钟
497
2024-11-14,由首尔国立大学创建的DAHL数据集,为评估大型语言模型(LLMs)在生物医学领域长文本生成中的幻觉问题提供了一个重要的工具,这对于提高模型的准确性和可靠性具有重要意义。

OpenLSD是一个自适应开源数据集,旨在支持逻辑综合中的多种机器学习任务。

3 月 18 日
阅读 3 分钟
427
2024-11-14,由中国科学院计算技术研究所、鹏城实验室和北京大学等联合创建OpenLSD数据集,目的为逻辑综合过程中的机器学习任务提供一个自适应的数据集生成框架。该数据集的核心研究问题是如何在逻辑综合的三个基本步骤——布尔表示、逻辑优化和技术映射中,通过机器学习方法提升效率和质量。
封面图

M3SciQA:由耶鲁大学和Allen Institute for AI共同创建首个多模态多文档科学问答基准,全面评估基础模型。

3 月 18 日
阅读 3 分钟
525
2024-11-07,由耶鲁大学和Allen Institute for AI共同创建的M3SciQA数据集,目的评估基础模型在多模态和多文档科学问答任务中的表现。M3SCIQA的创建旨在填补现有基准主要关注单文档、纯文本任务的空白,通过模拟研究人员在理解单篇论文时需要的多模态和多文档数据处理流程,提供了一个更全面的评估平台。
封面图

Chinese SimpleQA:包含3000个高质量问题,用来评估大型语言模型中文事实性能力的基准测试.

3 月 18 日
阅读 3 分钟
701
2024-11-12, 由阿里巴巴集团旗下的淘宝和天猫团队创建的Chinese SimpleQA数据集,是首个全面评估语言模型回答简短问题事实性能力的中文基准测试。该数据集的创建,为理解和提升大型语言模型在中文环境下的事实性回答能力提供了重要的工具和标准。
封面图

PCBS:由麻省理工学院和Google联合创建,揭示1.2M短文本间的相似性的大规模图聚类数据集。

3 月 18 日
阅读 3 分钟
511
2024-11-15,由麻省理工学院和Google联合创建的ParClusterers Benchmark Suite (PCBS)数据集,为图聚类算法的评估带来了革命性的意义。这个数据集不仅规模宏大,包含1.2M短文本,而且通过精确的50-最近邻图构建,为聚类算法提供了一个真实且具有挑战性的测试平台,从而推动了图聚类技术的发展和优化。
封面图

StainDoc:首个专为文档去污设计的大规模、高分辨率数据集

3 月 18 日
阅读 3 分钟
350
2024-10-30 ,由惠州大学、上海交通大学、中国科学院深圳先进技术研究院等联合创建的StainDoc数据集,首次为文档去污任务提供了大规模、高分辨率的图像对,极大地推动了文档图像增强技术的发展,特别是在去除文档上的污渍方面。
封面图

ADUULM-360:首个涵盖恶劣天气条件的多模态深度估计数据集。

3 月 18 日
阅读 4 分钟
535
2024-11-18,由德国乌尔姆大学的测量、控制和微技术研究所创建的ADUULM-360数据集,为自动驾驶领域提供了在不同天气条件下的深度估计新视角,填补了现有数据集在场景多样性和传感器模态上的空白。
封面图

CC-Foundation:包含200,000图像对和1.2百万描述的高质量、多样化的遥感图像变化描述数据集。

3 月 18 日
阅读 3 分钟
493
2024-11-18,由北京航空航天大学创建的CCExpert模型,通过引入差异感知整合模块和大规模高质量数据集CC-Foundation,显著提升了遥感图像变化描述(RSICC)任务的性能,为动态地球过程监测提供了创新的自然语言处理和计算机视觉结合方法。
封面图

ViSTa:一个包含4000多个视频和逐步描述的层次化数据集,用于评估VLMs在不同复杂性任务中的表现。

3 月 18 日
阅读 2 分钟
358
2024-11-22,由Google DeepMind和MATS机构创建的ViSTa数据集,为评估视觉语言模型(VLMs)在理解基于顺序的任务方面的能力提供了新的视角,这对于强化学习中的成本降低和安全性提升具有重要意义。
封面图

OSPTrack:一个包含多个生态系统中软件包执行时生成的静态和动态特征的标记数据集,用于识别开源软件中的恶意行为。

3 月 18 日
阅读 2 分钟
486
2024-11-22 ,由格拉斯哥大学创建的OSPTrack数据集,目的是通过捕获在隔离环境中执行包和库时生成的特征,包括静态和动态特征,来识别开源软件(OSS)中的恶意指标,特别是在源代码访问受限时,支持在运行时高效检测方法。
封面图

FineTuneBench:由斯坦福大学创建,目的评估商业微调API在不同泛化任务中的知识注入能力。

3 月 18 日
阅读 3 分钟
341
2024-11-11,由斯坦福大学创建的FineTuneBench数据集,揭示了商业大型语言模型(LLMs)微调API在新知识学习和现有知识更新方面的显著不足,这对于理解和改进LLMs的适应性和可靠性具有重要意义。
封面图

GlobalTomo:首个为地震波场建模和全波形反演量身定制的全球3D合成数据集。

3 月 18 日
阅读 3 分钟
431
2024-06-30,由北京大学和NVIDIA联合创建的GlobalTomo数据集,为地震波场建模和全波形反演(FWI)提供了一个独特的全球尺度的3D合成数据集,这对于加速计算效率和扩大FWI的适用性具有革命性潜力。
封面图

CMNEE:首个大规模文档级开源中文军事新闻事件抽取数据集.

3 月 18 日
阅读 2 分钟
456
2024-04-18,由国防科技大学大数据与决策实验室联合东南大学和清华大学共同创建了CMNEE数据集,这个数据集为军事领域的事件抽取研究提供了宝贵的资源,解决了该领域数据稀缺的问题,对情报分析和决策辅助等应用具有重要意义。
封面图

DriveMLLM:一个专为自动驾驶空间理解任务设计的大规模基准数据集

3 月 18 日
阅读 2 分钟
447
2024-11-20, 由武汉大学、中国科学院自动化研究所、悉尼科技大学、牛津大学等合创建了DriveMLLM数据集,该数据集是自动驾驶领域首个专为评估多模态大型语言模型(MLLMs)空间理解能力而设计的基准,对于推动自动驾驶技术的发展具有重要意义。
封面图

EmbodiedCity:首个基于真实城市环境的具身智能基准测试平台。

3 月 18 日
阅读 3 分钟
438
2024-10-13,由清华大学创建的EmbodiedCity数据集,标志着Embodied AI研究从室内走向户外,为人工智能提供了一个更接近现实世界的测试环境。
封面图