NAVCON:首个大规模基于认知和语言对齐的视觉语言导航预料库

3 月 11 日
阅读 3 分钟
482
2024-12-18 ,由宾夕法尼亚大学创建的 NAVCON ,这是一个大规模的视觉语言导航语料库,基于 R2R 和 RxR 数据集构建。该数据集通过标注导航指令中的核心概念,为模型提供更透明的跨模态对齐训练资源,显著提升了导航任务的可解释性和泛化能力。
封面图

EgoPlan-Bench2: 包含1321个高质量的多选题问答对,覆盖工作、日常生活、爱好和娱乐四大领域,共24个详细场景

1 月 22 日
阅读 3 分钟
588
2024-12-06,由香港大学与腾讯PCG的ARC实验室联合创建了EgoPlan-Bench2数据集,这个数据集通过模拟人类日常生活中的复杂任务,为多模态大型语言模型(MLLMs)的规划能力提供了一个严格和全面的评估平台,对于推动人工智能向通用智能发展具有重要意义。
封面图

selectdataset 发布2024最热门Top100数据集

1 月 3 日
阅读 22 分钟
1.2k
遇见数据集索引了国内外的大部分网站。首页有最新的数据集推荐:GitHub、Hugging Face、arXiv这些热门站点,都属于日级别的更新。
封面图