EgoPlan-Bench2: 包含1321个高质量的多选题问答对,覆盖工作、日常生活、爱好和娱乐四大领域,共24个详细场景

1 月 22 日
阅读 3 分钟
464
2024-12-06,由香港大学与腾讯PCG的ARC实验室联合创建了EgoPlan-Bench2数据集,这个数据集通过模拟人类日常生活中的复杂任务,为多模态大型语言模型(MLLMs)的规划能力提供了一个严格和全面的评估平台,对于推动人工智能向通用智能发展具有重要意义。
封面图

selectdataset 发布2024最热门Top100数据集

1 月 3 日
阅读 22 分钟
749
遇见数据集索引了国内外的大部分网站。首页有最新的数据集推荐:GitHub、Hugging Face、arXiv这些热门站点,都属于日级别的更新。
封面图