2024-11-07,由耶鲁大学和Allen Institute for AI共同创建的M3SciQA数据集,目的评估基础模型在多模态和多文档科学问答任务中的表现。M3SCIQA的创建旨在填补现有基准主要关注单文档、纯文本任务的空白,通过模拟研究人员在理解单篇论文时需要的多模态和多文档数据处理流程,提供了一个更全面的评估平台。
2024-11-15,由麻省理工学院和Google联合创建的ParClusterers Benchmark Suite (PCBS)数据集,为图聚类算法的评估带来了革命性的意义。这个数据集不仅规模宏大,包含1.2M短文本,而且通过精确的50-最近邻图构建,为聚类算法提供了一个真实且具有挑战性的测试平台,从而推动了图聚类技术的发展和优化。