谷歌 DeepMind 开源 Aeneas,这是一个用于分析古代文本的 AI 模型

主要观点:Google DeepMind 开源了用于理解古代铭文的生成式 AI 模型 Aeneas,它能处理文本和图像输入,在修复受损铭文中缺失字符方面优于其他最先进模型,旨在协助历史学家进行铭文学研究,包含多个关键任务,基于 Ithaca 项目且增加了图像输入支持,通过组装拉丁铭文数据集训练,在评估中表现出色,相关代码和互动演示网站已上线。
关键信息

  • Aeneas 可处理文本和图像输入,能完成多个铭文学任务,如确定铭文日期、产地等。
  • 基于 Ithaca 项目,增加图像输入和修复未知缺失字符等能力。
  • 训练用的拉丁铭文数据集包含 176861 个铭文,来自不同时期和地区。
  • 23 位铭文学专家在限时模拟研究中使用 Aeneas,其检索的平行文本改变了研究重点。
  • 关于 Aeneas 在 Hacker News 上有不同看法,有人认为是有教育意义的猜测。
    重要细节
  • Aeneas 用多模态 Transformer 架构,各任务有专用头。
  • 人类专家使用 Aeneas 后联合表现更好。
  • Aeneas 代码在 GitHub 上,有互动演示网站。
阅读 37
0 条评论