主要观点:Google DeepMind 开源了用于理解古代铭文的生成式 AI 模型 Aeneas,它能处理文本和图像输入,在修复受损铭文中缺失字符方面优于其他最先进模型,旨在协助历史学家进行铭文学研究,包含多个关键任务,基于 Ithaca 项目且增加了图像输入支持,通过组装拉丁铭文数据集训练,在评估中表现出色,相关代码和互动演示网站已上线。
关键信息:
- Aeneas 可处理文本和图像输入,能完成多个铭文学任务,如确定铭文日期、产地等。
- 基于 Ithaca 项目,增加图像输入和修复未知缺失字符等能力。
- 训练用的拉丁铭文数据集包含 176861 个铭文,来自不同时期和地区。
- 23 位铭文学专家在限时模拟研究中使用 Aeneas,其检索的平行文本改变了研究重点。
- 关于 Aeneas 在 Hacker News 上有不同看法,有人认为是有教育意义的猜测。
重要细节: - Aeneas 用多模态 Transformer 架构,各任务有专用头。
- 人类专家使用 Aeneas 后联合表现更好。
- Aeneas 代码在 GitHub 上,有互动演示网站。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。