谷歌 DeepMind 开源 Aeneas，这是一个用于分析古代文本的 AI 模型

发布于 2025-08-12

主要观点：Google DeepMind 开源了用于理解古代铭文的生成式 AI 模型 Aeneas，它能处理文本和图像输入，在修复受损铭文中缺失字符方面优于其他最先进模型，旨在协助历史学家进行铭文学研究，包含多个关键任务，基于 Ithaca 项目且增加了图像输入支持，通过组装拉丁铭文数据集训练，在评估中表现出色，相关代码和互动演示网站已上线。
关键信息：

Aeneas 可处理文本和图像输入，能完成多个铭文学任务，如确定铭文日期、产地等。
基于 Ithaca 项目，增加图像输入和修复未知缺失字符等能力。
训练用的拉丁铭文数据集包含 176861 个铭文，来自不同时期和地区。
23 位铭文学专家在限时模拟研究中使用 Aeneas，其检索的平行文本改变了研究重点。
关于 Aeneas 在 Hacker News 上有不同看法，有人认为是有教育意义的猜测。
重要细节：
Aeneas 用多模态 Transformer 架构，各任务有专用头。
人类专家使用 Aeneas 后联合表现更好。
Aeneas 代码在 GitHub 上，有互动演示网站。

阅读 122