关闭广告

谷歌开源AI工具Aeneas,辅助历史学家高精度修复、断代及溯源铭文

DeepTech深科技2025-07-25 00:00:025963人阅读

在博物馆幽暗的灯光下,一块残破的古罗马石碑静静地躺在展柜中。石碑上的拉丁文铭刻着早已逝去的时代信息,但岁月侵蚀和人为破坏让大部分文字变得模糊不清、难以辨认。对于历史学家和考古学家而言,解读这些被称为“历史最初手稿”的铭文,是一项极其重要却又无比艰辛的工作。现在,来自谷歌的 AI 或许能让这项工作变得轻松一些。

谷歌 DeepMind 与多所大学的历史学家合作,于 2025 年 7 月 23 日在《自然》(Nature)上发表了一项最新研究成果,推出了一款名为“埃涅阿斯”(Aeneas)的 AI 工具。这款以古罗马神话中特洛伊英雄命名的程序,旨在帮助研究人员解读、修复和考证那些饱经沧桑的古罗马拉丁文铭文。它不仅能以高准确率填补铭文中缺失的文字,还能推断出铭文的制作年代和地理来源。


图丨相关论文(来源:Nature)

古罗马人留下了海量的铭文,它们被刻在纪念碑、祭坛、墓碑、陶器甚至涂鸦墙上,内容包罗万象,从皇帝的法令、战争的记录,到商人的账本、情人的诗篇,为后世了解罗马世界的政治、经济、文化乃至普通人的日常生活提供了最直接、最鲜活的证据。与史官笔下的“胜利者书写的历史”不同,这些铭文是古罗马社会各阶层人士的真实心声。然而,解读它们的过程却相当困难。


(来源:Nature)

这些铭文常常以碎片的形态被发现,或者文字因风化而变得模糊不清,许多关键信息就此丢失。学者们在研究时,需要依靠自身的知识和丰富的经验,在浩如烟海的文献资料库中寻找可供参照的“平行文本”(parallels)——即那些在措辞、句法、格式或出处上相似的其他铭文。通过对比分析,他们才能逐步拼凑出碎片化的信息,推断缺失部分的内容,并将其置于更广阔的历史背景中进行解读。这一过程不仅耗时耗力,而且高度依赖学者的个人专长和所能接触到的图书馆资源,往往会限制研究的广度和深度。

DeepMind 的研究员 Yannis Assael 和诺丁汉大学的历史学家 Thea Sommerschield 博士领导的团队开发的 Aeneas,正是为了解决这一难题。Aeneas 的核心能力并不是单纯的文本匹配,而是深度“语境化”(contextualizing)。其基于一个名为“拉丁文铭文数据集”(LED,Latin Epigraphic Dataset)的数据集训练而成,这是一个庞大的数据库,整合了来自罗马铭文数据库(EDR,Epigraphic Database Roma)、海德堡铭文数据库(EDH,Epigraphic Database Heidelberg)等多个权威来源的数据,包含了超过 17.6 万条拉丁文铭文,总字符数高达 1,600 万个。

基于这个庞大的数据集,Aeneas 采用了一种基于 Transformer 架构的深度神经网络。它不仅仅是分析铭文的文本内容,还能在某些情况下结合铭文的图片进行多模态分析(multimodal analysis)。当研究人员输入一段残缺的铭文文本(甚至可以标记出缺失文本的长度是已知的还是未知的)和图片时,Aeneas 会通过嵌入(embedding)将每一段铭文转换成一个独特的“历史指纹”。这个指纹不仅编码了文本的字面信息,还包含了其背后隐藏的语言模式、句法结构、历史背景和地理来源等深层信息。

随后,Aeneas 会在这个由海量”历史指纹“构成的多维空间中进行检索,找出与目标铭文最相关的平行文本,并按照相关性排序后呈现给研究人员。更重要的是,它还能根据上下文语境,提出填补缺失文字的多种可能性建议,并预测该铭文最有可能的制作年代和发源地(精确到罗马帝国的 62 个行省之一)。


(来源:Nature)

为了验证 Aeneas 的实际效果,研究团队进行了一项规模空前的“古代历史学家与人工智能”合作研究。他们邀请了 23 位从事铭文研究的专家,从硕士生到资深教授,参与了一场模拟真实研究工作流程的实验。在实验中,历史学家们首先独立完成对一批铭文的修复、断代和溯源工作。随后,他们会获得 Aeneas 提供的平行文本和预测建议,再进行一次同样的工作。

实验结果显示,在 Aeneas 的帮助下,历史学家的工作效率和准确性都得到了显著提升。在地理归属方面,历史学家独立工作的最高准确率(Top-1 accuracy)为 27%,而在结合了 Aeneas 的平行文本和预测后,这一数字飙升至 68.3%,提升了 152%。

在文本修复方面,以字符错误率(Character Error Rate, CER,该数值越低越好)来衡量,历史学家的独立错误率为 39.0%,而在 Aeneas 的辅助下,错误率降至 21.4%。在年代判断上,预测结果与真实年代范围的平均差距也从 31.3 年缩短至 14.1 年,接近 Aeneas 自身的 12.8 年。在 90% 的情况下,学者们认为 Aeneas 提供的平行文本是“有用的研究起点”,他们完成任务的信心也平均提升了 44%。


(来源:Nature)

一位参与测试的历史学家感叹道:“Aeneas 检索到的平行文本彻底改变了我对(目标)铭文的看法。如果没有它,我可能要花好几天时间才能找到这些材料,而现在只需要 15 分钟。这让我可以把更多时间用于撰写和构建研究问题,而不是在寻找资料上。”

研究团队还用两个代表性案例来展示 Aeneas 的强大能力。其中一个是罗马帝国第一位皇帝奥古斯都的“神圣奥古斯都事迹录”(Res Gestae Divi Augusti)。关于这篇长篇铭文的确切撰写时间,学术界一直存在争论。Aeneas 在分析了全文后,给出了两个可能的年代高峰,一个在公元前 10-1 年,另一个则在公元 10-20 年。这恰好与学术界两种主流假说高度吻合,证明 Aeneas 能够以量化的方式捕捉并呈现复杂的历史学辩论。


(来源:DeepMind)

另一个案例是一座在今天德国美因茨(古罗马时期称为 Mogontiacum)发现的还愿祭坛。Aeneas 在分析这座祭坛的铭文时,其首要推荐的平行文本是另一座在附近发现、年代稍早的祭坛。这两座祭坛共享着非常罕见的文本程式和圣像学特征,考古学家此前已提出后者可能直接影响了前者。Aeneas 在不知道任何考古背景或空间信息的情况下,仅通过文本分析就精准地识别出了这种微妙而关键的历史关联。索默斯切尔德博士形容这些发现是“令人瞠目结舌的时刻”。

当然,Aeneas 并非完美无缺,它也不是要取代历史学家。哈佛大学的古典学教授 Kathleen Coleman 就指出,目前还不完全清楚这个工具在历史学家的长期工作流程中会多大程度上发挥作用,而且它并不能推测文本的“意义”,最终的解释工作仍需人类专家来完成。研究论文本身也坦诚,模型的性能在数据稀疏的地区和时期会有所下降,并且存在因训练数据本身的局限性而产生偏见的风险。

但 Aeneas 的设计初衷也正是成为一个强大的协作者,而非替代者。它将学者从繁重、重复的资料搜寻工作中解放出来,让他们能更专注于批判性思考和历史解释。剑桥大学的著名古典学家 Mary Beard 教授评价说:“它有望带来变革。”牛津大学的古代史教授、论文的合著者 Jonathan Prag 也表示,这个工具让更广泛的人群能够参与到铭文研究中来,因为“如果没有这样的工具,你只能依靠积累海量的个人知识或拥有一个巨大的图书馆。”

Aeneas 的技术建立在其前身 Ithaca 之上,Ithaca 是一个专注于修复古希腊铭文的 AI 模型。现在,Ithaca 也将升级为由 Aeneas 的技术驱动,性能得到全面提升。为了让这项技术能惠及更多人,研究团队已经将 Aeneas 的代码和数据集开源,并建立了一个名为“预测过去”(predictingthepast.com)的互动网站,免费向所有研究人员、学生和教育工作者开放。他们还与比利时根特的教师培训项目合作,开发了一套教学大纲,旨在将 Aeneas 融入中学历史课堂,培养学生的数字素养和史料批判能力。

参考资料:

1.https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/

2.https://www.nature.com/articles/s41586-025-09292-5

3.https://www.technologyreview.com/2025/07/23/1120574/deepmind-ai-aeneas-helps-historians-interpret-latin-inscriptions/

运营/排版:何晨龙

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

科创新就业|飞控工程师——为飞行器装上“最强大脑”

中安在线 浏览 699 07-23

百万“智驾险”,出事车企来买单?

Autolab 浏览 7079 05-30

合资反攻潮中的“一个福特”

远川研究所 浏览 15 10-02

拒绝捧杀!理想i6即将发布,高管亲自下场辟谣!

电车通 浏览 18 09-02

女子悬赏上海一套房寻被拐26年儿子:线索确认一定兑现

极目新闻 浏览 9563 08-19

特朗普:可能接管伊朗的哈梅内伊接班人 在空袭中丧生

扬子晚报 浏览 15 03-03

63岁蔡明支持陈佩斯电影落泪,瘦很多脸不僵了

疯说时尚 浏览 5589 07-18

金星归国路全被堵死,近照一出“原形毕露”

老吴教育课堂 浏览 1056 07-28

闫学晶的账还没有算清,49岁李湘又“塌”了

真的八卦小学弟 浏览 13 01-20

《731》日本女军官设定细思极恐,背后隐喻深,堪称全片最大争议

萌神木木 浏览 19 09-19

上了年纪的女人,请远离“假时髦、精致土”,这样穿才显得体

静儿时尚达人 浏览 8959 08-05

银河系列风格 全新吉利帝豪内饰谍照曝光

车质网 浏览 2731 08-15

千岸科技合规与税务双承压:股东借离婚还原股权代持,海外累计被罚近百万元|读懂IPO

时代周报 浏览 5 04-10

30亿资本注入,破产重整的上汽红岩如何“翻身”?

汽扯扒谈 浏览 13 10-28

另有安排 大众ID.Polo暂无引入中国计划

车质网 浏览 16 11-07

输油泵站和军事基地遭袭 俄称乌“故意破坏特朗普和平建议”

澎湃新闻 浏览 9656 03-22

叶珂说刚生完孩子 和黄晓明没分手?

小嵩 浏览 7977 08-08

造车也有“苏超”,谁是“江苏一哥”

21世纪经济报道 浏览 3134 07-20

百度崔珊珊可能不会远离权力中心

YOUNG财经 浏览 9037 07-31

华为&新央企赋能,阿维塔将加速海外突破

网易汽车 浏览 19 09-02

新款奥迪Q4 e-tron谍照曝光 有望四季度发布

车质网 浏览 2291 08-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2