「ai」AI破解古文字登Nature封面:修复缺失文字,精确地理位置和书写时间,DeepMind&哈佛&谷歌多家联手开发
精选评测好文
原文标题:AI破解古文字登Nature封面:修复缺失文字,精确地理位置和书写时间,DeepMind&哈佛&谷歌多家联手开发
最新一期的 Nature 封面,AI 再度来到舞台中央,这一次是在破译古文字方面立功了。
这是一种基于 Transformer 架构的方法,由 DeepMind、谷歌、牛津大学等多家研究机构联合开发。
在单独修复受损文本时,这种方法能达到62%的准确率。
在实际应用中,历史学家单独破译某块古希腊石碑的准确率本来只有 25%,但在使用这一方法后一举提升了近乎3 倍,达到了 72%。
不仅能修复文字,这一方法在地理归属的任务上也有 71% 的准确率,还能将古文字的书写日期精确到 30 年以内。
目前,这一方法已经引起了不小的讨论热度:
现在已经有可以在线解析古希腊文字的网页版,架构方法也已开源。
Transformer 破译古文字
这是一个叫做Ithaca的架构,以荷马史诗《奥德赛》中的希腊岛屿命名。
Ithaca 架构中的注意力机制能够通过串联输入的单个字符、完整单词的表征与顺序位置来了解输入文本的每一部分的位置,最终权衡不同的输入对模型决策过程的影响。
完整架构由多个 Transformer 块组成,每个 Transformer 块都输出一个经过处理的表征序列(Sequence of Processed Representations),其长度即输入字符的数量。
其输入随后被传递给三个分别负责文字修复、地理归属、时间归属的任务头,每个头都由一个前馈的神经网络组成,专门负责各自任务的训练。
在文字修复任务中,Ithaca 会提供 20 个按概率排列的解析结果预测:
地理归属的确定上,则会依据古历史学中的 84 个区域中对输入文本进行分类,将可能的区域预测类别通过地图和柱状图展现:
日期归属任务同样也通过分布预测的柱状图来展示。
如下图所示,公元前 300-250 年的日期 10 年一组,被表示为 5 个概率相同的范围,而公元前 305 年的铭文将以 100% 的概率被分配到公元前 300-310 年的十年组:
历史学家的 AI 助手
研究人员分别将 Ithaca 与历史学家、同类 AI 方法 Pythia、以及 Ithaca 与历史学家合作等不同破解古文字的方法做了对比。
字错率(CER)总是越低越好,在文字修复任务上,Ithaca 的字错率和准确率都最好,如果与历史学家合作时,效果还将再次提升。
在论文的最后,研究人员表示,研究方法适用于手稿学、钱币学和纸草学等所有与古代文本相关的学科,也适用于古代、现代的任何语言。
目前,这一方法已经投入了实际使用,比如在雅典时期颁布的某个重要法令的碑文的日期确认上,历史学家们之前认为是在公元前 446/5 年之前书写的。
而 Ithaca 与历史学家一起,将这一日期更新到了公元前 424/3 年:
Ithaca 现在提供了在线试用的途径,登录官网,在方框中中输入古希腊铭文,将缺少的字符标记为破折号(- ) ),将预测的字符标记为问号(?)。
每次查询最多可以预测 10 个连续或非连续的问号,点击查询后将在下方显示文本缺失的字符,并将其归属到原来的地点和时间:
作者介绍
研究由 DeepMind、威尼斯卡福斯卡里大学(Ca ’ Foscari University of Venice)、哈佛大学、雅典经商大学 ( Athens University of Economics and Business ) 、谷歌几家 AI 团队合作开发。
论文有两位共同一作,其中 annis Assael 为 DeepMind 的 AI 部门的研究员,硕博都毕业于牛津大学,同时也是福布斯 "30 岁以下 30 名欧洲杰出科学家 " 之一:
共同一作 Thea Sommerschield 则是一位历史学家,目前任威尼斯佛斯卡里大学的人文科学院,以及哈佛大学希腊研究中心的研究员,主要研究领域是将机器学习应用于研究古代地中海的书面文化。
论文:
https://www.nature.com/articles/s41586-022-04448-z
开源链接:
https://github.com/DeepMind/ithaca
在线试用:
https://ithaca.DeepMind.com/?job=eyJyZXF1ZXN0SUQiOiJmYzUwNGY0NWNhZjJjZWMxZjIxZDA4YWVjNTdkMjEzMSIsImF0dHJpYnV0aW9uIjp0cnVlLCJyZXN0b3JhdGlvbiI6dHJ1ZX0%3D
更多文章:黑科技不输戴森!吉米小轻杆P7无线吸尘器,轻如鸿毛<\a>
其他人还看了
「芯片」RedmiK50超大杯性能曝光:天玑9000芯片跑分轻松超104万,原神60分钟接近
「deepmind」预测过去?DeepMind用AI复原古希腊铭文,登Nature封面
「雅典」Nature最新封面:DeepMindAI“再下一城”,追寻人类古老文字踪迹
高性价比的真无线耳机,SOUNDPEATSAir3Pro评测
郑重声明:本文“「ai」AI破解古文字登Nature封面:修复缺失文字,精确地理位置和书写时间,DeepMind&哈佛&谷歌多家联手开发”,https://nmgjrty.com/shumacp_374809.html内容,由量子位提供发布,请自行判断内容优劣。
- 全部评论(0)
- 「ai」AI破解古文字登Nature封面:修复缺失文字,精确地理位置和书写时间,D
- 「战神」12代酷睿i7+RTX30系独显电竞本到手价不到六千
- 「于雷」苹果雷雳4Pro连接线上热搜,949元起你觉得贵么?
- 「谷歌」解决存储空间不足谷歌为Android开发“AppArchiving”功能
- 「华为」华为nova9SE盲订开启:或将搭载一亿像素主摄
- 「华为」华为nova9SE现身官网,华为首款一亿像素手机
- 「oppo」四平八稳入战局,OPPOPad体验评测
- 「华为」华为春季发布会官宣:新机P50E、Nova9SE接连登场
- 「redmi」RedmiK50系列海报再次意外曝光这颜值一言难尽
- 「芯片」RedmiK50系列终于官宣:3月17日发布
- 「redmi」表现逆天!RedmiK50可接近满帧运行《原神》1小时
- 「芯片」RedmiK50超大杯性能曝光:天玑9000芯片跑分轻松超104万,原神60分钟接近
- 「航嘉」春季装机必修课航嘉DIY硬件好货推荐
- 「酷睿」苹果M1Ultra处理器成绩来了,多核性能真强!
- 「佳能」数码单反编年史:黄金年代——佳能篇(上)
- 「屏下摄像」屏下摄像头,为什么不受待见了?
最新更新
- 「ai」AI破解古文字登Nature封面:修复缺失
- 「战神」12代酷睿i7+RTX30系独显电竞本到手
- 「于雷」苹果雷雳4Pro连接线上热搜,94
- 「谷歌」解决存储空间不足谷歌为Androi
- 「华为」华为nova9SE盲订开启:或将搭载一
- 「华为」华为nova9SE现身官网,华为首款一
- 「oppo」四平八稳入战局,OPPOPad体验评测
- 「华为」华为春季发布会官宣:新机P50
- 「redmi」RedmiK50系列海报再次意外曝光这颜
- 「芯片」RedmiK50系列终于官宣:3月17日发
- 「redmi」表现逆天!RedmiK50可接近满帧运行
- 「芯片」RedmiK50超大杯性能曝光:天玑9
- 「航嘉」春季装机必修课航嘉DIY硬件好货
- 「酷睿」苹果M1Ultra处理器成绩来了,多核
- 「佳能」数码单反编年史:黄金年代——
推荐阅读
- 「战神」12代酷睿i7+RTX30系独显电竞本到手价不到六千
- 「于雷」苹果雷雳4Pro连接线上热搜,949元起你觉得贵么?
- 「谷歌」解决存储空间不足谷歌为Android开发“AppArchiving”功能
- 「华为」华为nova9SE盲订开启:或将搭载一亿像素主摄
- 「华为」华为nova9SE现身官网,华为首款一亿像素手机
- 「oppo」四平八稳入战局,OPPOPad体验评测
- 「华为」华为春季发布会官宣:新机P50E、Nova9SE接连登场
- 「redmi」RedmiK50系列海报再次意外曝光这颜值一言难尽
- 「芯片」RedmiK50系列终于官宣:3月17日发布
- 「redmi」表现逆天!RedmiK50可接近满帧运行《原神》1小时
- 「芯片」RedmiK50超大杯性能曝光:天玑9000芯片跑分轻松超104万,原神60分钟接近
- 「航嘉」春季装机必修课航嘉DIY硬件好货推荐
猜你喜欢
- [iPhone]iPhone13promax远峰蓝128G入手
- [安卓手机]realme真我GTNeo2开箱,金刚石冰芯散热系统+E4屏,5000mAh大电池
- [贴膜]红米9爆屏更换记录,弯曲的中框修复
- [智能机器人]编程从娃娃抓起,MakeBlock程小奔上手体验
- [智能摄像机]内置大电池,无需打孔走线,小米室外摄像机给你满满的安全感
- [充电器]65w网红氮化镓一次看个够
- [电脑支架]原汤化原食,LGErgo显示器支架
- [蓝牙耳机]中端耳机音质天花板,降噪很有一手,鹿图COCO真蓝牙降噪耳机评测
- [音频播放器]关于R01主板的主观看法,和一些碎碎念
- [充电器]双口快充,满足日常需求
- [VR设备]GOOVISLite头戴影院评测
- [蓝牙耳机]魅蓝Blus耳机体验,魅蓝依旧还是当年坚持做良品的青年良品
- [安卓手机]从5988跌至2749,256GB+鸿蒙OS+7nm麒麟,从高端市场跌至中端市场
- 「轻众测|素诺智能可视冲牙器」别急,对准再冲!素诺可视冲牙器让残渣无所
- 「九号新品Nano及Air T15」萌娃初体验——Ninebot九号平衡车Nano