我和网信 | 数字技术让三千年前古文字“回家”

发布时间: 2024年02月02日 文章来源: 《中国网信》2023年第5期

如果古文字会说话,那甲骨文将会对人类说什么?进入复旦大学出土文献与古文字研究中心(以下简称“研究中心”)官网主页,最右侧“数据库”页卡里有一个通往“缀玉联珠”甲骨缀合信息库的端口,这里藏着穿越千年但“刻骨铭心”的答案。

缀合甲骨碎片“拼出”千年文明图景

甲骨文又称“契文”“甲骨卜辞”,是中国目前发现的最早成体系的文字,对探寻中华文明起源有着至关重要的作用。甲骨材质特殊,片多易碎,且有一些分布在全球各地,在现今存世的16万多片商周甲骨中,90%以上的都是碎片。

甲骨缀合,是综合利用甲骨上的各方面信息将甲骨碎片拼接起来,使原本散碎的材料变得完整或较为完整。甲骨缀合能让三千多年前的甲骨碎片“破镜重圆”,是开启殷商文化宝库的管钥,也是追溯中华千年文明的拼图。

一片在山东,一片在英国,两片在故宫,还有的只有拓本资料……通过学者的接力缀合,才能完成甲骨“合璧”。由于甲骨碎片需要妥善保存,学者们接触实物的机会并不多,一般只能依靠电脑上的拼合拓片和实物照片来进行研究。甲骨的流传过程、收藏和著录情况比较复杂,容易造成甲骨材料的离散,给研究带来很大难度。“甲骨文研究一定要有扎实的材料基础,整理甲骨资料时应有缀合意识。”这是研究中心研究员蒋玉斌对学生们的要求。不久前,研究中心2022级博士生程名卉整理了美国哥伦比亚大学近年对外公布的一批甲骨残片,她形象地将缀合工作形容为“寻亲”:“就像一个祖籍在殷墟的家族走散了,通过几代学者们的接力,找到了它们已经定居海外的‘亲人’。虽然现在不住在一起,但‘全家福’上缺失的面孔得以补全了。”

近百年来,已有超百位学者投身甲骨缀合工作,完成了7000多组甲骨碎片的缀合。学者的甲骨缀合成果一般通过专著、书刊和网络文章等方式发表,往往散见多处,不便利用。为此,研究中心师生共同打造了“缀玉联珠”甲骨缀合信息库,致力于全面整合甲骨缀合信息,将缀合情况、出处、缀合者等信息汇于一处,方便查检。“建立这样一个数据库,能够有效避免古文字研究者的重复劳动,避免出现花费心思整理,缀合完成后却发现已有前人缀过的情形。”研究中心2019级博士生杨熠说。

目前,“缀玉联珠”甲骨缀合信息库已收集了甲骨缀合信息6400余条,上线3个月以来,总访问量超27万人次,共收到90余条来自世界各地专家学者的反馈意见,成为学界检索甲骨缀合成果的主要平台。

“缀玉联珠”甲骨缀合信息库官网首页截图。

用数字技术力量为古文字研究“提速”

缀合的过程也是一个“破案”的过程,需要用技术手段帮助找到唯一的“真相”。“甲骨碎片的缀合结果具有唯一性,这也正是技术可以发挥作用的地方。”蒋玉斌提到。判断甲骨缀合是否成功的标准非常严格:甲骨的茬口是否严丝合缝?甲骨正反两面的纹路是否相接?刻写的文字内容是否一致?刻写者的字体和风格以及每组甲骨的叙事内容是否契合?其中的不少方面,技术手段都可以大显身手。缀合完成后,也需要及时实现数据信息共享,以便学者使用。

以往甲骨碎片都是靠研究者的记忆和经验,一片一片地手工拼合,如今借助人工智能图像技术可以实现自动缀合,大大提高了缀合效率。杨熠介绍道:“‘缀合库’等古文字信息库能够将缀合成果‘喂’给人工智能供其学习掌握,我们导入大量甲骨图像,让人工智能根据学习到的知识去尝试缀合,最后由学者来进行评判,看缀合是否成立。”同样,在蒋玉斌看来,找到技术应用与古文字研究的结合点,能弥补人脑人力所不及的方面。

如何将数字技术融合到古文字研究?近年来古文字学者一直在探索。安阳师范学院甲骨文信息处理实验室利用深度学习技术对甲骨碎片进行了自动缀合,到目前为止共缀合甲骨碎片4144组,并发布了甲骨文的检测、识别、手写数据集。河南大学和首都师范大学联合研发的“缀多多”软件已成功缀合40组甲骨,实现了由人工智能驱动的甲骨缀合。“这是机缀甲骨很好的开端。”蒋玉斌说,“我们还要优化算法,提高效率,实现人机协同的大规模甲骨缀合。”

缀玉联珠,含英咀华。数字技术的力量让三千年前古文字珠联璧合。在这些甲骨“拼图人”看来,缀合只是一个开始,传承这门“冷门绝学”的道路还很遥远,追寻文字背后的历史和文化的脚步也不会停歇。


(编辑:王小莉)