导航
计算机与信息工程学院官网
您现在的位置: 首页 >> 学院新闻 >> 正文

张重生教授做客央视《透视新科技》“智”破甲骨之谜节目

日期:2023年11月06日       点击量:

 

我校计算机与信息工程学院张重生教授和首都师范大学甲骨文研究中心莫伯峰教授作为共同特邀嘉宾录制的《透视新科技》“智”破甲骨之谜节目于2023年11月5日19:41在中央电视台科教频道(CCTV-10)播出,节目时长为30分钟。

该期节目中,莫伯峰和张重生共同分享了人工智能在推动甲骨学研究方面的主要进展,包含甲骨文的破译(释读),甲骨缀合、校重,甲骨文识别等方面的工作。


关于利用人工智能破译甲骨文方式的问题,张重生在节目中指出:

目前人工智能还不能完全破译甲骨文,但是可以辅助甲骨专家去做一些事情。第一,可以先把(已经破译/释读的)甲骨文识别出来;第二是把这些(未破译的)甲骨文图像进行类聚(聚类);第三是可以把残缺的材料进行缀合(拼合),把它变得更加完整。

一是(已破译的)甲骨文的自动识别。先搞清楚输入和输出,输入就是每个字的样本,如(甲骨文中的)“蠢”字的样本都收集到,然后再把其它字如“贞”、“王”的样本也收集到,把所有字的样本都要提供给计算机,输出时需要给每个文字类别进行编码,如第一个字(类)表示“蠢”,第二个字表示“王”。输入和输出中间是算法,现在都是基于深度神经网络的技术,它在中间完成文字特征提取的工作。

二是(未破译的)甲骨文字图像聚类。虽然不认识(无法破译)某些甲骨文,但是知道哪些图像属于这些字,计算机将同一个字的材料找出来、进行聚类,让专家再进一步地确认这个字的含义,能够节约甲骨专家的时间,大大减轻其工作量。

三是甲骨拼合(缀合)。比如说有5000个乌龟壳,每个乌龟壳随时打碎,并将每个乌龟壳随机扔掉一些碎片,然后将不同乌龟壳的碎片混在一起,让计算机自动拼合(复原)。在真实情况下,甲骨碎片的边缘已经腐蚀、残损,进一步增加了拼合难度。实验阶段,在牛骨上,我们的(AI甲骨缀合技术的)缀合准确率达到99%左右;在真实应用(应用于甲骨缀合研究)阶段,我们的准确率在85%左右,因为真实应用中,数据量更大,情况更多、更复杂。

关于人工智能与甲骨文结合的研究进展,张重生在节目中指出:

张重生、莫伯峰、门艺等学者通过联合攻关,真正实现了利用人工智能批量地把残损的甲骨拼合起来,因为甲骨绝大多数都是残断、破损的,因此,甲骨缀合一直是甲骨学中的一个非常基础性的问题。张重生、莫伯峰、门艺首次利用人工智能,进行了(真正的)甲骨缀合,而过去的已有研究则停留在实验阶段。利用我们的(AI甲骨缀合)技术,在15天内就发现了35组甲骨专家在过去几十年中都没有发现的新缀,而且其中有两组还被国家图书馆用实物拼接进行验证,证明了我们的拼合结果是正确的,所以这是一个比较有意义的工作。


关于利用人工智能识别甲骨文的难点问题,张重生在节目中指出:

从数据方面,甲骨文也给人工智能的研究人员提供了一个真实的、有挑战的、困难的数据集。第一,甲骨文(中的每个文字)的数据量分布非常不均衡的,有些字出现的频率非常高,如(甲骨文中的)“王”和“贞”,而另外一些字,如“蠢”,可能仅出现几次。目前,新一代人工智能技术是数据驱动的,只能正确识别出现频率比较高的甲骨文,而对出现次数较少的(低频的)甲骨文,有可能识别不出来或正确率不高。第二,甲骨文数据本身有噪声,计算机处理这类数据,也是有挑战的。第三,甲骨文中的形似字,如“夕”和“月”,“比”和“从”,在形态上非常相似,只有专家能够准确地辨识出来,若让计算机进行精细区分,则难度非常高。

从语言方面,文字不是孤立地存在的,文字需要放入具体的语言环境中进行理解,而语言本身就有一定的不确定性,将(甲骨)文字放入一个不确定的语言中进行理解,无疑增加了甲骨文破译的难度。


关于未来利用人工智能破译甲骨文的前景,张重生在节目中指出:

从长远来说,终于有一天,这个目标是能实现的,未来可期;但是这个过程肯定需要很长的时间。如果计算机掌握了甲骨文语法编码的规律,再结合古文字专家提供的规律,尤其是文字演变的规律,如知道了某个文字的后世演变过程,其它文字如果也有类似的演变规律,我们就可以倒推(破译)某个(甲骨)文字的含义。当然,这只是一个初步的尝试,但是未来一定是可以做出来的。


张重生,男,1982年9月生,博士,河南大学计算机与信息工程学院教授、博士生导师,数据科学与人工智能实验室负责人。2012年博士毕业于法国国家信息与自动化研究所(INRIA),获得优秀博士论文荣誉。研究方向为数据科学、人工智能、古文字计算。主持20项科研项目,含国家自然科学基金项目1项、教育部人文社会科学研究一般项目1项、科技部高端外国专家项目2项;在AAAI 2023、SIGKDD 2022、IJCAI 2020等CCF-A类顶级国际会议及知名期刊上发表学术论文50篇,获得法国数据挖掘会议EGC 2010最佳论文奖及1500欧元奖金;出版著译作5部,作为第一发明人申请/授权17项国家发明专利,其中9项与古文字计算密切相关。曾受邀在中国机器学习大会、全国大数据与社会计算学术会议、IEEE数字孪生和平行智能国际会议(DTPI)的专题论坛上进行专题报告。作为主要成员之一执笔《河南省大数据产业发展引导目录》、《河南省国家大数据综合试验区实施方案》并由河南省人民政府颁布实施。主研“AI缀多多”软件,实现了人工智能批量缀合甲骨,在古文字与人工智能结合方面取得了率先突破,得到新华社、河南卫视、河南日报、环球网、腾讯网等媒体的广泛报道。


CCTV-10“智”破甲骨之谜——节目链接:

https://tv.cctv.com/2023/11/05/VIDEETfzfRLtgE4quaelIXAv231105.shtml



CCTV-10“智”破甲骨之谜——完整视频下载:


链接:

https://pan.baidu.com/s/1-mBb-mkDGDRq-V6Io61qAQ?pwd=1111

提取码:1111


上一条:计算机与信息工程学院(密码学院)举行党支部书记工作会议

下一条:河南大学计算机与信息工程学院(密码学院)举行98级校友捐赠仪式