我系与人工智能学院联合举办“多元化史学”工作坊

       2022年9月17日,历史学系(珠海)、人工智能学院共同举办“多元化史学工作坊——史料的发掘与结构化整理”,活动在珠海校区海琴六号A324进行。

       两院系老师与学生齐聚,共同讨论在前沿的人工智能技术基础上,如何对史料中的有效信息进行挖掘整理以及数据库建设等相关问题。

       工作坊由历史学系(珠海)系主任吴滔教授主持。吴滔老师指出,自上个世纪八九十年代起在历史学的研究中,统计技术乃至计算机技术的引入已成为时代潮流。这次工作坊的目的是继承发扬中山大学社会经济史重视典章制度的传统,尝试在定量研究和数字人文的基础上进行更多的讨论与交流。

       本次工作坊共有三组报告,主要围绕史料信息挖掘中OCR技术的应用以及后续数据库技术等应用实践问题展开讨论。

       第一组报告中,人工智能学院赵宝全副教授围绕史料挖掘的问题作了题为“人工智能视角下的史料发掘与数据库建设”的专题报告。

       赵老师提到,目前使用AI技术进行史料发掘已经有相当丰富的经验,已在各类平台上广泛使用,其中OCR技术的应用有着相当广阔的前景。赵老师从OCR技术的机制、古文字识别以及数据结构化处理等多个角度,介绍了OCR技术在古籍识别中的应用场景及特点。

       在报告的最后,基于目前AI技术在史料发掘中的应用,赵老师提出了几个方面的思考。第一、数据的获取可以利用众包的模式进行批量化处理;第二、在数据分析和应用方面可以利用计算机视觉、自然语言处理、可视化与可视分析等方式进行分析;第三、人工智能开展的大数据史料挖掘只是一个基本样态,而“活”的问题阐释则需要人文社会学科学者进一步创造性的质性分析,最终实现跨学科新思路、新视角、新问题、新活力的深度融合。

       第二组报告由历史学系(珠海)硕士研究生何旭荣负责。他主要从价格数据库的开发与实践经验出发,讨论明代价格数据库的运行原理以及延伸开发的发展方向。

       首先,他指出数据库开发的主要问题在于史料的多样性与性质的复杂性,认为这是开发过程的一大难点,同时也是价格数据库核心功能所要解决的问题。其次,价格数据库开发在不同层面上尤其是财政收支数据上的应用具有广阔前景。最后,他在价格数据库开发的基础上,讨论了价格和财政收支数据的联动研究,并希望能最终解决在贡赋经济的体制下,中央的财政收支与各地方市场运作机制的具体运作逻辑关系问题。

       第三组报告由“明代价格研究与数据库建设”项目组成员、华南理工大学硕士梁君达负责。他从数据库开发等相关技术层面的问题出发,作题为“明代物料价格数据库管理系统的设计与实现”的报告。报告介绍了价格数据库的开发技术与运作机制,以及价格数据库的录入模块如何实现史料数据的输入,最终把“纸上”的史料转化为数据库中可供分析的数据。

       专题报告结束后,老师和同学们进行了充分的讨论。吴滔老师认为,一方面,在传统人工的层面上进行物价研究尤其是物料研究相当困难,人工智能技术的应用则让这方面的研究大有可为。另一方面,人工智能技术的应用不仅仅体现在历史学研究上,在历史学教学方面可能也有一定合作空间。历史学系(珠海)李骛哲副教授提到,人工智能技术在碑文还原等方面已经有一定的成果。目前在中国第一历史档案馆等大型档案馆中存有大量清代文献,这批文献的数字化、结构化在古籍整理层面上有着巨大的发展空间。最后,吴滔老师在会上做出总结,认为通过历史学学者们提供“素材”、计算机专业学者们提供“方法”的方式,可以进行更多合作,并对日后的合作与交流表示期待。