在“识典古籍”平台上,可以全文检索、开放图文对照阅读的古籍书目已经超过一万部了。距离2022年项目开始、平台上线以来,已有两年有余。
为了让所有人都能开放检索我们的文明,让中华文化服务于现代社会,“识典古籍”建设的数字资源覆盖儒家、佛家、道家基本典籍,意在全面涵盖中华文明的传承脉络。建设资源来自四部丛刊、四库全书、百衲本二十四史、径山藏、正统道藏等代表性版本;包括来自哈佛燕京图书馆等数字资源;也包括和国家图书馆出版社合作的《永乐大典》等特色内容。

为了实现快速处理大量古籍资源,“识典古籍”项目开发了古籍OCR;自动分卷、切页、正注文、标题标记;自动标点;自动命名实体识别和词条对齐;自动文言文、现代文翻译等技术。在将这些技术应用于古籍整理实践过程中,项目也克服了诸多大小问题、收到了内外部的众多反馈,技术也不断在实践中得以打磨精进。这些技术也通过“识典古籍”整理平台免费开放给广大古籍研究者和整理者,用于各类内部或开放的古籍整理项目。

在“识典古籍”上阅读古籍,完全免费、不需要登录、不限IP、不限制复制字数、全部资源皆可全文通搜。在此基础上,我们也希望借助人工智能技术,辅以学者校对,实现用新技术来利用古籍的知识。目前在部分古籍上探索的,包括在标记古籍中的人名、地名、时间之后,将它们对应到百科词条、公元年以及地图上的地理位置;以及通过实体关系图等方式,概览性地从古籍中寻找自己感兴趣的部分。最终,希望能服务广大读者、研究者,让大家能用现代化的方式高效利用传统文化资源。

“识典古籍”是一个全民共建的平台;它取得的成就也离不开大家的共同努力,特此代表项目团队对所有为平台作出贡献的个人和团队表示感谢。


