大数跨境
0
0

超过一万部古籍在“识典古籍”开放阅读检索了

超过一万部古籍在“识典古籍”开放阅读检索了 字节跳动公益
2024-11-26
2
导读:在“识典古籍”平台上,可以全文检索、开放图文对照阅读的古籍书目已经超过一万部了。

在“识典古籍”平台上,可以全文检索、开放图文对照阅读的古籍书目已经超过一万部了。距离2022年项目开始、平台上线以来,已有两年有余。


为了让所有人都能开放检索我们的文明,让中华文化服务于现代社会,“识典古籍”建设的数字资源覆盖儒家、佛家、道家基本典籍,意在全面涵盖中华文明的传承脉络。建设资源来自四部丛刊、四库全书、百衲本二十四史、径山藏、正统道藏等代表性版本;包括来自哈佛燕京图书馆等数字资源;也包括和国家图书馆出版社合作的《永乐大典》等特色内容。


为了实现快速处理大量古籍资源,“识典古籍”项目开发了古籍OCR;自动分卷、切页、正注文、标题标记;自动标点;自动命名实体识别和词条对齐;自动文言文、现代文翻译等技术。在将这些技术应用于古籍整理实践过程中,项目也克服了诸多大小问题、收到了内外部的众多反馈,技术也不断在实践中得以打磨精进。这些技术也通过“识典古籍”整理平台免费开放给广大古籍研究者和整理者,用于各类内部或开放的古籍整理项目。



在“识典古籍”上阅读古籍,完全免费、不需要登录、不限IP、不限制复制字数、全部资源皆可全文通搜。在此基础上,我们也希望借助人工智能技术,辅以学者校对,实现用新技术来利用古籍的知识。目前在部分古籍上探索的,包括在标记古籍中的人名、地名、时间之后,将它们对应到百科词条、公元年以及地图上的地理位置;以及通过实体关系图等方式,概览性地从古籍中寻找自己感兴趣的部分。最终,希望能服务广大读者、研究者,让大家能用现代化的方式高效利用传统文化资源。


“识典古籍”是一个全民共建的平台;它取得的成就也离不开大家的共同努力,特此代表项目团队对所有为平台作出贡献的个人和团队表示感谢。



【声明】内容源于网络
0
0
字节跳动公益
字节跳动公益聚焦“推动科技普惠”“丰富文化生活”“增进社会福祉”“应对气候变化”四大方向,结合公益平台与基金会,发挥企业的包容性、创造力与共创性,携手每一位伙伴,鼓励员工参与,共同为公益创造新的可能
内容 742
粉丝 0
字节跳动公益 字节跳动公益聚焦“推动科技普惠”“丰富文化生活”“增进社会福祉”“应对气候变化”四大方向,结合公益平台与基金会,发挥企业的包容性、创造力与共创性,携手每一位伙伴,鼓励员工参与,共同为公益创造新的可能
总阅读134
粉丝0
内容742