在政务、商务、法务等场景,一份文件是否盖章,往往代表着它是否生效,是权威性和法律效力的象征;进入数字时代,印章的电子化和自动识别也成为了刚需。然而,这枚小小的印章,却是AI识别中长期存在的难题:文字弯曲、模糊遮挡、图文重叠、颜色干扰......让传统OCR束手无策。
为解决这一难题,浪潮软件灵犀有言团队(以下简称“团队”)推出专用印章识别解决方案,通过“化繁为简、分步突破”的策略,实现高精度、轻量化、可落地的智能识别。
面对复杂多变的印章场景,团队放弃“一步到位”的通用模型思路,转而采用三步走策略:
印章AI识别“三步走”
第一步,印章检测:基于YOLO的高鲁棒性定位。首先将文档统一转换为标准图像格式,利用改进的YOLO目标检测模型精确定位印章区域。该模型在训练中引入旋转增强与低对比度模拟,显著提升对倾斜、褪色、边缘模糊印章的检出率。同时,结合几何先验(如圆形/椭圆约束),自动裁剪并输出标准化的印章子图,为后续处理提供高质量输入。
印章检测实例
第二步,印章分类:轻量级CLS模型判别颜色与类型。在获取印章图像后,部署基于YOLO-CLS架构的图像分类模块,快速判别印章颜色(红、蓝、黑白)及基本类型(公章、财务章、法人章等)。该步骤不仅辅助判断文件真伪(如彩色复印件与原件差异),也为下游识别路径提供决策依据,实现“按需调用”。
印章种类示意图
第三步,采用三大技术路线,各显其能,实现印章文字识别。
①极坐标展开 + 传统OCR:高效稳定,适用于标准章。针对清晰、规整的圆形公章,采用极坐标变换技术将环形文字映射为矩形带状区域,消除曲率畸变。
极坐标展开公式
随后调用轻量级OCR引擎(如PP-OCR)进行直线文本识别。该方案计算开销小、部署灵活,避免深度模型“幻觉”风险,适用于高吞吐量场景。
极坐标展开示意图
②TROCR(Transformer-based OCR):端到端识别,应对残缺与噪声。对于老旧文档、扫描模糊或部分遮挡的印章,采用基于Vision Transformer的TROCR模型。该模型将图像编码为序列特征,直接生成文本输出,无需显式文字检测与分割。经8000+真实与合成样本微调后,在低信噪比场景下准确率达95%以上,具备强鲁棒性。TROCR由图像编码器与文本解码器构成,通过对模型进行微调,可以适用弯曲印章的识别,并且由于其解码器连续上下文的特性,对于复杂图片有很强的辨别能力。
TROCR示意图
③DB++ + 极坐标 + SVTR:两阶段精细识别,专攻高密度复杂章。针对文字环排紧密、字号小、字体复杂的印章(如外资企业章、专用章),采用两阶段方案:首先使用改进的DB++(Differentiable Binarization++)检测弧形文字区域,生成高精度概率图与阈值图,有效拟合不规则弯曲文本。DB++算法核心通过概率图与阈值图拟合成的二值图,外扩找到对应的范围;在训练过程团队手动生成了大量数据弥补了数据不足导致的误差。随后结合极坐标校正拉直文字流;最终由SVTR(Sequence Visual Transformer)模型完成细粒度字符识别。团队自主研发了合成数据生成算法,通过字体模拟、形变注入与红章渲染,大幅提升模型泛化能力。
DB++算法示意图
团队设计了智能路由机制,根据印章的清晰度、形状、遮挡情况,动态选择最优识别路径。三种方法互补协同,无论是模糊章、重叠章还是标准章,都能应对自如,整体识别准确率显著提升。
为保障方案在政务、金融等异构环境中的适用性,所有模型均通过ONNX(Open Neural Network Exchange)协议进行格式统一,并依托ONNX Runtime实现跨平台、跨框架(PyTorch/TensorFlow)高效推理,支持边缘设备与云端部署。
ONNX示意图
指标评测
准确率(ACC):成功识别印章文件数除以总文件数,该指标越接近1越好
字符错误率(CER):识别错误的字符数除以总字符数,该指标越低越好
本次挑选了100张证照与文件进行评测,分别评测了传统OCR方案,与印章识别方案进行了比较。
各方法指标对比表
模型 |
ACC |
CER |
极坐标+传统OCR |
0.74 |
0.32 |
印章识别综合方案 |
0.85 |
0.12 |
传统OCR方法对于印章有遮挡模糊的情况识别效果并不是很好。浪潮软件的方案则能识别全部印章,排除文件干扰、仅基于印章识别,因此 CER 指数低。
文件识别效果展示:
挑战:文件像素较低,印章模糊且遮挡严重,人眼无法识别
效果:成功识别出并找到全部印章完美完成任务,示意图如下:
识别实例
浪潮软件灵犀有言团队始终致力于基于行业场景需求,持续深入AI领域技术和应用的研发,更好地解决实际场景中的痛难点。面对印章识别这一“小而难”的挑战,团队选择回归本质:拆解问题、分步求解、因地制宜,最终实现了相比传统方案识别效能显著提升。这套轻量化、可部署的方案,将助力政务领域“人工智能+”应用更加稳健、高效地前行。

