大数跨境
0
0

还在为系统无法识别少数民族语言烦恼?小编教你一招搞定

还在为系统无法识别少数民族语言烦恼?小编教你一招搞定 文通科技
2015-11-20
1
导读:面对繁忙的日常工作,小编相信大家都用过扫描仪帮助我们处理一些复杂的文件,然而很多时候当我们需要将这些文件上的......


面对繁忙的日常工作,小编相信大家都用过扫描仪帮助我们处理一些复杂的文件,然而很多时候当我们需要将这些文件上的文字提取出来的时候我们是否会想到利用ocr软件来提取内容?尤其是一些更加特殊的民族语言比如阿拉伯文,朝鲜文,柯尔克孜文等!是否也可以被转化提取呢?

下面我们以藏文识别为例:

这是小编手机里储存的一张.tif格式的图片,不管您是.pdf .tif .jpg格式的图片或不可改写的文件格式,都是可以被识别的呢!

在“设置”里选择您要识别的语种

图片扫描成功


有些读者会说,你那个图字那么小,没有说服力,谁知道是不是真的,所以我们来看这种局部的字大的图,左边和右边明显字体、字段落是不一样的。大家可以看看左右两边的字形就可以知道识别率有多么厉害了。


左边的蓝色框框表示的是程序分析该文段区域为横排文字,通过版面分析后识别率会更高!


上图左侧绿色背景区域表示的是右侧正在校对的那一行,而右侧的蓝色背景区域是左侧绿色区域浮动跟踪过来的,蓝色区域的下方就是要修改比对的识别结果区域!这样校对起来,既能方便的知道当前校对到原文哪里了,也能很快的匹配查看程序是否有识别错误的地方,好快速进行修改!


下面到了保存文件的时间啦.pdf,.xls,.txt,.tif格式任您选择。


在上图中,我们不难发现该系统不但能把藏文从图片中识别提取出来,并且能原版原样的进行还原,还支持文本校对呢,是不是觉得这个程序很棒?这就是文通TH-OCR 2013数据录入工厂民族语言识别系统,怎么样是不是很强大呢!


【声明】内容源于网络
0
0
文通科技
北京文通科技有限公司专注于OCR(光学字符识别)技术、文档影像技术和应用解决方案提供。目前已拥有跨平台(Windows/Linux/Android/IOS及嵌入式平台)智能图像处理、图文OCR、手写识别、二维码识别等自有知识产权技术。
内容 405
粉丝 0
文通科技 北京文通科技有限公司专注于OCR(光学字符识别)技术、文档影像技术和应用解决方案提供。目前已拥有跨平台(Windows/Linux/Android/IOS及嵌入式平台)智能图像处理、图文OCR、手写识别、二维码识别等自有知识产权技术。
总阅读146
粉丝0
内容405