大数跨境
0
0

你是猴子派来折磨我的么 !这验证码到底都是干嘛的?

你是猴子派来折磨我的么 !这验证码到底都是干嘛的? 易道博识
2020-10-22
0
导读:哪来的这么些公交车消防栓!
大家都是这么多年网上冲浪过来的,基本上就没有不知道验证码这玩意的。但这些年来,验证码被玩得越来越花,在激怒和逗笑我们的边缘疯狂试探……



特别是在遇到滑动式验证码这种细致活儿时,就经常因为手抖而前功尽弃。



当反复错误几次之后,终于忍不住爆发:你天天不知道在哪搞的这些公交车、消防栓,到底是想干嘛!?


是啊,这种明显让用户体验不佳的东西,到底有啥存在的意义呢?


其实啊,验证码的用处可以用简单的一句来解释清楚:区分计算机和真正的人。


而这一切要从验证码的历史讲起。



1



验证码技术


 网上冲浪的护航者 


验证码英文叫做 “ CAPTCHA ”,这七个大写的字母是 “ Completely Automated Public Turing test to tell Computers and Humans Apart ” 这个超长词组的缩写,直译就是 “ 全自动区分计算机和人类的图灵测试 ”



而图灵测试是人工智能圈一个著名的实验:实验者询问一台机器和一个人类一些问题,如果实验者无法分辨他俩的差别,那么这台机器便通过的图灵测试。


计算机科学之父,人工智能之父

才华与颜值并存的大帅锅 图灵


验证码就是这个图灵测试的反向和变种,用来区分计算机和人类。


在 2000 年初,互联网的浪潮刚刚在全世界掀起,当时最让大伙苦恼的一件事就是垃圾邮件太多了。甚至有一群家伙还特意制作了程序,可以终日无休地大量注册新邮箱账号,然后用来发送垃圾推广邮件。


公司封号删除的速度远远赶不上他们注册的速度,用户邮箱中的重要邮件也常常被一大波的垃圾邮件所淹没。


互联网公司和用户都深受其苦。


一位名叫 Luis 的天才程序员就想到了法子,他发现计算机程序很难认清手写的文本,而人类可以轻松地看懂。可以在注册账号的时候设一道门槛,必须输入 “ 歪曲 ” 的文本才能完成注册,用来识别计算机和真人。


创造了“验证码”和“Duolingo”

身家7亿美元的天才数学教授Luis Von Ahn


验证码从此孕育而生,无数的黄牛、垃圾邮件、还有爬虫程序就这样被验证码挡在了外面。


随着计算机的识别技术越来强,验证码也变得越来越 " 扭曲 ",验证码的形式和花样也越来越多。


但到目前为止,输验证码还是区别人和计算机最有效率的方法。



2




OCR ( 光学字符识别 )


悄悄照亮世界的光芒


随着 OCR ( 光学字符识别 )技术和 AI 的发展,验证码也在不断被破解中,过去简单扭曲一下的字母,可挡不住现在的程序了。


但无论验证码怎么进化,只要你是真真切切的人,验证码这关都不可能真正挡住你。就像 reCAPCHA 一直所倡导的那样:Tough on bots,Easy on humans  ( 对机器人困难,对人类简单 )


Tough on bots,Easy on humans  

( 对机器人困难,对人类简单 )


说到OCR技术,早在“胜人半子”的AlphaGo出现之前的2015年,易道博识已经对深度学习进行了深入了解,并且敏锐地认识到这一技术将会将OCR行业带入崭新的领域。


从那时起,易道博识就投入核心研发力量和资源,开始了基于深度学习的OCR技术的研究。经过近三年的努力,克服重重困难,终于推出了新一代OCR产品——“易识云”。


易识云较传统的OCR技术而言,拥有诸多优势。首先,从可处理的图像来讲,传统OCR仅支持扫描仪图像;而易识云可以处理任意自然场景下用相机拍摄的图片,这一点在移动互联网时代下的今天意义尤为重大!

通过小程序“快易识”识别图片后的界面


传统OCR需要经过预处理、OCR单字识别、识别结果聚合与后处理等多个工序。而其中每一个工序都由多个子工序构成,众多工序之间是以线性管道模式串联,在这种模式下,每一个工序产生的误差都会被传递叠加到下一个工序,原始影像文件中的一点小缺陷都会被逐步放大,最终导致结果的巨大误差。因此,只有使用扫描仪,并以高标准采集的图像才可以得到较为满意的识别结果。


而易识云则由于采用了深度神经网络技术,彻底避免了以上的问题。它仅用三个工序即可完成整个识别过程:文字区域定位、整行识别、结构化输出。定位与识别均采用卷积神经网络CNN、循环神经网络RNN、长短期记忆网络LSTM技术实现,可在灰度图像上实现文字区域的自动定位和整行文字的OCR识别。


尤其是后者,彻底弥补了传统OCR技术中单字识别技术无法借助上下文来判断形似字的问题。这些因素帮助易识云在低质量图片的容忍能力与识别准确率两方面,得到显著的提升。



易识云还具有快速实施和扩展的特点。目前易识云已经支持三十多种证件、票据、凭证的识别,这一数字还在不断增加中。


了解更多OCR智能识别案例,体验分类、识别效率10倍提升的效果,扫描下方二维码,获取AI+智能OCR识别解决方案。


【声明】内容源于网络
0
0
易道博识
北京易道博识科技有限公司致力于人工智能领域的技术研究与应用开发,基于计算机视觉、机器学习、深度学习、自然语言处理等前沿技术,为企业用户提供从AI能力生产、AI能力管控、AI能力应用的全栈解决方案。
内容 292
粉丝 0
易道博识 北京易道博识科技有限公司致力于人工智能领域的技术研究与应用开发,基于计算机视觉、机器学习、深度学习、自然语言处理等前沿技术,为企业用户提供从AI能力生产、AI能力管控、AI能力应用的全栈解决方案。
总阅读55
粉丝0
内容292