谷歌新算法突破:90%准确率识别街景门牌号,挑战验证码安全性
谷歌最新开发的算法在识别“街景”图像中的门牌号码方面表现出色,可帮助用户获得更精准的位置信息。与此同时,该算法也因能够识别高达99%的验证码(CAPTCHA)而引发关注。
谷歌表示,这套新算法可以在90%的时间内成功读取街景图像中高难度数字。这一成果来源于谷歌街景团队与reCAPTCHA团队的联合研究。在自然图像中提取此类数据一直是技术难题,由于光照差异、动态模糊和焦点不清等因素影响识别效果,但对于谷歌地图项目而言,这类信息又是不可或缺的重要数据。
此前常规做法是分别进行定位、分割和识别等步骤,而此次的新算法将这些流程整合,并采用“深度卷积神经网络”——一种对图像识别极为有效的技术模型。在利用公开的“街景门牌号码”(Street View House Numbers)数据集测试时,算法的整体识别准确率达到96%,若按每个数位(per-digit)计算,则能达到97.84%。
目前该系统已助力谷歌抓取了全球近1亿个门牌号码。
为验证该算法性能,谷歌还使用自有reCAPTCHA验证码作为测试内容。结果显示,即使是最难的reCAPTCHA验证码,新算法也能达到99.8%的识别准确率。该结果远超大多数人类用户的识别能力。
这种表现对验证码体系带来了挑战,但谷歌解释称,现在的reCAPTCHA不再仅仅依赖识别歪曲文字作为主要防御机制,而是从更广泛的线索中评估互动行为是否来自人类。输入验证码仅是一个参考因素,reCAPTCHA将其视为“引出定义人与机器人行为特征的互动媒介”。


