大数跨境
0
0

软核科普:浅谈银豹AI识别这点事

软核科普:浅谈银豹AI识别这点事 泛华金服
2022-07-18
2
导读:银豹团餐AI智慧化食堂改造方案,使用图像识别技术在收银流程上持续发力,在很大程度上解决了团餐食堂就餐高峰期排队拥堵、就餐时间长的难题。

图片:银豹&AI


AI包括它的中文翻译“人工智能”,一直以来给人一种神秘莫测的影响,不知计算机如何做到“思考”这样一种行为。AI从小众群体彻底跨入公众视角成为全民热议话题,是从谷歌开发的Alpha Go与中韩棋手李世石、柯洁的比赛,让AI进入了大众视野。AI是如何做到的,其实没有那么神秘,我们今天从团餐AI“如何识别"来告诉大家计算机是怎么做的。


图片:柯洁苦战

而这场跨时代的比赛已过去五年,目前大众对人工智能的理解趋于极端化:


图片来源:百度图库

实际上人工智能既不是常人无法触及的概念,也不是“人工傻子”。虽然在完全代替生产力的道路上依旧路漫漫,但是在一些特定场景下,已经远超预想。



银豹的思考

也许我们目前不能用“仿真机器人”代替真人服务员,但是我们目前可以用一台机器,代替收银员这个角色在流程中的作用,让这个环节“AI化”。逐个环节用AI局限但是深度的功能突破,是我们的目标。将人工智能中的图像识别作为一个重要工具,在智能化餐厅改造过程中起到重要的作用。


图片来源:百度图库



什么是“图像识别”

只要你用眼睛和记忆生活在世界上,你就可以理解图像识别是什么

我们可以用一种比较粗浅的方式来理解图像识别,以我们人类为例,人类是怎么判断实体食物的呢,当我们还是孩童时,家长都会教我们认识事物,比如在我们牙牙学语第一次见到苹果的当下,我们不会知道我们见到的又圆又大还带点红的东西就是现实概念中的苹果,当长辈指着具体苹果实物并告知我们这就是苹果时,对于苹果的概念也将在此刻印刻在我们的记忆中,下一次再看到,我们就会自发性的在我们的记忆库中去搜索我们关于苹果图像的记忆痕迹,搜索匹配完毕,苹果这个名词也就顺其自然从我们嘴边蹦出,而这个过程就可以类似看做人工智能图像识别的过程。


图片来源:百度图库


AI图像识别技术类似于人类将看到的东西和记忆中相同或相类似的东西做匹配,通过分类并提取重要特征而排除多余的信息来进行图像区分,和人脑识物不同,该技术使用的是深度学习的方式将大规模的底层数据进行模型训练,以此得到识别的效果。



银豹AI图像识别的识别原理

我们已经了解到,在传统意义上,图像识别过程就是,在识别任务上,给出具体实物,由设备自带或外接摄像头上将对应实物图像进行拍摄采集,再根据已训练成熟的算法回答这个图片具体是什么。简单来说“培训他”。


假设深度学习要处理的信息是“水流”,而处理数据的深度学习网络是一个由管道和阀门组成的巨大水管网络。网络的入口是若干管道开口,网络的出口也是若干管道开口。这个水管网络有许多层,每一层由多个可以控制水流流向与流量的调节阀。根据不同任务的需要,水管网络的层数、每层的调节阀数量可以有不同的变化组合。对复杂任务来说,调节阀的总数可以成千上万甚至更多。水管网络中,每一层的每个调节阀都通过水管与下一层的所有调节阀连接起来,组成一个从前到后,逐层完全连通的水流系统。

图片来源:百度图库

读完上面的文字,您和您身边的朋友相比,在图像识别知识掌握部分已经是银牌选手了,让我们继续向金牌选手进发!


我们预先在网络的每个出口标记我们预想的输出,对应于每一个菜品。这时,因为输入的是“番茄炒蛋”这道菜,等数据流过整个网络,计算机就会到数据输出的出口位置确认,是不是标记由“番茄炒蛋”预期的出口输出结果。如果是这样,就说明这个管道网络符合要求。如果不是这样,就调节网络里的每一个参数,让“番茄炒蛋”出口我们期望的结果。


图片:如何“学习”番茄炒蛋



下一步,学习“红烧肉”时,我们就用类似的方法,把许多“红烧肉”的图片输入学习网络,确认是否由“红烧肉”标记的出口输出,如果不是,我们再调整所有的参数。这一次,要既保证刚才学过的“番茄炒蛋”结果不被影响,也要保证新的“红烧肉”可以被正确识别。


……不断重复……

……不断重复……


完成超过数以百万计的菜品和餐盘学习;深度学习大致就是这么一个用人类的数学知识与计算机算法构建起来的整体架构,再结合尽可能多的训练数据以及计算机的大规模运算能力去调节内部参数,尽可能逼近问题的建模方式。


图片来源:百度图库


银豹设计的深度学习网络通过发现经验数据中错综复杂的结构进行学习。我们设计的卷积神经网络深度学习模型使用超过一百万张菜品/餐盘图片,超过一千种餐盘图像进行训练,从所采集图像中进行学习。对图像中餐盘/菜品的特征分组(如菜品的颜色、比例,餐盘的形状、颜色),并将表示这些特征的像素分类成组。银豹向系统提供极大量的图像,系统便可以自主学习形成各种餐盘和菜品的特征。





银豹&图像识别




银豹如何一步步优化模型,其中遇到了哪些困难

如何获取大量且丰富的数据用于底层模型训练一直都是一个棘手的问题,银豹深耕行业多年,已积淀足量多的客户,在智慧化食堂改造已为大势所趋的今天,较多现存客户愿意在原有传统收银的基础上进一步进行食堂智慧化的升级过程,在客户信任助力的基础上,银豹得以进行最初模型的建立。


目前银豹识别模型已经过海量数据训练,迭代更新多个版本,图像识别在现有识别算法基础上,使用特有的方式进行数据模型训练,根据每次底层数据的差异及训练过程,得到不同的权重结果,在相同测试集进行测试得到96%以上的准确率模型权重的基础上,再进一步进行图像增强策略训练,以达到最终较高识别率的精准输出。



银豹团餐AI有哪几种识别模式

银豹在智慧食堂解决方案上搭建了两种识别模式,分别为餐盘识别及菜品识别,这两种识别模式对应使用的都是我们传统意义上的AI图像识别技术。

图片:银豹识别模型





【声明】内容源于网络
0
0
泛华金服
致力于“互联网+”创业信息传播,为实体经营者提供动力、前沿趋势报道、营销策划支持与管理工具,塑造泛华品牌,提供金牌服务。
内容 604
粉丝 0
泛华金服 致力于“互联网+”创业信息传播,为实体经营者提供动力、前沿趋势报道、营销策划支持与管理工具,塑造泛华品牌,提供金牌服务。
总阅读114
粉丝0
内容604