大数跨境
0
0

从不同领域看人工智能的优劣势--AI指数报告解读

从不同领域看人工智能的优劣势--AI指数报告解读 数创时代DSG
2023-10-23
2

01

在图像分类的领域

已经可以看到人工智能明显的超过了人类的平均水平,人类平均水平的准确度是94.9%,今天人工智能的表现已经高于这个值。有一点特别值得注意的地方是,即使我们不用特别大的数据集来做训练的话,现在图像分类领域人工智能的准确度也已经达到97.9%的准确率,如果我们再加上一些额外数据集的话,准确度则可达到99.02%。

02

面部监测和面部识别领域

这个可能是大家最了解以及应用最多的一个场景。面部识别技术已经存在了几十年,不过这几年的技术进步非常显著,一些今天表现最好的面部识别算法在挑战数据集上,成功率接近100%。人脸识别可以广泛的运用于交通,跨境旅行,以及防伪一些敏感的文件加密,同时运用在考场上起到监督作用。下面的图我们可以看到,如果在戴口罩的情况下,误识率低至14‰,如果不带口罩,只有2‰的的误识率。这个识别错误率远远超越了人类视觉平均值的5.19%。

估计有些人会非常不服气,识别个人,我还能认不出来吗?拉低平均值的一定是那些有脸盲症点人!

给大家看个因人脸识别不准确而导致刑事案件误判的真实案例:

2014年美国发生连环银行抢劫案,警方随后逮捕了Steve Talley。他在警察局内遭到了殴打,并被拘留了近两个月。他前妻认定他是抢劫现场录像中的罪犯,一名FBI的面部识别专家同样表示认同。

但最终调查结果表明Talley不是肇事者。不幸的是,逮捕使他受到了非常大的伤害:他失去了工作,一段时间内甚至无家可归。

03

人体姿态估计

人体姿态估计是计算机视觉中的一个重要任务,也是计算机理解人类动作、行为必不可少的一步。

在2021年,表现最好的“人体姿势估计模型”正确识别率达到了99.5%这一关键点。(使用LSP体育姿势数据集)

LSP(Leeds Sports Pose) 是一个体育姿势数据集,其被分为竞技、羽毛球、棒球、体操、跑酷、足球、排球和网球几类,共包含约 2000 个姿势注释,图像均来自于 Flickr 的运动人员。

每张图像均为3通道的彩色图像,其像素的行范围为:[64,202],列范围为:[57,202],并且每个图像都注有 14 个关节位置,其左侧和右侧关节始终以人为中心进行标记

3D领域的人体姿态估计是个更有挑战性的项目,

Human3.6M 是一个超过360万张,集合了17种不同类型的人体姿势的图片(打电话、讨论、吸烟等)影像集合。

均每次关节位置误差(Average Mean Per Joint Position Error (MPJPE))以每个关节位置误差的平均平均值(以毫米为单位)来衡量,这是AI模型的位置估计与实际位置注释之间的平均差值。在2014年,表现最好的误差为16厘米,是标准尺子的一半大小。到2021年,这一数字下降到1.9厘米,还不到一个普通回形针的大小。

04

医学图像分割领域

医学图像分割是指人工智能系统对医学图像中感兴趣的对象进行分割的能力,如器官、病变或肿瘤。

这项任务中的技术进步对简化医疗诊断至关重要。医学图像分割的进步意味着医生可以花更少的时间在诊断上,更多的时间在治疗病人上。

VC-Clinic DB是一个数据集,包括来自31次结肠镜检查的600多张高分辨率图像。Kvasir-SEG是一个由医生手工分割并由专业胃肠病学专家交叉验证的1000张高分辨率胃肠道息肉图像的公共数据集。这两个数据集都用于跟踪医学图像分割的进展。

AI的性能以平均DICE来衡量,它代表人工智能系统识别的息肉段与实际息肉段之间的平均重叠。AI系统现在能够以94.2%的CVC-Clinic DB正确分割结肠镜息肉,比2015年提高了11.9个百分点,比2020年提高了1.8个百分点。在Kvasir-SEG上也取得了类似的进展,目前表现最好的AI模型可以精确分割胃肠道息肉,准确率为92.2%。MSRF-Net模型在CVC-ClinicDB和Kvasir-SEG基准测试中都取得了最佳结果,MSRF-Net也是第一个专门为医学图像分割设计的模型。

不是所有的人工智能算法都是超越人类的好消息,我们也来看看目前接近人类水平和有差距的方面:

01

视觉问答领域

根据下面图像,想象一个系统,它可以回答这些问题

  • 图中谁带了眼镜?

  • 图中婴儿坐在哪里?

  • 伞上下颠倒了吗?

  • 床上有一个孩子?

尽管作为人类,我们通常可以轻松地执行此任务,但研发具有这些功能的系统似乎更接近于科幻小说。但是今天人工智能的准确度达到79.78%,这个比例已经非常接近人类的平均值80.80%。

02

视觉常识推理领域

视觉常识推理挑战是视觉理解相对较新的基准。VCR要求人工智能系统回答关于图像中呈现的场景的具有挑战性的问题,并提供答案背后的推理。就像下图中右下角的人,右手指向另外一个,跟他一起共同用餐的小伙伴,对人类来说这个推理是非常简单,大家一看就知道这个食物是他的。但是对人工智能来说怎么样判断却是非常有意思的事情。

自从这项挑战首次亮相以来,人工智能算法的性能,已经取得了长足的进步,在2021年底,最高分数是72%比2 018年提高了63%。但是值得注意的是,现在改进的幅度越来越小,这表明可能需要发明新的技术来提升。而且72%是远远落后于目前人类的基准水平的85%。

03

英语语言的理解领域

英语语言理解是指人工智能在各种语境下理解英语语言,比如理解句子,阅读理解、逻辑推理。

尽管人工智能系统目前能够在简单的问题上取得相对高的表现水平,但是他们在复杂的问题集上,表现的仍然不尽如人意。

04

文本摘要领域

就像其他自然语言领域一样,进展似乎趋于平稳。

05

机器翻译

英语-德语和英语-法语

WMT展示了,从2014年以来过去10年里,人工智能机器翻译取得的重大进展。在这10年里,英法翻译能力提高了23.1%英德翻译能力提高了68.1%。但是我们可以看得到,在翻译领域里面跟大家的感知是一样的,能够完全替代人,给我们带来再创作般唯美翻译的机器翻译系统还有待时日。

关注我们,了解更多
文章来源:知乎@fat3

点分享

点收藏

点在看

点点赞

【声明】内容源于网络
0
0
数创时代DSG
数创时代DSG为CXO和其他数字化领导者,提供关于数字化转型、业务复杂性、组织变革和数字化工作方式等主题的见解。和企业管理人员共同迎接全球化、数字化、不确定性等组织所面临的挑战。
内容 303
粉丝 0
数创时代DSG 数创时代DSG为CXO和其他数字化领导者,提供关于数字化转型、业务复杂性、组织变革和数字化工作方式等主题的见解。和企业管理人员共同迎接全球化、数字化、不确定性等组织所面临的挑战。
总阅读1.2k
粉丝0
内容303