大数跨境
0
0

【人工智能】AI 开发中脏数据的高昂成本

【人工智能】AI 开发中脏数据的高昂成本 七元宇宙
2024-11-04
0
导读:在数据是新石油的时代,确保其纯度不仅是技术上的需要,也是战略上的当务之急。今天投资于清洁数据的企业将成为明天创新前沿的引领者。

众所周知,人工智能 (AI) 开发领域正掀起一股淘金热。根据微软和领英发布的《2024 年工作趋势指数》,超过 40% 的企业领导者预计,他们将在未来几年内利用 AI 彻底重新设计其业务流程。这一重大转变不仅仅是技术升级,更是企业运营、决策和与客户互动方式的根本转变。这种快速发展推动了对数据和第一方数据管理工具的需求。根据Forrester 的调查,高达92% 的技术领导者计划在 2024 年增加数据管理和 AI 预算。 

在最新的麦肯锡全球 AI 调查中,65% 的受访者表示,他们的组织经常使用生成式 AI 技术。虽然这一采用标志着一次重大飞跃,但也凸显了一个关键挑战:为这些 AI 系统提供数据的质量。在一个 AI 的有效性取决于训练数据质量的行业中,可靠而准确的数据正变得越来越难以获得。



不良数据的高昂代价




不良数据并不是一个新问题,但在 AI 时代,其影响被放大了。早在 2017 年,麻省理工学院 (MIT) 的一项研究就估计,不良数据使公司的收入损失高达 15% 至 25%。2021 年,Gartner 估计,不良数据平均每年给组织造成 1290 万美元的损失。 
脏数据(不完整、不准确或不一致的数据)会对 AI 系统产生连锁反应。当 AI 模型使用低质量数据进行训练时,产生的洞察和预测从根本上就是错误的。这不仅会削弱 AI 应用的有效性,还会给依赖这些技术进行关键决策的企业带来重大风险。
这给企业数据科学团队带来了巨大的困扰,他们不得不越来越多地将有限的资源集中在清理和组织数据上。在DBT 近期发布的一份工程状况报告中,57% 的数据科学专业人士认为数据质量差是他们工作中的主要问题。 



 AI 模型的影响




坏数据对 AI 发展的影响主要体现在三个方面:
  1. 准确性和可靠性降低: AI 模型依赖于从数据中得出的模式和相关性。当输入数据受到污染时,模型会产生不可靠的输出;被广泛称为“ AI 幻觉”。这可能导致错误的策略、产品故障和客户信任的丧失。

  2. 偏见放大:脏数据通常包含偏见,如果不加以控制,这些偏见就会根深蒂固地融入 AI 算法中。这可能会导致歧视性做法,尤其是在招聘贷款和执法等敏感领域。例如,如果 AI 招聘工具是根据有偏见的历史招聘数据进行训练的,它可能会不公平地偏向某些人群。

  3. 运营成本增加:存在缺陷的 AI 系统需要不断调整和重新训练,这会耗费额外的时间和资源。公司可能会发现自己陷入了不断修复错误而不是创新和改进的循环中。



即将到来的数据末日




“我们正快速接近一个‘临界点’——非人类生成的内容将远远超过人类生成的内容。AI 本身的进步为数据清理和验证提供了新的工具。然而,网络上 AI 生成的内容数量正在呈指数级增长。 
随着越来越多的 AI 生成内容被推送到网络,并且这些内容是由接受过 AI 内容训练的大语言模型生成的,我们正在预见未来第一方和可信数据将成为濒危和有价值的商品。 



数据稀释的挑战




 AI 生成内容的激增带来了几大行业挑战:
  • 质量控制:区分人类生成的数据和 AI 生成的数据变得越来越困难,这使得确保用于训练 AI 模型的数据的质量和可靠性变得更加困难。

  • 知识产权问题:由于 AI 模型无意中抓取并学习 AI 生成的内容,因此有关数据所有权和权利的问题随之产生,可能会导致法律纠纷。

  • 道德影响:数据来源缺乏透明度可能导致道德问题,例如错误信息的传播或偏见的强化。



数据即服务成为基础




人们越来越多地寻求数据即服务 (DaaS) 解决方案来补充和增强用于培训目的的第一方数据。DaaS 的真正价值在于数据本身已经针对不同的保真度和商业应用用例进行了规范化、清理和评估,以及流程标准化以适应消化数据的系统。随着这个行业的成熟,我预测我们将开始看到整个数据行业的标准化。我们已经看到零售媒体行业正在推动统一化。 
随着 AI 不断渗透到各个行业,数据质量的重要性将日益凸显。重视干净数据的公司将获得竞争优势,而忽视干净数据的公司将很快落后。 
 AI 开发中脏数据带来的高成本是一个不容忽视的紧迫问题。数据质量差会破坏 AI 系统的基础,导致错误的见解、增加成本和潜在的道德陷阱。通过采用全面的数据管理策略并培养重视数据完整性的文化,组织可以降低这些风险。
在数据是新石油的时代,确保其纯度不仅是技术上的需要,也是战略上的当务之急。今天投资于清洁数据的企业将成为明天创新前沿的引领者。

免责声明:

本文所发布的内容和图片旨在传播行业信息,版权归原作者所有,非商业用途。如有侵权,请与我们联系。所有信息仅供参考和分享,不构成任何投资建议。加密货币市场具有高度风险,投资者应基于自身判断和谨慎评估做出决策。投资有风险,入市需谨慎。

交流更多AI/Web3/Meta相关知识

⬇️点击下图⬇️


注我们,一起探索AWM

近期热

谁发明了AI

2024-10-13

如果机器人能像人类一样思考和学习会怎样?

2024-10-14

AI 模型越复杂,撒慌的可能性越大

2024-10-1

【声明】内容源于网络
0
0
七元宇宙
AI、Web3、Meta聚合型精选内容分享。以前沿视角,探索科技未来;让每一个人,都走在时代的前沿
内容 3217
粉丝 0
七元宇宙 AI、Web3、Meta聚合型精选内容分享。以前沿视角,探索科技未来;让每一个人,都走在时代的前沿
总阅读415
粉丝0
内容3.2k