大数跨境

一文读懂生成式人工智能|CXO Generative AI指南

一文读懂生成式人工智能|CXO Generative AI指南 数据驱动智能
2024-07-17
7

一概述

人工智能技术正在改变世界的商业运作方式。生成式人工智能(Generative AI)是指使用人工智能来创建新内容,如文本、图像、音乐、音频和视频。它可以生成各种内容,包括图像、视频、音乐、语音、文本、软件代码和产品设计。生成人工智能有助于加快产品开发速度、增强客户体验并提高员工生产力。

麦肯锡将生成性人工智能定义为可用于创建新内容的算法(例如ChatGPT),包括音频、代码、图像、文本、模拟和视频。

生成式人工智能由基础模型(大型人工智能模型)提供支持,可以执行开箱即用的任务,包括总结、问答、分类等。

本文涵盖了生成式人工智能技术的行业采用、生成式人工智能的特点、生成式人工智能采用步骤和挑战、生成式人工智能参考架构和生成式人工智能的优势。它还涵盖了生成式人工智能技术采用的实际用例。

1.生成式人工智能的行业应用

Gartner称,“任何行业的任何组织,尤其是那些拥有大量数据的组织,都可以利用人工智能实现商业价值。”生成式人工智能将在未来五年内对企业产生越来越大的影响。

·到2025年,30%的企业将实施人工智能增强开发和测试策略,高于2021年的5%—Gartner

·到2026年,生成设计AI将使新网站和移动应用程序60%的设计工作实现自动化—Gartner

·到2027年,近15%的新应用程序将由人工智能自动生成,无需人工参与。这在今天根本不会发生——Gartner

根据埃森哲的2023年技术愿景报告,97%的全球高管同意基础模型将实现跨数据类型的连接,彻底改变人工智能的使用地点和方式。

最近的CEO调查显示,近80%的CEO认为人工智能可能会显著提高其组织的业务效率—《福布斯》

如今,估计有60%的IT领导者正在寻求实施生成式AI—CIO.com

生成式人工智能被评为顶级新兴企业技术。80%的人认为它将颠覆他们的行业,几乎所有人(93%)都认为生成式人工智能将为他们的业务带来价值—毕马威

生成式AI编码支持可帮助软件工程师将代码开发速度提高35%至45%,将代码重构速度提高20%至30%,将代码文档编写速度提高45%至50%-麦肯锡

预计未来五年内,44%的员工核心技能将发生变化。培训员工利用生成式人工智能将至关重要—世界经济论坛。

从现在到2027年,各公司都将人工智能训练视为最高战略重点之一—DataBricks

2.生成式人工智能的商业案例

许多CXO认为IT预算存在超支现象,并不断寻找降低成本和精力的方法。

技术进步的能力是“用越来越少的资源做越来越多的事情,直到最终可以用零资源做所有的事情”。——R.巴克敏斯特·富勒,建筑师、系统理论家、作家、设计师、发明家、哲学家和未来学家。

利用生成式AI推动业务成果需要企业团队的战略和协作。以下战略层面的问题有助于了解企业对生成式AI采用的准备情况。

·生成式人工智能是否有CXO授权

·是否有与一个或多个驱动因素相关的生成式人工智能的高层管理级别章程。

·企业是否已发布生成式人工智能商业战略

·生成式人工智能如何帮助增强现有流程和企业战略

·谁将对生成式人工智能计划做出最终决定(仅限商业、商业和IT、仅限IT)

·是否建立了内部业务案例?如果是,在哪个层面?

·现有的MLOps技术堆栈和平台许可证是否支持生成式AI,还是需要第三方服务

·劳动力是否具备使用生成式人工智能的技能,这对人才获取和技能提升有何影响

·部署生成式人工智能时会出现哪些风险,以及这些风险如何影响生成式人工智能的价值

·当前和预期的法律法规涉及生成式人工智能的使用,现有的治理和MLOps流程是否足以满足这些法律法规

·生成式人工智能计划何时启动(未来3个月、未来6个月、1年以上)

二关键术语

人工智能:这是一种使机器能够模仿人类行为和认知能力的技术。它包括机器学习。

机器学习:它使用统计方法根据过去的经验改进任务。它包括深度学习。

深度学习:它使用神经网络训练机器执行任务。它由多层互连节点组成,用于图像和语音识别等任务。它包括生成式人工智能。

神经网络:模仿人类大脑的机器学习算法。它由多层相互连接的神经元组成,用于处理和分析数据。

NLP:它涉及计算机和人类语言之间的交互。它包括文本分析、情感分析、语音识别和机器翻译。

生成式人工智能:它是一组描述我们想要的东西的模型,可视化并生成与提示相匹配的内容。生成式人工智能加速了构思,将愿景变为现实,并让我们有更多的时间投入到创意中。它创建各种各样的数据,如图像、视频、音频、文本和3D模型。通常使用大型语言模型,例如:ChatGPT、OpenAI。

大型语言模型:这是一种生成式人工智能算法,使用深度学习技术和庞大的数据集来生成和预测新内容。

三生成式人工智能技术的关键特征

以下是生成式人工智能技术的主要特征,

  • 文本管理:生成式人工智能可以以连贯的方式完成给定的文本。它可以将文本从一种语言翻译成另一种语言。它可以将文本总结为更短、更简洁的形式。它可以生成模仿人类写作的文本。

  • 上下文理解:生成式人工智能具有强大的理解上下文的能力。

  • 自然语言处理:它可以执行各种NLP任务。理解和处理人类语言,让用户以对话的方式提出问题。

  • 问答:生成式人工智能可以根据知识库回答问题。

  • 个性化:生成式人工智能可以针对特定用例进行微调。

  • 多语言支持:生成式人工智能可以用多种语言执行NLP任务。

  • 高级语义搜索:支持对大量结构化和非结构化数据(包括数据库、文档等)进行语义搜索。此外,还支持使用基于自定义AI/ML的数据处理进行自动数据索引,以实现高效嵌入。

  • 内容审核:针对企业特定数据进行训练的查询和响应的智能内容过滤和审核引擎。

  • 集成:可以与组织内的各种应用程序/数据源集成,包括CRM、ERP和其他专有系统,以通过API访问和分析数据。

  • 基于角色的访问控制:系统可以设置基于角色的访问控制,确保用户只能访问和查询他们有权限查看的数据。

  • 软件编码:代码生成、翻译、解释和验证。

四生成式人工智能的采用步骤

以下是在整个企业中实施生成式人工智能所要遵循的步骤。

生成式人工智能准备情况评估:建立一个执行团队,负责识别和监督整个组织的人工智能计划。为生成式人工智能实施制定清晰的愿景和战略,使其与企业目标和业务功能保持一致。为员工制定切实可行的沟通方式和适当的访问权限。

业务用例识别:识别需要关注的业务挑战。此外,了解采用人工智能对企业成功至关重要的业务优势。选择目标用例并执行概念验证(POC),以实现所需的业务和运营成果。通过提高生产力、增长和新业务模式来创造价值。

确定流程:了解人工智能解决方案的影响并确定其成功衡量标准。创建持续监控和审计生成式人工智能系统的流程,以负责任地使用人工智能,确保符合法律和技术标准。定义人工智能系统的数据访问控制、数据共享协议和数据生命周期管理程序。从试点转向生产,包括将生成式人工智能功能集成到更大的IT系统中。迭代并学习符合企业目标和愿景的潜在生成式人工智能。

识别数据源:通过处理结构化和非结构化数据源来实现对高质量数据的访问。

评估生成式AI工具:评估适用于企业业务的生成式AI工具。该工具需要遵守企业标准,如安全性、隐私性、数据处理和合规性。该工具需要授权利益相关者满足业务需求,并根据业务指标不断改进其生成的体验。

生成式人工智能治理:在整个企业内建立生成式人工智能治理。定义参与生成式人工智能开发、部署和监控的个人的角色和职责。促进人工智能专家、领域专家和业务利益相关者之间的合作。建立一个集中的跨职能团队,根据技术、法规和企业需求审查和更新生成式人工智能治理实践。

技能提升:通过开展各种培训课程重新培训员工,提高生产力,并鼓励他们执行POC。此外,根据员工的角色和技能,确定技能差距并进行有效培训,以更好地为企业转型计划做出贡献。

建立员工队伍:教育员工如何使用生成式人工智能技术、它们在企业系统中的使用、使用生成式人工智能的挑战以及如何克服这些挑战。进行结构化培训以培养新技能并应用新思维方式,为最终用户提供更好的体验。制定沟通机制,让员工了解生成式人工智能技术及其含义。

五生成式人工智能原则

生成性人工智能涵盖人工智能系统的设计、开发和监控,以增强和提高整个企业的生产力和工作质量。

下图描述了生成式人工智能原则,分为战略、应用、数据分析、技术、安全和治理。

下面介绍了12大生成式人工智能原则及其基本原理。

原则1:人们应该对人工智能系统负责。

理由:建立监督机制,使人类能够承担责任并保持联系。评估系统对人员和组织的影响。

原则2:人工智能系统应该透明、可理解。

原理:设计人工智能系统以智能地进行决策。人工智能系统旨在告知人们他们正在与人工智能系统交互。

原则3:人工智能系统应该公平对待所有人。

理由:人工智能系统旨在为特定人口群体提供类似质量的服务

原则4:人工智能系统应该赋予每个人权力并让每个人参与进来。

理由:人工智能系统的设计符合企业可访问性标准

原则5:在整个企业实施AI微服务。

理由:快速构建利用微服务组件的应用程序。GemAI平台必须提供跨企业的基于AI的软件服务综合目录。

原则6:支持全生命周期AI模型开发。

理由:生成式人工智能平台支持集成的全生命周期算法开发体验。

原则7:设计系统的数据质量管理

理由:训练数据可供企业AI系统使用

原则8:统一所有企业数据。

原理:将来自众多系统的数据集成为统一的联合数据。数据必须是最新且实时的。

原则9:访问多格式数据

理由:该平台需要支持数据库技术,包括关系数据存储、分布式文件系统、键值存储、图形存储以及传统应用程序。

原则10:提供企业数据治理和安全。

理由:生成式人工智能平台必须提供强大的加密、多级用户访问认证和授权控制。

原则11:实现多云部署。

理由:生成式人工智能平台必须支持多云操作。生成式人工智能平台必须进行优化,以利用差异化服务。

原则12:生成式人工智能治理应端到端地发展。

理由:治理、道德、诚信和安全需要从一开始就建立起来。开发生成式人工智能系统与整个企业互动,从基础层面提供诚信。赋予个人权力。建立持续的人类学习和改进决策的过程。

六生成式AI参考架构

下图展示了生成式人工智能的逻辑架构及其关键组件和层。

生成式人工智能的各个模块分为:

o企业平台

o人工智能数据源

o人工智能基础设施

o基础模型

o人工智能数据存储库

o及时工程

o人工智能搜索

oAPI网关

o政策管理

o商业用户

企业平台:这些是现有的以及新的企业应用程序和平台,涵盖ERP、CRM、资产管理、DWH、数据湖和社交媒体等。它们使用来自AI数据源的数据并与基础模型共享。

AI数据源:数据源提供解决业务问题所需的洞察力。数据源是结构化的、半结构化的和非结构化的,它们来自许多来源。基于AI的解决方案支持处理来自各种来源的所有类型的数据。

人工智能基础设施:它由存储、计算支持生成人工智能应用所需的大量数据的存储和处理组成。

基础模型:这些是深度学习模型。它们在大量非结构化和未标记数据上进行训练,以执行特定任务。它充当其他模型的平台。为了处理大量非结构化文本,基础模型利用大型语言模型(LLM)。

LLM是一种基于大量文本数据进行训练的AI系统,可以理解自然语言并生成类似人类的响应。LLM模型可以使用开源模型或专有模型构建。开源模型是现成的,可以定制。专有模型以LLM即服务的形式提供。以下是一些LLM工具,

基础模型经过微调,适合不同领域的采用,并且能够使用标记数据进行短期训练,从而更好地执行特定任务。在特定任务或数据集上进一步训练预训练模型,使其适应特定应用或领域的过程称为微调。

这些模型的例子有GPT-4、BERT、PaLM2、DALL·E2和StableDiffusion。

AI数据存储库:此层主要由模型中心、博客存储和数据库组成。模型中心由经过训练和批准的模型组成,这些模型可以根据需求配置,并充当模型检查点、权重和参数的存储库。涵盖结构化和非结构化数据源的综合数据架构被定义为存储库的一部分。此外,数据被分类和组织,以便生成AI模型可以使用。

提示工程:这是一个设计、改进和优化输入提示的过程,以引导生成式AI模型产生所需的输出。

AI搜索:这包括上下文管理、缓存和认知搜索。上下文管理为模型提供来自企业数据源的相关信息。该模型可以在正确的时间访问正确的数据以产生准确的输出。缓存可以加快响应速度。

AI安全:有助于建立强大的安全性。AI安全必须涵盖战略、规划和知识产权。生成式AI平台需要提供强大的加密、多级用户访问、身份验证和授权。

API网关:利益相关者使用API网关渠道与企业进行互动。它是消费者访问后端服务的单一入口点。基于客户旅程和上下文的服务组合和编排。此功能由API管理平台提供。

策略管理:确保对企业数据资产的适当访问。它涵盖基于角色的访问控制和基于内容的策略,以保护企业数据资产。例如,HR的生成式AI模型涵盖的员工薪酬详细信息仅由HR访问,而组织的其他部分则无法访问。

业务用户:内部和外部的各种利益相关者都属于此层。他们是系统的主要用户。

七生成式人工智能的真实用例

生成式人工智能的用例无穷无尽,而且它们在不断发展。各行各业的企业都在尝试以不同的方式整合生成式人工智能。此外,各行各业对提高效率和改善决策能力的需求也很高。生成式人工智能应用可改善体验、降低成本并增加企业收入。

1.医疗保健和制药

基于生成式人工智能的应用程序可帮助医疗保健专业人员提高工作效率,提前发现潜在问题,提供洞察力以实现互联健康并改善患者治疗效果。它有助于:

更好的客户体验:自动化管理任务,例如处理索赔、安排预约和管理医疗记录。

患者健康摘要:通过生成个性化的患者健康摘要、加快患者响应时间并改善患者体验来提供医疗决策支持。

加快出版物分析速度:生成式人工智能通过比以往更快地分析来自多个来源的大量数据,有助于减少创建特定药物研究出版物所需的时间。它有助于加快护理速度和质量。它还可以提高药物依从性。

个性化医疗:根据患者的基因构成、病史、生活方式等制定基于生成人工智能的个性化治疗计划。

医疗保健虚拟助手:它为最终用户提供对话式且引人入胜的访问方式,以获取最相关、最准确的医疗保健服务和信息。

2.制造业

生成式人工智能使制造商能够利用其数据创造更多东西,从而推动预测性维护和需求预测的发展。它还有助于模拟制造质量、提高生产速度和材料效率。

预测性维护:帮助估计机器及其部件的使用寿命。主动向技术人员提供有关零件和机器维修和更换的信息。这有助于减少停机时间。

绩效效率:主动预测问题。它涵盖实时生产中断风险、瓶颈和安全风险。

生成式人工智能在制造业的其他用途包括:

·产量、能源和产量优化

·数字模拟

·销售和需求预测

·物流网络优化

3.零售

生成式人工智能有助于个性化产品、品牌管理、优化营销和销售活动。它使零售商能够更精确地根据客户需求定制产品。它有助于支持动态定价和规划。

个性化产品:使零售商能够提供定制的体验、产品、定价和计划。它还有助于实现在线和实体购物体验的现代化。

动态定价和计划:预测不同产品的需求,为定价和库存决策提供更大的信心。

生成式人工智能在零售业的其他用途包括:

·活动管理

·内容管理

·增强客户支持

·搜索引擎优化

4.银行业

生成式人工智能应用程序有助于为客户提供个性化的银行体验。它改进了金融模拟,开发了风险分析和欺诈预防。

风险缓解和投资组合优化:生成式人工智能帮助银行构建数据基础,以开发风险模型,识别影响银行的事件,如何缓解风险并优化投资组合。

客户模式分析:生成式人工智能可以大规模分析历史银行数据中的模式,帮助客户经理和客户代表识别客户偏好、预测需求并创造个性化的银行体验。

客户财务规划:生成式人工智能可用于自动化客户服务、识别客户行为趋势、预测客户需求和偏好。这有助于更好地了解客户并提供个性化建议。

生成式人工智能在银行业的其他用途包括:

·反洗钱法规

·遵守

·财务模拟

·申请人模拟

·下一步最佳行动

·风险分析

·预防诈骗

5.保险

生成式人工智能分析和处理大量数据的能力有助于准确评估风险和有效处理索赔。各种数据类别包括客户反馈、索赔记录、保单记录和经济状况等。

客户支持:生成式人工智能可以通过翻译客户查询并以客户首选语言回复来提供多语言客户服务。

政策管理:生成式人工智能分析与客户政策、各种政策文件、客户反馈、社交媒体文献相关的大量非结构化数据,以实施更好的政策管理。

索赔管理:生成式人工智能有助于分析各种索赔工件,以提高索赔管理的整体效率和有效性。

生成式人工智能在保险行业的其他用途包括:

·客户沟通

·覆盖范围说明

·产品的交叉销售和追加销售

·加速产品开发生命周期

·产品创新

6.教育

生成式人工智能有助于连接教师和学生。它还使教师、管理人员和技术创新者之间的协作成为可能,从而为学生提供更好的教育。

学生赋能:生成式人工智能帮助学生进行实时课程翻译,翻译语言多种多样。帮助盲人学生实现课堂无障碍。

学生成功:深入分析学生的成功并帮助教师做出如何改善学生成绩的明智决定。

7.电信

电信行业采用生成式人工智能可提高运营效率和网络性能。在电信行业,生成式人工智能可用于:

·分析顾客购买模式

·个性化服务推荐

·提高销量,

·管理客户忠诚度

·洞察客户偏好

·更好的数据和网络安全性,增强欺诈检测。

8.政务部门

数字政府的目标是建立互联政府,提供更好的公民服务。生成式人工智能使这些公民服务能够更有效地服务公民,并保护机密信息。

智慧城市:生成式人工智能有助于收费管理、交通优化和可持续性。

更好的公民服务:通过跟踪、搜索和对话机器人为公民提供更便捷的联网政府服务。

使用生成式人工智能实现的其他服务包括:

·服务运营优化

·联络中心自动化

八生成式人工智能的好处

以下是生成式人工智能改变行业的优势,

·做得更好、做更多的工作

·创造更多更好的内容

·个性化客户体验并接触合适的客户

·识别新的客户旅程并识别新的受众

·通过增强聊天和搜索体验改善客户互动

·增强创造力和使用创造工具的能力

·通过对话界面和摘要探索大量非结构化数据

·改变活动、受众、体验、旅程和见解。

·帮助营销团队提出更好的想法,更快地执行活动并创造更加个性化的体验。

九当前生成式人工智能的局限性

当今企业在实施生成式人工智能解决方案时面临的主要挑战是:

数据准备:人工智能的数据源识别、算法的数据标记、数据管理、数据治理、数据政策、数据安全和数据存储是企业面临的挑战。

可靠性:训练后的模型是黑匣子,对最终用户没有任何线索。这可能会导致错误、有害和不安全的结果。

安全风险:云模型可能会泄露专有数据、IP、PII和模型交互历史记录。

技术复杂性:LLM的数据准备、算法设计、模型构建、模型训练是一项复杂的任务。训练的计算识别、云识别和部署都是复杂的任务。

大规模定制:企业业务需求需要对基础模型进行大量精细调整和及时工程。

技能差距:生成式人工智能计划需要机器学习/深度学习/快速工程/大型语言模型专业知识来构建和训练基础模型。许多企业缺乏这些技能资源,并且内部没有这些资源。企业构建算法和模型以满足业务需求将是一个挑战。

生成式人工智能模型的其他挑战包括:

•不受控制的输出

•不可预测的输出

•生成可能错误或非法的输出

•版权和法律挑战

十使用生成式人工智能的关键成功因素

在大多数情况下,企业的IT部门会为了应对降低成本的业务压力而启动生成式AI的采用。他们以极大的热情开始这项计划,但一段时间后,这项计划便自行消退。这可能是由于高层管理人员缺乏承诺、将重点转移到其他新计划、规划不周和期望不切实际。

以下是整个企业生成式人工智能计划要解决的关键成功因素。

CXO需要关注的是,

  • 制定战略并领导治理

  • 建立生成式人工智能治理委员会,帮助指导企业决策

  • 确保生成式人工智能战略与业务战略保持一致

  • 向各利益相关者清晰传达生成式人工智能的目标

  • 获得同行的支持

  • 阐明执行生成式人工智能的好处,以及对企业的成本和风险

  • 定义指标

  • 所有利益相关方的参与和积极参与

  • 引入业务

  • 建立负责任的人工智能文化

  • 保持势头

  • 通过定期审查来监控生成式人工智能计划

  • 要求定期更新现代化项目

  • 生成式人工智能的采用是一个持续的过程,需要定期评估

  • 鼓励员工对生成式人工智能的兴趣

IT领导者应重点关注的是,

  • 定期进行生成式人工智能采用情况审查

  • 部署具有适当技能组合的经验丰富的顾问团队

  • 确定适合采用生成式人工智能的应用程序,以经济高效且可靠的方式满足业务需求

  • 纳入审计。这有助于企业制定和部署政策,以保护企业免受版权侵犯和专有数据泄露等风险

  • 确定建议的行动方案

  • 创建生成式AI采用框架

  • 简化数据源、人才和技术

  • 建立商业案例

  • 阐明每个潜在生成式人工智能项目的成本和风险,包括不采取任何行动的机会成本

  • 民主化思想,限制生产。防止员工启动未经测试和不受监管的人工智能项目

  • 允许员工进行实验,但无需具备使用生成式人工智能的能力

  • 建立卓越中心

  • 提升员工的生成式人工智能技能

  • 构建用例和最小可行产品

  • 及时定义并进行微调

生成式人工智能团队将重点关注

  • 收集相关且有意义的数据

  • IT利益相关者和关键SME/资源是否能够按照计划及时并有时间投入进行信息共享、研讨会、访谈、调查、调查结果验证和相关活动

  • 针对客户痛点提出一系列正确的问题,引领生成式人工智能实践

  • 识别动态数据

  • 检查现有数据并适当使用

  • 准备动态数据。动态数据包括表格、图像、视频、文本、代码等。

  • 迅速识别

  • 提示识别

  • 调整AI在初始阶段使用的提示

  • 微调提示以解决不准确和有偏见的输出

  • 构建目标架构

  • 创建目标参考架构

  • 创建生成式人工智能采用路线图

小结

生成式人工智能在企业中的应用越来越广泛,甚至可能走向工业化。

了解生成式人工智能基础知识,以确定业务用例。制定整个企业的数据和人工智能战略。确定需要LLM的用例的最高价值。

生成式AI平台可以是开源的,也可以是专有的,支持基于标准的集成(API),使用ML和DL库和数据管理工具。生成式AI的应用不断发展,有助于:

  • 为新产品创造创意

  • 重新构想用户体验

  • 重塑工作流程

培训员工以推动生成式人工智能驱动的计划。考虑重新培训和提升员工技能,以便有效地使用生成式人工智能。解决并随时了解与人工智能相关的新兴道德准则和法规。

最后,生成式人工智能是一个机会,而不是我们的竞争对手。它不会取代人类,但会帮助下一代企业取得成功。



往期推荐

数据简史:对数据的理解

实体关系图 (ERD) 与数据血缘:相似之处和不同之处

数据战略:理论与实践

如何开展战略数据分析

大型集团企业数据治理实施的有效策略

如何设计更好的指标

谈谈数据交易现在最大的问题

为何数字化转型需要数据战略


【声明】内容源于网络
0
0
数据驱动智能
专注数据治理、数字化转型、数据资产、数据要素等方面的实践分享。
内容 1046
粉丝 0
数据驱动智能 专注数据治理、数字化转型、数据资产、数据要素等方面的实践分享。
总阅读4.2k
粉丝0
内容1.0k