大模型领域目前正处于快速发展阶段,企业需要保持对新技术、新趋势的跟踪从而制定大模型应用战略,并定期更新战略。
对企业而言,大模型的建设路径有多种,企业需要了解每种大模型建设路径的技术差异以及优缺点,考虑所有关键因素,由此选择最合适企业的大模型建设路径。
01
企业大模型的建设路径
(1)购买嵌入了大模型的应用
定义:
企业可以直接使用嵌入了大模型的商业应用,例如金山办公WPS AI目前在底层嵌入了MiniMax、文心一言等大模型。
优势:
•企业可以以非常低的成本甚至零成本的方式体验大模型的能力;
• 基于大模型的应用所提升的能力将直接转换为用户的使用价值,而用户无需为底层大模型付出额外成本;
• 基本不会改变用户现有的工作流程。
不足:
• 缺乏灵活性,无法构建超出标准应用功能之外的工作流程,也无法将大模型的能力扩展到应用之外;
• 嵌入大模型的应用在理解和生成上下文准确响应方面存在固有局限性;
• 企业对数据安全和隐私保护的控制能力较弱,依赖于应用提供商对数据安全和隐私保护的控制措施。
(2)调用大模型的API接口
定义:
企业可以通过调用基础大模型API来构建自己的应用,然后通过提示工程进行进一步优化,引导大模型生成有效输出。
优势:
• 企业可以利用大模型快速创建一个定制化的应用,将大模型使用到现有产品中,只需要为模型的使用付费,而无需为其训练付费;
• 大模型可以通过小样本学习调优,允许大模型在只有少量示例的情况下进行学习和推理,并按预期完成任务;
• 提示工程为企业提供了一种灵活且轻量级的方法,通过改变问题的描述方式去影响模型内部的运行,从而改变输出,提示工程并不会改变模型本身,对企业而言简化了模型管理和治理的工作。
不足:
• 提示工程需要使用企业自身的数据进行训练,可能导致提示词和本地数据泄露的风险;
• 提示工程是一个新兴学科,具备相关技能的人才稀缺,提示词工作依赖于经验,因此需要大量的实验和探索;
• 提示词数据有限,可能会限制通过提示工程优化模型的范围,而且提示工在不同的模型中的表现可能会有很大差异;
• 向后兼容性问题,供应商必须继续支持旧版本的模型,否则会影响基于模型建立的应用。
(3)通过信息检索扩展大模型
定义:
检索增强生成使企业可以通过外挂数据库的方式将企业自有知识补充到大模型中,并将检索添加到提示中来增强提示词,提高特定任务领域大模型的响应质量。
优势:
• 通过RAG(检索增强生成)进行数据检索,企业可以将基础模型训练数据之外的其他数据纳入到模型中,解决了大模型的容量限制;
• 通过RAG的方式扩展大模型,为企业提供了一种将企业私有数据“外挂”到基础大模型的方式,使企业不需要为了特定任务重新训练整个大模型(微调或从头构建);
• 通过及时增强模型,可以优化大模型在特定任务领域的输出,改善模型幻觉问题。
不足:
• RAG 方法受限于上下文窗口,限制了可发送给模型的检索信息量。同时,增强提示的额外检索步骤可能会导致延迟,影响应用过程中模型反馈的及时性;
• 使用RAG方法需要重新设计技术架构和工作流程,接入新的技术组件如向数据库、embedding模型等,增加这些技术组件会带来额外的成本;
• 企业需要在访问控制、信息检索、检索输出监控等方面建立防护机制,避免敏感信息泄露问题。
(4)在大模型的基础上微调
定义:
在大型预训练基础模型之上,将领域知识或企业知识喂给模型进行进一步训练,形成定制的领域大模型或企业大模型。
优势:
• 通过使用企业私有数据或特定领域数据对特定任务进行微调,可以提高特定任务的性能,减少模型幻觉;
• 与从头训练一个基础大模型所需要的数据相比,微调通常不需要大量数据(但是数据必须是高质量的);
• 目前市场上有很多参数量更小但性能更高的开源大模型,例如Llama2等,这使得微调大模型变得更加可行且投入产出比更高。
不足:
• 将领域知识或企业自有知识注入大模型具有较大的挑战,需要大规模的微调数据集、大量的计算资源和扩展预训练。微调模型仍然是拥有数十亿参数的大模型,需要经过优化才能实现大规模应用;
• 企业在某一特定基础大模型上进行微调,如果未来出现更好用的基础大模型,切换成本较高;
• 针对特定任务进行微调的基础模型可能会使模型过于专业化,微调数据集可能无法覆盖所有变化和复杂性,导致模型在出现新情况下的泛化能力不足。
(5)自建基础大模型
定义:
企业按照自己的数据和业务领域,从0到1训练一个专属于企业的基础模型,这需要投入大量的算力、人力和资金。
优势:
• 模型完全根据企业自身需求和目标进行个性化定制,相较于其他建设路径,可以更好的适应特定的业务问题;
• 与同行相比,企业自主构建大模型可以产生技术和创新方面的差异化竞争优势,如果基础大模型具有足够强的性能,在特定领域表现足够出色,就有可能实现商业化。
不足:
• 训练和维护大模型的成本非常高,包括基础算力、数据获取、标注、模型质量的人工审核以及推理成本等;
• 企业自主构建大模型并定期维护和更新模型需要具备足够多的技术人才,而这些人才往往是稀缺的;
• 大模型市场目前正快速发展,对于大多数企业而言,外部技术供应商的创新速度远超企业内部的创新速度,企业从头自建大模型未必是最合理的决定。
02
企业大模型建设路径的决策框架
不同的大模型建设路径之间不是互斥关系,企业根据实际业务需求、企业技术能力、资源情况等选择其中的一种或几种。在选择建设路径时,企业需要考虑的关键因素包括:领域数据、使用成本、数据安全与隐私保护、模型输出质量。
第一,领域数据。大多数基础大模型都是都是通用大模型,虽然具有较强的泛化能力,但在特定任务上往往表现一般。
企业可以通过RAG、微调或者自建大模型的方式将领域数据或企业自有数据注入到大模型中,从而保证在某些任务下与需求更匹配。目前市场上一些大模型提供商也在开发垂直领域大模型并提供基础大模型的垂直行业解决方案,不仅具备强大的基础模型能力,也更加符合企业业务需求。
第二,使用成本。
• 使用嵌入了大模型的应用和调用大模型的API接口都不会产生模型训练成本,但会有使用成本或订阅费用。
• 在进行提示工程时,每次修改人工创建的提示词时会产生推理成本,但由于提示工程不会更新模型参数,因此成本不高。
• 数据检索会在模型提示词中添加更多数据,从而增加推理成本。
• 微调的成本与模型参数量有关,超过数十亿参数的模型,微调成本会很高。
• 企业自建基础大模型的成本非常之高。
第三,数据安全与隐私保护。隐私安全和数据安全是企业使用大模型时必须要注意的问题,在引入大模型之前,企业需要考虑大模型可能对数据安全带来的风险。企业建立自己的模型或通过微调创建模型可以加强对数据的控制,并在安全措施方面具有更强的灵活性。企业需要建立相应的安全风险评估框架,建立模型的安全主内机制,对引入的大模型进行安全风险评估,确保模型满足监管合规要求。
第四,模型输出控制。模型输出质量非常重要,但大模型固有的事实幻觉、输出内容不稳定等问题短期内难以完全解决,尤其是直接面向客户的场景,企业直接使用大模型可能无法提供确定性的服务。在对模型输出质量要求较高的场景,RAG、微调或自建大模型可能是企业最好的选择。大模型目前无法做到100%的正确,因此在一些关键业务场景,需要有人工的参与。
* 参考材料:(点击查看全文)

