大数跨境
0
0

金融机构大模型应用的挑战与应对

金融机构大模型应用的挑战与应对 沙丘社区
2023-11-29
1
导读:数据构建问题、时效性问题、输入输出数据长度限制、安全问题等挑战的应对方法
目前金融机构使用大模型往往遇到数据构建问题、时效性问题、输入输出数据长度限制、安全问题等,本文详细介绍了这些挑战以及业内较为常见的应对方式,供金融机构参考。

01

数据构建

挑战:

• 数据稀缺问题:在金融领域,某些特定领域的数据可能非常稀缺,例如新兴市场、特定行业或新型金融产品等。如果微调数据集中缺乏这些稀缺数据,模型可能无法准确地预测相关问题或无法处理新的场景。

• 泛化能力问题:金融行业的大模型需要有很好的泛化能力,能够适应不同的市场、产品和情景。然而,微调数据集可能无法涵盖所有的变化和复杂性,导致模型在新的情况下泛化能力不足。

• 数据质量问题:金融领域的数据通常非常复杂,可能存在错误、缺失值或不一致的情况。如语音客服对话数据,由于方言识别错误导致的数据噪声问题。这些问题可能会导致模型在微调过程中学习到错误的模式或产生不准确的预测结果。

• 数据标注问题:构建问答对数据集需要大量的人工标注工作,而金融领域的专业知识和复杂性使得标注工作更加困难和耗时,标注成本较高。标注人员可能存在理解偏差、主观判断或标注错误的情况,这会对微调数据的质量产生影响。

应对:

• 提高指令复杂度、增加话题多样性、扩大指令数量、平衡指令难度;

• 数据是金融机构构建大模型的核心竞争力,Self-instruction为金融机构提供了一种构建数据集的新思路,可以用GPT4等大模型将文本类非结构化数据生成为问答对;

02

时效性

挑战:
• 大模型通常通过训练数据集来学习知识和模式。然而,由于现实世界的快速变化和不断更新的信息,训练数据可能很快就会过时。这意味着大模型在处理当前的实时数据时可能无法准确地捕捉到最新的信息和趋势。例如,当使用大模型进行自然语言处理时,如果模型的训练教据是基于过时的新闻文章或社交媒体数据,那么大模型可能无法理解最新的词汇、短语或概念。
应对:
• 持续更新数据:定期更新训练数据,使用微调的方式,以确保模型能够学习到最新的知识和模式;
• 推理架构设计: 结合模型上下文学习能力,使用langchain/RAG,通过上下文学习新知识后输出。

03

输入输出数据长度限制

挑战
• 大型模型通常对输入和输出数据的长度有一定的限制,超过该长度的文本可能会被截断或丢弃。同样,在图像处理任条中,模型可能对输入图像的尺寸有限制,超过该尺寸的图像可能会被缩放或裁剪。这些限制可能会导致一些信息的丢失或不完整,影响模型的性能和准确性。
• 数据长度会直接影响模型在内存和显存中的存储需求。较长的输入序列或高维度的输入向量会占用更多的内存和显存空间。这可能会导致以下问题:第一,内存溢出。如果输入数据的长度超过了可用内存的限制,就会导致内存溢出错误,使模型无法正常运行;第二,计算速度下降。较长的输入序列或高维度的输入向量会增加计算的复杂性和计算量,导致模型的计算速度下降,影响实时性能。
应对
• 数据预处理:对输入数据进行预处理,例如截断、分段或填充,以适应模型对输入长度的限制,并减少内存和显存的需求
• 模型架构设计: 设计更适应长序列或高维度数据处理的模型架构。

04

安全

挑战:

• 数据隐私。大语言模型可能获取和使用用户的历史数据 (账号、电话、地址、姓名)导致用户隐私信息的泄露或用户隐私数据被滥用。用户在使用大语言模型时会输入信息,依托于大语言模型的运行逻辑,输入的信息可能会被用作大语言模型进一步迭代的训练数据。如果一些员工使用大语言模型辅助其工作,可能会导致公司的商业秘密泄露的问题。

• 信息安全。大语言模型可以短时间内产生大量令人信服但却无信源的内容。导致其回复看起来可信度极高,但实际并无可信依据,这对判断能力不足的用户将产生极大的误导。由于ChatGPT 等大模型在短时间内已经形成了庞大的用户群体,其具备的舆论属性和社会动员能力也随之快速提升。在信息生成和传播上,可能引导大量用户思想或行为偏好向有预谋的方向发展,导致信息安全风险。

• 数据伦理。大语言模型可能输出带有偏见歧视性或违反公序良俗的内容。大语言模型的输出取决于训练数据,但训练数据中包含开发团队的主观偏见、丰富情感态度以及政治、宗教、性别等敏感议题,导致数据伦理也是大语言模 型输出需要重点关注的内容。

应对

• 如果想通过模型架构的方式解决安全问题,目前ChatGPT主要使用RLFH方式,但成本较高;

• 目前国内部分大模型如百度、智谱等,在大模型输出后通过独立安全模块的方式规避安全性问题。


* 更多研究参考:

企业考虑是否微调大模型的决策框架

领域大模型的构建思路与落地步骤

大模型在哪些金融场景更具潜力?

企业开发大模型前需考虑的三大挑战





【声明】内容源于网络
0
0
沙丘社区
数字化研究与服务机构
内容 672
粉丝 0
沙丘社区 数字化研究与服务机构
总阅读223
粉丝0
内容672