昨天看到中证报报道,近日,美国顶级公立大学佛罗里达大学金融学院公布的一项研究表明,将ChatGPT融合在投资模型中,可以预测股市的走势,其投资回报率甚至高达惊人的500%,堪称AI界的“巴菲特”。该研究使用2021年10月至2022年12月CRSP(证券价格研究中心)公开的真实股市数据和新闻进行测试。
ChatGPT和GPT-4大语言模型(LLM)发布之后,各行各业都开始关注大模型如何落地自己所在的领域,金融行业应用IT技术一向积极,这次自然也不甘落后,例如奇富科技快速组建一级战略部门——大模型部,致力于开发运用各种深度学习算法和生成式人工智能技术在金融领域的场景化应用。同时,国内外金融机构相继推出了一系列金融领域的大模型,例如国外的Morgan Stanley、Stripe、Bloomberg和国内的工行、农行、中信证券(CiticsAI)、老虎证券(TigerGBT)、同花顺等都相继推出大模型,并相信大模型技术在大幅提升银行在智能投顾、智能获客、风险管理、智能客服、智能营销与智能运营等方面的能力和效率上发挥着重要作用,为客户带来显著的优化体验,可提升金融机构的经营效率和风险管理决策能力。例如:
-
将大数据和大模型结合起来,可以在金融风险控制、判断用户信用状况、征信解读等方面发挥作用;
-
在通用大模型的基础上,叠加金融客服领域的数据和专业服务经验,经过垂直领域定向训练后,客服机器人既能与用户进行多轮对话,让运营智能客服更简单,又能提出具体的、可行的解决方案,提升复杂问题解决率、人机交互感知和意图理解程度,完成流程自主构建、知识生成等;
-
基于大模型可以实时追踪行业动态,深入理解客户投资需求,通过用户画像和对投资要素的解析,为客户自动生成专业的定制化投资建议。
金融行业属于信息密集型行业,信息化或数字化起步比较早,在互联网上也沉淀了大量数据,金融机构内部数据量大、数据质量高,这些优势意味着,金融行业是大模型技术大有作为的领域。但这也面临较高的数据安全性与合规性挑战,如果大模型作为私有化部署,这种挑战会小很多。
为了进一步提升大模型技术所生成结果的精准性,越来越多境内外金融科技平台还尝试在大模型技术里,外挂专业金融领域的知识库与无监督学习+调参模式,即将专业知识、操作手册、业务规范、产品信息、竞品信息等领域知识先注入到大模型技术,再将客户和行业数据、宏观经济的分析等内容进行关联,就能提供更精准的自然语言处理效果,令AI金融服务的成效与精准性进一步提升。
传统AI技术工作量大、时效性相对比较低。无论是预先设定业务流程,还是结构化数据提炼要求,传统AI技术都需大量专业人员参与,导致工作量大且专业性要求高,且对AI深度学习训练的成效,往往只能在事后进行分析调整;但是,大模型技术将众多非结构化数据融入于相对便捷的特征工程(利用领域知识从原始数据中提取特征、属性的过程),所以大模型技术不但可以大幅简化专业人员工作量,还能提供事前、事中的效果评测与及时调整优化,令金融场景AI服务的效率进一步提升。
据BloombergGPT: A Large Language Model for Finance一文中所述, BloombergGPT和 OpenAI GPT模式一样,也是基于 Transformer架构的,但BloombergGPT模型参数为500亿,在GPT-2 (1.5亿)和GPT-3 (1750亿)之间。
不同之处在于BloombergGPT是基于金融数据集 进行训练和精调的。为了加强 LLM对金融垂直领域的专业理解, Bloomberg构建了目前规模最大的金融数据集 FINPILE,通过对通用文本+金融知识的混合训练,使得 BloombergGPT在执行金融任务方面的表现超过了现有的通用 LLM模型,而在通用场景方面的表现则与现有的通用 LLM模型基本持平。
GPT-3和GPT-4等大型语言模型都是由专业的人工智能团队开发出来的,而且模型的训练对计算能力的要求很高。BloombergGPT的成功验证了“开放源代码模型+优质垂直数据”的思路,为基于垂直数据构建大语言模型提供了可能。
大量的、高质量的垂直领域知识(从金融数据集 FINPILE获得的)可以弥补模型在规模上的不足。通过对 BloombergGPT和GPT-3的对比,虽然 BloombergGPT的模型参数相对于GPT-3来说是比较小的,但是由于 BloombergGPT的预训练数据增加了大量的高质量的金融数据,并且对预训练数据进行了一系列的清洗和标注,所以 BloombergGPT在通用性和GPT-3基本持平的前提下,实现了对金融垂直能力的大幅提升。这也说明当参数尺度一定时,高质量的数据才是决定模型性能的关键因素。
算法方面,作者也有计划披露BloombergGPT训练的细节;算力方面,约使用512块40GB的A100 GPU,在训练过程中备份了4个模型,每个模型分了128块GPU。
作为一家不以人工智能为核心的金融垂直领域企业,Bloomberg为金融 GPT的发展提供了一个可借鉴的范例。国内头部金融科技公司在数据、算法、算力等各方面可以参考这个范例,打造出一个专属于自己金融场景的大语言模型。
• 问答:同花顺问答业务主要是同花顺问财, 用户每日问句数量大约为1000万条,累计不同问句约5亿条,需求量比较高。问财前几年用的深度学习模型TextCNN做通用语义识别准确率为88%,在应用了预训练大模型后,准确率显著提升至92.96%。再加上更多的数据进行迭代,可进一步提升效果。
• 对话:同花顺对话业务分为面向C端的智能投顾以及面向B端的智能客服、智能营销机器人。智能投顾业务要基于用户画像,理解用户语义;智能客服与营销机器人也需要有多轮对话能力与意图识别能力。公司已在使用基于 BERT的预训练模型赋能智能对话,下一步使用基于GPT-3架构的大模型可提升复杂意图理解能力与准确度。
• 信息抽取:用于知识图谱构建和金融数据库构建两个方面,这在风控、投研、投顾、银行理赔等场景都非常重要。从研报、新闻资讯中自动提取因果关系的三元组(因-影响-果)能够用于搭建金融知识图谱,以此进行推理决策。同花顺用Char Embedding + LSTM抽取时,F1值(衡量模型精度)不到70%,用自研BERT模型, F1值可达到77%。
• 舆情监控:“同花顺企洞察”,可以自动识别公司正负面新闻。大模型让机构名称识别准确度提升17.25%,舆情风险识别准确度提升同样提升17.25%,并且使用的是参数较少的tinybert,后续还有优 化空间。
• 智能投研:关键在于高效处理信息、光速挖掘投资线索、智能辅助成果生产、沉淀投资逻辑。大模型可从多个方面赋能智能投研,如提高信息搜集效率、信息抽取能力,有利于动态推演产业链、事件推演,智能识别事件影响因子与利空/利好公司,找到投资逻辑。除此之外,大模型还可以赋能智能研报生成,减少机构机械式的工作时间;赋能智能财务预测,通过大模型找出关键因子,进行实时预测,保证时效性与准确性。
未来进一步结合大模型,金融领域的摘要生产、金融预测、金融推荐能够提升金融机构资源整合能力与工作效率。
作者:Test Ninja
来源:软件质量报道
版权申明:内容仅供分享学习,版权归原创者所有
如果想进一步了解GPT相关内容,请关注5月24日晚8点K+Talk大咖对话,本期K+Talk邀请到招商银行信息技术部/陈展文、文因互联董事长&创始人/鲍捷博士、海思算法专家/王晓雷以及Thoughtworks创新技术总经理/肖然共同做客直播间,深入探讨“GPT+银行:大模型唤起的银行智能技术热潮真金白银在哪里?”
如果想要了解更多关于软件研发行业内最新资讯与顶尖案例,请关注即将于6月9-10日在上海举办的K+全球软件研发行业创新峰会,本届峰会以“数字时代的企业拓界与创变”为主题,整合国际前沿技术实践,致力于打造最高效和前沿的技术交流平台,构建多元融合的科技发展创新生态圈,非常期待您的报名与加入!