GSA来了！无缝优化Transformer，无需再次预训练，为所有AI模型全面降本增效！- 大数跨境

首页

GSA来了！无缝优化Transformer，无需再次预训练，为所有AI模型全面降本增效！

陆兮科技LuxiTech

2024-09-25

导读：无缝 + 无痛 + 低成本 = 性能更好的Transformer！

！！！特大新闻 ！！！

深耕 [ 自研架构 ] + [ 类脑AI ] 的

国内首个全流程自研AI大模型公司

陆兮科技

正式发布全新产品啦 !!!

G. S. A.

Gated Slot Attention

人工智能基础架构

无缝优化解决方案

在人工智能成为新兴支柱产业、支撑起国家经济命脉的新时代，很多深耕AI技术、产品、服务研发的人工智能厂商和希望通过AI实现产业转型与产能升级的人工智能企业用户都面临着同一个难题： 降本增效。

人工智能大模型越造越大，模型推理与使用成本越来越高。算力、存储、功耗与人力成本越来越贵。不管是开发者，还是使用者，都觉得捉襟见肘，难以为继。如何才能高效、高质、低成本地发展人工智能呢？

为解决这些痛点，陆兮科技基于我司最新科研成果，推出了GSA人工智能基础架构优化解决方案，针对 Transformer 架构各项技术瓶颈，进行全面高效优化，实现性能飞升！

陆兮联合苏州大学、麻省理工、腾讯AI-Lab等

共同发表 Gated Slot Attention(GSA) 论文

原文链接：https://arxiv.org/abs/2409.07146

请至本文底部点击 “阅读原文” 浏览论文全文

无论你是

AI 生产者 已经在Transformer架构的基础上，打造了属于自己的人工智能产品，希望降低算法复杂度、减少功耗、提升效率，提升AI产品综合竞争力；

还是

AI 消费者 正在积极响应国家发展 [新质生产力]、加速推进 [人工智能+] 行动，希望通过AI产品的加持，实现产业升级，筑牢行业 + 产业 + 产品护城河，但即将被巨额沉没成本 + 高昂使用成本劝退

[GSA] 都能为你

显著提升性能 让AI变得更好用、延迟更低、理解能力更强、功能更多，真正为用户排忧解难！

大幅降低成本 省算力，省存储，省人手，省时省力又省钱！真正做到通过AI帮助企业用户降本增效！

Ch. 1

Transformer 架构瓶颈

人工智能服务为何那么贵？

打破架构垄断，路在何方？

Transformer架构，简称T架构，起源于谷歌2017年的开创性论文《Attention is All You Need》，是 GPT (Generative Pre-Trained Transformer) 背后的神来之笔 “T”，也是每个生成式人工智能大模型、每一类人工智能服务背后的 “基础架构“，更是驱动本轮人工智能技术革命的核心底层技术。GPT、BERT、T5、文心一言、通义千问等海内外明星大模型，背后的核心技术都是Transformer。

伴随着人工智能产业的发展，企业与个人用户对人工智能产品的期待与要求越来越高，人工智能产品的数据量级 + 功能性 + 应用场景越变越多，Transformer架构的技术瓶颈也逐渐显现，导致训练、使用和维护成本急剧上升，愈发难以响应各行各业需求变化。

瓶颈 1

长文本处理效率低

Transformer虽然在短文本处理上表现出色，但在处理长文本时其计算复杂度呈指数增长，导致算力消耗飞速增加。处理长上下文信息时，需要更多的硬件资源和更复杂的并行计算能力，这极大地加剧了模型训练与推理成本。

瓶颈 2

算力存储要求过高

由于Transformer架构对注意力机制的依赖，每次推理都需要大量计算资源，尤其在处理高维数据时，功耗需求极高。这不仅使得模型运行成本难以控制，也让企业在部署大模型时面临高昂的硬件和能源开销。

瓶颈 3

总体成本难以控制

Transformer架构的大模型在开发初期需要巨大的语料库进行训练，而后期维护过程中，模型的更新与优化也需要不断的再训练。对于许多企业而言，已经在硬件、数据和代码上投入了大量资源，这些成本并非一朝一夕可以回收。

陆兮科技曾多次深入分析 + 批判 Transformer 架构，指出其在处理长文本、降低功耗、提升计算效率等方面的局限性（详情请点击专题文章：Transformer 架构七年之痒）

打破底层算法架构性能局限，开发出更高效、更低功耗的底座模型，研发更符合行业与企业需求的人工智能服务，是鞭策陆兮科技不断加大架构研发力度、推出自研架构产品、开发具备全流程自主知识产权的【类脑大模型】的核心使命（详情请点击专题文章: 首个自研架构模型，通过网信办备案）

然而，看似鸡肋的 Transformer架构 已经成为AI大模型的「紧箍咒」。虽然成本高 + 效率低，但是垄断地位 + 用户粘性已经形成，就像孙悟空脑袋上的金箍，“戴着头痛”、“怎么摘也摘不下来”、“不戴又不行”。用新架构取代T架构，绝非一朝一夕之易事。

困境 1

社会大众：刻板印象已经形成

在大众眼中，GPT 已经成为大模型代名词，Transformer架构也已经成为大模型架构代名词。

困境 2

AI厂商：训练成本难以收回

很多AI大模型企业虽然愿意尝试新技术，但由于已经在T架构模型训练上投入了海量资源，沉没成本巨大，难以从零开始，用新架构训练一个新模型。

困境 3

AI企业用户：采购成本难以为继

很多希望涉足AI的传统行业企业，虽然向往AI带来的产业转型与产能升级前景，但苦于大模型训练成本高昂，一时难以在算力、存储与人力成本上下重注，不知如何针对企业具体经营需要合理配置大模型采购。

因此，如何不对底层架构进行根本性调整、在现有架构的基础上施以魔法，实现模型整体性能优化，是当今整个人工智能行业共同面临的核心需求。

Ch. 2

AI 厂商降本增效

GSA 无痛优化大模型，无需再次预训练

性能噌噌猛增，成本 chuachua 直降!

很多【AI厂商】已经练出自己的 Transformer 架构大模型，但随着模型规模的增长，算力消耗、上下文处理能力和功耗逐渐成为迫在眉睫的难题。

陆兮科技全新发布的【GSA】产品可以在模型架构层面，不改变预训练路径，无需重复进行预训练，无缝集成到现有大模型中，低成本、高质量、快速突破大模型性能瓶颈！

卖点 1

运算难度：抛物线秒变直线

[ 推理速度 + 使用体验 ] 升升升 !

[ 算力成本 + 能耗开支 ] 降降降 !

通过GSA优化后的模型，推理速度将提升至少 20-30%，同时减少至少 25-40% 的算力成本与能耗开支。也就是说，模型不仅运行更快，而且更加节能，节约的算力资源可以直接减少企业的基础设施成本。

卖点 2

上下文长度：无限扩展延长

[ 大数据 + 复杂任务 ] 秒处理

[ 延迟 + 卡壳 +宕机 ] 一扫光

传统的Transformer架构在处理长文本时性能受限，GSA可以将上下文处理长度短期提升至少 30%、长期提升至无限长度，让优化后模型在处理长文本或复杂对话时不再受制于技术瓶颈，提升用户体验和模型精度。

卖点 3

现有架构：无缝光速优化

无需重新 [ 搭架构 + 预训练 ]

立等可取 [ 简单升级就能用 ]

GSA设计的最大优势之一就是它可以直接无缝集成到现有 Transformer 架构中，无需重新预训练或修改现有的推理机制，简单升级即可享受全面优化的性能提升。

Ch. 3

企业用户 AI 转型

GSA 全面降低AI产品采购+运维成本

为传统产能插上 [AI 业转型] 金翅膀！

对于想入手大模型、希望用AI实现产业升级、奈何模型采购与使用成本高昂的【企业客户】而言：GSA让AI服务买得起、用得起、玩得转，无痛实现传统行业AI转型！

很多企业与机构看到了AI带来的巨大潜力。在智能制造、智能出行、智慧农业、智慧金融、医疗诊断、视觉设计、办公自动化、客服自动化、工业自动化、城市治理等 “千行百业“，AI都在发挥着企业服务领域前所未有的”智能化“作用。

AI不仅可以大幅提升办公效率，替代原本需要人力完成的重复性工作，同时可以大幅提升工作智能化程度，为企业管理、产品设计、市场营销、客户运维提供高效智能辅助。可以说，当今的每一个企业，都想有一个能够服务企业上下每一位员工的 “人工智能助手“ or “人工智能生产力工具”。

然而，大部分针对企业定制的”人工智能助手“，背后依旧是Transformer架构驱动的底座模型。企业部署一个”人工智能助手“，必须为Transformer架构和底座模型的训练、调试、推理和日常运营付出巨额金钱、时间和人力成本。

同时，绝大多数企业端 ”人工智能助手“ 必须在云端 + 服务器端部署。由于Transformer架构运算复杂度限制，大部分T架构大模型必须依赖云端大额算力与存储资源。企业在使用 “人工智能助手” 时，终端APP需与云端服务器通过网络保持实时通信，数据安全问题严重，隐私泄露风险极高。

原本以”降本增效“为卖点的”人工智能“，到头来却成为企业资本管理的巨额负担与企业数据管理的新风险，让很多企业望而却步，的确是本末倒置。GSA的出现，将彻底改变这一局面

卖点 1

不上云 + 离线用

数据资产更安全

本地部署更聪明

经过GSA优化的大模型，由于算力 + 存储 + 能耗成本骤降，可以轻松在企业本地服务器直接部署，无需依赖云端算力，在不联网的情况下即可实现GPT-4级别的离线智能功能。

GSA具备极强的安全保护性能。经过GSA加持的大模型，无需云端通讯，基于客户本地存储的、不便出域的隐私数据，即可完成绝大部分企业办公与经营相关任务，从源头杜绝AI数据隐私泄露风险。

卖点 2

线性计算 = 更便宜 + 更好用

智能转型成本低

场景功能多又好

经过 GSA 优化的大模型，由于运算复杂度从【抛物线】增长变为【等比线性增长】，模型参数量级增幅与算力开销增长呈等比关系。换言之，以往练 Transformer 大模型，需要投入模型规模至少二次方倍的算力资源，成本上不封顶；现在只需投入模型规模同样量级的算力，即可完成，成本完全可控。

可以说，GSA的推出，将会极大地拉低大模型驱动的”人工智能助手“类产品的价格，降低大模型的采购门槛，提升大模型算力资源分配的合理性，引导AI厂商与AI企业用户将算力资源投入到扩展 AI产品功能性 + 提升定制化部署精准度 + 更好服务企业用户需求上。

卖点 3

易安装 + 易部署 = 早盈利

助您巩固行业地位

成为 AI 时代新龙头

作为架构优化产品，GSA 与现有的Transformer架构 100% 匹配，在部署时不会破坏 AI 产品、底座模型与Transformer架构本身自带的代码体系、数据集和基础推理逻辑，无需再次开展预训练。

GSA部署过程类似电脑 + 手机软件安装过程，用时短，效率高，所需人力极少；部署后无需多次微调，仅需单次微调，即可投入企业生产工作与运营管理，不干扰原有AI产品、底座模型与Transformer架构正常运营。

对于已经采购人工智能产品的企业，使用 GSA 可以即刻降低现有工具的使用成本，节约算力、存储、能耗，加速回本+止损+增效+增收速度，让企业尽收AI时代红利，筑牢行业领先地位。

对于尚未采购人工智能产品的企业，既可以入手国内各类基于Transformer架构打造的AI大模型，用陆兮科技 GSA 实现推理与运营层面的降本增效，更可以直接入手陆兮科技的企业定制化模型产品，用内置”GSA“的陆兮科技Transformer大模型，实现架构 + 训练 + 推理 + 运行全流程降本增效。