数千万关注+杨立昆转发+全球媒体报道！无矩阵乘法大模型有多厉害？- 大数跨境

首页

数千万关注+杨立昆转发+全球媒体报道！无矩阵乘法大模型有多厉害？

陆兮科技LuxiTech

2024-08-16

导读：国内外AI同行：“香，真香，太香了！”

今年六月

中国首个

大模型架构企业

全球首个

类脑AI全生态链企业

陆兮科技

LuxiTech

在全球最大的

开源科技类文献库

发布了一篇

震惊AI学术

与产业界的

*** 重磅论文 ***

可大规模部署的

无矩阵乘法模型

论文链接：https://arxiv.org/abs/2406.02528

请滑到文章末尾处点击 “阅读原文” 查看

该论文一经发布

一夜间便吸引全球

数千万人关注

人称AI教父的

图灵奖获得者

因为舌战马斯克

而火遍全网的

杨力昆

Yann LeCun

也在该论文发布的第一时间

通过个人推特账号转发

单条推送阅读量

一夜间突破240万

同时，多家海内外

金融与科技媒体

多个国内头部

AI公众号

纷纷第一时间报道

全网总阅读量

突破千万!

这篇论文背后的

由陆兮科技主导的

尖端学术研究

到底有多厉害呢？

众所周知

谷歌专利技术

Transformer

和

OpenAI专利技术

GPT

虽然推动了上一轮

生成式人工智能涌现

同时也催生了

巨巨巨巨巨巨巨大的

算力成本

Computing Cost

巨巨巨巨巨大的

存储占用

Memory Consumption

以及

巨

长

的

用户提问与

大模型回答

之间的

响应延迟

Latency

这些

“落后技术”

与高质量发展、新质生产力和

人工智能+行动背后的

绿水青山+节能减碳

总体发展思路

与企业和个人

使用人工智能

实现降本增效的初衷

与我们每一个人潜意识里

希望与机器智能

无缝、零延迟、高质量对话

的本能

背道而驰

基于Transformer打造的

泛GPT类大模型

对，就是你们每天都在用的

市面上99.9%的大模型

之所以算力消耗如此巨大

大部分原因

就是因为【学习】和【推理】

都离不开一个

运算量极其巨大的算法

【矩阵乘法】

如果您想了解

【矩阵x乘法】驱动的GPT

到底有多

重+贵+笨+慢

请复习陆兮科技4月发布的

【Transformer的七年之痒】

而在陆兮科技发布的

重磅论文里

陆兮CTO 周芃

(通讯作者)

携手一众AI专家

共同提出了一种

有效替代【矩阵x乘法】

可以在FPGA芯片上

实现低成本+大规模部署的

全新类脑大模型架构

与Transformer和GPT相比

【无矩阵乘法】模型架构

算力消耗：下降至少10倍

运存占用：下降至少10倍

响应延迟：缩短至少10倍

整体性能实现

跨时代的进步

翻译成大家都能听得懂的

非学术语言

由于【无矩阵乘法】架构

可在技术成熟

采购+使用+维护成本较低的

FPGA芯片上

实现过去只有高价芯片

才能做到的大规模部署

【无矩阵乘法】大模型

不仅将大幅降低

算力使用成本

还会进一步推动

芯片行业产业变革

这将使世界各地的大模型

不再依赖某几家

垄断型芯片企业

用成本较低的

成熟制程芯片

没错

不要3nm/5nm/7nm

只需要14nm/28nm

就能实现

100%的

大模型功能性

全球芯片行业

无需依赖

高精度制程

即可实现

大模型硬件性能跃迁

这也意味着

芯片行业有机会摆脱

"卷制程"

"卷工艺"

过度投入+低效收益的

成本陷阱

下一步

陆兮科技将基于

MatMul-Free

无矩阵乘法架构

和其他NEURARK类脑架构

发布一系列

低成本+高功效+低延迟+低排放的

类脑生成式AI大模型

覆盖底座+通用+行业垂类+端侧离线

AI全生态链产品线

敬请期待!!!!!!

陆小兮邀请您关注

全球最懂“类脑AI”的

陆兮科技

【声明】内容源于网络

陆兮科技LuxiTech

陆兮的类脑大语言模型「Neuromorophic language model」基于循环神经网络和脉冲神经网络，采取原创的类脑算法架构

内容 26

粉丝 0

陆兮科技LuxiTech 陆兮的类脑大语言模型「Neuromorophic language model」基于循环神经网络和脉冲神经网络，采取原创的类脑算法架构

总阅读0

粉丝0

内容26