大数跨境

数千万关注+杨立昆转发+全球媒体报道!无矩阵乘法大模型有多厉害?

数千万关注+杨立昆转发+全球媒体报道!无矩阵乘法大模型有多厉害? 陆兮科技LuxiTech
2024-08-16
1
导读:国内外AI同行:“香,真香,太香了!”

今年六月
中国首个
大模型架构企业
全球首个
类脑AI全生态链企业

陆兮科技
LuxiTech

在全球最大的
开源科技类文献库


发布了一篇
震惊AI学术
与产业界的

***  重 磅 论 文  ***

可大规模部署的
无矩阵乘法模型


论文链接:https://arxiv.org/abs/2406.02528
请滑到文章末尾处点击  “阅读原文”  查看

该论文一经发布
一夜间便吸引全球
 数千万人关注 

人称AI教父的
图灵奖获得者
因为舌战马斯克
而火遍全网的
杨力昆
Yann LeCun
也在该论文发布的第一时间
通过个人推特账号转发
单条推送阅读量
一夜间突破240万


同时,多家海内外
金融与科技媒体
多个国内头部
AI公众号
纷纷第一时间报道

全网总阅读量
突破千万!

这篇论文背后的
由陆兮科技主导的
  尖 端 学 术 研 究  
到底有多厉害呢?

众所周知
谷歌专利技术
Transformer
OpenAI专利技术
GPT 
虽然推动了上一轮
生成式人工智能涌现
同时也催生了

巨巨巨巨巨巨巨大

算力成本
Computing Cost

巨巨巨巨巨大

存储占用
Memory Consumption

以及


用户提问
大模型回答
之间的

响应延迟
Latency

这些
 “落后技术”

质量发展新质生产力
人工智能+行动背后的
绿水青山+节能减碳
总体发展思路

与企业和个人
使用人工智能
实现降本增效的初衷
与我们每一个人潜意识里
希望与机器智能
无缝、零延迟、高质量对话
的本能

 背 道 而 驰 

基于Transformer打造的
泛GPT类大模型
对,就是你们每天都在用的
市面上99.9%的大模型
之所以算力消耗如此巨大
大部分原因
就是因为【学习】和【推理】
都离不开一个
运算量极其巨大的算法

【矩阵乘法】

如果您想了解
【矩阵x乘法】驱动的GPT
到底有多

 重+贵+笨+慢 

请复习陆兮科技4月发布的
【Transformer的七年之痒】

而在陆兮科技发布的
重磅论文里
  陆兮CTO 周芃  
(通讯作者)
携手一众AI专家
共同提出了一种
有效替代【矩阵x乘法】
可以在FPGA芯片上
实现低成本+大规模部署的
  全新类脑大模型架构  

与Transformer和GPT相比
【无矩阵乘法】模型架构
算力消耗:下降至少10
运存占用:下降至少10
响应延迟:缩短至少10

整体性能实现
跨 时 代 的 进 步

翻译成大家都能听得懂的
非学术语言

由于【无矩阵乘法】架构
可在技术成熟
采购+使用+维护成本较低的
FPGA芯片
实现过去只有高价芯片
才能做到的大规模部署

【无矩阵乘法】大模型
不仅将大幅降低
算力使用成本

还会进一步推动
芯片行业产业变革

这将使世界各地的大模型
不再依赖某几家
垄断型芯片企业

用成本较低的
成熟制程芯片
没错
不要3nm/5nm/7nm
只需要14nm/28nm
就能实现
100%的
大模型功能性

全球芯片行业
无需依赖
高精度制程
即可实现
大模型硬件性能跃迁

这也意味着
芯片行业有机会摆脱

"卷制程"
"卷工艺"

过度投入+低效收益的
成本陷阱

下一步
陆兮科技将基于

MatMul-Free
无矩阵乘法架构

和其他NEURARK类脑架构
发布一系列

低成本+高功效+低延迟+低排放的
类脑生成式AI大模型

覆盖底座+通用+行业垂类+端侧离线
AI全生态链产品线

敬请期待!!!!!!



陆小兮邀请您关注
全球最懂“类脑AI”的
陆兮科技


【声明】内容源于网络
0
0
陆兮科技LuxiTech
陆兮的类脑大语言模型「Neuromorophic language model」基于循环神经网络和脉冲神经网络,采取原创的类脑算法架构
内容 26
粉丝 0
陆兮科技LuxiTech 陆兮的类脑大语言模型「Neuromorophic language model」基于循环神经网络和脉冲神经网络,采取原创的类脑算法架构
总阅读0
粉丝0
内容26