搜索
首页
大数快讯
大数活动
服务超市
文章专题
出海平台
流量密码
出海蓝图
产业赛道
物流仓储
跨境支付
选品策略
实操手册
报告
跨企查
百科
导航
知识体系
工具箱
更多
找货源
跨境招聘
DeepSeek
分享
字节跳动大模型团队推出稀疏架构,推理成本削减83%
2025-02-12 14:22 星期三
2月12日,字节跳动豆包大模型Foundation团队推出UltraMem架构,解决稀疏模型计算和参数解耦的推理访存问题,保持模型效果。该架构使MoE推理时的访存问题得到有效解决,推理速度提升2-6倍,最高降低成本83%。
新闻推荐
查看更多
大数新闻社群
7x24h跨境新闻推送
加入卖家交流群
查看更多
2025-02-12 14:22 星期三
字节跳动大模型团队推出稀疏架构,推理成本削减83%
2月12日,字节跳动豆包大模型Foundation团队推出UltraMem架构,解决稀疏模型计算和参数解耦的推理访存问题,保持模型效果。该架构使MoE推理时的访存问题得到有效解决,推理速度提升2-6倍,最高降低成本83%。
下载