DeepSeek新一代大模型V4完成国产AI芯片适配
4月4日,据报道,DeepSeek即将发布的新一代大语言模型V4已基于华为等最新国产AI芯片完成优化。
为确保V4在国产硬件上顺利运行,DeepSeek过去数月已与华为及寒武纪展开深度合作,对模型底层程序进行调整重写并同步验证测试。
与以往AI模型优先适配美系芯片不同,此次DeepSeek未向美方芯片厂商提供测试,将国产芯片厂商置于优先位置。
该团队同步开发了两款针对不同应用场景的V4衍生版本,同样基于中国芯片设计。
为应对云服务上线需求,阿里巴巴、字节跳动和腾讯等科技企业已提前采购华为新一代AI芯片,订单量达数十万颗。
华为于3月21日中国合作伙伴大会正式推出搭载昇腾950PR处理器的Atlas 350加速卡。该芯片基于SIMD架构,算力达1PFLOPS(FP8)/ 2PFLOPS(FP4),支持FP32至FP4等多种数据格式,互联带宽2TB/s,配备128GB内存及1.6TB/s带宽。


