DeepSeek V4成功迁移至华为昇腾950PR芯片
DeepSeek V4已完成从英伟达CUDA到华为CANN框架的迁移,部署于华为昇腾950PR芯片。据The Information 4月3日报道,国内主要互联网企业已向华为预订数十万颗芯片,以抢占模型发布先机。
昇腾950PR上月开始量产,专为推理设计。华为昇腾计算业务负责人张迪轩表示,其算力约是英伟达H20的2.87倍。H20是英伟达为中国市场定制的芯片,但更强型号H200供应时间未定,华为芯片成为当前主流选择。
DeepSeek选择与华为和寒武纪等国产芯片企业合作进行适配,涉及底层代码重写和反复测试,部分原因导致V4从原计划2月延迟至近期发布。去年使用昇腾910C训练模型时曾遇稳定性问题,本次V4可能是首个完整跑通的国产芯片适配案例。
华为芯片生态仍有差距:训练芯片950DT预计今年Q4上市,追赶H200需至2027年。但DeepSeek擅长高效用算,V3训练成本仅560万美元。V4非官方爆料为万亿参数混合专家模型,支持百万token上下文和多模态,但尚未获证实。若如期发布,它将是首个专为国产芯片重写的主流AI模型。
GPT-6发布传闻分析
GPT-6代号“Spud”存在,预训练于3月24日完成,Sam Altman表示发布将数周内进行。但性能提升40%、200万token上下文等具体数据无可靠信源,模型命名尚待确定。
市场预测GPT-5.5 4月底前发布概率70%,6月底前95%;GPT-6年底前发布概率83%。当前英伟达芯片供应紧张,但国产AI模型研发持续加速。

