阿里通义千问团队在国际顶级AI会议NeurIPS 2025上荣获最佳论文奖,成为唯一获此殊荣的中国团队。其研究成果《Gated Attention for Large Language Models》首次系统阐释了注意力门控机制对大模型性能与训练稳定性的影响。 几乎同时,DeepSeek开源社区发布具备自我验证能力的数学推理模型DeepSeekMath-V2,在2025年国际数学奥林匹克竞赛(IMO)中达到金牌水平。 国家发改委同日就具身智能产业发展发声,政策研究室副主任李超表示,我国人形机器人企业已超过150家,要着力防范重复度高的产品“扎堆”上市风险,并将建立健全行业准入和退出机制。 而在资本层面,国产GPU企业沐曦股份科创板IPO获准注册,摩尔线程完成上市申购;阿维塔科技正式向港交所提交上市申请,2025年上半年营收达122亿元。01大模型架构革新:门控注意力机制突破阿里通义千问的Gated Attention研究攻克了长期困扰大模型的训练不稳定和长度外推难题。该技术仅增加1%参数,即实现困惑度显著下降与多项基准评测提升。 NeurIPS 2025评委会认为这一成果“将极大推动社区对大语言模型中注意力机制的理解”。门控机制如同为模型装上“智能降噪耳机”,帮助模型过滤无效信息,提升性能。在1.7B密集模型与15B混合专家模型上训练超过3.5万亿token的实验表明,门控注意力将首token注意力占比从46.7%降至4.8%,同时将最大激活值从1053降至94。这意味着大模型训练过程中的损失波动大幅减少,低精度训练稳定性增强。该技术已成功应用于Qwen3-Next模型并全面开源,为全球开发者提供了新思路。02DeepSeekMath-V2的定理证明突破DeepSeekMath-V2采用基于大语言模型的验证机制,可对生成的数学证明进行自动审查,突破传统方法仅关注最终答案准确性的局限。该模型在多项高规格数学竞赛中表现卓越:在2025年国际数学奥林匹克竞赛(IMO 2025)和2024年中国数学奥林匹克竞赛(CMO 2024)中均达到金牌水平,更在2024年普特南数学竞赛(Putnam 2024)中取得118分(满分120分)的优异成绩。DeepSeekMath-V2在IMO-ProofBench基准测试中展现出了差异化优势。在Basic基准上达到近99%的高分,远胜其他模型,而排在第二的Gemini Deep Think分数为89%。团队指出,虽然仍有许多工作要做,但这些结果表明可自我验证的数学推理是一个可行的研究方向,为构建更强大、更可信的数学智能系统提供了新方向。03人形机器人政策引导与风险防控我国具身智能产业正以超50%的增速跨越式发展,预计2030年将达到千亿元市场规模。但随着新兴资本加速入场,目前已有超过150家人形机器人企业,其中半数以上为初创或“跨行”入局。面对“速度”与“泡沫”的平衡问题,国家发改委将采取三方面措施: