大数跨境
0
0

一日四重磅:千问团队在NeurIPS 2025上荣获最佳论文奖,人形机器人迎新规,阿维塔冲港股,芯片业加速跑

一日四重磅:千问团队在NeurIPS 2025上荣获最佳论文奖,人形机器人迎新规,阿维塔冲港股,芯片业加速跑 AIGC 深一度
2025-11-28
0
导读:阿里通义千问团队在国际顶级AI会议NeurIPS 2025上荣获最佳论文奖,成为唯一获此殊荣的中国团队。


阿里通义千问团队在国际顶级AI会议NeurIPS 2025上荣获最佳论文奖,成为唯一获此殊荣的中国团队。其研究成果《Gated Attention for Large Language Models》首次系统阐释了注意力门控机制对大模型性能与训练稳定性的影响。


几乎同时,DeepSeek开源社区发布具备自我验证能力的数学推理模型DeepSeekMath-V2,在2025年国际数学奥林匹克竞赛(IMO)中达到金牌水平。


国家发改委同日就具身智能产业发展发声,政策研究室副主任李超表示,我国人形机器人企业已超过150家,要着力防范重复度高的产品“扎堆”上市风险,并将建立健全行业准入和退出机制。


而在资本层面,国产GPU企业沐曦股份科创板IPO获准注册,摩尔线程完成上市申购;阿维塔科技正式向港交所提交上市申请,2025年上半年营收达122亿元。
01
大模型架构革新:门控注意力机制突破
阿里通义千问的Gated Attention研究攻克了长期困扰大模型的训练不稳定和长度外推难题。该技术仅增加1%参数,即实现困惑度显著下降与多项基准评测提升。


NeurIPS 2025评委会认为这一成果“将极大推动社区对大语言模型中注意力机制的理解”。门控机制如同为模型装上“智能降噪耳机”,帮助模型过滤无效信息,提升性能。
在1.7B密集模型与15B混合专家模型上训练超过3.5万亿token的实验表明,门控注意力将首token注意力占比从46.7%降至4.8%,同时将最大激活值从1053降至94。
这意味着大模型训练过程中的损失波动大幅减少,低精度训练稳定性增强。该技术已成功应用于Qwen3-Next模型并全面开源,为全球开发者提供了新思路。
02
DeepSeekMath-V2的定理证明突破
DeepSeekMath-V2采用基于大语言模型的验证机制,可对生成的数学证明进行自动审查,突破传统方法仅关注最终答案准确性的局限。
该模型在多项高规格数学竞赛中表现卓越:在2025年国际数学奥林匹克竞赛(IMO 2025)和2024年中国数学奥林匹克竞赛(CMO 2024)中均达到金牌水平,更在2024年普特南数学竞赛(Putnam 2024)中取得118分(满分120分)的优异成绩。
DeepSeekMath-V2在IMO-ProofBench基准测试中展现出了差异化优势。在Basic基准上达到近99%的高分,远胜其他模型,而排在第二的Gemini Deep Think分数为89%。
团队指出,虽然仍有许多工作要做,但这些结果表明可自我验证的数学推理是一个可行的研究方向,为构建更强大、更可信的数学智能系统提供了新方向。
03
人形机器人政策引导与风险防控
我国具身智能产业正以超50%的增速跨越式发展,预计2030年将达到千亿元市场规模。但随着新兴资本加速入场,目前已有超过150家人形机器人企业,其中半数以上为初创或“跨行”入局。
面对“速度”与“泡沫”的平衡问题,国家发改委将采取三方面措施:
  • 加速构建行业标准与评价体系,建立健全准入退出机制
  • 加快关键核心技术攻关
  • 推动训练与中试平台等基础设施建设
上海财经大学数字经济研究院发布的《具身智能十大观察》报告显示,政策引导下,具身智能产业未来将呈现三大趋势:技术创新聚焦算法优化与国产替代,产业协同强化上下游合作与集群发展,应用落地向工业、医疗、家庭等场景纵深拓展。
投资机构建议,现阶段不应拘泥于“人形”,而应深度挖掘“AI+机器人”的机会,如外骨骼机器人、灵巧手和传感器等商业化落地更快的方向。
04
新能源汽车与芯片产业资本动态
阿维塔科技港股上市申请
阿维塔科技正式向港交所提交上市申请,联席保荐人为中信证券、中金公司。招股书显示,2025年上半年阿维塔营收122.08亿元,同比增长98.5%,其中车辆销售收入114.9亿元。
阿维塔已实现连续八个月销量超1万辆,完成“三年四车”产品布局。公司提出雄心勃勃的销量目标:2027年冲击40万辆全球销量,2030年达80万辆,2035年挑战150万辆。
芯片企业上市与融资动态
芯片领域,纳芯微启动H股招股,计划全球发售1906.84万股H股,发售价上限为每股116.00港元,预计12月8日开始交易。公司已将募集资金主要用于提升技术能力、扩大汽车电子应用和扩展海外市场。
国产GPU企业迎来上市潮。沐曦股份科创板IPO获准注册,计划募资39.04亿元;摩尔线程完成上市申购,尽管有334.86万元新股遭弃购,但整体发行结果稳健。
同时,AI算力服务商无问芯穹完成近5亿元A+轮融资,由珠海科技集团、孚腾资本领投,形成“国资+市场”资金的双重加持格局。该公司致力于推动AI从数字世界走向物理世界,为智能体规模化落地提供基础设施支持。
随着技术不断突破,中国科技产业正迎来多领域协同发展的新阶段。阿里千问和DeepSeek的开源举措加速了大模型技术普及;国家发改委对具身智能产业的规范引导有望避免无序竞争;阿维塔的IPO申请代表着中国智能电动车成熟度获资本认可;芯片企业的密集上市和融资则预示着国产替代进程加快。

动动小手点点赞

图片

【声明】内容源于网络
0
0
AIGC 深一度
专注AIGC领域,关注微软 OpenAI、百度文心一言、讯飞星火 DeepSeek等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC,欢迎关注 个人网站 https://www.chenbaiqi.com
内容 469
粉丝 0
AIGC 深一度 专注AIGC领域,关注微软 OpenAI、百度文心一言、讯飞星火 DeepSeek等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC,欢迎关注 个人网站 https://www.chenbaiqi.com
总阅读46
粉丝0
内容469