对话面壁CEO李大海：端侧AI模型赶上GPT-4，国产芯软件要补课- 大数跨境

首页

对话面壁CEO李大海：端侧AI模型赶上GPT-4，国产芯软件要补课

智东西

2026-06-12

导读：面壁智能CEO谈端侧AI终局、国产算力与开源打法。

面壁智能 CEO 李大海深度解析端侧 AI 终局、国产算力适配与开源战略。

作者 | 江宇

编辑 | 漠影

6 月 12 日，在智源大会期间，面壁智能 CEO 李大海与 AI Infra 负责人李宇轩接受了媒体专访。双方就端侧模型进展、国产算力适配、智能体落地、开源策略及汽车手机等终端场景进行了深入交流。李大海针对行业热点抛出了多项关键判断：

1、端侧模型进展：原预测 2026 年底达 GPT-4 水平的目标已提前实现。

2、端侧落地：2025 年为端侧模型落地元年，汽车量产是重要标志，今年将有更多应用爆发。

3、端侧角色：面壁将持续发布端侧基础模型，服务头部设备厂商，并探索 AI 原生端侧硬件。

4、智能体：多场景已可落地，但外界对“零介入、全负责”的期待仍偏高。

5、手机智能体：端侧模型与智能体结合的核心价值在于改变人机交互方式。

6、国产算力：训练环节需模型与芯片厂更深协作，软件生态仍需完善。

7、开源策略：开源是高效商业模式，旨在降低客户验证成本，核心竞争力仍在“冰山之下”。

8、端侧 AI 终局：长期看模型与芯片将深度协同，甚至出现“模型即芯片”，但这仍是较远未来。

端侧模型提前追上 GPT-4，落地等待芯片协同

在近四十分钟的群访中，李大海和李宇轩回答了十余个关键问题。

Q1：2024 年曾预测，到 2026 年底端侧模型智能水平可以达到 GPT-4 水平。现在看，这个目标会提前还是延后？

李大海明确表示，这个目标已经提前达到。

他指出，面壁近期发布的 MiniCPM-5 1B 版本在 Artificial Analysis 榜单上得分 17.6 分。社区研究显示，2024 年 5 月 OpenAI 发布的 GPT-4o（约 200B 参数）在该榜单得分仅高出零点几分，而 MiniCPM-5 1B 参数量仅为 1B。这验证了面壁提出的“大模型知识密度定律”。

Q2：端侧模型现在落地到哪些生活场景？为什么用户感知还不强？

李大海认为，2025 年是端侧模型落地元年，面壁去年四季度在汽车上的正式量产即是重要标志。

他坦言，端侧模型能力增长迅速，但落地的最大制约仍是模型与芯片的结合。随着一批国产存算一体端侧 AI 芯片完成流片并提供更有竞争力的功耗、算力和带宽，端侧应用将迎来爆发。未来的合理架构是上下文管理与高频推理在端侧，形成高效的端云协同。

Q3：面壁在端侧模型领域的长期定位是什么？

李大海将面壁定位为“端侧模型的基础设施”，主要开展三层工作：持续发布世界领先的端侧基础模型赋能开发者；直接服务出货量大的重要设备厂商；探索新的 AI 原生端侧硬件产品。

智能体已具备落地能力，“零介入”尚需时日

Q4：面壁怎么看智能体当前的局限？最大问题是成本、稳定性、记忆，还是权限？

李大海表示，智能体正在快速进化，虽面临诸多挑战，但模型与智能体的结合推进迅速。面壁早在 2024 年便利用智能体技术在人工智能辅助审判领域协助法官落地。

但他也指出，外界对智能体“零介入、100% 完成且负责”的期待过高。技术打磨符合自然规律，仍需时间沉淀。

Q5：怎么看豆包手机这类把智能体放到手机上的尝试？

李大海认为这是必然趋势。端侧模型的重要方向之一，就是改变人与设备的交互方式。相比云端，端侧模型在隐私保护、实时性和可靠性上更具优势，更适合承担高频人机交互任务。他类比云游戏指出，用户对交互帧率和稳定性的极高要求，决定了此类能力更适合在端侧完成。

Q6：做端侧智能体会遇到哪些困难？

核心难点依然是模型与芯片的结合。李大海将其概括为能力、成本和场景三要素的匹配。目前限制主要来自芯片、内存和带宽，但在端侧摩尔定律和知识密度定律的双重推动下，这些问题正逐步改善。

国产算力进入训练环节，软件生态亟待补课

Q7：依托国产智算集群做训练和推理时，如何提高算力利用率？如何协作？

李大海透露，过去行业多用英伟达芯片训练，推理逐步转向国产；今年起，训练工作也开始向国产卡转移。

他坦言，相比英伟达集群，国产芯片集群在软件生态上仍有差距，需要芯片公司提供更多支持。面壁一方面与国产芯片厂深入配合，另一方面与智源主导的 FlagOS 生态深度合作，通过自顶向下的规划推动生态完善。

李宇轩补充道，训练对精度要求高于推理。面壁利用“模型风洞”技术，先在华为等国产卡上进行深度评测并与英伟达对齐，确认精度可用后再推进大模型训练。

Q8：此前提到在昇腾上达到 95% 训练效率，另外 5% 差距来自哪里？

李宇轩澄清，该数据并非指华为平台相对英伟达的效率，而是指在华为平台上，极低位宽量化感知训练相比普通训练达到了 95% 的效率。面壁与华为合作优化了量化器开销，将损失控制在 5% 以内，验证了极低位宽训练 pipeline 的可行性。

苹果端侧 AI 落地稍晚，手机厂商差距未拉开

Q9：怎么看苹果推出端侧大模型？会不会挤压高端安卓手机市场？

李大海认为，苹果早在 2024 年 6 月公布战略，以苹果的风格来看，今日才落地已晚于行业预期。苹果在大模型上与谷歌的深度合作，反而凸显了第三方专业大模型公司的价值。他认为关键在于芯片选型及场景产品设计，国内手机厂商在此方向理解深刻，差距并不大。

Q10：手机厂商选择面壁，主要看重哪些因素？

李大海总结三点：一是面壁能持续训练高知识密度的端侧模型；二是与高通等端侧芯片公司有深度协同设计合作；三是在高效推理上积累深厚。他强调，在同等效果下，显著降低推理功耗是巨大的竞争优势。

Q11：端侧模型压缩是否有极限？

李大海指出，1.58 比特应已是极限，关键在于在此压缩比下保持低性能损失。李宇轩团队通过在训练第一阶段即引入三值量化作为量化感知训练的一部分，有效降低了量化损失。

开源是高效商业模式，核心竞争力在“冰山之下”

Q12：中国大模型公司出海时，如何平衡自主可控与全球开放合作？

李大海认为两者不冲突。自主可控是内生要求，开放合作体现于灵活的商业模式及对海外客户文化的尊重。同时，开放不等于无底线输出技术，面壁将在国家相关指导方针下推进海外合作。

Q13：行业竞争激烈，面壁为什么仍然坚持开源？

李大海表示，开源是非常高效的商业模式，能用更低成本触达潜在客户。开源模型便于客户低成本试用和内部验证，从而提升从技术影响力到商业合作的转化效率。

对于是否培养竞争对手，他认为开源内容不足以让他人完全掌握核心能力，因为一家公司的核心竞争力在“冰山之下”。企业应靠技术前瞻性和速度构建持续优势，而非单纯依赖技术封锁。

多场景落地推进，法律领域成效显著

Q14：过去一年，面壁主要有哪些进展？未来规划是什么？

李大海介绍了三方面进展：资本层面，获得包括国家队属性资本在内的多方支持；技术层面，持续推进基础模型、数据治理及 AI 训练框架，推出流式全双工端侧全模态模型；产业层面，除智能汽车外，还将端侧模型部署至手机、无人机、潜水器等终端，实现“上天入地”。此外，面壁协助最高人民法院进行的全国法院“一张网”试点已覆盖 20 至 30 个城市。