编辑部 整理自 MEET2026
量子位 | 公众号 QbitAI
大模型究竟是真正有用,还是仅是技术噱头?企业如何判断自身是否需要部署私有模型?
潞晨科技创始人兼董事长、新加坡国立大学校长青年教授尤洋提出了一套清晰的判断框架,为企业提供决策参考。
有三类企业需要行业模型或私有模型:传统大型企业、拥有海量数据的中小型企业,以及致力于颠覆行业的新兴公司。
在具体落地层面,尤洋指出:
若企业业务仅涉及日常办公或文本处理,无需构建私有模型。调用通用大模型API或结合RAG技术即可满足多数需求。
若企业具备海量多模态数据或对数据隐私有高要求,则更适合构建私有模型,以实现差异化竞争优势。
以下为尤洋在MEET2026智能未来大会上的演讲内容整理,在不改变原意基础上进行精炼与优化。
MEET2026智能未来大会由量子位主办,汇聚近30位产业代表,线下参会人数近1500人,线上直播观看超350万次,获主流媒体广泛关注。
核心观点梳理
-
大模型的价值远不止于聊天机器人或编程助手,其真正潜力在于千行百业的深度落地。 -
三类企业适合构建行业或私有模型:传统大型企业、拥有海量数据的中小企业、颠覆性创新企业。 -
To B场景下,关键在于后训练或Agent化;仅调用API难以形成竞争壁垒,开源模型需经专业训练方可超越闭源模型。 -
企业成功部署大模型的关键:最大化算力效率,并配备微调SDK与低代码模板。 -
潞晨云推出微调SDK,开发者可专注算法创新,平台负责训练调度、分布式适配及底层运维。
四年服务八家世界五百强,助力三千企业AI落地
潞晨科技坚信,大模型的核心价值在于推动AI在各行业的实际应用,而非局限于通用对话能力。
作为新加坡国立大学教授,我于2021年创立潞晨科技,专注于大模型基础设施研发。过去几年,我们已在技术与商业化方面取得阶段性成果。
自2018年起,潞晨聚焦大模型底层系统优化,涵盖编译器、CUDA及优化算法等关键技术。
LAMB优化器是早期代表性成果,曾在Google千卡TPU集群上将大模型训练时间从三天缩短至76分钟。
该技术现已被微软DeepSpeed、字节Megascale、英伟达Megatron-LM等主流万卡系统广泛采用。
基于LAMB的延伸研究已应用于华为盘古大模型和字节推荐系统,并荣获ACL杰出论文奖。
Anthropic联合创始人、GPT-3共同第一作者Benjamin Mann曾于2019年使用LAMB,首次将Transformer扩展至128个GPU。
英伟达官方GitHub记录显示,其专家曾借助LAMB实现17倍加速效果。
在此基础上,潞晨打造了高性能大模型训推系统Colossal-AI,并开源基础版本。
目标是通过更高效、低成本的工具,帮助用户快速构建私有模型。
目前,Colossal-AI在GitHub同类项目中综合指标领先,已服务于全球八家世界五百强、十家世界两千强、六十所顶尖高校及三千余家企业,覆盖汽车、互联网、制造、制药等多个行业。
对标Thinking Machines Lab,挖掘行业大模型价值
OpenAI前CTO创办的Thinking Machines Lab虽无营收,估值已达120亿美元,其Tinker平台助力企业构建私有模型与AI Agent。
类似地,Together AI通过算力优化提升GPU利用率。
企业首要问题:是否真需大模型?其价值是实质性的,还是仅为概念炒作?
已有案例表明,大模型正深入垂直领域:中石油昆仑大模型(3000亿参数)、Bloomberg金融模型、华为盘古气象模型、宝马制造优化系统、李维斯、航空航天、动画制作、西门子及制药企业等。
这些场景的数据复杂度远超通用文本模型处理能力,大模型在行业落地的价值尚未充分释放。
例如石油勘探,单井成本高达千万美元,成功率仅10%。大模型可通过分析PB级地质数据,优化钻井决策,即使提升10%效率,也将带来巨大经济效益。
传统算法在稳定性与扩展性上存在瓶颈,而大模型能以更高效率求解复杂方程组,提供更优近似解。
三类企业适合构建私有模型
- 传统大型企业:如世界五百强,拥有大量行业专有数据资源。
- 拥有海量数据的中小企业:深耕细分领域,数据构成核心竞争力。
- 颠覆性创新企业:在金融、制药、社交、游戏等领域探索新模式,亟需定制化AI能力。
三种落地路径选择
- 调用通用API:适用于无行业数据、仅处理日常办公或文本任务的企业。
- RAG + API:拥有一定文本数据时,可通过检索增强生成满足需求。
- 构建私有模型:面对海量多模态数据或高隐私要求(如石油、高铁、汽车、制药、金融),自建模型更具优势。
据Grand View Research预测,大语言模型市场将分为三大方向:
- 领域大模型(Domain-Specific LLMs):如法律、医疗、教育、能源等行业专用模型,预计2033年占市场40%。
- 通用大模型:如ChatGPT、豆包、Gemini,占比约30%。
- 私有大模型:仅供企业内部使用,隔离外部环境,预计占比30%。
Training as a Service:让企业高效打造专属模型
若决定构建私有或行业模型,如何高效利用大模型成为关键。
To B场景下,不应追求复刻通用大模型,而应聚焦后训练(Post-training)与Agent化。
仅调用通用API会导致同质化,无法建立竞争壁垒。唯有通过行业数据深度训练,才能使开源模型超越闭源方案。
企业需重点解决两大问题:
- 最大化算力效率:降低训练成本,提升资源利用率。
- 提供灵活微调模板:支持快速构建行业专用模型。
为此,潞晨推出潞晨云微调SDK,旨在实现Training as a Service。
无论是监督微调还是强化学习,本质均为梯度计算与参数更新。
开发者应专注于业务逻辑与数据本身,而非底层基础设施搭建。
当前市场存在两种极端:
- 零代码微调:易用但控制力弱,难以支撑真实业务。
- 全手动开发:需掌握分布式计算、集群运维等复杂技能,效率低下。
潞晨的目标是将复杂流程抽象为函数级调用,用户只需关注模型与数据,后台由SDK自动管理。
实现工程便捷性与模型灵活性的最佳平衡,既非“玩具级”低代码,也非“裸机式”全栈开发。
通过SDK定义模型与数据,一键完成云端训练与部署,兼容主流开源框架,支持监督微调与强化学习。
底层集成Colossal-AI,进一步优化算力性能,降低企业成本。
用户可自由选择框架、工具链与调度策略。
典型客户案例
-
某世界五百强车企:构建多模态自动化决策支持系统。 -
某世界五百强电商自动驾驶业务:3D点云技术性能显著提升。 -
另一世界五百强车企:打造智能座舱AI模型。 -
制造业世界500强企业:基于AI Agent与具身智能构建供应链管理系统。

