
大多数企业 AI 项目失败,不是因为技术不够,而是因为模型根本不懂业务。互联网训练的通用模型,怎么可能理解你公司几十年的内部文档和工作流?
法国黑马看准了 B 端市场的痛点
还记得那个在 AI 圈横空出世的法国公司 Mistral 吗?这家一直专注服务企业客户的初创公司,刚刚在英伟达 GTC 大会上甩出了一张王牌——Mistral Forge。
简单说,Forge 就是一个让企业从零开始训练专属 AI 模型的平台。不是微调,不是 RAG(检索增强生成),而是真正的从头训练。
Mistral CEO Arthur Mensch 信心满满:公司今年的年度经常性收入(ARR)有望突破 10 亿美元。这个数字放在 OpenAI 和 Anthropic 疯狂收割 C 端用户的背景下,显得格外有意思。
为什么企业需要"自己的"AI?
现在的企业 AI 困境很真实:
| 痛点 | 传统方案的问题 |
|---|---|
| 数据隐私 | 敏感数据上传到第三方 API |
| 语言支持 | 对小语种和专业术语理解差 |
| 领域知识 | 缺乏行业专属知识 |
| 模型控制 | 厂商更新模型,行为不可预测 |
Mistral 的产品负责人 Elisa Salamanca 说得很直白:"Forge 让企业和政府能为特定需求定制 AI 模型。"
跟 RAG 和微调有什么不同?
市面上很多方案都说自己能"定制",但大多数只是:
-
微调(Fine-tuning):在现有模型基础上调整参数 -
RAG:运行时把企业数据塞给模型参考
这两种方法都有天花板——模型底层还是那个通用模型。
Mistral Forge 的野心更大:让企业从头训练模型。理论上,这意味着:
-
对小语种和垂直领域的数据处理更好 -
模型行为完全可控 -
可以用强化学习训练 Agent 系统 -
不用担心厂商突然改模型或下线服务
技术细节:小模型也能玩出大花样
Forge 基于 Mistral 的开源模型家族,包括最近发布的 Mistral Small 4 等小模型。
联合创始人 Timothée Lacroix 解释了一个有趣的技术取舍:
"我们在构建小模型时需要做取舍——它们不可能在所有话题上都像大模型那么强。但通过定制能力,我们可以选择强调什么、放弃什么。"
这意味着企业可以根据自己的场景,打造一个"专精"而非"全能"的 AI。
不只是工具,还有"驻场工程师"
Forge 的服务模式也很有意思。除了平台,Mistral 还配备了一支**前置部署工程师(FDE)**团队——这个概念借鉴自 IBM 和 Palantir。
这些工程师会:
-
深入客户现场 -
帮助识别和整理数据 -
设计评估体系(evals) -
确保数据量足够且质量过关
Salamanca 说:"企业通常没有构建正确 evals 的专业知识,这正是 FDE 能提供的价值。"
谁在用?从政府到芯片巨头
Forge 已经向部分合作伙伴开放,名单相当豪华:
| 客户类型 | 代表客户 | 用途场景 |
|---|---|---|
| 政府 | 欧洲航天局、新加坡 DSO/HTX | 适配本土语言和文化 |
| 科技巨头 | ASML(荷兰光刻机巨头) | 芯片制造知识库 |
| 咨询 | 意大利 Reply | 客户服务 |
| 通信 | 爱立信 | 网络优化 |
ASML 值得一提——这家公司去年领投了 Mistral 的 C 轮融资,估值达到 117 亿欧元(约 138 亿美元)。
企业 AI 的下一战场
Mistral 首席营收官 Marjorie Janiewicz 总结了 Forge 的核心使用场景:
-
政府 —— 需要适配本国语言和文化的模型 -
金融 —— 合规要求极高的行业 -
制造 —— 有大量定制化需求 -
科技 —— 需要基于自有代码库训练模型
这其实是 Mistral 的一次战略宣言:当 OpenAI 和 Anthropic 在 C 端打得火热时,Mistral 选择了另一条路——把企业市场做深做透。
最后
AI 行业的竞争正在分化。
一边是 OpenAI、Anthropic 在消费者市场疯狂扩张,另一边是 Mistral 这样的玩家在 B 端默默构建护城河。
Forge 的推出说明了一个趋势:企业越来越不满足于"租"一个通用模型,而是想要"拥有"一个真正懂自己的 AI。
这场"自建 AI" vs "调用 API"的博弈,可能才是接下来几年企业 AI 市场最精彩的故事。

