这两天朋友圈都被Google Gemma 4 刷屏了。
满屏都是开源、Apache 2.0、140 种语言,看着好厉害的样子,但我完全搞不清楚这东西到底是什么。
所以我花了大半天时间,把 Google 官方的模型卡、部署文档、测试数据全翻了一遍,又看了一圈技术社区的讨论。
今天把我搞明白的东西分享出来。没有专业术语,就讲人话。如果你也是看到这条新闻一脸懵的,这篇文章应该能帮你省点时间。
先搞清楚一件事:Gemma 不是 Gemini
我一开始还以为,Google 是不是把 Gemini 开源了。后来看完才知道,不是这样的。
Gemini 还是那个在网上直接用的东西,Gemma 更像是 Google 把一套模型放出来,让你可以下载到自己的电脑上跑。数据不用出本地,模型本身免费。
两个东西在技术上有渊源,但用法完全不同:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
基于 Google AI for Developers 官方文档整理
所以你看到有人说 Google 把 Gemini 开源了,那是不对的。准确地说,是 Google 发布了一套可以下载到自己设备上跑的 AI 模型,许可证完全开放,可以商用。
四个型号,你不用全记住
Gemma 4 一共发了四个型号。你不用记那些参数,只要知道三件事:
有轻的版本能试水。最小的 E2B 只要 7.2GB,普通笔记本应该就能跑,适合先看看这东西到底行不行。
有强的版本能上显卡。31B 是最强的,20GB,需要比较好的显卡。
有一个很多人都在讨论的中间版本。26B MoE 这个型号,查资料的时候经常被提到。它的设计比较特别——总共 25.2B 参数,但每次干活只用 3.8B。我目前的理解是,它比较像一个干活够用、又不太吃硬件的选择。不过我自己还没跑过,具体体验怎么样还要试了才知道。
型号和参数数据来自 Google 官方模型卡(2026-04-02 更新),下载大小来自 Ollama 官网
至于从上一代到这一代的提升,官方测试数据上的跳升幅度确实挺大(比如数学竞赛得分从 20.8% 跳到 89.2%,编程竞赛评分从 110 涨到 2150)。但测试是测试,实际干活是另一回事,这个我们自己得清楚。
测试数据来自 Google 官方模型卡
对我来说,我根本不关心它考试多少分
我只关心三件事:
第一,客户邮件能不能帮我先读。
因为很多时候我们业务员不是不会回邮件,是先把邮件看明白、把需求摘出来这一步就很费时间。官方说支持 140 多种语言,还专门提到了商务邮件助手这个场景。如果真能把英文、西语、阿语的询盘先过一遍,提炼出客户要什么产品、什么数量、什么交期,那就是有用的。
第二,产品图和参数图能不能帮我先整理。
特别是产品图、参数图、包装图这些东西,经常信息散得到处都是。官方说所有型号都能读图,能做文字识别、图片问答,甚至有教程教怎么根据产品图生成商品描述。如果能从参数图里把卖点读出来、帮我出个英文标题初稿,那就省事了。
第三,手册和报价规则这种长文件,能不能别让我自己翻半天。
规则文件、报价表、产品手册,最烦的不是没有,而是有了你也找半天。大型号能一次吃进去比较长的文档,不用你拆成很多段慢慢喂。比如新人问一个报价问题,先让 AI 从规则文件里找第一版答案,总比自己翻半天强。
以上场景参考自 Google 官方博客和 Google AI for Developers 文档中的应用示例
不过我要说清楚:这三件事我都还没自己跑过完整测试。目前只是看了官方文档和技术社区的讨论,觉得理论上能做。等我实际跑通了,再分享实操效果和踩坑记录。
查完之后,我觉得最该说的反而是这件事
免费的是模型授权,不是整体落地
模型本身确实免费,Apache 2.0 许可,随便用、可商用。
但硬件要钱——你得有一台配置还行的电脑,显卡不够可能需要另买。
部署要时间——第一次装环境、下模型、调通,少说 1~2 小时。
维护要人——模型更新、硬件故障、提示词优化,都得有人管。
微调门槛不低——官方的微调教程需要专业级 GPU,显存至少 16GB。
微调硬件要求来自 Google AI for Developers 视觉微调教程文档
我的直觉是,如果团队就两三个人、偶尔用一下 AI,继续买 ChatGPT 或者 Kimi 的订阅更省事。但如果是多人高频用、又比较在意数据隐私(比如客户报价和邮件不想发到外部平台),那本地部署这条路就值得认真看看。
还有一件事:Gemma 4 是模型,不是产品。它不会自己变成一个邮件助手或者文案工具。你需要自己写提示词、搭流程,甚至需要做个界面才能让不懂技术的同事用起来。这一步的工作量,可能比装模型本身还大。
跟通义千问、Llama 比呢?
这也是我查资料时很好奇的问题。现在开源模型不只 Gemma 一家,阿里的通义千问 Qwen 3.5、Meta 的 Llama 4 也都在。
这个对比我还没完整做完,暂时不下结论。目前看到的一个方向性信息是:如果你的业务很依赖中文理解和中英互译,通义千问在这方面可能有优势,它的中日韩词表明显更大。但 Gemma 4 在图片理解、语音处理这些方面,目前看起来更全面一些。
具体怎么选,我整理清楚了单独写。
我现在准备做的事
查完这一圈,我现在的理解是:
Gemma 4 这件事的意义不在于又多了一个模型,而在于它降低了一条路的门槛。以前中小企业用 AI 基本就一条路:买别人的服务。现在多了一个选项:把一部分 AI 能力装到自己电脑里,不按人头付费,数据不出公司。
这条路好不好走,我现在还不确定。
反正我不想空聊这个东西。先自己跑一遍,能用我再告诉你怎么用;不好用,我也会把坑写出来。这样总比空讲强。
本文数据来源
1. Google AI for Developers - Gemma 4 模型卡(2026-04-02 更新)
2. Google DeepMind 官方博客 - Gemma 4 发布公告
3. Ollama 官网 - Gemma 4 模型下载页面
4. Google AI for Developers - 视觉微调教程(硬件要求)

