谷歌深夜放大招,E2B/E4B 两个版本专为手机打造,128K 超长上下文,原生音频输入——这次真的不是噱头。
2026年4月2日,Google DeepMind 悄然发布了一款让整个 AI 圈震动的开源模型:Gemma 4。
没有发布会,没有铺天盖地的宣传,但模型一上线就登顶了 Hugging Face 热门榜——因为它做了一件很多人以为还要等两三年的事:
把大模型真正塞进了手机里。
一、四个版本,从手机到服务器全覆盖
Gemma 4 这次一口气发布了四个规格,覆盖了从 IoT 设备到数据中心的全场景:
|
|
|
|
|
|---|---|---|---|
| E2B |
|
|
|
| E4B |
|
|
|
| 26B MoE |
|
|
|
| 31B Dense |
|
|
|
其中 E2B 和 E4B 是这次的重头戏——它们不是简单压缩参数的"残血版",而是从架构层面为端侧量身打造。
图:Gemma 4 采用 MatFormer 架构,实现了"有效参数"与"总参数"的解耦。E2B 总参数 5.1B,实际只激活 2.3B,却能达到更高参数量模型的智能水平。
二、手机上跑大模型,到底是什么体验?
实测数据告诉你答案:
也就是说,你现在的 iPhone 15/16,下载一个 App 就能跑一个"本地版 ChatGPT"——不用联网、不耗流量、不存在隐私泄露。
Google AI Edge Gallery:一键体验
Google 还提供了官方 App:Google AI Edge Gallery(应用商店搜索"AI Edge"即可找到),不用折腾命令行,不需要技术基础,点开就能体验 E2B 和 E4B,对普通用户非常友好。
三、和 Qwen 3 对比,强在哪里?
总结:对话、推理、长文本分析 → Gemma 4 胜;批量处理图片 → Qwen 3 依然是端侧王者。
四、不只是"能跑",还有杀手锏
Gemma 4 E2B/E4B 有四大核心杀手锏:
此外,Gemma 4 已与 Pixel 团队、高通、联发科 达成深度合作,在芯片层面做了硬件加速优化。未来出厂就自带 Gemma 能力的手机,可能比我们想象的来得更快。
五、槽点也有:逻辑推理是硬伤
尽管 Gemma 4 在端侧综合表现上堪称最强,但也不是没有短板。
在"脑筋急转弯"类逻辑题测试中,Gemma 4 E2B/E4B 几乎全军覆没——复杂的多步推理、长链条逻辑,仍然是这类端侧小模型的软肋。
所以目前的定位很清晰:
日常助手够用,复杂推理还是上云端。
六、Apache 2.0 全开放,商用无忧
Gemma 4 采用 Apache 2.0 开源许可证,完全开放商用,不要求署名,不限制商业使用。
对于想自己做端侧 AI 应用的开发者来说,这是目前最优的选择之一。
总结
Gemma 4 不是一个"凑参数"的缩小版模型,而是真正为端侧场景从架构层重新设计的作品。
E2B / E4B 的出现,意味着:
-
📱 手机上跑本地大模型,从"技术可行"变成了"体验可用" -
🔇 完全离线,保护隐私,适合处理敏感内容 -
🎙️ 原生音频输入,语音交互更自然 -
📖 128K 超长上下文,手机上做深度阅读分析成为可能
2026 年的手机 AI,格局彻底变了。
你会在手机上跑本地大模型吗?欢迎评论区聊聊你的使用场景。
往期推荐:

