Agnes出手了。
核心模型矩阵全面上线Zenmux平台。四款主力——Agnes-1.5-Lite、Agnes-1.5-Pro、Agnes-Image-1.2、Agnes-Video-V1.2——文本Agent与多模态生成双线并进。
首周数据已经出来:调用量超过多家头部同类产品。开发者正在快速涌入。
性能与成本的双重竞争里,Agnes用高性价比+全工具链的组合,正在打开新的生态入口。
Agnes模型矩阵在Zenmux正式上线
01
AgnesClaw
低至1美元的「养虾」入门神器
OpenClaw热度攀升,Agnes将其接入自研App实现AgnesClaw一键部署。用户订阅会员(部分地区Starter新用户低至1美元/月),即可免费部署使用该功能并解锁平台全部高级功能,性价比出众。
AgnesClaw入口设于首页,一键部署后切换模式即可体验「养龙虾」,学习成本极低。
目前该功能支持绑定Telegram,后续将接入更多平台,还会上线定时任务、长期记忆及skills库,含Agnes预置的PPT生成、表格处理等常用skills与开源skills。
受底层模型能力限制,部分AI应用无法安装或流畅运行特定skill组件,而AgnesClaw依托自研「龙虾」基座模型和优秀的工具调用适配能力,可无缝安装使用绝大多数热门skills,能助力用户创建定时任务、处理文件、实现办公自动化等。
此外,该功能具备自我进化能力,可通过上下文理解和记忆贴合用户使用习惯,更高效地协助完成任务。
一键部署AgnesClaw
AgnesClaw的最大亮点在于自研的「龙虾」基座模型,这是赋予Agnes版本「龙虾」具备更强的理解力和skill适配能力的核心。
Agnes为用户高性价比「养龙虾」,专门推出了两款不同参数规模基于LLM优化的Agent模型,分别是Agnes-1.5-Pro模型和Agnes-1.5-Lite模型。
PinchBench榜单中Agnes-1.5 系列模型在准确性维度表现突出
AgnesClaw定位「下一代极速多模态混合专家模型」,融合隐式MoE、Mamba-2状态空间模型与原生多模态早融合技术,攻克超长上下文、高频工具调用、复杂Multi-Agent协作三大痛点,打破传统「规模-延迟-记忆」三元悖论。
在全球权威「养虾」AI评测榜单PinchBench中,Agnes-1.5-Pro模型准确性表现突出,跻身榜单前列,是开发者「最佳养虾模型」优选之一。
PinchBench榜单
02
Agnes-Image-1.2
开源第一,闭源第二
本次发布中,Agnes 20B全新图像编辑模型Agnes-Image-1.2的表现超出预期。
据官方测试数据,该模型综合评分4.25分(满分5分),闭源模型中仅次于4.48分的NanoBananaPro,超Seedream4.0、4.5,开源模型中排名第一。
全新图像模型综合评分达到4.25分(满分5分)
Agnes-Image-1.2模型单项指标表现亮眼,人像维度提升显著,经人像场景定向微调,面部细节保真、局部编辑可控性及背景自然融合能力均增强,Portrait从3.98升至4.30(+0.32);Extract(2.47→3.05,+0.58)、Viewpoint(2.82→3.17,+0.35)同步提升,模型在目标区域分离、结构/几何稳定性上更可靠,保障复杂编辑任务的一致性表现。
03
完整模型家族
覆盖多模态全链路
Agnes此次除推出Agnes-1.5-Pro、Agnes-1.5-Lite语言模型及Agnes-Image-1.2图像编辑模型外,还完善了模型矩阵,涵盖搜索研究、AI Slides、图片视频生成类模型。
图片视频生成领域,Agnes搭建了完整体系,拥有20B的Agnes-Image-1.2和19B的Agnes-Video-V1.2视频生成模型。后者支持原生音画同步、图生视频及特定风格/角色生成,适配多业务场景;采用双流音视频Transformer架构,实现音画天然同步,且可在有限显存运行,便于企业规模化部署和个人开发者本地实验。
语言模型上,Agnes面向东南亚市场推出8B参数的小语种模型Agnes-SeaLLM,现已成为该地区小语种理解与生成任务的SOTA模型。
东南亚小语种模型Agnes-SeaLLM
Agnes在信息处理与研究能力上,推出Agnes-Search(30B)和Agnes-DeepResearch(30B)模型:前者内部测试推理成本降78.6%、生成速度提18.6%,后者测试引用准确率100%、基准测试准确率平均提14.3%。
办公场景下,Agnes-Slides(30B)可将网页或文档内容自动生成PPT,1分钟约出15—20页,单页生成成本低至几美分。
04
模型后训练为主
RLAF框架减少人工依赖
AI训练AI的时代,Agnes正在提速。
他们的技术路径很清晰:CPT(持续预训练)→ PT(后训练)→ RL(强化学习),全程连续迭代。但真正的突破在于——把"进化"从模型层推进到了Agent层。
在AgnesClaw体系里,Agent执行任务时会根据反馈实时调整策略,与skills协同自进化。系统不再是一次性产品,而是越用越强的有机体。
背后是国际化研发团队提出的RLAF框架:
DSPO:动态过滤优化算法,同规模下性能超DeepSeek Search-R1达34.1%
UV:通用验证器,用AI评估替代人工标注,从逻辑、事实、完成度自动打分
成本效率,正成为AI商业化的生死线。Agnes此次登陆Zenmux,等于直接把模型送进开发者的真实战场。首周调用数据已经说明问题——当模型从"刷榜"走向"被调用",便宜和好用,就是新的竞争力。
📢 想获取更多 AI 大模型实战资料?
欢迎扫码加入【AI 大模型学习交流群】
和行业伙伴一起,解锁 AI 落地全流程,
共享干货资源、交流技术难题!
图片/素材来源于网络,其版权归原作者所有,侵删
一键关注 👇 点亮星标

