大数跨境

Agent能不能自己教会自己?人大&字节开源了这个"自我进化"框架,结果超乎预期

Agent能不能自己教会自己?人大&字节开源了这个"自我进化"框架,结果超乎预期 AIGC 深一度
2026-04-22
5
PDF文件已上传至IMA知识库,扫码可加入

 🌍 Agent-World: Scaling Real-World Environment Synthesis for Evolving General Agent Intelligence

随着🦞OpenClaw、MCP 与 Agent Skills 的发展,大模型能轻松调用世界工具,但在【有状态、多工具、长程交互任务上】仍有明显短板。

本文提出Agent-World:一个通用智能体训练场,将【真实世界环境合成】与【持续自进化训练】相结合,形成智能体与环境协同进化闭环。它包含两部分:

(1)智能环境-任务探索:通过深度搜索智能体,围绕真实世界环境主题,自主从互联网挖掘环境数据库、生成可执行工具并合成可校验任务。

(2)持续自进化训练:通过多环境强化学习训练智能体,并将合成环境视作训练场,自动诊断智能体的能力短板,有针对性地进行环境/任务扩展,实现持续自进化。

最终,Agent-World 共构建了1978个环境、19,822 个工具,任务平均交互轮次超过15轮。

在 23 个挑战性的基准上 (τ²-Bench、BFCL V4、MCP-Mark、ClawEval、Skills Bench等),Agent-World-8B/14B 持续优于现有环境扩展方法与强开源基础模型。进一步的实验分析表明,环境多样性、自进化轮次与智能体性能之间存在清晰的 scaling 关系。


论文链接:https://huggingface.co/papers/2604.18292
项目主页 & Demo:https://agent-tars-world.github.io/-/

【声明】内容源于网络
0
0
AIGC 深一度
专注AIGC领域,关注微软 OpenAI、百度文心一言、讯飞星火 DeepSeek等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC,欢迎关注 个人网站 https://www.chenbaiqi.com
内容 573
粉丝 0
AIGC 深一度 专注AIGC领域,关注微软 OpenAI、百度文心一言、讯飞星火 DeepSeek等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC,欢迎关注 个人网站 https://www.chenbaiqi.com
总阅读3.3k
粉丝0
内容573