Agent能不能自己教会自己？人大＆字节开源了这个"自我进化"框架，结果超乎预期- 大数跨境

首页

Agent能不能自己教会自己？人大＆字节开源了这个"自我进化"框架，结果超乎预期

AIGC 深一度

2026-04-22

PDF文件已上传至IMA知识库，扫码可加入

🌍 Agent-World: Scaling Real-World Environment Synthesis for Evolving General Agent Intelligence

随着🦞OpenClaw、MCP 与 Agent Skills 的发展，大模型能轻松调用世界工具，但在【有状态、多工具、长程交互任务上】仍有明显短板。

本文提出Agent-World：一个通用智能体训练场，将【真实世界环境合成】与【持续自进化训练】相结合，形成智能体与环境协同进化闭环。它包含两部分：

（1）智能环境-任务探索：通过深度搜索智能体，围绕真实世界环境主题，自主从互联网挖掘环境数据库、生成可执行工具并合成可校验任务。

（2）持续自进化训练：通过多环境强化学习训练智能体，并将合成环境视作训练场，自动诊断智能体的能力短板，有针对性地进行环境/任务扩展，实现持续自进化。

最终，Agent-World 共构建了1978个环境、19,822 个工具，任务平均交互轮次超过15轮。

在 23 个挑战性的基准上 (τ²-Bench、BFCL V4、MCP-Mark、ClawEval、Skills Bench等)，Agent-World-8B/14B 持续优于现有环境扩展方法与强开源基础模型。进一步的实验分析表明，环境多样性、自进化轮次与智能体性能之间存在清晰的 scaling 关系。

论文链接：https://huggingface.co/papers/2604.18292

项目主页 & Demo：https://agent-tars-world.github.io/-/

【声明】内容源于网络

AIGC 深一度

专注AIGC领域，关注微软 OpenAI、百度文心一言、讯飞星火 DeepSeek等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC，欢迎关注个人网站 https://www.chenbaiqi.com

内容 573

粉丝 0

AIGC 深一度专注AIGC领域，关注微软 OpenAI、百度文心一言、讯飞星火 DeepSeek等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC，欢迎关注个人网站 https://www.chenbaiqi.com

总阅读3.3k

粉丝0

内容573