搜索
首页
大数快讯
大数活动
服务超市
文章专题
出海平台
流量密码
出海蓝图
产业赛道
物流仓储
跨境支付
选品策略
实操手册
报告
跨企查
百科
导航
知识体系
工具箱
更多
找货源
跨境招聘
DeepSeek
首页
>
Agent能不能自己教会自己?人大&字节开源了这个"自我进化"框架,结果超乎预期
>
Agent能不能自己教会自己?人大&字节开源了这个"自我进化"框架,结果超乎预期
AIGC 深一度
2026-04-22
5
PDF文件已上传至IMA知识库,扫码可加入
🌍 Agent-World: Scaling Real-World Environment Synthesis for Evolving General Agent Intelligence
随着🦞OpenClaw、MCP 与 Agent Skills 的发展,大模型能轻松调用世界
工具
,但在【有状态、多工具、长程交互任务上】仍有明显短板。
本文提出Agent-World:一个通用智能体训练场,将【真实世界环境合成】与【持续自进化训练】相结合,形成智能体与环境协同进化闭环。它包含两部分:
(1)智能环境-任务探索:通过深度搜索智能体,围绕真实世界环境主题,自主从互联网挖掘环境数据库、生成可执行工具并合成可校验任务。
(2)持续自进化训练:通过多环境强化学习训练智能体,并将合成环境视作训练场,自动诊断智能体的能力短板,有针对性地进行环境/任务扩展,实现持续自进化。
最终,Agent-World 共构建了1978个环境、19,822 个工具,任务平均交互轮次超过15轮。
在 23 个挑战性的基准上 (τ²-Bench、BFCL V4、MCP-Mark、ClawEval、Skills Bench等),Agent-World-8B/14B 持续优于现有环境扩展方法与强开源基础模型。进一步的实验分析表明,环境多样性、自进化轮次与智能体性能之间存在清晰的 scaling 关系。
论文链接:https://huggingface.co/papers/2604.18292
项目主页 & Demo:https://agent-tars-world.github.io/-/
【声明】内容源于网络
0
0
AIGC 深一度
专注AIGC领域,关注微软 OpenAI、百度文心一言、讯飞星火 DeepSeek等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC,欢迎关注 个人网站 https://www.chenbaiqi.com
内容
573
粉丝
0
关注
在线咨询
AIGC 深一度
专注AIGC领域,关注微软 OpenAI、百度文心一言、讯飞星火 DeepSeek等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC,欢迎关注 个人网站 https://www.chenbaiqi.com
总阅读
3.3k
粉丝
0
内容
573