熟悉Linux(所有类unix系统)的开发者都知道,在linux中,一切都是文件,无论是磁盘上的文本、设备、网络接口、进程通信、甚至内核状态信息。因此所有的动作都可以通过相同的操作系统调用(open、read、write、close)。
这里面的设计哲学是:
“通过统一的文件接口抽象所有资源,简化系统复杂性。”
Agent Skills 或许将成为Agent OS,一个真正的智能操作系统。
Agent Skills介绍
官方文章在这里
https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills
下面有请豆包同学简单总结
在我看来,Agent Skills是一种设计思想,提前将指令、知识、脚本等资源打包成文件夹,由Agent按需加载,再使用有限的MCP,完成复杂任务。
Agent Skills是上下文工程的一部分。
同时由于文件夹的分层特性,天然提供了渐进式的信息披露方式。Agent只在需要时加载信息,节省上下文窗口,启动时只读YAML开头,需要时整篇 SKILL 入上下文,再深入才读同目录下的附加文件/脚本等。
Skill的组成
SKILL.md文件及其依赖的其他文件组成的文件夹。
SKILL.md
这个文件要求必须包含一些必要元数据, YAML 文件头: name(名称)、description(描述)以及 正文,Agent启动时会把拥有的skill的文件头预加载到系统提示词中,类似工具调用的工具名称和工具描述,当模型觉得这其中某些能力跟当前用户提出的需求有关系,就查看这些能力的全部内容(即Markdown正文部分),然后加载到上下文中,这是最简单任务的流程。
其他捆绑文件
在技能中捆绑额外的文件,将更多上下文(通过附加文件)整合到技能中,然后Agent根据任务触发,灵活调用它们,确保按需加载,最大化利用。这种开发方式就像word文档中一级二级三级标题一样,是逐层递进的形式。
比如示例SKILL.md中所使用到的其他md文件。
由于我们不需要把当前任务所需要用到的所有上下文的信息全部加载到LLM窗口,而是基于每个步骤调用每个步骤对应的上下文,所以理论上来说,一个技能中可以打包的上下文量可以无上限。
Agent Skills的调用逻辑
skills与mcp的关系
skills解决怎么做的问题,mcp解决做的问题。
最后
现如今大模型Agent已经在朝着操作系统的方向发展,期待一个全新的世界。

