Claude skills大概率会是AI圈2026年最火的方向之一。
从现在开始,AI改造各行各业的速度将会大幅度加快。你如果也想抓住这一波历史级别的机遇,但是不知道从哪里下手的话,恭喜你刷到宝藏了。
都说2025年是AI agent元年,但是计算机世界第一名校卡内基梅隆大学最近主导了一个研究。他们把包括软件工程、项目管理、数据分析、行政、人力和财务这些现代公司里面常见的工作抽象成175个任务,来评测市面上主流的agents在真实职业任务上的能力。
结果发现,当前最强的AI agents也只能全自动完成当中30%的任务。觉得2025年是AI agent元年,这个口号显得特别尴尬。
AI agent现在为什么还不够聪明?
search AI在做了和卡耐基梅隆类似的研究之后,提出了一个有趣的概念,叫做agent能力金字塔。
第一层是模型的基本功。
模型至少要能理解问题的字面意思,并且能够使用工具。比如我要求agent操作浏览器帮我在电商网站搜索一双鞋子,完成这种非常明确的指令,是最基本的要求。
第二层是适应性。
模型需要具备最基本的变通能力。比如Siri,AI的研究人员让AI去查一个牌子的显卡。像Gmail 2.5这样的中等模型操作浏览器搜了一下,发现没有什么结果,会直接告诉客户说我们不卖这个东西。而Chrome 4.5这样的顶级模型就聪明很多,他会想是不是系统里录入这个品牌的时候没有打空格呢,他就把显卡品牌中间的空格去掉再搜,然后就搜到了。
第三层是抓地力。
简要来讲,就是agent需要尽最大限度避免胡说八道。尤其是在需要多个步骤才能完成的任务里面,需要最大限度的避免大模型出现幻觉。比如cloud的早期版本模型会在查询客户资料的时候,自己编一个根本不存在的Email地址,非常离谱。
今年之所以能够被称作AI agent的元年,search AI认为,是因为我们已经具备了在前三个等级都能同时做得不错的模型,比如g b nine 3 Pro g b T5和cloud 4.5。但金字塔接上了第四个等级,对于AI而言才是真正的地狱,那就是人类的常识。
GPT 5是怎么翻车的呢?
在一个客服场景里面,客户说我的账户名字应该是Sarah king。PPT误以为客户是想改用户名,但客户的真实意图是想告诉他自己的用户名,然后查询自己的会员折扣。现实生活中,很多被大家当做常识的黑话和暗知识,在AI的眼里是完全无法理解的。
为了让AI冲击金字塔顶,在去年发布了MCP协议,已经改变过一次世界的a s o b i c再次提出了一个全新的概念skills。不要再去造那些像玩具一样的agent,先停一下,去造skills,把你的知识沉淀出来。这是全世界所有普通人都能参与,也都应该参与的超级机遇。
那么skills到底是什么?
a topic不绕弯子,非常简单。skills本质就是一个由很多Markdown文档组成的文件夹。如果AI模型是一个刚来你们公司的大学生的话,那skills就是发给这个大学生的入职手册和工作流程,告诉他这件事情你按什么步骤做,你有哪些工具可以用,你需要交付什么样的结果,哪些坑尽量不要踩。
你可能会说,那我们公司的资料多了去了,全部写成skill,AI记得住吗?尤其是有些跑得比较快的朋友,在这两年应该尝试过通过rap这样的技术,让AI在绘画中直接拿到自己的暗知识,但是是不是总感觉你喂给AI的信息越多,AI越找不到重点,稀里糊涂的。
and so big在今年的技术博客里说过一句非常经典的话:搜索的本质是压缩。人类学习和解锁信息的过程,本质上是从浩瀚的人类文明长河当中总结和提取观点。
围绕这个哲学,aesopick为skills设计了一种叫做渐进式披露的技术。这个名字听上去很高大上,但其实你随便找一个别人写好的skill看一眼,你就能理解a topic的设计。
a topic除了要求skill需要写成Markdown文档之外,还有一个格式要求,就是在skill文档的头部必须用统一的格式写清楚这个skill的名称和描述。这样cloud就可以在绘画开始的时候只加载所有skill的基础信息,当他判断解决你的问题需要某一个skill的时候再去看这个skill的细节。
每个skill文档都可以引用更多其他的skill文档。这样AI就可以根据解决问题的实际需要,自己决策去看哪些文档,并且一层一层展开你的知识库。这就是鉴定式披露技术。当不同领域的skill组合在一起,并且在一个AI绘画里被同时加载的时候,AI就能带着这些领域的黑化和暗知识加入你的团队。
那具体一点讲,skills和agents以及m c p这两个今年非常火的概念的区别和关系又是什么?
我打个比方:agent就像是那个聪明的新员工,主要负责执行和干活;skills是给agent准备的业务手册,教他怎么干活;m c p则像是公司的it中台,让agent能连上系统,拿到权限调用工具。
所以MCP更像是把世界接进来的基础设施层,数据库、文件系统、内部API、第三方系统都能直接接到ai上。skills则是教你怎么在现实世界里面把事情做对的方法论——什么时候查什么,按什么标准写,走什么流程。MCP提供连接与能力,skills定义流程与方法。
现在已经有人用skills全自动做出各种交互式课件。


