大数跨境

Skills热背后的冷思考:AI产品经理如何穿越技术迷雾?

Skills热背后的冷思考:AI产品经理如何穿越技术迷雾? AI产品经理研习与实践
2026-01-27
0
导读:Context经济学和可控、可测、可维护下的理性选择。

🚀 欢迎来到AI产品经理研习之旅 🚀

各位,好久不见。想必诸位也和我一样,近期被“Skills”这个到处都在讨论、展示的新概念/新实践所刷屏(当然严格来说它是Anthropic在去年10月份所提出的,不算很“新”)

过去两年,我们经历了不少这样的"新概念时刻":Workflow、Tools、Context Engineering、Skills……相比于着急或焦虑是不是该立即跟上这波浪潮,我想关键是理解它背后的真实价值。

不知道你是否也有这样的困惑:

  • 困惑1:技术概念层出不穷。Tools让你标准化调用,Workflow让你可视化编排,JIT让你动态加载,Skills让你封装知识……看上去都很有道理,但到底该信谁?

  • 困惑2:不知道如何选择。A说Workflow+RAG是未来;B说Agent+Skills是方向;C说Context Engineering才是王道。

  • 困惑3:害怕错过(FOMO)。担心如果我不跟上,会不会被淘汰?我们不用是不是就落后了?

这些困惑都很真实,但我们不应迷失在技术迷雾中,忘记了探索本质——这些技术演化的背后,到底是什么在驱动?旨在解决什么问题?

依我看来,每个新方法的诞生,都在解决上一个阶段的核心痛点。但同时,每个新方法也引入了新的代价。在当下,也许还没有能解决Agentic 系统所有问题的完美方案

以Skills为例,我认为它是吸收了JIT(动态加载)、Workflow(工作流)、Tools(标准化工具)的经验教训后的"集大成者"。

但Skills不是银弹。它需要平台支持,需要知识封装能力,需要成熟的生态系统。如果你的场景不匹配,盲目跟风只会带来更高的成本和复杂度。

所以,关键不是"什么是Skills",而是"我的场景需要什么"。

如果你期待的是一个‘Skills 上手指南’,这篇文章可能会让你失望;
但如果你关心的是:在资源有限、风险真实存在的情况下,如何做出不后悔的 AI 产品决策,那这正是我想讨论的。

读完这篇文章,我希望你能得弄懂它,并为你的企业找到最具性价比的解决方案。

01

技术演化的逻辑
如果只记住一件事,那就是:所有 Agent 技术的演进,都是在为‘可控性’付费。

 演进的路径

这里仅限于我个人的认知(未必全面、准确,欢迎评论区补充、探讨),从早期的AutoGPT到最新的Skills,在技术上的演化如下:
如果以类似于Cursor这样的AI编程智能体而言,其演进则是:

 演化的本质:问题导向

说实话,技术演化的驱动力,根本不是更先进的技术,而是更高效地解决实际问题。

让我们看看这四年里的四个关键演化逻辑:

逻辑1:从不确定性到确定性

✅ 不是技术退步,而是工程进步

逻辑2:从手工到自动化

✅ 不是"偷懒",而是效率提升

逻辑3:从静态到动态

✅ 不是"更高级",而是"更高效"

逻辑4:从一次性到可复用

✅ 不是"创新",而是"沉淀"

 Skills的独特之处

现在让我们聊聊Skills。关于Skills本身,我当然更推荐你去阅读Anthropic的工程博客,这里就不展开了。

地址:https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills

To activate skills, all you need to do is write a SKILL.md file with custom guidance for your agent.
skill-name/  SKILL.md        # 元信息 + 高层流程/准则(按需加载)  references/     # 口径、schema、边界条件、例外(按需加载)  scripts/        # 校验/生成/转换/对比等确定性工具(执行但不入上下文)  templates/      # 输出模板(邮件、报告、表单字段映射等)  tests/          # 用例与评测样例(供离线评测/CI)

为什么它值得关注?我认为因为它不是替代,而是吸收。它吸收了:

- 动态加载和渐进式披露 ← 来自JIT(Just-in-time Instructions)和Context Engineering

- 结构化组织 ← 来自Workflow

- 标准化接口 ← 来自Tools

动态加载和渐进式披露本质上是为了解决LLM上下文窗口不足的问题:

我的判断是:Skills代表了未来趋势——可复用的知识/经验封装。但不要盲目跟风,要看你的场景是否需要。

需要强调的是:Workflow、Tools、JIT、Skills 并非简单的‘你死我活’,而是在不同复杂度区间的最优解。

02

一些案例
如果说上一节是理论,那么接下来,我们看看真实企业是如何为这些取舍买单的。

 Shopify:当工具数量失控时

Shopify的Sidekick是一个帮助商家管理店铺的AI助手。在建设过程中,他们遇到了一个经典问题:工具复杂度危机。

🟢 阶段1(0-20 tools):

"挺好用的,边界清晰,容易调试。"问题还没暴露。

🟡 阶段2(20-50 tools):

"开始乱套了,工具组合产生意外结果。"调试成本开始上升。

🔴 阶段3(50+ tools):

"三种方式做同一件事,系统难以推理。"

他们称之为"Death by a Thousand Instructions"——System Prompt变成了臃肿的特殊情况集合。

Shopify的选择是:不是继续增加工具,而是改变提供指令的方式。

他们推出了JIT(Just-in-Time Instructions),核心思路是:

1. Localized guidance:指令只在相关时出现

2. Cache efficiency:动态调整不破坏缓存

3. Modularity:可根据上下文动态提供不同指令

结果呢?系统可维护性提升,性能指标全面改善。他们从加工具转向了优化上下文管理。

Shopify给AI产品经理的三个建议:

1. Stay simple:保持简单,不要为了加工具而加工具

2. Start modular:从一开始就用模块化模式

3. Avoid multi-agent early:早期避免多智能体架构

快速自查:

[ ] 你的工具数量超过20个了吗?

[ ] System Prompt超过10000 tokens了吗?

[ ] 团队开始抱怨"难以调试"了吗?

如果都打勾 → 考虑JIT,但要接受系统复杂度会增加,需要精心设计。

 Stripe:当Agent需要花钱时


Stripe面临的挑战完全不同。他们的Agent要帮用户花钱——这在AI领域是个大问题。

三重难题:

1. 信任问题:Agent要帮用户花钱,如何确认是用户本人授权?如何防止fraudulent transactions?

2. 碎片化问题:每个Agent都要单独对接吗?成本太高,维护太难

3. 灵活性需求:不仅是"一键购买",还有"buy for me"后台运行、多商家购物车、订阅、使用模型...

Stripe的选择是:不是自建封闭系统,而是推出开放标准ACP(Agentic Commerce Protocol)。

ACP的三个特点:

1. Built for businesses:保持商家控制权

2. Works with existing systems:兼容支付基础设施

3. Supports complex flows:支持多种交易类型

Blog > Introducing our agentic commerce solutions > Image 1

结果呢?OpenAI ChatGPT的Instant Checkout由Stripe提供支持,Etsy、Shopify(Glossier、Vuori、Spanx、SKIMS)等商家纷纷接入。

给AI产品经理的启示:

[ ] 你的Agent需要跨系统交互吗?

[ ] 你希望避免被单一平台锁定吗?

[ ] 你有能力推动生态建设吗?

如果都打勾 → 考虑开放标准(ACP)。 但需要生态支持,早期可能陷入单打独斗。

 Malt:从炫酷技术到实用工具

Malt(欧洲领先的自由职业者平台)的故事最有趣,因为他们展示了从"炫酷技术"到"实用工具"的完整演化路径。

1: Building In-House

他们一开始自己建:Qdrant(向量数据库)+ Vertex AI(LLM)+ Slack bot。结果呢?频繁幻觉、难以验证、扩展难。

2: Testing Phase

他们采用Dust平台(SaaS)。但真正的突破不是技术,而是让业务团队拥有自己的AI。他们组建了跨职能团队:产品经理+客服+工程师+设计师。

3: Malty AI品牌化

他们创建了logo、宣传视频、甚至AI生成的歌曲。目的是什么?让员工理解这个"新队友",不是冷冰冰的工具,而是团队成员。

4: AI Workflows

场景:产品反馈流程自动化。技术:Slack + Malty AI + Make。成果:处理150+反馈,强采用率。

5: AI Agents

第一阶段:简单Agent,通过标签请求AI帮助。

成果:L0支持handle time减少80%(2'20" → 20")

第二阶段:7个专业助手(客户、自由职业者、项目专家...),Make编排,路由问题到合适专家。

Malt的金句>>>

It's not about replacing people, it's about augmenting them with tools tailored to their domain expertise.即不是替代人,而是增强人

在 Malt,我们采取了一种独特的方法,为每个团队量身定制专属的 AI 助手,以满足其特定需求和工作流程。我们没有采用千篇一律的解决方案,而是为不同的垂直领域(从产品、客户服务到其他特定领域的工作流程)创建了专属的 AI 代理(品牌名称均为 Malty AI)。每个助手都针对特定领域进行专门开发,并深度集成到日常运营中。

给AI产品经理的启示:

[ ] 你是从PoC开始的吗?

[ ] 业务团队能参与配置吗?

[ ] 你做了品牌化吗?

如果都打勾 → 你在正确的路径上。但要接受:需要持续迭代,跨职能协作要求高。

03

如果用Skills重构Sidekic
理解了这些取舍之后,我们才能回答一个更难的问题:如果重来一次,Sidekick 该怎么设计?把它从"提示词堆叠+工具堆叠",重构为"稳定内核+可治理的Skills平台"。

但前提是:必须尊重Sidekick已经形成的三条产品契约:

  • 写入必经人确认:Human-in-loop策略要保留并强化,例如表单紫色高亮、资金转移预览、主题编辑需手动保存等已形成用户预期的交互语义

  • 上下文输入机制:附件、目标模式、@提及、记忆开关、聊天历史等,因为这些是 agent 获取正确上下文、降低幻觉与误操作的关键“输入管线”

  • 工程闭环:JIT +评测 +校验,这些已验证的能力必须保留

有不少人把 Skills 理解成“把提示词存起来复用”。这只对了一半。
我更愿意把 Skills 定义为:

Skills = 能力的最小治理单元
你封装的不只是“怎么做”,还包括:什么时候能做、做到什么程度、怎么证明没做错、出了错怎么回退。

所以一个真正生产级的 Skill,不是只有一段指令,而至少包含五个要素(这是我认为它比Prompt/Workflow/Tools 更“重”的原因):

  1. 能力合同:输入/输出是什么,边界是什么(强结构)

  2. 执行剧本:标准流程与对话要点(让推理可预测)

  3. 安全护栏:权限、风险分级、写入前必须预览/审批

  4. 确定性校验:能用规则/脚本验证的,就别让模型“凭感觉”

  5. 评测与回归:真值集与模拟重放,作为发布门禁

我们还可以把 Sidekick 的“扩展点”显式拆成三类,对应不同治理强度:
  • 平台内置 Skills(Shopify 官方维护,最高治理):折扣、客户分群、ShopifyQL、主题编辑、资金相关等核心流程,强校验、强审计、强回滚语义、强评测门禁

  • 生态 Skills(中治理):通过 app extensions 让第三方应用接入,沙箱/隔离执行、schema 声明、权限明确,尽量“引导用户回到应用完成最终写入”,Sidekick 做好检索与建议

  • 用户自定义 Skills(轻治理但可控):从“提示词快捷键”升级为“受限 skill 包”,允许模板/清单/字段映射,默认禁止自动调用高风险写入工具(至少要显式确认)

这背后的判断很简单:越接近资金/店铺状态这类不可逆写入,治理成本就必须越高。

案例推演:Sidekick创建折扣码>>>

用户说:"给我创建一个学生折扣,六月份九折。"

融合架构图融合架构图

Step 1 (Level 0 & 1):Agent的核心提示词和所有技能的元数据被加载。模型通过"折扣"关键词,迅速从几十个技能中匹配到了discount技能。

Step 2 (Level 2):Agent加载discount技能的SKILL.md文件。它首先学习了文件中的"工作流程"部分,知道了创建折扣需要确认类型、范围、时间等。然后,它注意到了"JIT工具指令"部分,知道了有一个名为create_discount_code的工具可用,但此时并不加载该工具的详细API文档。

Step 3 (执行与交互):Agent开始与用户对话,确认折扣细节。当所有信息收集完毕,准备调用工具时,它才将create_discount_code工具的详细指令动态注入到上下文中,完成调用。

Step 4 (Level 3):在调用前,Agent发现工作流程中提到"学生折扣需要特殊验证"。于是,它进一步按需加载了references/student_rules.md文件,学习了验证规则,确保了操作的合规性。

Step 5(Plan + Preview):Sidekick 先生成“变更计划”,把折扣范围、时间、叠加规则、验证方式等用结构化清单展示,并高亮风险点。
Step 6(Approve → Execute → Undo):用户点击确认后才写入;执行完成给出结果与“撤销入口”,并记录审计日志,确保可追溯。

04

写在最后
技术的进化当然重要,但真正决定成败的,是我们是否清楚地知道:
  • 当前系统最痛的瓶颈在哪里

  • 哪些复杂度是“必须承担的”,哪些只是“想象中的先进”

  • 我们是在解决问题,还是在缓解焦虑

在我看来,Skills 的真正价值,并不在于它有多“新”,而在于它提醒我们一件事:
当问题足够稳定、足够重复、且值得长期投入时,才配得上被封装、被沉淀、被复用。

如果你只是害怕错过,那不妨慢一点。

希望这篇文章,能帮你在下一次面对“又一个新范式”时,多一分冷静,少一点焦虑。
技术会继续演进,但判断力,才是我们最值得长期投资的能力。



👉 点赞+在看+分享,让我们一起探索更多AI前沿技术和产品实践 🌟

也欢迎你在留言区与我互动。

【声明】内容源于网络
0
0
AI产品经理研习与实践
现软件产品经理、前管理咨询顾问。坚信人工智能(AI)将会深刻影响我们未来的工作、学习、生活,因此我正在积极拥抱变化、研究和学习人工智能产品经理相关的知识和技能。
内容 76
粉丝 0
AI产品经理研习与实践 现软件产品经理、前管理咨询顾问。坚信人工智能(AI)将会深刻影响我们未来的工作、学习、生活,因此我正在积极拥抱变化、研究和学习人工智能产品经理相关的知识和技能。
总阅读202
粉丝0
内容76