

用了一亿 Token 来实践自主编程智能体，我得到了一些经验

数翼

2025-12-17

导读：上个月重度使用了 Claude Code 等自主编程智能体，以及一些 Spec 驱动编程的工具。

上个月重度使用了 Claude Code 等自主编程智能体，以及一些 Spec 驱动编程的工具。今天分享一些思考和经验给大家。

在各种自主编程智能体和 Spec 驱动编程发展越来越成熟的时候，我当时也构想了一些编程流程。

比如：

• 让 AI 自动编写测试，自动测试
• 使用 Playwright 执行端到端的测试
• 自动访问应用页面，检查控制台输出错误，并自行解决
• 自动截图应用页面，分析页面 UI 是否满足要求
• AI 编码任务执行之后，发信息通知我
• 工作时间，在 AI 编程过程中，重要的事情决定朗读语音
• 根据任务列表和开发计划自动执行
• 在 Agent 之上在开发项目管理，多智能体自动启动协助工作
• ...

但是，在时间了将近一个月之后，虽然之前想象的功能基本都实现了，但是最终的效果去并不像理想中那样，自己可以当一个甩手掌柜。

产品定义

做一个新东西，第一步当然是定义产品了。也就是明确告诉AI你要做什么。

其实这一步很花时间的，可能是我有个心里，既然当甩手掌柜，我就让你自己好好干，清清楚楚和 AI 对齐自己的需求和目标，才是最重要的。

然后就遇到两个问题。

第一个，你只清除你大概要个什么，但是详详细细写出来，也有问题：

一是：花费时间太长，做过产品经理的都知道，定义一个完整产品需求，大概要多久，像我这样的懒人肯定不能啊。

二是：很多时候我们也无法一下子确定所有细节是什么，就拿日常中的很多事情来说，也都是边做边回顾，边改进，边设计下一步。

但是这样的话，又和传统开发有啥区别呢？我也是万万不能接受的。

于是，我认为最有效的路径，就是提出想法，和 AI产品经理讨论，对齐产品需求，一遍遍的讨论。

听起来很美好，但是实际上，效率并没有想象中高。

这也和我的期望太高有关系，

但是效率问题的本质是，目前我们在使用 AI 出现的一个不可避免的分歧：

• 要么是 AI 太聪明，我们太笨
• 要么是我们太聪明，AI 太笨

当 AI 给出你很棒的建议的时候，你需要很大的成本去学习和对齐。这点儿 AI 无法给你太多的支持，你让 AI 辅助你学习，很可能会付出BI传统学习知识更多的成本。

如果经常忽略 AI 给出的建议，那么你可能发现，最后还是无法绘制一个很棒的整体蓝图。

所以实际的情况是，和 AI 对话一天，你也无法完成一个像样的、完全经过你评审的需求和设计。

只有你的需求很简单，明确告诉 AI 你要做什么，此时你才能拥有很高的效率。

不要把太复杂的事情交给AI

这里的复杂不是技术实现复杂，而是需求、设计、架构的复杂性。

我经常布置一个任务给 AI 伴我设计，实际的情况他会给我一份看起来很完美，也很复杂的设计。

90%的特性我都需要，但是我知道，当前阶段我无法实现它，即使实现了我也很难测试。

于是我会手动检查并删掉一些内容，留下来我认为当前阶段可以实现的内容。

即使删掉一半的内容，最终我在实施过程会发现，还是复杂了。

我真正需要的可能不是一个系统，只是一个功能，一个页面而已。

AI 可以实现很复杂的东西，但是你要做好心理准备来接受这些复杂和强大东西。

人很难掌握你知识外的东西

在实践 AI 编程，特别是使用自主智能体编程的时候，我有一个很强烈的感悟。

就是我们很难掌握一个你知识以外的东西。

比如我之前实现一个3d材质的时候，我觉得应该有一个材质模块来管理和维护材质。于是乎 AI 给了我一个很棒的设计，同时也让我第一次见到了很多我之间不认识的单词或概念。

很明显，这个项目在几天之后失败了，我又重新画了一两个小时实现了一个简单的材质管理，包含了我场景中所需的所有材质。

乱花渐欲迷人眼 ，这句话在我们和 AI 对话的时候，感觉特别贴切。如果能忍住 AI 给你的 优秀建议 的诱惑，那么在实践过程中你会发现轻松高不少。说到底，AI 也只是我们打工的工具，以结果为导向，不要花费太多时间。

回归传统

在尝试了很多牛而逼之的框架之后，我回归了使用 AI 传统的样子。

Claude Code、Open Code， Roo Code 等等这些工具也在我编程工具箱里面慢慢吃灰了，而是把他们当作通用智能体工具来解决日常的问题。

而编程的主力，还是用 IDE 一句一句提示来写代码。因为我只买了 Trae 的订阅，所以主要用这个，对于编程任务的提效很多。

Trae 还有个 Solo 模式，在刚开始公测的时候，我也测试了一阵子，发现起效果真的差劲，比起 Claude Code, Cline, Roo Code 这些工具，效果都差了太多，不知道如今迭代的怎么样了。

关于模型

编程智能体我使用的是 glm-4.6 模型。在应对一般编程任务的时候，完全可以胜任。

不过再一些小众和新技术领域的时候比较吃力。

就比如我编写一个 Claude Agent 的多项目管理产品时候，多次从原型开始搭建测试，glm-4.6 基本对话成功过一次，但是对其一些概念的理解还是不太对，比如 Commands/Skills 等。

当然同样的项目，我用 Google 的 Antigravity 其内置的 Gemini 3 也同样有问题，项目对话都完成不了。

当时也尝试了很多反复，比如把官方文档网址给 AI 让他自己读，或者单独读取AI 做成本地知识库文档，效果都不太好。

最后换了 Claude Sonnet 4.5，很顺利的解决了问题。看来还是自家模型对自家的产品了解。

哪些自动化的美好愿望

前面我提到我曾经对 AI 自主或者辅助编程有很多想法。

• 让 AI 自动编写测试，自动测试

• 使用 Playwright 执行端到端的测试

• 自动访问应用页面，检查控制台输出错误，并自行解决

• 自动截图应用页面，分析页面 UI 是否满足要求

• AI 编码任务执行之后，发信息通知我

• 工作时间，在 AI 编程过程中，重要的事情决定朗读语音

• 根据任务列表和开发计划自动执行

• ...

经过这一个月的折腾，虽然这些功能基本都实现了，但是我发现我似乎对这些功能没有了需求。

一些建议

对于普通人使用 AI 编程有一单不成熟的建议，

• 从简单入手，所有事情都是越简单越好，如果每个工具和方法论让你感到复杂，请立刻放弃
• AI 辅助辅助 而非 AI自助编程
• 面对 AI 保留初心，不要被AI诱惑实现你预想之外的功能
• 除了基本的架构和技能约束，没必要编写太多的规范文件，比如 CLAUDE.md 文件

【声明】内容源于网络

数翼

专注 AIGC 人工智能知识传播和实践

内容 228

粉丝 0

数翼专注 AIGC 人工智能知识传播和实践

总阅读357

粉丝0

内容228