我是郭震。
近期,我针对Agent自动完成小红书图文发布进行了实测。本文探讨的并非AI生成文案,而是完整发布流程:包括Skill安装、浏览器连接、登录验证、图文生成、封面上传及标题正文填写。如下图所示:
虽然流程看似简单,但涉及真实账号、浏览器登录态及平台页面结构变动时,自动化脚本易失效。本次实测聚焦真实环境下的问题解决。
使用Skill输入主题后,系统自动预填充至小红书发布页,用户仅需确认发布,如下图所示:
选择方案
本次实测基于GitHub项目:
autoclaw-cc/xiaohongshu-skills
该Skill作为浏览器自动化工具,通过Chrome扩展连接用户真实浏览器环境,避免接管高风险登录程序。安装流程如下:
- 将项目复制到本地Codex skills目录,运行Skill校验时发现
SKILL.md中version字段与Codex校验器不兼容。 - 实施最小兼容补丁:仅移除
version字段,保留核心逻辑。 - 使用用户级pip安装Python依赖:
requests和websockets。 - 加载Chrome扩展(路径:
C:\Users\guozh\.codex\skills\xiaohongshu-skills\extension)。 - 通过开发者模式加载扩展,执行登录检查并扫码完成自动登录。
登录过程如图:
修复Skill问题
以“智能体Skill编写逻辑”为主题测试发布时,初始失败报错“未找到发布TAB - 上传图文”。调试发现新版小红书发布页存在多个同名Tab(部分为透明副本或z-index为负)。
解决方案:在脚本中增加元素可见性判断,跳过透明度过低、z-index为负或视口外元素,确保精准定位真实“上传图文”Tab。修复后成功预填充表单,效果如下:
Skill功能说明
高效Skill的核心在于清晰定义“触发、流程、工具、边界”:
关键设计原则:
- 用户指令(如“发小红书图文”)需明确触发条件。
- 执行流程严格分阶段:登录→内容生成→表单填入→等待确认。
- 重复操作封装至
scripts文件,保持SKILL.md简洁。
当前已优化两项关键问题:
- 移除Codex不兼容的version字段
- 修复小红书透明Tab误点击漏洞
总结
本次实测全程跑通小红书图文发布流程:从Skill安装、登录验证、内容生成到封面上传及标题正文填写。该方案特别适用于内容分发、账号运营及教程生产场景。
Skill的本质非提示词堆砌,而是构建可执行、可恢复、边界清晰的自动化系统。优化后的Skill文档结构完整,可直接应用于实际运营中。

