配图这件事,做公众号的人都懂——前两篇风格还在线,第三篇开始 AI 给你画成 PPT 信息图,第五篇直接画风跳到另一个次元的卡通人。
最近发现一套「白嫖方案」:xiaohei Skill + Agnes Image 2.1 Flash 免费模型。一个管风格 DNA,一个管出图,全程基本不花钱。生成的图我放到「创见 AI 实验室」IP 上跑了一遍,效果出乎意料。
本文就是对这个”白嫖“方案的最佳实践,今天把这套免费流水线拆给你(Skill和模型地址会再放一份在评论区)。
先说结论:能白嫖到什么程度
- Skill:
helloianneo/ian-xiaohei-illustrations,4,580 stars,MIT 协议,永久免费 - 生图模型:Agnes Image 2.1 Flash(
https://agnes-ai.com提供),注册就送额度,目前看没有限量,相当于白嫖 - 付费模型也能接:OpenAI DALL-E、Midjourney、GPT 都可以换。有预算的话用收费模型效果会更好——细节更精细、笔触更稳、中文标注更准。但白嫖版已经能跑通整个流程,适合先跑通再升级
Agnes API Key 注册路径:去 https://agnes-ai.com 注册账号 → 控制台拿 Key → 写到 .env 文件里(变量名 AGNES_API_KEY)。
Skill 是什么:一句话讲清楚
xiaohei Skill 不是 prompt 模板,是一套约束 AI 配图风格的规则集。它解决的是「AI 画图风格乱跳」这个老问题:
- 固定一个角色 IP(默认叫「小黑」,这个我已经换成「小创」)
- 固定 8 种构图结构(Workflow / 系统局部 / 前后对比 / 角色状态 / 概念隐喻 / 方法分层 / 地图路线 / 小漫画分镜)
- 固定视觉 DNA(纯白背景、黑色手绘线稿、40-60% 留白、少量红橙蓝中文批注)
- 内置 QA checklist(自动跑检查,失败重生成)
所有规则拆成 markdown 文档,AI Agent 直接读然后自己组装 prompt。这套设计和 prompt 模板最大的区别是:模板只解决单张图,Skill 解决跨文章一致性。
装到 OpenCode / pi / Hermes
xiaohei 原生是 Codex Skill,但它是 markdown 文档,不绑死任何 Agent。OpenCode、pi、Hermes 都能装:
OpenCode:
pi(本文中图片使用 pi+xiaohei skill 生成):
Hermes:
装完在 Agent 里说 Use $ian-xiaohei-illustrations 就能引用。如果遇到安装的其他问题或者不会安装,直接把github的地址扔给agent,它会帮你搞定一切!
第一步:换 IP,把小黑换成「小创」
原版小黑是「黑色实心小怪物、白点眼、细腿」。我把它换成「创见 AI 实验室」的形象 IP「小创」
小创 IP 定义(你自己的IP,你做主):
- 少年脸,圆润线条,圆眼睛带高光
- 黑色短发,刘海偏分,左耳戴单只黑色蓝牙耳机
- 穿着:米色连帽卫衣 + 灰色工装短裤 + 黑色运动鞋 + 左手腕戴黑色电子表
- 胸口印「创见 AI 实验室」小字 logo(不抢眼,但能识别)
- 表情:专注、好奇、偶尔带一点得意
- 标志动作:单手叉腰、推眼镜(无眼镜时改成摸下巴)、举大拇指、趴桌上盯屏幕
改法是直接改 references/ 里的三个 markdown(把IP的定义给AI,让AI改就行):
xiaohei-ip.md→ 重写为小创的角色定义prompt-template.md→ 替换 prompt 里的「小黑」为「小创」,加入新形象描述composition-patterns.md→ 补充姿势库(举大拇指、摸下巴、趴桌等)
跑一遍,AI 自动用新角色——这就是 Skill 化设计的好处,改一个文件全链路生效。
第二步:5 个测试实例
我跑了 5 张图做测试,每张图我都按 Skill 的规范走完了「shot list → 选结构 → 写 prompt → 出图」完整流程。
实例 1:Workflow 结构 — 公众号配图流程
文章主题:「AI 写公众号的完整流程」
核心认知锚点:文章配图不是一步到位,是「消化正文 → 提炼认知锚点 → 选结构 → 设计动作 → 出图」5 步流水线。
结构选择:Workflow(流程图)
画面描述:
小创站在一条传送带左边,单手拿起「中文文章」放上传送带;传送带上有 5 个工位(消化、提炼、选结构、写 prompt、生图),每个工位上方挂一个红色箭头标签;传送带最右边,3 张配图从出口滑落到桌面上。主体占比 50%,左侧大量留白写标题「公众号配图流水线」。红色批注:「先消化,再画图」;蓝色批注:「3 张 / 篇」。
小创动作:单手叉腰看着传送带运转。
生成 prompt 关键参数:
- 比例:16:9(1920×1080)
- 风格:白底 + 黑色手绘线稿 + 少量红橙蓝批注
- 角色 IP:使用小创(米色卫衣 + 短发 + 单只蓝牙耳机)
- 留白:≥35%
实例 2:系统局部 — 一篇长文怎么拆成 5 张图
文章主题:「如何把一篇长文拆成多张配图」
核心认知锚点:长文不是 1 张大图,是 N 张小图。每张图只表达文章里的 1 个核心判断,N 张图形成序列。
结构选择:系统局部(局部放大)
画面描述:
画面左侧 1/3 是「文章」轮廓——长条形纸张上写满文字(用乱码符号代替)。画面右侧 2/3 是「配图阵列」——5 张缩略图横向排列,每张图下方挂一个橙色标签,标签上写文章里的关键词。小创站在「文章」和「配图阵列」中间,背对读者,一手指着右侧 5 张图。蓝色批注:「1 篇 → 5 图」;红色批注:「每图 1 事」。
小创动作:面对读者、单手指向配图阵列。
生成 prompt 关键参数:
- 比例:16:9
- 留白:≥40%
- 角色:面对视角(首次测试面对动作)
实例 3:概念隐喻 — 「信任账户」
文章主题:「写公众号就是往信任账户里存钱」
核心认知锚点:信任不是讲道理讲出来的,是一笔一笔存出来的。可以借(透支信任)但必须还(持续输出)。
结构选择:概念隐喻
画面描述:
画面中央是一个透明玻璃罐子,罐子外形像存钱罐,顶部是一个漏斗口。罐子里堆着大量「硬币」——硬币上写「干货」「真实」「踩坑」等词。罐子前方蹲着一个小创,单手把硬币从漏斗口投进罐子。罐子底部有一行橙色字:「信任账户」。红色批注:「存进去的是信用」;蓝色批注:「透支要还」。
小创动作:蹲姿、单手投币、专注。
生成 prompt 关键参数:
- 比例:16:9
- 视觉焦点:玻璃罐(透明质感 + 笔触清爽)
- 角色:蹲姿(首次测试非站立姿势)
实例 4:前后对比 — 「AI 配图」vs「Skill 配图」
文章主题:「为什么你的 AI 配图风格老崩」
核心认知锚点:通用 prompt 画的 5 张图,5 种画风;xiaohei Skill 画的 5 张图,1 种画风(5 个不同动作)。
结构选择:前后对比
画面描述:
画面左右对称分两栏。左栏标题:「直接 prompt」——5 个形态各异的小卡通人(有的胖、有的瘦、有的萌、有的丑)杂乱排列,每人身上有不同风格的衣服。底部红色字:「5 张图 / 5 张脸」。右栏标题:「xiaohei Skill」——5 个一模一样的小创,但每个做不同动作(推眼镜、趴桌、举拇指、摸下巴、叉腰)。底部绿色字:「5 张图 / 1 个 IP」。中间用一条红色虚线分隔。
小创动作:左右各 5 个(10 个小创)。
生成 prompt 关键参数:
- 比例:16:9
- 角色重复:10 次(测试角色一致性)
- 强调:左右 5 个小创的「一致性」对比
实例 5:小漫画分镜 — 「AI 配图 3 件套」使用流程
文章主题:「公众号配图工具的 3 件套」
核心认知锚点:用 AI 给公众号配图,只需 3 步——选 Skill、换 IP、跑流程。
结构选择:小漫画分镜(3 格)
画面描述:
画面是横排 3 格漫画,从左到右:第 1 格:小创站在 GitHub 仓库前,仓库外形是一个方块,上面写着「ian-xiaohei-illustrations」。小创单手指向仓库。蓝色字:「第 1 步:装 Skill」。第 2 格:小创坐在电脑前,屏幕显示 markdown 文档(
xiaohei-ip.md),小创单手敲键盘。红色字:「第 2 步:换 IP」。第 3 格:小创站在一个「流水线」出口处,传送带运出 3 张配图,小创叉腰得意。绿色字:「第 3 步:跑流程」。3 格之间用细黑线分隔,下方是统一标题「公众号配图 3 件套」。
小创动作:3 个不同姿态(指仓库、敲键盘、叉腰)。
生成 prompt 关键参数:
- 比例:16:9
- 分镜:3 等分横排
- 角色:3 个不同姿态(测试多动作一致性)
第三步:白嫖的 2 个关键点
跑完 5 张图我总结了下,要真正白嫖到稳定效果,有 2 个关键点:
1. 准备一张参考图锁定角色 IP
不准备参考图,AI 每次对小创的文字理解都有偏差(虽然 Skill 把角色定义写得很细,但图模型对「黑色短发少年 + 米色卫衣」的理解每次都差一点点)。给一张小创的参考图用 img2img 锁形象,所有图角色识别度从 60% → 95%。
2. 第一次跑用小尺寸(512×512)测 API
1920×1080 大图生成要 2-3 分钟,第一次调 API 容易超时。先用 512×512 跑一次确认 API 通了、IP 形象对了,再切大图出最终版。
免费 vs 付费:怎么选
白嫖版(Agnes Image 2.1 Flash)能做什么:
- 风格一致的角色 IP 配图
- 免费的批量配图
- 公众号正文插图、个人博客图、知识付费课程图
- 质量在免费的API中还算不错,但风格 DNA 一致性很稳
付费模型(OpenAI DALL-E / Midjourney / GPT) 适合:
- 商业级海报、品牌 KV
- 复杂多人场景、电影质感
- 中文标注准确度要求极高
- 有预算支撑
我的建议:先用白嫖版跑通整个流程,验证 Skill 的设计是不是你需要的。有预算了再换付费模型。Skill 本身(规则文件)不变,只是换了一个生图后端。
适合谁
- 写公众号 / 博客,需要稳定配图风格的人
- 知识型内容创作者(方法论、流程、概念解释)
- 用 AI Agent 做内容生产,希望视觉风格资产化的人
- 一人公司 / 小团队——一个人也能产出统一风格的内容
- 预算有限的学生 / 独立开发者——这套方案几乎不花钱
不适合谁
- 要商业插画 / 品牌 KV / 精致扁平插画
- 要儿童卡通 / 可爱 IP / 表情包风格
- 要在一张图里塞大量文字
- 需要可编辑矢量源文件
最后
这套方案的核心价值不是「白嫖」,是「稳定地生同一种风格的图」。单张图质量不是关键,关键是你能连续产 50 张图都看起来像一个人画的。
Agnes 模型目前没看到限量通知,注册就能用,先到先得白嫖窗口。
去 https://agnes-ai.com 注册 → 装 xiaohei Skill → 改 IP → 跑流程——产出第一张图,然后产出第一篇配图齐的公众号文章。





