【强烈推荐】白嫖党狂喜：用这个 Skill + 免费生图模型，给文章配出统一风格的高质量图- 大数跨境

首页

【强烈推荐】白嫖党狂喜：用这个 Skill + 免费生图模型，给文章配出统一风格的高质量图

创见AI实验室

2026-06-15

导读：最近发现一套「白嫖方案」：xiaohei Skill + Agnes Image 2.1 Flash 免费模型。一个管风格 DNA，一个管出图，全程基本不花钱。生成的图我放到「创见 AI 实验室」IP

配图这件事，做公众号的人都懂——前两篇风格还在线，第三篇开始 AI 给你画成 PPT 信息图，第五篇直接画风跳到另一个次元的卡通人。

最近发现一套「白嫖方案」：xiaohei Skill + Agnes Image 2.1 Flash 免费模型。一个管风格 DNA，一个管出图，全程基本不花钱。生成的图我放到「创见 AI 实验室」IP 上跑了一遍，效果出乎意料。

本文就是对这个”白嫖“方案的最佳实践，今天把这套免费流水线拆给你（Skill和模型地址会再放一份在评论区）。

先说结论：能白嫖到什么程度

Skill：helloianneo/ian-xiaohei-illustrations，4,580 stars，MIT 协议，永久免费
生图模型：Agnes Image 2.1 Flash（https://agnes-ai.com 提供），注册就送额度，目前看没有限量，相当于白嫖
付费模型也能接：OpenAI DALL-E、Midjourney、GPT 都可以换。有预算的话用收费模型效果会更好——细节更精细、笔触更稳、中文标注更准。但白嫖版已经能跑通整个流程，适合先跑通再升级

Agnes API Key 注册路径：去 https://agnes-ai.com 注册账号 → 控制台拿 Key → 写到 .env 文件里（变量名 AGNES_API_KEY）。

Skill 是什么：一句话讲清楚

xiaohei Skill 不是 prompt 模板，是一套约束 AI 配图风格的规则集。它解决的是「AI 画图风格乱跳」这个老问题：

固定一个角色 IP（默认叫「小黑」，这个我已经换成「小创」）
固定 8 种构图结构（Workflow / 系统局部 / 前后对比 / 角色状态 / 概念隐喻 / 方法分层 / 地图路线 / 小漫画分镜）
固定视觉 DNA（纯白背景、黑色手绘线稿、40-60% 留白、少量红橙蓝中文批注）
内置 QA checklist（自动跑检查，失败重生成）

所有规则拆成 markdown 文档，AI Agent 直接读然后自己组装 prompt。这套设计和 prompt 模板最大的区别是：模板只解决单张图，Skill 解决跨文章一致性。

装到 OpenCode / pi / Hermes

xiaohei 原生是 Codex Skill，但它是 markdown 文档，不绑死任何 Agent。OpenCode、pi、Hermes 都能装：

OpenCode：

git clone https://github.com/helloianneo/ian-xiaohei-illustrations.gitmkdir -p ~/.config/opencode/skillscp -R ian-xiaohei-illustrations/ian-xiaohei-illustrations ~/.config/opencode/skills/

pi（本文中图片使用 pi+xiaohei skill 生成）：

mkdir -p ~/.pi/skillscp -R ian-xiaohei-illustrations/ian-xiaohei-illustrations ~/.pi/skills/

Hermes：

mkdir -p ~/.hermes/skillscp -R ian-xiaohei-illustrations/ian-xiaohei-illustrations ~/.hermes/skills/

装完在 Agent 里说 Use $ian-xiaohei-illustrations 就能引用。如果遇到安装的其他问题或者不会安装，直接把github的地址扔给agent，它会帮你搞定一切！

第一步：换 IP，把小黑换成「小创」

原版小黑是「黑色实心小怪物、白点眼、细腿」。我把它换成「创见 AI 实验室」的形象 IP「小创」

小创 IP 定义（你自己的IP，你做主）：

少年脸，圆润线条，圆眼睛带高光
黑色短发，刘海偏分，左耳戴单只黑色蓝牙耳机
穿着：米色连帽卫衣 + 灰色工装短裤 + 黑色运动鞋 + 左手腕戴黑色电子表
胸口印「创见 AI 实验室」小字 logo（不抢眼，但能识别）
表情：专注、好奇、偶尔带一点得意
标志动作：单手叉腰、推眼镜（无眼镜时改成摸下巴）、举大拇指、趴桌上盯屏幕

改法是直接改 references/ 里的三个 markdown（把IP的定义给AI，让AI改就行）：

xiaohei-ip.md → 重写为小创的角色定义
prompt-template.md → 替换 prompt 里的「小黑」为「小创」，加入新形象描述
composition-patterns.md → 补充姿势库（举大拇指、摸下巴、趴桌等）

跑一遍，AI 自动用新角色——这就是 Skill 化设计的好处，改一个文件全链路生效。

第二步：5 个测试实例

我跑了 5 张图做测试，每张图我都按 Skill 的规范走完了「shot list → 选结构 → 写 prompt → 出图」完整流程。

实例 1：Workflow 结构 — 公众号配图流程

文章主题：「AI 写公众号的完整流程」

核心认知锚点：文章配图不是一步到位，是「消化正文 → 提炼认知锚点 → 选结构 → 设计动作 → 出图」5 步流水线。

结构选择：Workflow（流程图）

画面描述：

小创站在一条传送带左边，单手拿起「中文文章」放上传送带；传送带上有 5 个工位（消化、提炼、选结构、写 prompt、生图），每个工位上方挂一个红色箭头标签；传送带最右边，3 张配图从出口滑落到桌面上。主体占比 50%，左侧大量留白写标题「公众号配图流水线」。红色批注：「先消化，再画图」；蓝色批注：「3 张 / 篇」。

小创动作：单手叉腰看着传送带运转。

生成 prompt 关键参数：

比例：16:9（1920×1080）
风格：白底 + 黑色手绘线稿 + 少量红橙蓝批注
角色 IP：使用小创（米色卫衣 + 短发 + 单只蓝牙耳机）
留白：≥35%

实例 2：系统局部 — 一篇长文怎么拆成 5 张图

文章主题：「如何把一篇长文拆成多张配图」

核心认知锚点：长文不是 1 张大图，是 N 张小图。每张图只表达文章里的 1 个核心判断，N 张图形成序列。

结构选择：系统局部（局部放大）

画面描述：

画面左侧 1/3 是「文章」轮廓——长条形纸张上写满文字（用乱码符号代替）。画面右侧 2/3 是「配图阵列」——5 张缩略图横向排列，每张图下方挂一个橙色标签，标签上写文章里的关键词。小创站在「文章」和「配图阵列」中间，背对读者，一手指着右侧 5 张图。蓝色批注：「1 篇 → 5 图」；红色批注：「每图 1 事」。

小创动作：面对读者、单手指向配图阵列。

生成 prompt 关键参数：

比例：16:9
留白：≥40%
角色：面对视角（首次测试面对动作）

实例 3：概念隐喻 — 「信任账户」

文章主题：「写公众号就是往信任账户里存钱」

核心认知锚点：信任不是讲道理讲出来的，是一笔一笔存出来的。可以借（透支信任）但必须还（持续输出）。

结构选择：概念隐喻

画面描述：

画面中央是一个透明玻璃罐子，罐子外形像存钱罐，顶部是一个漏斗口。罐子里堆着大量「硬币」——硬币上写「干货」「真实」「踩坑」等词。罐子前方蹲着一个小创，单手把硬币从漏斗口投进罐子。罐子底部有一行橙色字：「信任账户」。红色批注：「存进去的是信用」；蓝色批注：「透支要还」。

小创动作：蹲姿、单手投币、专注。

生成 prompt 关键参数：

比例：16:9
视觉焦点：玻璃罐（透明质感 + 笔触清爽）
角色：蹲姿（首次测试非站立姿势）

实例 4：前后对比 — 「AI 配图」vs「Skill 配图」

文章主题：「为什么你的 AI 配图风格老崩」

核心认知锚点：通用 prompt 画的 5 张图，5 种画风；xiaohei Skill 画的 5 张图，1 种画风（5 个不同动作）。

结构选择：前后对比

画面描述：

画面左右对称分两栏。左栏标题：「直接 prompt」——5 个形态各异的小卡通人（有的胖、有的瘦、有的萌、有的丑）杂乱排列，每人身上有不同风格的衣服。底部红色字：「5 张图 / 5 张脸」。右栏标题：「xiaohei Skill」——5 个一模一样的小创，但每个做不同动作（推眼镜、趴桌、举拇指、摸下巴、叉腰）。底部绿色字：「5 张图 / 1 个 IP」。中间用一条红色虚线分隔。

小创动作：左右各 5 个（10 个小创）。

生成 prompt 关键参数：

比例：16:9
角色重复：10 次（测试角色一致性）
强调：左右 5 个小创的「一致性」对比

实例 5：小漫画分镜 — 「AI 配图 3 件套」使用流程

文章主题：「公众号配图工具的 3 件套」

核心认知锚点：用 AI 给公众号配图，只需 3 步——选 Skill、换 IP、跑流程。

结构选择：小漫画分镜（3 格）

画面描述：

画面是横排 3 格漫画，从左到右：第 1 格：小创站在 GitHub 仓库前，仓库外形是一个方块，上面写着「ian-xiaohei-illustrations」。小创单手指向仓库。蓝色字：「第 1 步：装 Skill」。第 2 格：小创坐在电脑前，屏幕显示 markdown 文档（xiaohei-ip.md），小创单手敲键盘。红色字：「第 2 步：换 IP」。第 3 格：小创站在一个「流水线」出口处，传送带运出 3 张配图，小创叉腰得意。绿色字：「第 3 步：跑流程」。3 格之间用细黑线分隔，下方是统一标题「公众号配图 3 件套」。

小创动作：3 个不同姿态（指仓库、敲键盘、叉腰）。

生成 prompt 关键参数：