大数跨境

小开源:蒸馏版自己的 SEO 审计工具 seo-audit-skill

小开源:蒸馏版自己的 SEO 审计工具 seo-audit-skill 子木聊出海
2026-04-10
26
导读:手动跑了几十个网站的 SEO 审计,总结出哪些检查是确定性的、哪些需要语义判断,然后才设计出这套 Script + LLM 架构。

SEO 这么久,一直想要一个既专业又省事的审计工具

所以我花了点时间,做了个 seo-audit-skill — 给它一个 URL,它就能跑出针对这个页面,一份结构化的报告,告诉你哪里有问

题、为什么有问题、怎么改。

开源 + 免费,欢迎大家用起来、提 PR、多交流!

GitHub 地址:https://github.com/JeffLi1993/seo-audit-skill

先看效果:

为什么做这个工具?

做 SEO 的都知道,审计是个苦力活:

  • 要检查 robots.txt、sitemap.xml、canonical 标签……

  • 要看 TDK(Title/Description/Keywords)写得对不对

  • 要分析 H1/H2 结构、内链分布、Schema 标记

  • 还要跑 PageSpeed Insights,看性能分数

这些事儿,80% 是机械重复,20% 需要人工判断。

比如:

  • “这个页面的 title 是不是 50-60 字符?” → 机器能判断

  • “这个 H1 的语义是否匹配关键词意图?” → 需要 LLM 理解

所以我设计了一个 Script + LLM 双层架构

  • Layer 1(Python 脚本) 处理确定性检查 → 输出结构化 JSON

  • Layer 2(LLM Agent) 处理语义判断 → 只在需要时介入

这样既不会让 LLM 瞎编(比如说“robots.txt 存在”但其实不存在),也不会漏掉需要理解的部分(比如 H1 的语义匹配度)。

能检查什么?

目前 v1.0 支持 20+ 项 SEO 检查,分为两个版本:

seo-audit (Basic 版)

适合日常快速审计,给个 URL 就能跑:

站点级检查:

  • ✅ robots.txt 解析(RFC 9309 标准)

  • ✅ sitemap.xml 验证

  • ✅ 404 处理(真 404 vs 软 404 vs 重定向到首页)

  • ✅ URL 规范化(HTTP→HTTPS、www 一致性、尾部斜杠)

  • ✅ 国际化 / hreflang 标签

  • ✅ Schema(JSON-LD)验证

  • ✅ E-E-A-T 信任页面(About/Contact/Privacy/Terms)

  • ✅ PageSpeed Insights 分数(移动端 + 桌面端)

页面级检查:

  • ✅ URL Slug(小写、连字符、关键词、停用词检测)

  • ✅ Title 标签(50-60 字符、关键词位置)

  • ✅ Meta Description(120-160 字符、关键词匹配、具体价值主张)

  • ✅ H1 标签(单一 H1、关键词匹配、语义意图)

  • ✅ Canonical 标签(自引用、重定向后匹配)

  • ✅ 图片 Alt 文本

  • ✅ 字数统计(正文 ≥ 500 字)

  • ✅ 关键词位置(前 100 字内)

  • ✅ 标题结构(H2 数量、H3/H2 比例、关键词分布)

  • ✅ 内链分布

怎么用?

超简单,两种方式:

方式 1: CLI(推荐)

  
 
 
   

npx skills add JeffLi1993/seo-audit-skill 

 

# 或者安装指定版本 

npx skills add JeffLi1993/seo-audit-skill --skill seo-audit 

npx skills add JeffLi1993/seo-audit-skill --skill seo-audit-full 

 

方式 2: Claude Code 插件

  
 
 
   

/plugin marketplace add JeffLi1993/seo-audit-skill 

/plugin install seo-audit-skill 

 

然后直接对话:

  
 
 
   

audit this page: https://example.com 

 

就能生成报告了!

项目结构

  
 
 
   

seo-audit-skill/ 

├── seo-audit/ 

│   ├── SKILL.md                       # Skill 定义 + agent 工作流 

│   ├── references/REFERENCE.md        # 字段定义、边界情况 

│   ├── assets/report-template.html    # HTML 输出模板 

│   └── scripts/ 

│       ├── check-site.py              # robots.txt + sitemap → JSON 

│       ├── check-page.py              # TDK + H1 + canonical + slug → JSON 

│       ├── check-schema.py            # JSON-LD 提取 + 验证 → JSON 

│       ├── check-pagespeed.py         # PageSpeed Insights API → JSON 

│       └── fetch-page.py              # 原始 HTML 抓取,SSRF 防护 

└── seo-audit-full/ 

    ├── SKILL.md 

    ├── references/REFERENCE.md 

    └── assets/report-template.html 

 

所有脚本输出结构化 JSON 到 stdout。退出码 0 = 通过/警告,1 = 失败。

依赖:pip install requests

欢迎交流!

这个工具是我自己做 SEO 时的痛点产物,希望能帮到更多人。

如果你:

  • 用了觉得不错,给个 Star ⭐

  • 发现 Bug 或有改进建议,提个 Issue 🐛

  • 想贡献代码,欢迎 PR 🚀

  • 想交流 SEO 实战经验,随时找我聊 💬


GitHub 地址:https://github.com/JeffLi1993/seo-audit-skill

开源 + 免费,期待你的反馈!


最后说两句

AI 时代,真正稀缺的不是会用 AI 的人,而是没有 AI 也能把问题想透、跑通的人

我做这个工具的过程,就是先自己手动跑了几十个网站的 SEO 审计,总结出哪些检查是确定性的、哪些需要语义判断,然后才设计出这套 Script + LLM 架构。

只有自己下过苦功夫、趟过坑,才知道策略的关键在哪,才能精准地指挥 AI。

否则,拿着烂大街的 prompt 让 AI 干活,出来的也只能是平庸的结果。

希望这个工具能帮你省点时间,把精力放在更有价值的事情上 🚀


【声明】内容源于网络
0
0
子木聊出海
增长黑客,爱分享 Learning by Writing。专注于出海 AI SaaS,探索 SEO、红人营销、Ads、EDM 等增长策略
内容 56
粉丝 0
子木聊出海 增长黑客,爱分享 Learning by Writing。专注于出海 AI SaaS,探索 SEO、红人营销、Ads、EDM 等增长策略
总阅读1.5k
粉丝0
内容56