有没有那么一款工具,可以一次性把公众号的所有文章批量扒出来,结合公司介绍、产品手册、解决方案等内部资料,搭成咱们自己的企业知识库?以后写文案、做方案、培训新人,直接调用这个库就能用,相当于给公司做个第二大脑。甚至把友商公众号的文章全抓下来,系统性做拆解分析,也能省大把力气。
但是吧,要把公众号变成私有知识库,第一步最难的就是把文章 “搬” 出来。我以前试过一篇篇手动复制公众号内容,要么把链接复制到网站用打印功能转 PDF,要么逐篇打开保存到本地,要么格式错乱、图片全丢,要么排版乱到没法用,一天时间全耗在这上面,正经工作一点没推进。
前几天在 To B CGO 社群分享了一款 “公众号文章批量下载” 工具,大家直呼:及时雨,这个工具是真需要了。
其实在此之前我已经用这款工具导出了 To B CGO 公众号所有的文章,由于有一些功能上的缺陷,为此我还挖掘出了另外一款扒公众号推文的工具,两个工具互为补充,这篇文章一次性分享给大家。
先说第一款:
工具名:wechat-article-exporter
GitHub地址:https://github.com/wechat-article/wechat-article-exporter
在线网页地址:https://down.mptext.top/dashboard/account
这是一个 GitHub 上的开源项目,免费随便用,堪称小白福音,傻瓜式操作。它最核心的优势:支持批量导出公众号的全部文章,甚至连排版、图片、阅读数、点赞、留言都能一键导出。导出格式多样,支持 HTML、Markdown、TXT、JSON 等多种格式。更便捷的是,无需下载客户端,在线网页打开即可使用。
使用流程:打开地址 down.mptext.top,扫码登陆后点击获取,所有文章按时间倒序列出,标题、发布日期、是否原创一目了然。可全选或勾选特定文章,点击右上角 “打包下载”,几分钟即可获取 Zip 压缩包。
解压后每篇文章独立成文件夹,包含 HTML 文件与对应图片资源,双击 HTML 文件,展示效果与微信内完全一致,标题、正文、图片、代码块样式、文末 “在看” 数据均完整保留,对比浏览器打印的 PDF 更整洁。
该工具还有进阶玩法:设置抓取凭证(Credential)后,可导出阅读量、点赞数、分享数、留言内容。凭证仅半小时有效期,操作稍繁琐,但用于数据分析十分值得。
再说第二款:
工具名:长风的储物柜
GitHub地址:https://github.com/qiye45/wechatDownload
网页版地址:https://changfengbox.top/wechat
同样是 GitHub 开源项目,免费使用、在线操作,无需下载与复杂配置,极简 UI 界面,上手零难度。
两款工具核心差异:第一款工具更擅长抓取自家公众号文章,抓取他人公众号存在缺陷,无法直接导出 PDF,导出 MD 等格式易排版错乱,仅 HTML 格式稳定但不适合投喂 AI,也不支持批量下载其他公众号文章。
第二款工具完美弥补短板,同样支持批量下载,尤其适合抓取友商、行业公众号内容,用于后续分析与行业调研。

我已通过工具扒下 To B CGO 公众号全部 793 篇文章,存储至本地,准备投喂搭建 AI 知识库。
公众号文章批量抓下来之后,要怎么用?
很多人扒下了几百篇文章,往电脑硬盘一扔,觉得心里踏实了。但这和存在微信收藏夹有什么区别?只是一个在云端吃灰,一个在本地吃灰。依然是死数据。
资料一多,根本看不过来,抓取只是第一步,如果这些文章不能被快速检索、被二次调用,那批量导出来是毫无意义的。我们需要的是把这些散落的素材,结构化地吸收掉。
怎么让这些抓取下来的文章发挥最大价值?
思路很简单,就是做“内外缝合”。
比如:把抓取下来的友商公众号文章、行业大V的深度拆解,作为“外部视角”放到一个目录;然后,把自己公司的介绍、产品手册、解决方案、历史成功案例、内部策略文档,作为“内部底气”放到另一个目录。
对,我的做法是分库管理。
不是把所有东西混在一起,而是按主题拆成多个知识库。比如:
“产品知识库”:只放产品手册和自家公众号里关于产品功能的文章
“解决方案知识库”:只放解决方案白皮书和对应的客户案例
“竞品知识库”:只放友商的文章和自己的竞品分析笔记
“公司通识库”:放公司介绍、发展历程、文化价值观等
每个知识库独立使用。当你要写某个解决方案的销售话术时,只调“解决方案知识库”+“产品知识库”,不掺别的,回答更精准。当要做新员工培训时,只调“公司通识库”+“客户案例库”。
关于这个分类,其实也是不需要你自己去手动分类和区分的,几百篇文章,分类是很费时间的事情。
我的做法是:放在同一文件夹中,作为原始文章库,再给AI写一份文章拆分指南,让AI按规则,拆分后的文章放入另一个文件夹,再建立目录索引。这个工作流有点类似于龙虾🦞,让它自己去处理。(不是说只有小龙虾才可以搞定,很多编程软件都可以,我自己在用的就有(Cursor、字节跳动的 Trea、字节跳动的扣子编程,都能搞定)。
如果实在不行,也可以让AI 帮你写一个 Python 代码,然后运行帮你分类。

用什么 AI 工具,让批量导出的文章真正“活”起来?
我用的 AI 工具不多,平时用 NotebookLM、Gemini、豆包、Obsidian、Cursor、智谱GLM-5.1 这几个比较多。
知识库处理的话,我主要是用Obsidian、NotebookLM,这两个进行处理。
Obsidian 的好处是:它是本地存储,不依赖任何平台。我让AI帮我写一份拆分指南,把长文按知识点拆分成卡片,并建立目录索引,以后提问,AI先查目录再读对应文档,精准且绝不乱编。
然用表格把所有文章按主题、标签、来源列出来,这样当我在Obsidian里问AI(通过Agent Client插件接Claude API)时,AI可以先查索引,定位到相关文章,再读取那几篇的内容,而不是全文检索几百篇。速度快,答案准。
Obsidian适合存你自己消化后的知识,以及那些不想放云端的敏感资料。
NotebookLM 做 AI 加工
NotebookLM是Google出的研究助手,最牛的是“基于你给的资料回答问题”,不瞎编。我把“解决方案知识库”里的PDF全部上传到一个笔记本里,然后让NotebookLM帮我生成“方案演进时间线”“核心功能对比表”“常见客户问题Q&A”,还能生成信息图、PPT大纲、思维导图、还能做成调查问卷那种问答,真的很有用。
4 月5日之前的缺点:NotebookLM有个短板:它不连互联网,只能在你给的资料里打转,现在,问题解决了。
Gemini:智能问答+联网拓展
Google最近的一个大更新(2026年4月初上线的)。Gemini和NotebookLM彻底双向打通了。什么意思呢?以前我在NotebookLM里建个笔记本,想在Gemini里用,得手动导入。
现在好了,在Gemini网页端左侧边栏可以直接创建“笔记本”,这个笔记本会自动同步到NotebookLM。我在Gemini里上传的资料,NotebookLM里也有;我在NotebookLM里生成的音频,Gemini里也能引用。
更关键的是,Gemini可以联网做深度研究。比如我让它:“基于我笔记本里这些自家产品的资料,再去网上搜索友商最近三个月的产品动态,生成一份对比分析报告。”Gemini会先读我给的PDF,然后联网检索公开信息,把两者结合起来回答。既有内部资料的准确性,又有外部信息的广度。
我还给每个笔记本设置了自定义指令。比如竞品分析笔记本的指令是:“在这个笔记本里,你是一个市场研究专家。回答时先总结友商的产品特点,再对比我司产品的差异点,最后给出建议。不要编造数据,引用资料里的原文。”设置一次,后面所有对话都按这个来,不用每次重复说。
关于 ima 知识库
看到这儿,你是不是也挺疑惑的?我说到的这几个工具,明明和腾讯的 IMA 属于同一类产品,为什么我偏偏不用 IMA 呢?实在是一言难尽。它完全没有上下文关联,仿佛压根没有记忆,根本抓不住我到底想表达什么。哪怕我反复调试、一遍遍跟它对话优化同一个内容,它还是跟失忆了一样,前后内容毫无关联性。每次让它调整修改,结果都是直接全盘重新生成全新内容,完全衔接不上之前的思路。
别的 AI 顶多是产出的内容不合心意,顶多摇摇头,接着对话调整,改一改还能凑合用。但这款 IMA,简直就像处在叛逆期的逆子,用完只想口吐芬芳。
谁用谁知道
最后
强烈建议大家试试:先抓取,再缝合,最后用AI工具分层调用这个思路。真正把别人的公众号干货,变成完全属于自己、可检索、可生成、可迭代、不依赖任何平台的私有知识库。
竞品分析、公司知识库、个人知识库、产品介绍内容撰写、内容营销、解决方案撰写等等,这些内容完全可以跟公众号文章结合起来,丢给 AI,变成自己的知识库。
它和过往的 AI 不一样,真的是基于你的本地资料和联网搜索补充来给你完整的方案。
你再也不用再手动折腾一天导出文章,不用再花几个月去整理资料,两款简单的工具,一套实操流程,就能把外部干货变成内部资产,再结合 AI 工具提效,把繁琐的整理工作全交给工具,自己只需要专注在更有价值的思考和工作上。
我的实操经验掏家底分享,希望对你有帮助。

