n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!

大家好呀,我是 茉茉,一位专注于分享 AI 智能体实战技能的博主。

你是不是也经常研究那些公众号做得特别好的大 V?琢磨他们的爆款套路、内容结构,想把这些经验变成自己的?

无论是你想模仿他们的写作风格,还是打算用AI打造一个拥有他们知识的数字分身,

核心问题都只有一个:你得先把他们的全部历史文章拿到手。

公众号没有批量下载功能,传统爬虫又复杂又不稳定,很多朋友都在这一步卡住了。

别担心,我最近自己跑通了一个超好用的方法。

我做了一套自动化工作流,操作起来非常简单,能稳定、完整地把任何一个你需要的公众号文章全部提取出来。不管你是想获取历史文章还是当天发布的文章,这个工作流都可以一键搞定!

是不是很心动啊~

今天手把手这个工具和流程分享给你。咱们开始吧。

一、效果如图

n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!

二、工作流全景

n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!

三、工作流思路

n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!

四、工作流拆解(主要节点)

公众号没有提供接口调用,这里我们使用第三方平台【极致了数据网站】

网址是:https://www.jzl.com

n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!
n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!
获取key的方式如下图所示,在后面的节点中会遇到
n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!
获取biz的值如下图所示,将公众号文章在浏览器中打开,按F12,出现网页右边的界面,再按下Ctrl+F,在输入框中输入biz,找到biz,将它的值复制出来,也是在后面的节点中会遇到
n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!

(一)HTTP Request:获取公众号文章信息

我们要想获取某一个特定的公众号文章,首先需要知道该公众号一共有多少文章

n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!

url的值为https://www.dajiala.com/fbmain/monitor/v3/post_history

n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!
n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!
{    "biz":"XXXXXXXXXX",    "url":"公众号文章链接",    "name":"",    "page":1,    "key":"你的极致了数据的key",    "verifycode":""}

(二)Edit Fields:获取总页数

这里设置一个总页数的变量,在后面的节点中会遇到

n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!

(三)Code in Python (Beta):获取循环次数(page)

我们这里通过前面获取到的文章总页数来判断循环次数,通过代码节点来实现

在代码节点的输出中,里面包含了每个page的索引,这里总共是2个索引

n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!
# 1. 修正取值:假设 _data 是单个对象 { "total_page": 2 }total = _data['total_page'] # 增加打印,请查看 Console 确认输出 "获取到的总页数: 2"print(f"获取到的总页数: {total}")orig = 1output = []page = []# 2. 循环生成页码if isinstance(total, int) and total > 0:    for i in range(total):        page.append(i + 1)# 3. 构造输出output.append({'page': page})return output

(四)Split Out:分割page

这里我们将获取的page列表进行分割,便于在后面的循环节点进行控制。这里我们需要一页一页的获取文章

n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!

(五)Loop Over Items:循环

n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!

(六)HTTP Request:获取每页信息

在该节点的输出中,我们可以看到每页里面的文章参数,都在data里面

每个data里面,包含了文章的url和title,后续通过这两个参数进行文章下载

n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!

url的值填https://www.dajiala.com/fbmain/monitor/v3/post_history

n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!
n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!
{    "biz":"XXXXXXXXX",    "url":"公众号文章链接",    "name":"",    "page":{{ $json.page }},    "key":"你的极致了数据的key",    "verifycode":""}

(七)Split Out:分割文章

因为每一页有多篇文章,需要对data进行分割,一篇一篇的进行下载

n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!

(八)HTTP Request:下载文章

根据文章的url进行下载

n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!
n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!
Mozilla/5.0 (Windows NT 10.0; Win64; x64) Chrome/116.0.0.0 Safari/537.36

(九)HTML:提取文本

前面下载的文章,是整个网页代码,这里我们把需要的文本给提取出来

n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!

(十)Convert to File:转成文件

将取出来的文本转成文件的格式保存,文件名为文章标题

n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!

(十一)Read/Write Files from Disk:存入本地

n8n 喂饭级教程:一键下载公众号对标大 V 1000 篇文章,AI 知识库轻松搭建!

File Path and Name的值是/files_storage/{{ $('Split Out:分割文章').item.json.title }}.txt

码字不易,如果有收获,辛苦你点赞,转发,推荐给更多需要的小伙伴。我们下期教程见!👋

作者: 光予学姐
来源: 光予学姐

本文所引用的图文来自网络,版权归属原作者所有。本文基于合理使用原则少量引用,仅用于对数字营销的分析,非商业宣传目的。 若作者或版权方认为该引用损害其权益,请通过极致了数据微信: JZL3122 联系我方,我们将立即配合删除处理。

上一篇:

下一篇:

相关新闻

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

客服微信

联系我们

18658854422

微信号:JZL99876

邮件:474804@qq.com

工作时间:周一至周五,9:00-18:00,节假日休息