
大家好,我是科叔。目前在学习AI工作流、AI编程。希望可以用最小成本,获得最大产出,打造1人团队。
作为一个公众号博主,其实一直有个想法,能否把自己公众号内容同步一份到个人知识库中,作为知识的沉淀。
但是微信公众号有严格的反爬虫策略、认证和权限限制、数据结构复杂等等问题,目前个人批量下载文章是比价困难。
之前也尝试过在Trae直接写都没成功,经过最近几天的尝试,终于发现高效稳定的方法!
由于篇幅过长,计划分两期,本期先介绍如何通过Trae编写脚本+API获取个人公众号历史所有文章链接地址。下期介绍如何批量存入个人知识库。
这个方法同样适用于获取对标账号所有文章
,不过需要注意微信平台的使用条款和权保护。
通过阅读和学习大量对标账号,可以学习对标的选题思路、内容结构和表达方式,为自己的创作提供灵感
了解同类账号的商业化路径,为自己的变现提供参考。
本期内容非常实用,不需要编程知识,任何人完全可以跑通,今天手把手教你,只求一个关注+点赞+推荐。
废话不多说,我们直接上手,主要过程分三步:
1.注册极致了平台并获取apikey
2.获取公众号biz
3.在Trae通过AI编程编写脚本
注册极致了平台
极致了数据是专业的新媒体数据服务商,提供专业的微信公众号数据分析与运营解决方案,提供大批量文章数据实时监控与历史文章数据采集两大API接口提供精准数据服务。
注册地址:https://www.jzl.com

获取apikey获取:https://www.dajiala.com/main/interface?actnav=0&invite=8ghs
复制下图位置的key

接口资费
本次用到是第7个接口,可实时下载任何公众号内历史上所有的文章标题、链接以及发文时间,100%准确,一页5次发文,可不断翻页。费用为0.08元/次。
也就是如果公众号有100篇文章,获取所有链接地址大概是 100/5*0.08=1.6 ,成本在可接受范围内。初次用冲个几块钱就够了。

获取目标公众号biz
-
1. 先在浏览器打开一个公众号文章,右键显示网页源代码 -
在微信公众号体系里,biz 就是公众号的「身份证」。
它是一个 固定不变、全网唯一 的 Base64 字符串(通常 16~22 位,结尾带 == ),微信用它来精准定位到某个具体公众号。

-
2. ctrl+f,全局搜索__biz=找到下图红框后面的的就是biz的值,复制出来

比如这个微信公众号的biz是:MzkzODkwODYwMA==
-
3. 调试接口
还是回到刚才获取apikey的地址:https://www.dajiala.com/main/interface?actnav=0
点击在线调试

-
4. 在线调试 -

查看请求体参数列表,在右侧在线运行进行调试

查看数据返回响应正常

在Trae编写Python脚本
将请求地址,请求参数,响应数据在AI聊天框内贴入,并在最后打入如下提示词
根据上面给到的请求地址,请求参数,响应数据,帮我写一个Python程序,批量获取我的文章url链接


很快Trae生成了一个wx_articl_crawler.py的文件,点击 应用
同时检查文件中的BIZ 和 KEY 是否正确

这里提示你需要安装依赖,是一个python常见的request库 点击 运行

最后点击 运行 这个脚本
300行代码一把就过,AI编程的能力还是非常强大,效率拉满!


一共生成了3个文件,所有数据保存再csv中

wx_articles.csv随便点开一个,网址打开正常,且和标题内容一致

在费用方面,57篇文章耗费0.84元,和官方API接口费用一致。
开始

结束

以上就是本期分享的内容,后续会分享如何通过请求到的url,批量获取全文,再导入个人AI知识库中。
以上就是今天的分享内容,我们下期见。
作者: 科叔AI进化记
来源: 科叔AI进化记
本文所引用的图文来自网络,版权归属原作者所有。本文基于合理使用原则少量引用,仅用于对数字营销的分析,非商业宣传目的。 若作者或版权方认为该引用损害其权益,请通过极致了数据微信: JZL3122 联系我方,我们将立即配合删除处理。
