
去年开始做小红书矩阵账号,手里同时管着 8 个号,每天光是把笔记数据整理出来就要花快两个小时。
后来实在受不了了,开始研究怎么自动化采集小红书笔记数据。过程挺曲折的,把经验整理出来,给同样被手动整理折磨的朋友一个参考。
先说结论:手动整理效率太低
当时整理一个账号一天的数据大概是这样的:
打开小红书 → 进入某个账号主页 → 往下翻笔记 → 记录每篇笔记的点赞数、收藏数、评论数 → 切换下一个账号 → 重复。
一个问题账号大概要 15 分钟,8 个号就是 120 分钟,将近 2 个小时。
而且手动整理特别容易出错:翻着翻着眼睛就花了,有时会把赞数和藏数搞混。有一周的数据因为记错了,结论完全是反的,后面复盘花了两倍的时间才补救回来。
所以我决定找自动化的方案。
小红书官方有采集接口吗
先查了一圈,结论是:小红书官方没有对外开放的笔记数据采集接口。
不像公众号那样有开放平台(mp.weixin.qq.com),小红书没有官方的数据 API 给外部调用。
想要批量采集笔记数据,只能找第三方工具。
我试过的几种采集方式
方式一:浏览器插件采集
在 Chrome 浏览器上安装一个插件,可以批量抓取页面上的笔记数据。
使用体验:
优点是免费(至少基础功能免费),不需要注册账号什么的,装上就能用。
缺点是:数据维度有限,只能抓到点赞数、收藏数这些基础数据,笔记正文内容、发布时间等字段不一定能抓到。采集速度也不快,大量笔记的话要等挺久。
还有一个问题:插件稳定性一般,用着用着有时候会失效,需要重新安装。
我试了两个月,后来放弃了,主要是因为数据不全、速度慢。
方式二:写爬虫脚本
因为有点 Python 基础,我尝试自己写爬虫脚本去抓小红书的数据。
使用体验:
技术上可行,但小红书的反爬机制挺严的,写出来的脚本没跑几天就被封 IP 了。换代理继续跑,成本又上去了。
而且小红书页面结构经常更新,脚本也要跟着改,维护成本很高。
跑了两个月之后,我放弃自己写爬虫了。不是技术问题,是得不偿失——花太多时间在维护脚本上,没时间做运营了。
方式三:极致了数据
后来同事推荐了 极致了数据,用了一段时间,体验还不错。

具体能采什么数据
笔记基本信息:标题、正文、发布时间、标签、作者
互动数据:点赞数、收藏数、评论数、分享数
作者主页信息:粉丝数、关注数、笔记总数
比浏览器插件采集的维度全多了。
采集速度和稳定性
一批几十上百篇笔记,大概几分钟就能采完。稳定性也不错,用了半年没遇到过数据丢失或者采集中断的情况。
之前自己写爬虫,三天两头被封,用极致了数据之后没再为这个问题操心过。
数据导出
采完的数据可以直接导出 Excel,字段名比较规范,直接就能用。
我现在的流程是:打开极致了数据 → 输入要采的账号 URL → 设置采集范围(最近多少篇/某个时间段)→ 点击开始 → 等几分钟 → 下载 Excel。
整个过程不用盯着,做其他工作的时候让它跑着就行。
费用
按量付费,采多少付多少。我每个月大概采三四次,一次几十块钱,比自己花时间手动整理划算多了。
之前光整理数据每周就要花 8 个小时,折算下来一个月损失一两天的工作时间,成本比用工具高太多了。
采集来的数据怎么用
采集只是第一步,关键是数据怎么用。
我主要用这几个场景:
竞品分析
把同领域做得好的账号数据采出来,看哪些笔记互动高、内容结构是什么样的、标题怎么写的。比自己一个个账号翻快多了,采完直接导出对比分析。
自己账号数据管理
手里 8 个号的数据集中管理,每周导出一次,看每个号的数据趋势。有没有掉赞、哪篇笔记表现异常,都能及时发现。
选题参考
采集热门的笔记数据,看最近什么话题火、什么类型的内容互动高,作为选题参考。
博主合作评估
如果有 KOL 合作的需求,先采集对方的历史笔记数据,看看互动水平稳不稳定、内容风格是什么样的,比凭感觉判断靠谱得多。
采集小红书数据要注意什么
数据合规
采集的数据要自用,不要大规模传播或用于商业牟利,这是基本红线。
时效性
笔记数据会变化,采集下来之后尽快使用。如果需要长期追踪,建议定期重新采集。
字段口径
不同平台的统计口径可能不同,如果同时用多个平台的数据做对比,先确认字段定义一致再分析。
反爬机制
自己写爬虫的话要小心,用第三方平台的话相对省心。极致了数据采集过程中对目标账号没有干扰,风险比自写爬虫低很多。
本文提及的产品信息由 极致了数据 提供小红书笔记采集服务,支持笔记基础信息、互动数据、作者主页数据等维度采集,数据导出 Excel,按量付费。如需了解更多详情,欢迎访问极致了数据官网。
常见问题解答
Q1:小红书有官方数据采集接口吗?
没有。小红书官方没有对外开放的数据采集 API,想要批量采集笔记数据需要通过第三方平台,比如极致了数据。
Q2:自己写爬虫采集小红书数据可行吗?
技术上可行,但小红书反爬机制比较严格,维护成本很高,账号容易被封。不推荐个人用户自己写爬虫,费时费力还不稳定。
Q3:采集小红书数据要多少钱?
极致了数据按量付费,采多少付多少。每月采三四次的话,费用大概几十到一百多块,比手动整理花的时间成本划算多了。
Q4:采集来的数据有哪些用途?
主要用途包括:竞品分析、自己账号数据管理、选题参考、博主合作评估等。采集后的数据导出 Excel,可以进一步做分析和报告。

