Coze工作流:一键批量抓取小红书笔记,告别手动复制!

大模型向量数据库机器学习

哈喽,大家好,我是狗哥!专注AI干货知识分享,如果你正在学习AI相关知识,欢迎关注狗哥领取免费学习资料哦~

本篇是《100个Coze工作流案例》第9篇,今天给大家分享的是——小红书笔记批量抓取神器!

前言

对于小红书,相信很多做自媒体的朋友都有这样的烦恼:

看到某个博主火了,想分析他的内容策略,结果一个个点开笔记手动复制,累得要死;想做竞品分析,光是收集素材就要花掉大半天时间...

这不,狗哥给你找到个解决方案,用Coze工作流一件提取笔记信息。现在,只需要输入博主首页链接,coze就能自动帮你把所有笔记信息抓取下来,整理成结构化数据,存储到飞书表格里。

这效率提升不需要我多说了吧?这就让大家看看效果:

picture.image

工作流思路

在开始搭建之前,咱们先理清楚整个抓取流程应该怎么做:

1. 获取博主信息 - 根据链接获取博主基础信息和首页笔记
2. 循环抓取内容 - 翻页获取所有历史笔记数据
3. 数据清洗整理 - 提取关键信息并格式化
4. 批量存储数据 - 将处理后的数据写入飞书表格

整个流程的核心在于循环抓取和数据处理,完整的工作流程图长这样:

picture.image

看起来有点复杂?别担心,狗哥会一步步带大家搭建。

🛠️ 狗哥实操

0. 准备工作

首先,我们需要在飞书中创建一个多维表格来存储抓取的数据。你准备在工作流中保存什么数据,就设置好对应的字段,否则工作流中的数据会添加失败。

创建完成后,复制表格链接备用。

1. 开始节点

打开Coze,创建新的工作流,设置开始节点的4个关键参数:

user_url :小红书博主首页地址
这个最简单,打开电脑浏览器进入小红书,搜索你想分析的博主,进入主页后复制地址栏链接即可。

picture.image

Cookie :登录状态标识
这是关键步骤!在博主页面按F12打开开发者工具,点击Network标签,刷新页面后,找到请求头中的Cookie值并复制。

picture.image

feishu_url :飞书表格地址;就是刚才创建的多维表格链接。

cursor :分页标识;可选参数,默认可以不写。因为大部分小红书博主内容较多,所以查看时会进行分页,而cursor的作用就是作为分页的标识。

2.首次获取博主数据

添加"小红书"插件节点,用于首次获取博主笔记内容,主要是收集博主信息,因为后续遍历循环时可能不会输出作者信息,所以最好是单独保留一份。

picture.image

picture.image

3. 构建循环体

这是整个工作流最关键的部分!

添加一个循环节点,循环类型设置为无限循环(在循环体中控制终止),并关联开始节点的cursor参数:

picture.image

4. 循环节点

循环体中,第一个节点也是小红书插件。主要用于遍历获取每一页的笔记内容信息:

picture.image

5. 选择器节点

在循环获取节点之后,新增一个选择器节点,主要是用于判断是否为最后一页。判断的标识为循环获取节点的has_more参数,如果该参数为ture,表明有笔记内容,则可以继续下一步:

picture.image

6. 设置变量节点

当需要进行下一步时,需要先加一个设置变量节点,作为选择器节点的第一输出口。用于更新var_cursor变量,用于在下一轮遍历中获取新的笔记页内容:

picture.image

7. 数据清洗

数据清洗是确保信息质量的重要环节,目的是为了将小红书插件中获取的数据清洗并整理成我们需要的数据。

picture.image

8. 数据上传

数据清洗完成齐后,新增一个飞书多维表格的add records插件,将清洗出的数据上传至表格即可。

picture.image

写在最后

今天分享的这个Coze工作流,真的能让你的内容分析效率提升10倍!不管你是自媒体博主、市场营销人员,还是内容创作者,这个工具都能帮你快速获得竞争优势。

当然,工具只是手段,关键还在于如何分析和应用这些数据。如果你想了解更多工作流技巧,记得关注狗哥,我会持续分享更多干货!

对了,如果你觉得大模型不好用,可能是你不会写提示词。狗哥为你准备了海量提示词模板和DeepSeek相关教程,只需关注公众号,点击底部【资源】菜单即可领取。

如果这篇文章对你有帮助,不知道大家能否点个关注,顺便 给我个三连击:点赞、转发和再看。有什么问题也欢迎在评论区留言,我会一一回复的~

想要获取完整工作流和更多AI干货,欢迎私信交流!

我是狗哥,关注我获得更多优质内容。

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
火山引擎大规模机器学习平台架构设计与应用实践
围绕数据加速、模型分布式训练框架建设、大规模异构集群调度、模型开发过程标准化等AI工程化实践,全面分享如何以开发者的极致体验为核心,进行机器学习平台的设计与实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论