AI智能体|最新扣子(Coze)实战:【一键批量抓取小红书笔记】工作流

大模型数据中台容器服务

picture.image

你是不是也和我一样,在小红书上刷到某个“宝藏博主”时,总想把他们的笔记都保存下来,好好研究一番?

无论是想学习爆款内容的选题角度,还是分析引人入胜的写作风格,一篇篇手动复制粘贴,不仅效率低下,还容易遗漏。

今天,就想给你分享一个我最近发现的“偷懒”小技巧,只需要创建一个简单的工作流,就能实现一键批量获取心仪博主的全部笔记,并自动整理到飞书多维表格里。

来看看最终效果:

picture.image

第一步:新建并命名工作流

打开扣子空间(coze.cn),点击“新建工作流”。如果不太熟悉操作,可以参考这篇教程AI智能体|最新扣子(Coze)实战:5步玩转Coze,学会这一招,领先同事一整条街!【小白必看】

picture.image

第二步:配置“开始”节点
在工作流中,添加一个“开始”节点,用来接收外部输入。

picture.image

  • user_url :小红书博主的主页地址。

例如,在浏览器访问 https://www.xiaohongshu.com/ 搜索并进入博主主页,复制地址栏 URL 即可:

picture.image

  • cookie :用于模拟登录状态,按 F12 → 选择网络 → 复制 Cookie 值(提示:如果没看到下图的入口,刷新一下浏览器页面就会出现)。
  • feishu_url :飞书多维表格文档链接,用于保存抓取结果。创建好表格后复制 URL:

picture.image

  • cursor :分页标识,默认可不填。

第三步:配置“首次获取”节点

添加小红书 xsh\_auther\_notes 插件,用于第一次拉取博主笔记及作者信息,保证作者信息单独保存:

picture.image

关联 user_urlcookiecursor

picture.image

第四步:配置循环体节点
为了翻页获取所有笔记,需要在首次获取节点下游搭建循环逻辑。

  • 4.1 循环节点 :无限循环,关联开始节点的 cursor 参数:

picture.image

  • 4.2 循环获取节点 :再次调用 xsh\_auther\_notes 插件,传入 user_urlcookie 和循环节点的 var_cursor

picture.image

  • 4.3 选择器节点 :判断字段 has\_more 是否为 true ,决定是否继续循环:

picture.image

  • 4.4 设置变量节点 :在选择器的第一输出口,更新 var_cursor ,为下一页做准备:

picture.image

  • 4.5 数据清洗节点 :用 JavaScript 代码把插件输出的原始数据,转成飞书表格对应的字段:

 
 
 
 
   
async functionmain({ params }: Args): Promise<Output> {  
    const auther\_info = params.auther\_info;  
    const notes = params.notes;  
    let records = [];  
    for (let item of notes) {  
        let record = { "fields": "{}" };  
        let fields = {};  
        fields.笔记标题 = item.note\_display\_title;  
        fields.点赞数   = item.note\_liked\_count;  
        fields.笔记链接 = item.note\_url;  
        fields.博主昵称 = auther\_info.nick\_name;  
        fields.粉丝数   = auther\_info.fans;  
        fields.作者主页 = auther\_info.user\_link\_url;  
        record.fields  = JSON.stringify(fields);  
        records.push(record);  
    }  
    return { records };  
}

并关联 首次获取节点auther\_info 与循环获取节点的 notes,输出 records

picture.image

  • 4.6 写入飞书节点 :使用 “飞书多维表格–add_records” 插件,将清洗好的 records 写入表格:

picture.image

关联 feishu_urlrecords 后即可。

  • 4.7 终止循环节点 :在选择器的第二输出口,添加 “终止循环” 节点,一旦 has\_morefalse ,结束循环:

picture.image

第五步:添加结束节点
循环体外,再加一个“结束”节点,输出 feishu_url ,整个工作流就完整了:

picture.image

希望这份指南能为你的自动化之路提供助力。

搭建工作流,犹如搭建乐高积木 :按部就班、耐心拼接,最终就能实现你的创意与需求。

虽然今天我们用它来抓取小红书笔记,但当你渐渐掌握“让机器替你干活 ”的自动化思维 ,就会发现生活和工作中那些重复而繁琐的事务,都能被简化、被解放。

一步一个脚印,从一个简单的工作流开始,也许就是你开启高效新世界的那把金钥匙。

End

如果你也对 AI 充满好奇,欢迎公众号后台私信我「进群」,一起打破信息差,真诚分享前沿资讯与实用教程。期待与你并肩探索 AI 世界!picture.image

视频和图文教程都已上传至知识星球

还有可以一键复制使用的Coze空间......

欢迎扫描下方二维码 🔗 一起学习交流👇

picture.image

既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~真诚感谢你看我的文章,我是洞见君,我们,下次再见。

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
大规模高性能计算集群优化实践
随着机器学习的发展,数据量和训练模型都有越来越大的趋势,这对基础设施有了更高的要求,包括硬件、网络架构等。本次分享主要介绍火山引擎支撑大规模高性能计算集群的架构和优化实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论