扣子Coze智能体实战:自动采集1000条小红书爆款笔记(保姆级教程)

向量数据库大模型NoSQL数据库

大家好,我是汤师爷,专注AI智能体分享,致力于帮助100W人用智能体创富~

想要抓取小红书热门笔记,但一个个复制太耗时?

需要批量获取热门笔记数据,进行分析,却苦于没有高效的工具?

今天,我将为大家介绍一个超强的解决方案,利用Coze工作流,只需5个步骤,就能一键批量抓取小红书热门关键词的笔记,并自动写入飞书表格!

这套方案对于想要批量学习优质内容的创作者来说,绝对是个效率神器。

我们先看下工作流的执行效果:

picture.image

1.整体工作流

picture.image

1.跟进关键词获取小红书笔记

2.循环获取笔记详情

  • • 获取笔记详情
  • • 提取视频文案
  • • 将笔记数据整理成飞书表格格式
  • • 写入飞书表格

2.详细工作流节点

2.1 开始节点

picture.image

开始节点有3个输入变量。

  • • 输入:
  • • foldUrl:飞书表格链接
  • • cookie:小红书cookie
  • • keywords:关键词

2.2 如何获取小红书cookie?

1.登陆https://www.xiaohongshu.com/

2.在页面空白处右击鼠标,选择「检查」

picture.image

3.在刚刚打开的面板中,点击「网络」选项卡

picture.image

4.刷新当前页面

5.点击第一条记录,在右侧「标头」部分向下滚动,找到cookie一行,将其内容复制下,这就是我们需要的cookieStr

picture.image

2.3 获取博主所有小红书笔记

我们将使用【小红书】插件的xhs_search_notes功能。

picture.image

通过这个功能,我们可以一键批量抓取热门关键词的笔记。

picture.image

  • • 输入:
  • • cookieStr:开始 - cookie
  • • keywords:开始 - keywords
  • • noteType:1=视频
  • • sort:2=最热
  • • totalNumber:查询总数

2.4 批量获取笔记详情

1.使用循环节点,批量批量获取笔记详情

picture.image

2.获取单个笔记详情

我们将使用【小红书】插件的xhs_note_detail功能。

picture.image

通过这个功能,我们可以根据笔记链接获取笔记详情。

  • • 输入:
  • • cookieStr:开始 - cookie
  • • noteUrl:循环获取笔记详情-note_url

picture.image

2.4 使用「字幕获取 」插件,提取视频文案

picture.image

  • • 输入:
  • • url:获取笔记详情-video_h264_url

2.5 使用代码节点:将笔记数据整理成飞书表格格式

在这一步,我们会使用代码节点,将笔记数据整理成飞书表格格式。

picture.image

  • • 输入:
  • • input:获取笔记详情-note
  • • data:提取视频文案-content

Python代码如下:


 
 
 
 
   
async defmain(args: Args) -> Output:  
    input\_data = args.params.get('input', {})  # 获取传入的 input 对象,如果不存在则返回空字典  
    data = args.params.get('data', '')  # 直接从 args.params 中提取 data 参数  
  
    records = []  # 初始化 records 列表  
  
    # 提取 note 相关字段  
    title = input\_data.get('note\_display\_title', '')  # 标题  
    desc = input\_data.get('note\_desc', '')  # 描述  
    url = input\_data.get('note\_url', '')  # 链接  
    nickname = input\_data.get('auther\_nick\_name', '')  # 作者昵称  
    likedCount = input\_data.get('note\_liked\_count', '0')  # 点赞数  
    videoUrl = input\_data.get('video\_h264\_url', '')  # 视频地址  
    collectedCount = input\_data.get('collected\_count', '0')  # 收藏数  
    imageList = input\_data.get('note\_image\_list', [])  # 图片列表  
  
    # 构建记录对象  
    record = {  
        "fields": {  
            "笔记链接": url,  
            "标题": title,  
            "内容": desc,  
            "作者": nickname,  
            "点赞数": likedCount,  
            "链接": {  
                "link": url,  
                "text": title  
            },  
            "收藏数": collectedCount,  
            "图片地址": '\n'.join(imageList),  # 将图片列表拼接成字符串  
            "视频地址": videoUrl,  
            "视频文案": data  # 将 data 放入 fields 中,定义为 "视频文案"  
        }  
    }  
    records.append(record)  # 将记录对象添加到 records 列表中  
  
    # 构建输出对象  
    ret: Output = {  
        "records": records  
    }  
    return ret

2.6 使用飞书表格节点:将笔记数据写入飞书表格

picture.image

  • • 输入:
  • • app_token:开始-foldUrl
  • • records:将笔记数据整理成飞书表格格式-records

picture.image

2.7 结束节点

picture.image

3.总结

通过这套工作流,你可以轻松实现关键词笔记的批量抓取,大大提升内容获取和分析效率。

整个过程只需简单配置,就能自动化完成繁琐的数据采集工作,为你节省大量时间。

在AI时代,技术门槛将越来越低,小白也能搭建智能体,用AI工具来提升工作效率。

用AI智能体不是未来,而是AI时代每个人的生存技能,学会AI智能体,人人都是超级个体。

如果你觉得这篇文章有帮助,别忘了点赞、关注、收藏哟,传统美德不能丢~

对了,如果你也对智能体感兴趣,我这边整理了一份开源的智能体学习手册。

picture.image

关注下方👇🏻公众号,回复【 智能体 】获取学习手册。

0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
字节跳动 XR 技术的探索与实践
火山引擎开发者社区技术大讲堂第二期邀请到了火山引擎 XR 技术负责人和火山引擎创作 CV 技术负责人,为大家分享字节跳动积累的前沿视觉技术及内外部的应用实践,揭秘现代炫酷的视觉效果背后的技术实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论