影刀RPA零基础教程:AI大模型(DeepSeek)接入指南——从API配置到数据清洗实战

做电商采集最头疼的不是“点不到按钮”,而是采回来的数据乱七八糟——“¥49.00元”、“49元”、“49.00”三种格式混在一起,标题里还有一堆换行和空格,SKU规格更是五花八门。

传统RPA有个明显短板:只能做“规则明确”的事。遇到需要理解语义、判断意图、生成内容的场景就束手无策了。RPA负责“做”,AI负责“想”——这就是AI+RPA的核心价值。

picture.image

这篇文章用影刀RPA对接DeepSeek大模型,从API配置到数据清洗实战,手把手教你把AI能力集成到自动化流程里。

picture.image

一、RPA+AI能解决什么问题?

先看三个真实场景,你就知道为什么要集成AI了。

场景一:商品标题清洗与翻译

picture.image 从1688采集的商品标题是“2024新款女装韩版宽松显瘦连帽卫衣女春秋加绒”。要上架到TikTok Shop,需要:

  • 提炼5个核心卖点
  • 翻译成地道英文标题
  • 生成英文产品描述

picture.image 用正则表达式写死规则?每个品类规则都不同,维护成本极高。

场景二:评论情感分析 采集了1000条商品评论,想知道“好评率到底多少”“差评主要集中在什么问题上”。人工看不过来,用关键词匹配又太粗糙。

picture.image 场景三:SKU规格标准化 货源数据里“颜色-升级版”“藏青色-加绒”这种非标准写法,要转成“Color: Navy Blue, Style: Fleece-lined”才能上架亚马逊。正则表达式根本处理不了这种语义级的混乱。

以上三个场景,AI大模型都能搞定。

picture.image

二、接入AI大模型的两种方案

影刀接入大模型有两种主流方案,看你的场景选哪个。

picture.image

方案适用场景配置难度灵活性成本
影刀AI Power不想写代码、快速上手⭐ 低影刀额度
HTTP请求+Python代码需要自定义模型/参数⭐⭐⭐ 中API按量付费

picture.image 方案一:影刀AI Power(推荐新手) 影刀内置的AI能力平台,已经封装好了DeepSeek、ChatGPT等多个模型。在AI Power里配置好API Key,影刀流程里直接拖“AI对话”指令就能用。

方案二:HTTP请求+Python代码(更灵活) 用影刀的“发送HTTP请求”或“执行Python代码”指令,直接调用大模型的API接口。适合需要自定义Prompt、调整参数、处理复杂返回结果的场景。

社区版用户注意:两种方案都不消耗影刀的运行时长,但调用大模型API本身会产生费用(按token计费)。建议先在AI Power里用少量数据测试,确认效果后再批量使用。

三、获取DeepSeek API Key(3分钟搞定)

DeepSeek是目前性价比很高的大模型,API价格便宜,中文理解能力强。

操作步骤:

  1. 打开DeepSeek开放平台:https://platform.deepseek.com/
  2. 注册/登录账号
  3. 进入“API Keys”页面,点击“创建API Key”
  4. 复制生成的API Key(只显示一次,务必保存好

这里容易踩坑:API Key千万不要硬编码在流程里。建议用影刀的“应用参数”功能管理敏感信息,或者存到本地配置文件里动态读取。

四、方案一实操:影刀AI Power接入DeepSeek(零代码)

这是最快的方式,不需要写一行代码。

picture.image

操作步骤

第一步:打开AI Power

在影刀客户端顶部菜单找到“AI Power”入口,或者在流程编辑器中点击AI相关图标。

第二步:添加DeepSeek模型

在AI Power里选择“添加模型” → 找到DeepSeek → 输入API Key。

第三步:配置对话参数

在高级任务里选择DeepSeek,点击对话操作:

  • 用户消息:输入要问的问题(可以用影刀变量)
  • temperature:模型创造性参数,0-1之间。数据清洗用0.3(更保守准确),内容生成用0.8(更有创意)

第四步:在流程中使用

拖入“AI对话”指令 → 选择已配置的DeepSeek模型 → 设置输入输出变量。

基础对话示例

【影刀流程】
→ 设置变量:用户问题 = "请用一句话总结:这款卫衣采用优质棉料,舒适透气"
→ AI对话(模型=DeepSeek, 消息=用户问题) → AI回答
→ 输出日志(AI回答)

创业版以上用户可以在AI Power里搭建更复杂的AI工作流——把多个AI组件串起来,实现“采集→清洗→翻译→格式化”一条龙。

picture.image

五、方案二实操:Python代码调用大模型API(更灵活)

如果需要更精细的控制(比如自定义System Prompt、处理JSON返回、并发调用),用Python代码更灵活。

基础封装代码(直接复制)

在影刀里拖入“执行Python代码”指令,粘贴以下代码:

# 影刀Python代码 - DeepSeek API调用封装
# 输入变量:user_input(字符串,用户的问题)
# 输出变量:ai_response(字符串,AI的回答)

import requests
import json

# ===== 配置区(替换成你自己的API Key)=====
API_KEY = "sk-你的DeepSeek API Key"  # 建议用影刀应用参数管理
API_URL = "https://api.deepseek.com/v1/chat/completions"

# ===== 构建请求 =====
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}

messages = [
    {"role": "system", "content": "你是一个专业的电商运营助手,用中文回答用户问题"},
    {"role": "user", "content": user_input}
]

data = {
    "model": "deepseek-chat",  # DeepSeek模型名称
    "messages": messages,
    "temperature": 0.7,
    "max_tokens": 2000
}

# ===== 发送请求并处理响应 =====
try:
    response = requests.post(API_URL, headers=headers, json=data, timeout=60)
    response.raise_for_status()
    result = response.json()
    ai_response = result['choices'][0]['message']['content']
    print(ai_response)  # 影刀会捕获print的内容作为输出
except requests.exceptions.Timeout:
    print("错误:请求超时,请检查网络")
except requests.exceptions.RequestException as e:
    print(f"错误:{str(e)}")
except (KeyError, json.JSONDecodeError) as e:
    print("错误:解析响应失败,请重试")

运行结果:在影刀里运行后,ai_response变量里就是AI的回答。

六、实战一:商品标题清洗与翻译(最常用)

采集到的中文标题 → 生成英文标题+中文翻译+5个卖点 → 结构化输出。

构造Prompt

# 在Python代码里构造Prompt
user_input = f"""
你是一个专业的跨境电商运营专家。请分析以下商品标题,生成上架内容:

原始标题:{raw_title}

请输出以下内容(JSON格式):
1. 优化后的中文标题(去除冗余词,突出卖点)
2. 英文标题(符合SEO规范,不超过150字符)
3. 英文标题的中文翻译
4. 5个核心卖点(英文,每个不超过20词)
5. 5个核心卖点的中文翻译

输出格式:
{{
    "title_cn": "...",
    "title_en": "...",
    "title_en_translation": "...",
    "bullet_points_en": ["...", "...", "..."],
    "bullet_points_cn": ["...", "...", "..."]
}}
"""

解析JSON返回结果

AI返回的是JSON字符串,需要用Python解析成字典,再逐个字段写入Excel。

# 解析AI返回的JSON
import json

# ai_response 是AI返回的JSON字符串
try:
    result = json.loads(ai_response)
    title_cn = result.get("title_cn", "")
    title_en = result.get("title_en", "")
    # ... 提取其他字段
except json.JSONDecodeError:
    print("AI返回格式错误,请检查Prompt")

影刀指令精确名称:在影刀里可以用“文本转JSON对象”指令解析JSON,也可以用Python代码里的json.loads()

七、实战二:评论情感分析(批量处理)

采集了500条商品评论,让AI逐条判断情感倾向(好评/中评/差评)并提取关键词。

批量处理流程

【外层循环】循环列表(评论列表, 当前评论):
    → 构造Prompt:"请判断以下评论的情感倾向(好评/中评/差评),并提取2-3个关键词:{当前评论}"
    → 调用AI对话(DeepSeek, Prompt) → AI分析结果
    → 解析结果 → 写入Excel(评论+情感+关键词)
循环结束

性能优化:每条评论都调用API,500条就是500次请求,耗时较长。可以用“批量Prompt”——把10条评论打包成一条消息让AI一次性分析。

# 批量分析10条评论
batch_prompt = "请分析以下10条评论,每条输出情感(好评/中评/差评)和关键词:\n"
for i, comment in enumerate(comments_batch):
    batch_prompt += f"{i+1}. {comment}\n"
# 一次调用AI,返回10条分析结果

八、进阶:并发调用优化(提速关键)

单次调用大模型API通常需要几秒到十几秒。如果循环50次,光等AI响应就要好几分钟。

解决方案:并发调用子流程

影刀的“并发调用子流程”指令可以同时启动多个AI调用,等待的途中主流程可以做其他事情。

操作要点

  1. 把“调用AI”的逻辑单独做成一个子流程
  2. 在主流程中用“并发调用子流程”同时启动多个
  3. 线程对象.is_alive()检查运行状态
  4. 线程对象.join()等待所有子流程完成

参数传递注意:并发调用子流程的参数输入需要使用字典。由于多线程无法直接传递输出参数,通过传入一个可变对象(字典) 来获取结果。

九、AI+RPA完整实战:智能商品上架系统

这是一个完整的“AI思考,RPA执行”的3.0智能化架构。

整体流程设计

A_Main(主流程)
├─ 【Extract - 采集脏数据】
│   ├─ 打开1688商品详情页
│   ├─ 采集标题、价格、描述、规格表(原始HTML/文本)
│   └─ 存入变量:raw_data
│
├─ 【Transform - AI清洗结构化】  ← 核心
│   ├─ 调用Python代码(DeepSeek API):
│   │   ├─ 输入:raw_data
│   │   ├─ Prompt:清洗为标准化商品信息,输出JSON
│   │   └─ 输出:clean_data(JSON格式)
│   └─ 解析JSON → 拆分为标题、价格、SKU、描述等字段
│
└─ 【Load - 自动上架】
    ├─ 打开目标平台(如TikTok Shop)后台
    ├─ 填写标题、价格、描述
    ├─ 循环SKU列表逐个填写规格
    └─ 点击发布

这种架构保证了业务的极度灵活性——货源平台改版了,只改Extract模块;目标平台规则变了,只改Load模块。

常见问题/易错速查

  1. API Key放在哪里最安全 → 不要硬编码在流程里。用影刀的“应用参数”功能管理,或者存到本地配置文件里动态读取。

  2. AI返回的内容不是JSON格式 → 在System Prompt里明确要求“必须输出严格的JSON格式”。同时在代码里做异常处理,解析失败时重试或记录日志。

  3. 调用API超时 → 大模型API响应时间不稳定。在requests里设置timeout=60,超时后记录日志并跳过该条数据。

  4. Token消耗太快,费用超预算 → 用更便宜的模型(如DeepSeek比GPT-4便宜很多);减少max_tokens;批量处理减少调用次数。

  5. AI Power和Python代码方案怎么选 → 简单对话用AI Power(零代码),复杂逻辑用Python代码(更灵活)。

  6. 社区版能用AI功能吗 → 可以。AI Power和“执行Python代码”指令社区版都支持,不消耗运行时长。但调用大模型API本身需要付费。

  7. 并发调用子流程的参数怎么传 → 使用字典格式传入参数。输出结果通过传入的可变对象(字典) 来获取。

推荐资源

  1. DeepSeek开放平台:https://platform.deepseek.com/
  2. 影刀AI Power官方文档(影刀帮助中心搜索“AI Power”)
  3. 影刀官方社区搜“AI大模型”有大量实战案例
  4. 影刀RPA与ChatGPT联动实战(CSDN):完整5个实战场景
  5. 影刀接入AI大模型的常规方法步骤及实操(影刀社区)

#影刀RPA #RPA自动化 #AI大模型 #DeepSeek #数据清洗 #电商自动化

作者:林焱

本文为《影刀RPA学习手册》系列文章之一,内容源于实操经验的整理与分享。

0
0
0
0
评论
未登录
暂无评论