鼠标和键盘是RPA里最基础的两类指令。但越基础的东西,细节越多——点击元素有五种模式,输入文本有三种方式,选错了轻则效率低,重则流程跑不起来。
这篇文章把鼠标和键盘相关的指令全部捋一遍,把每个指令的适用场景和坑点讲清楚。
一、鼠标点击的五种模式
影刀的“点击元素”指令在右侧详情面板里有个下拉选项叫“点击方式”,里面有五种模式。很多新手从来不改这个选项,默认是什么就用什么,结果遇到特殊场景就卡住了。
| 点击模式 | 适用场景 | 稳定性 |
|---|---|---|
| 模拟点击(默认) | 大部分普通按钮、链接 | ⭐⭐⭐⭐ |
| 前台点击 | 游戏/特殊控件/弹窗 | ⭐⭐⭐ |
| 后台点击 | 多窗口并行操作 | ⭐⭐⭐⭐ |
| 点击坐标 | 元素捕获不到的场景 | ⭐⭐ |
| 双击 | 需要双击打开的文件/文件夹 | ⭐⭐⭐⭐ |
模拟点击(最常用,默认选项)
这是默认选项,适合90%的场景。影刀会模拟鼠标的点击事件,和真人点按钮的效果几乎一样。
适用场景:网页按钮、链接、下拉菜单、复选框——大部分常规操作。
前台点击
用真实的鼠标进行点击,需要鼠标光标实际移到目标位置。操作期间不能动鼠标,否则会点偏。
适用场景:游戏界面、特殊控件、弹窗按钮(这些场景模拟点击可能不生效)。
容易踩坑:运行时不能动鼠标,否则会点歪导致流程失败。如果需要在运行期间用电脑干别的,就别用前台点击。
后台点击
不移动鼠标,直接发送点击指令到目标窗口。操作期间可以正常使用鼠标做别的事。
适用场景:需要一边跑流程一边干别的(摸鱼神器),或者需要同时操作多个窗口。
容易踩坑:后台点击依赖窗口句柄,如果目标窗口被最小化或隐藏了,点击可能失效。另外后台点击对部分网页(如Canvas游戏)不生效。
点击坐标
不依赖元素定位,直接点屏幕上某个坐标。
适用场景:元素捕获不到(比如图片按钮、画布上的元素)、浮层弹窗、桌面软件。
操作方式:在“点击元素”指令的详情面板中,点击方式选“点击坐标”,然后勾选“捕获坐标”,在网页上选取要点的位置。不同分辨率的坐标位置不一样,所以不建议在不同尺寸的屏幕上使用。
容易踩坑:不同分辨率下坐标会偏移。用坐标点击时,最好先固定浏览器窗口大小(比如1920×1080)。
双击
适用场景:需要双击打开的文件、文件夹,或者某些需要双击触发的操作。
二、输入文本的三种方式
影刀的“输入文本”指令也有多种方式,在最右侧详情面板中选择“输入方式”。
| 输入方式 | 适用场景 | 效率 |
|---|---|---|
| 输入文本(默认) | 普通输入框 | ⭐⭐⭐⭐⭐ |
| 模拟输入 | 输入框不响应/加密页面 | ⭐⭐⭐ |
| 剪切板粘贴 | 长文本/特殊字符 | ⭐⭐⭐⭐ |
输入文本(默认,最快)
直接通过浏览器API填入文本,效率最高,适合大部分普通输入框。
适用场景:搜索框、登录框、表单输入。
操作:拖入“输入文本”指令,捕获目标输入框,在内容栏填入要输入的文字或变量。
模拟输入(一个一个字符敲)
逐字符模拟键盘敲击,和真人打字一样。速度比默认输入慢,但兼容性更好。
适用场景:默认输入不生效的输入框(如某些加密页面、安全控件)、输入框有特殊事件监听(如实时搜索联想)。
容易踩坑:模拟输入时不能动鼠标和键盘,否则会打断输入。另外模拟输入用的是系统语言,如果切换了输入法,输入内容可能会变。
剪切板粘贴
先把内容复制到剪切板,再通过“粘贴”填入输入框。
适用场景:长文本(如几百字的商品描述)、内容包含特殊字符、输入框对逐字符输入有限制。
操作步骤:
- “设置文本到剪切板”指令,把要输入的内容存到剪切板
- 点击输入框获得焦点
- “模拟按键(Ctrl+V)”粘贴
三、输入文本前的强制清空操作
输入文本前不清空已有内容,是一个容易被忽略的问题。
假设输入框里已经有“连衣裙”三个字,你直接输入“T恤”,结果变成了“连衣裙T恤”。
解决方案:在输入文本前加一个“模拟按键(Ctrl+A)”全选,再“模拟按键(Delete)”删除。
点击输入框(获得焦点)
模拟按键(Ctrl+A) # 全选已有内容
模拟按键(Delete) # 删除
输入文本(输入框, 新内容)
影刀指令精确名称:“模拟按键”在“键盘”分类下。支持Ctrl、Alt、Shift组合键。
四、键盘快捷键模拟:比点击更快
有些操作用键盘快捷键比用鼠标点击快得多——比如Ctrl+S保存、Ctrl+C复制、Alt+Tab切换窗口。
影刀的“模拟按键”指令专门做这件事。
常用快捷键模拟
| 快捷键 | 用途 | 影刀写法 |
|---|---|---|
| Ctrl+S | 保存文件 | 组合键选“Ctrl+S” |
| Ctrl+C | 复制 | 组合键选“Ctrl+C” |
| Ctrl+V | 粘贴 | 组合键选“Ctrl+V” |
| Ctrl+A | 全选 | 组合键选“Ctrl+A” |
| Alt+Tab | 切换窗口 | 组合键选“Alt+Tab” |
| Enter | 确认/搜索 | 组合键选“Enter” |
| Tab | 切换到下一个控件 | 组合键选“Tab” |
拖拽操作
影刀支持鼠标拖拽。在指令面板搜“拖拽”或“鼠标拖拽”。
适用场景:滑动验证码(如拼多多的滑块验证)、文件拖拽上传、页面元素拖拽排序。
操作步骤:
- 捕获起始元素(要拖动的对象)
- 捕获目标元素(要拖到的位置)
- 在“拖拽”指令中分别选择起始元素和目标元素
容易踩坑:滑动验证码的滑块通常捕获不到元素,需要用“点击坐标”配合“鼠标拖拽坐标”来实现。
# 拖拽示例:把文件拖到上传区域
# 起始元素:文件图标
# 目标元素:上传区域
五、滚动操作:让元素进入可视区域
很多页面元素不在屏幕可见区域内时,点击会失败或报错“元素不可交互”。
方案一:滚动到元素(推荐)
在点击元素之前加“滚动到元素”指令,影刀会自动把该元素滚动到屏幕中央。
滚动到元素(目标元素)
等待(200) # 让滚动动画完成
点击元素(目标元素)
方案二:滚动到指定位置
如果不需要精确到某个元素,只是翻页,可以用“滚动页面”指令。
# 滚动到页面底部
滚动页面(方向="底部")
# 滚动到页面顶部
滚动页面(方向="顶部")
# 滚动到页面中间(可设百分比)
滚动页面(滚动值=50%)
容易踩坑:滚动操作后,页面内容可能需要加载(懒加载)。滚动完加一个“等待元素出现”确保内容加载完成再操作。
六、鼠标与键盘的组合操作
有些场景需要鼠标和键盘配合——比如鼠标悬停触发下拉菜单,再键盘选择选项。
鼠标悬停
指令名称:鼠标悬停。不点击,只是把鼠标移到元素上方。
适用场景:
- 下拉菜单(鼠标移上去自动展开)
- 弹窗触发(移上去出现操作按钮)
- 工具提示(移上去显示详情)
鼠标悬停(菜单元素)
等待(500) # 等待下拉菜单展开
点击元素(下拉选项)
模拟按键组合
用“模拟按键”指令配合Ctrl/Alt/Shift实现组合键:
# 示例:Ctrl+Shift+Esc 打开任务管理器
模拟按键(组合键="Ctrl+Shift+Esc")
七、常见坑点与避坑指南
坑1:点击失败,报“元素不可交互”
原因:元素被遮挡(弹窗、遮罩层)、元素在可视区域外、元素被禁用。
解决:
- 先“滚动到元素”
- 检查是否有弹窗遮罩,先关闭弹窗
- 检查元素是否处于可点击状态(如按钮是否被禁用)
坑2:输入文本少字符或乱码
原因:输入法切换、页面编码问题、模拟输入被拦截。
解决:
- 切换到默认输入法(英文)
- 用“剪切板粘贴”代替“模拟输入”
- 用“模拟按键”逐字符输入
坑3:前台点击时鼠标乱动导致失败
原因:前台点击需要鼠标光标在目标位置,运行期间动鼠标会导致偏移。
解决:用“后台点击”代替“前台点击”,不需要移动鼠标。
坑4:坐标点击在不同分辨率下失效
原因:坐标是固定的,换台电脑分辨率不同位置就变了。
解决:
- 固定浏览器窗口大小(用“设置窗口大小”指令)
- 在流程说明里注明分辨率要求(如1920×1080,缩放100%)
- 能用元素定位就别用坐标
坑5:滚动后元素还是点不到
原因:滚动动画没完成就执行了点击。
解决:滚动后加“等待时间”0.3-0.5秒,或者“等待元素出现”确保元素可交互。
八、完整实战:登录流程中的鼠标键盘组合操作
一个标准的登录流程,把鼠标和键盘的指令串起来:
A_Main(主流程)
├─ 打开网页(登录页)
├─ 点击元素(账号输入框) # 鼠标点击获得焦点
├─ 输入文本(账号输入框, ${账号}) # 键盘输入
├─ 点击元素(密码输入框)
├─ 输入文本(密码输入框, ${密码})
├─ 模拟按键(Enter) # 键盘提交,代替点击登录按钮
├─ 等待元素出现(登录成功标志, 10秒)
└─ 输出日志("登录成功")
推荐资源
- 影刀官方帮助中心搜索“点击元素”和“输入文本”有完整指令文档
- 影刀开发者社区搜“模拟点击”有大量踩坑记录
- B站“小可耐教你学影刀RPA”有鼠标键盘指令的实操视频
#影刀RPA #RPA自动化 #鼠标指令 #键盘指令 #点击操作 #网页自动化
作者:林焱
本文为《影刀RPA学习手册》系列文章之一,内容源于实操经验的整理与分享。
