
影刀RPA电商卖家专属教程淘宝天猫运营中的50个自动化场景实战——从订单导出到竞品监控做电商的每天有太多重复劳动了。订单导出、竞品价格监控、评价管理、库存同步——这些事情不用RPA也能做但用RPA之后你每天能省2-3个小时。这篇文章就是把电商运营里最值得自动化的场景全部过一遍每个场景都讲清楚用什么指令、怎么实现、有什么坑。认识影刀和安装电商视角电商运营用影刀最常见的场景是打开浏览器→登录后台→执行一系列操作→把结果存到Excel或发到飞书。整个流程不需要写代码拖指令就行。安装没什么好说的去官网下Windows版安装包双击运行。但电商用户要注意一件事淘宝、拼多多这些平台对浏览器环境有检测建议你用影刀自带的浏览器基于Chrome不要试图用自己装的Chrome容易出兼容问题。我第一次配的时候就是用自己电脑上的Chrome淘宝能打开但登录总是失败换成影刀自带的浏览器立马就好了。元素定位电商网页的特殊性电商后台的页面结构通常比较复杂元素定位是重中之重。XPath的6种写法在电商场景里的优先级最常用的是//tag[attributevalue]比如淘宝订单列表里的发货按钮//button[classbtn-ship]。但class经常变所以更稳健的写法是结合text()//button[text()发货]或者//button[contains(text(),发货)]。第二种有用的是通过父元素定位//div[idorder-list]//button[text()发货]先锁定订单列表区域再在里面找发货按钮避免页面上有多个发货按钮时找错。CSS选择器在电商场景里的用法CSS语法更简洁button.btn-ship等同于 XPath 的//button[classbtn-ship]。但CSS做不到文本匹配所以如果按钮上没有唯一的id或class只能用XPath按文字找。选型指南有唯一id或class的用CSS写法短需要按文字内容定位的用XPath需要向上查找父元素的用XPathCSS不支持。变量与数据类型订单数据处理的核心拼多多店群自动化上架方案电商自动化最频繁的操作就是处理订单数据这部分全靠变量。列表用来存一批订单号、一批买家昵称。比如用循环相似元素抓完一页订单号把每个订单号追加到列表里最后一次性写入Excel。字典用来存订单号→订单详情的映射关系。比如你要同时记录订单号、买家、金额、状态用字典比用4个列表更清晰。JSON调用电商API的时候必用。淘宝开放平台、拼多多开放平台返回的都是以SON格式用JSON转对象转成字典然后提取字段。我第一次调淘宝API的时候返回了一坨字符串不知道怎么处理后来才知道要用JSON转对象转一下。流程控制订单导出的循环逻辑电商场景里最常见的流程控制就是翻页抓取的循环组合。For次数循环你知道总共有多少页比如共100页提取这个数字用For次数循环循环100次每次点下一页然后抓数据。无限循环disabled判断推荐不用管总页数直接无限循环每次循环判断下一页按钮是否包含disabled包含就退出。这个方案更稳健因为总页数可能变化比如你白天跑流程和晚上跑流程订单量不一样总页数也不一样。淘宝订单导出的标准做法是每次循环导出600页每页15条共9000条留1000条余量防止大促时超限取第600页最后一条订单的时间作为下一段的起始时间循环直到剩余页数小于650。网页自动化电商后台的三大坑坑一等待策略。电商后台加载慢尤其是淘宝订单列表可能在加载动画期间页面元素还没出来。解决方案是用智能等待模式或者手动加等待元素出现指令等订单列表的第一条订单号出现了再开始抓。坑二弹窗处理。淘宝后台经常弹亲有新的订单通知之类的弹窗如果不处理后面的点击操作会失败。标准流程是用处理浏览器弹窗指令在关键操作之前先检查并关闭弹窗。坑三iframe嵌套。淘宝订单详情页是嵌在iframe里的要操作详情页的元素必须先切换iframe操作完再切回主文档。我第一次做淘宝自动化的时候详情页的元素怎么都捕获不到排查了一下午才发现是iframe的问题。翻页的disabled判断法按F12看下一页按钮的class属性不可点击时最后一页会多一个disabled所以判断逻辑是先捕获下一页按钮勾选class里不含disabled的状态然后在循环里判断这个元素是否还存在不存在就说明到最后一页了。懒加载的index去重法电商后台的订单列表通常用懒加载页面只渲染可见区域的行。解决方案是在循环里维护一个列表记录已经抓过的行的index属性滚动加载更多数据之后用index判断是否已抓取已抓取就跳过。数据处理Excel和数据库Excel读写订单数据通常先存到Excel。注意两个坑一是Can not convert Array to String报错原因是把整行列表直接填进了只能接收文本的输入框要用获取列表项取具体列的值二是日期偏移8小时用时间加减加回8小时。数据库连接订单量大的时候每天几万单不要用Excel存储用MySQL。影刀支持数据库连接流程是建立连接→执行查询→批量插入→关闭连接。5个常见报错连接超时检查IP白名单、SQL语法错误注意引号转义、字段类型不匹配日期格式要统一、连接未关闭导致泄漏一定要在Finally里关闭、编码问题中文乱码要设utf8。鼠标键盘和图像自动化有些电商后台的按钮无法用元素定位点击比如验证码、滑块这时候用图像识别。图像识别的标准流程用wait_appear等待目标图片出现→用click点击图片中心位置→如果点击位置有偏移用锚点9位置偏移来微调。比如验证码的关闭按钮先识别验证码弹窗的某个特征区域作为锚点然后算好关闭按钮相对于锚点的坐标偏移量用偏移点击。模拟模式vs驱动模式模拟模式日常够用遇到网站拦截切换成驱动模式。驱动模式需要安装虚拟键盘驱动有管理员权限才能装。进阶技能HTTP请求和Python协同HTTP请求/API对接电商平台大多有开放API比如淘宝开放平台、拼多多开放平台。用发送HTTP请求指令调用API返回JSON之后用JSON转对象处理。注意API通常有频率限制每次调用之后加适当等待。Python协同有些数据处理逻辑用影刀指令写很麻烦比如要把订单数据按一定规则分类汇总用Python的pandas库几行代码就搞定。用法是在影刀里用执行Python代码指令可以写Python代码也可以调用已经写好的.py文件。如果需要用第三方库在影刀的Python环境里装一下就行。OCR文字识别有些电商后台的订单信息是用图片展示的比如有些特殊商品的属性用OCR识别图片里的文字再提取关键信息。平台实战淘宝、拼多多、TEMUTEMU店群如何管理运营淘宝订单导出是最常见需求。标准做法是分时间段导出每次导出600页约9000条避免超过10000条的限制。还要注意数据去重因为大促期间订单量波动大建议每天运行多次每次导出的数据去重后保留最完整的版本。拼多多商品数据采集。拼多多对爬虫检测比较严格要点有几个1. 不要用固定的User-Agent每次请求随机换一个2. 操作之间加随机等待1-3秒3. 登录状态用影刀的获取当前已打开的网页来保持。TEMU跨境电商TEMU的后台是英文界面元素定位的时候注意文字匹配要用英文。另外TEMU的后台响应比较慢等待时间要设置长一点5-8秒。系统联动飞书通知和定时任务飞书消息通知每天自动把订单数据汇总发到飞书群。用发送飞书消息指令消息内容可以用变量拼接比如今日新增订单{order_count}条总金额{total_amount}元。飞书多维表格读写把订单数据直接写到飞书多维表格团队其他人可以直接在看不用传Excel文件。用写入飞书多维表格指令先配置好表格ID和字段映射然后循环把每条订单数据写入。邮件发送有些合作伙伴要求用邮件发送订单报表用发送邮件指令可以带附件Excel或PDF格式。定时任务配置订单导出通常配置成每天凌晨2点自动运行这时候订单量最少不容易漏单。配置路径影刀控制台→定时任务→新建任务→选择应用→配置Cron表达式0 2 * * *表示每天凌晨2点。注意设置运行超时时间建议设6小时防止大促期间数据量太大跑不完以及配置运行失败时的通知方式发飞书消息或邮件。工程化和规范子流程封装订单导出流程里“判断总页数”“导出当前页数据”“解析导出结果这几个步骤在多个地方都会用到封装成子流程主流程里直接调用。子流程可以带参数比如导出指定时间段的订单”把起始时间和结束时间作为参数传入。调试技巧订单导出流程最常用的调试方法是打断点。在发送HTTP请求指令前打断点运行时可以看到HTTP返回的完整内容方便确认接口是否调通、返回格式是否正确。在写入Excel指令前打断点可以查看要写入的数据是否完整。命名规范变量名要有意义比如order_count订单数、current_page当前页不要叫a、b、temp。子流程命名要体现功能比如导出订单数据解析JSON返回等。版本选择如果订单量每天超过10000条社区版每天30分钟的限制肯定不够用需要升级到企业版。企业版可以按机器人数量付费一个机器人可以同时跑一个流程。速查表电商场景常见报错场景报错原因解决办法淘宝订单导出导出失败提示超过10000条时间段选太大分时间段导出每次600页元素捕获订单列表元素找不到等待时间不够 / iframe加等待指令 / 切换iframeExcel写入Can not convert Array to String列表直接当字符串用用获取列表项取具体值HTTP请求返回401 UnauthorizedaccessToken过期重新获取accessToken定时任务任务没有按时运行Cron表达式写错检查表达式用在线Cron工具验证更多电商自动化场景和案例可以去 home.linyan.cloud 查看我平时整理了不少实战内容。#影刀RPA #电商自动化 #淘宝订单 #拼多多 #TEMU #RPA教程作者林焱。