软件的初始页面如下:
你可以选择新建流程,随便起一个名字,我的已经有建好的了。进入新建流程之后如下:
点进去后的页面如下:
在点击获取数据之前,你需要打开获取数据的网页,我所要获取的是淘宝网上的商品数据,于是便打开了淘宝网站,搜索我想要获取的商品名称,这里我搜索的是女生生日礼物。页面如下:
看到网页,选择你想要的数据,比如图中的金额,这时返回Uibot中再点击获取数据那个标签,出现了新页面点击选择目标按钮,选择网页中的金额目标,然后弹出了让你再次选择同一层级的数据目标,也是就上图中两个箭头指向的数据,属于同一层级。获取完金额数据,可以点击获取更多数据选择,再获取其他的数据,我们这里再次获取了旗舰店名称的数据,当然也可以获取更多,看你自己的选择了,之后点击下一步,可以选择点击翻页也可以点击完成,一个是获取更多的页面的数据,另一个是只获取当前页面的数据。具体的过程如下图:
经过以上步骤就可以完成网页数据的抓取了,只有一行代码,这里我只抓取了金额和旗舰店数据,第二行代码就是显示我们抓取的数据,代码有可视化的功能,便于理解,也可以查看源代码,接下来我们就来看看代码及我们抓取的数据吧。
如上图所示,你点击运行按钮,就会输出我们抓取到的数据,如果没有数据,你可以选择刷新一下页面,再次运行一下即可。
如果我们想要这些数据怎么办呢,很简单,再加2行代码,把它保存到EXCEL文件中即可。如下,一个5行代码:
保存到的EXCEL数据如下:
解决方案:
要实现利用uibot流程块依次选择序号并进行判断的功能,可以按照以下步骤进行操作:
首先打开uibot软件,进入新建流程页面。
在新建流程页面中,点击获取数据标签。此时需要确保已经打开了待选择内容的网页,比如淘宝网。
在打开的网页中,选择要获取的数据,比如商品的序号和内容。可以点击选择目标按钮,并依次选择所需数据的位置。可以重复上述步骤来获取更多的数据。
获取完所需数据后,点击下一步,可以选择执行操作的具体内容,比如判断是否与excel表格中的内容相符。
在判断部分,可以使用python代码来处理。首先,需要导入pandas
和openpyxl
库。可以使用以下命令安装这两个库:
pip install pandas openpyxl
import pandas as pd
# 读取excel表格中的内容
excel_data = pd.read_excel('path/to/excel/file.xlsx')
# 获取网页数据
web_data = ['序号1', '序号2', '序号3', '序号4'] # 假设从网页中获取的数据为列表形式
for data in web_data:
if data in excel_data['序号列'].values:
# 执行相关操作
pass
else:
# 继续向下选择序号
pass
注意,以上代码中的path/to/excel/file.xlsx
需要替换为实际的excel文件路径,序号1
、序号2
等需要替换为实际从网页中获取的数据。
通过以上步骤,可以实现利用uibot流程块依次选择序号并进行判断的功能。