iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python selenium参数详解和实现案例
  • 364
分享到

python selenium参数详解和实现案例

2024-04-02 19:04:59 364人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

无头模式添加,可以让selenium模拟登录,进入到后台运行这里以登录打开公司内网下载数据为例,因为涉及私密问题,所以有些地方我们进行覆盖,还请谅解先不添加无头模式,进行登录,并且下

无头模式添加,可以让selenium模拟登录,进入到后台运行
这里以登录打开公司内网下载数据为例,因为涉及私密问题,所以有些地方我们进行覆盖,还请谅解
先不添加无头模式,进行登录,并且下载文件
因为一般selenium使用的是之前版本的浏览器,所以会出现以下情况,需要进行安全认证,所以可以进行直接忽略认证书的错误

一般是在selenium的options进行添加

options.add_argument('ignore-certificate-errors')

登录界面

可以看到上面有很多目录点击过来的,要求下载所有的含有日报的excel,需进行小框选择后,才会出现下载按钮

下载一般是直接下载到浏览器默认的地址,这里我们可以进行自主修改,还是在options里进行配置,函数如下

# 设置默认地址
prefs = {'download.default_directory': r'D:\desktop\test_download'}
options.add_experimental_option('prefs', prefs)

完整代码如下

# 导入所需要的库
import time
import JSON
import warnings
from selenium import WEBdriver
from sqlalchemy import create_engine
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
# 运行时terminal里面会出现好多警告,剔除警告
warnings.filterwarnings('ignore')
class Download():
	def __init__(self, url, year, path, chrome, username, passWord, elements):
		self.year = year
		self.url = url
		self.path = path
		self.chrome = chrome
		self.username = username
		self.password = password
		self.elements = elements
	# 浏览器设置
	def web_sets(self):
		self.options = webdriver.ChromeOptions()
		# 因为我使用的是谷歌浏览器
		self.c_service = Service(f'{self.chrome}')
		self.c_service.command_line_args()
		# 设置后端服务器开始,因为会在后台产生好多服务,为了后面的关闭
		self.c_service.start()
		# 提供默认下载地址
		self.prefs = {'download.default_directory': f'{self.path}'}
		self.options.add_experimental_option('prefs', self.prefs)
		# 设置忽略安全证书所带来的错误
		self.options.add_argument('ignore-certificate-errors')
		# 一些小的设置
		self.options.add_experimental_option('excludeSwitches', ["enable-automation"])
		self.options.add_argument('--np-sanbox')
		self.options.add_argument('--disable-dev-shm-usage')
		# 加属性避免bug
		self.options.add_argument('disable-gpu')
		# 添加无头模式
		self.options.add_argument('headless')
		self.br = webdriver.Chrome(f'{self.chrome}', chrome_options=self.options)
		self.br.implicitly_wait(3)
	def loginPage(self):
		"""
		因为我是将所有元素保存在json文件里面,这样就不需要因为find_element而占用好多列
		也为代码节省地方
		这里需要强调的时find_element(By.XPATH)是最新selenium的使用方法,之前的使用会报错
		"""
		self.br.get(self.url)
		time.sleep(4)
		self.br.find_element(By.XPATH, f'{self.elements[keys[2]]}').send_keys(self.username)
		time.sleep(2)
		self.br.find_element(By.XPATH, f'{self.elements[keys[3]]}').send_keys(self.password)
		time.sleep(2)
		self.br.find_element(By.XPATH, f'{self.elements[keys[4]]}').click()
		time.sleep(2)
	# 设置跳转到最后页面
	def skipPage(self, url):
		self.br.get(url)
		time.sleep(2)

	# 下载文件
	def download_excel(self):
		# 获取所有ul下面的li标签个数
		ul2 = self.br.find_element(By.XPATH, f'{self.elements[keys[6]]}')
		# 获取li标签数目
		lis2 = ul2.find_elements(By.XPATH, 'li')
		time.sleep(1)
		# 循环li标签
		for j in range(len(lis2)):
			# 因为li的elements都是从1开始,python列表是从0开始,所以要+1
			j+=1
			# 获取li标签的text
			name = self.br.find_element(By.XPATH, f'{self.elements[keys[7]][1]}'%j).get_attribute('title')
			print(f'li标签name: {name}')
			if '日报' in name:
				print(f'第二遍过滤name: {name}')
				li_test = self.br.find_element(By.XPATH, f'{self.elements[keys[8]]}'%j)
				self.br.execute_script('arguments[0].click();',li_test)
				time.sleep(0.5)
				self.br.find_element(By.XPATH, f'{self.elements[keys[9]]}').click()
				time.sleep(0.5)
				li_test2 = self.br.find_element(By.XPATH, f'{self.elements[keys[8]]}'%j)
				time.sleep(1)
				# 设置点击覆盖,以防止报错
				# 因为一直要模拟点击选择文件,然后进行下载文件,防止点击覆盖
				self.br.execute_script("arguments[0].click();", li_test2)
				time.sleep(8)
		time.sleep(10)
		time.sleep(12)
		# 退出浏览器,推出后台服务
		# c_service.stop()对应之前的c_service.stop()
		self.br.quit();self.c_service.stop()

JSON文件

json文件

ul标签的展示

li标签下的title

获取li标签内div的title

在这里顺便讲下如何获取xpath的绝对路径或者相对路径

展示下ul标签相对路径和绝对路径

xpath: //*[@id="main"]/div[2]/div/div[3]/div[1]/as-dataview/div[2]/ul
full_xpath: /html/body/div[2]/div[1]/div[2]/div/div[1]/div[2]/div/div[3]/div[1]/as-dataview/div[2]/ul

下图是没有c_service.stop(),后台运行服务,不能进行关闭

运行代码

if __name__ == '__main__':
	jsonFile = r'JsonFile\elements.json'
	with open(jsonFile, 'r') as f:
		row_data = json.load(f)
	# 获取所有json的键
	keys = list(row_data.keys())
	# 读取账号和密码
	filename = row_data[keys[0]]
	# 获取账号和密码txt
	with open(filename, 'r') as f:
		data = f.read()
	data1 = data.split('\n')
	url = 'url'
	# chromedriver.exe
	chrome = r'chromedriver.exe'
	username = data1[0]
	password = data1[1]
	path = row_data[keys[1]]
	year = time.gmtime().tm_year
	start = Download(url, year, path, chrome, username, password, row_data)
	start.web_sets()
	start.loginWeb()
	e = row_data[keys[5]]
	start.skipPage(e)
	start.download_excel()
	time.sleep(15)

为了展示出来 取消掉无头模式 这样可以看到浏览器进行下载

可以看到只有含有’日报’的数据被下载了,并且任务管理器里面没有刚才出现的Chrome32的服务

到此这篇关于Python selenium参数详解和实现案例的文章就介绍到这了,更多相关python selenium参数内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: python selenium参数详解和实现案例

本文链接: https://www.lsjlt.com/news/120834.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • python selenium参数详解和实现案例
    无头模式添加,可以让selenium模拟登录,进入到后台运行这里以登录打开公司内网下载数据为例,因为涉及私密问题,所以有些地方我们进行覆盖,还请谅解先不添加无头模式,进行登录,并且下...
    99+
    2024-04-02
  • selenium鼠标操作实战案例详解
    目录前言ActionChains 类常用方法实例示例1示例2:实例3实例4总结前言 人类频繁的用手操作鼠标和键盘,为了解决这个问题,selenium工具为我们提供了一个类来处理这些事...
    99+
    2023-05-20
    selenium 鼠标操作 selenium鼠标悬停事件 selenium的鼠标拖拽
  • python selenium实现登录豆瓣示例详解
    使用python爬虫selenium访问豆瓣https://www.douban.com/,实现模拟登录过程。 网页界面如图所示 首先导包后,定位图中 密码登录 的element,...
    99+
    2024-04-02
  • Python selenium find_element()示例详解
    selenium有以下定位方式: driver.find_element_by_id(‘id') driver.find_element_by_xpath('xpath') driv...
    99+
    2024-04-02
  • python Pandas库read_excel()参数实例详解
    目录1.read_excel函数原型2.参数使用举例2.1. io和sheet_name参数2.2. header参数2.3. skipfooter参数2.5. parse_date...
    99+
    2024-04-02
  • Python实现堆排序案例详解
    Python实现堆排序 一、堆排序简介 堆排序(Heap Sort)是利用堆这种数据结构所设计的一种排序算法。 堆的结构是一棵完全二叉树的结构,并且满足堆积的性质:每个节点(叶节点除...
    99+
    2024-04-02
  • python open函数中newline参数实例详解
    目录问题的由来具体实例总结问题的由来 我在读pythoncsv模块文档 看到了这样一句话 如果 csvfile 是文件对象,则打开它时应使用 newline=‘&rsqu...
    99+
    2024-04-02
  • Python的命令行参数实例详解
    目录0. 命令行参数1. sys.argv2. getopt2.1 getopt.getopt 方法2.2 Exception getopt.GetoptError3. argpar...
    99+
    2024-04-02
  • Java中的隐式参数和显示参数实例详解
            在学习Java的过程中,我们会遇到许多的问题。下面我们就来看看什么是隐式参数和显示参数。     &nb...
    99+
    2023-05-31
    java 隐式参数 显示参数
  • Java reservedcodecachesize虚拟机参数案例详解
    一、reservedcodecachesize参数介绍 该参数是JvM虚拟机调优中调整内存大小的一个设置参数,值得大小设置直接影响到Code Cache的大小,而jvm编译的代码有常...
    99+
    2024-04-02
  • Python 实现静态链表案例详解
    静态链表和动态链表区别 静态链表和动态链表的共同点是,数据之间"一对一"的逻辑关系都是依靠指针(静态链表中称"游标")来维持。 静态链表 使用静态链表存储数据,需要预先申请足够大的一...
    99+
    2024-04-02
  • Python中np.random.randint()参数详解及用法实例
    目录可实现功能:np.random.randint() 根据参数中所指定的范围生成随机 整数。参数一、基础用法二、高级用法总结可实现功能: 1.随机生成一个整数。 2.随机生成任意范...
    99+
    2024-04-02
  • python中flatten()参数示例详解
    这篇博客主要写flatten()作用,及其参数的含义 flatten()是对多维数据的降维函数。flatten(),默认缺省参数为0,也就是说flatten()和flatte(0)效...
    99+
    2024-04-02
  • Python torch.flatten()函数案例详解
    先看函数参数: torch.flatten(input, start_dim=0, end_dim=-1) input: 一个 tensor,即要被“推平”的 tensor。 ...
    99+
    2024-04-02
  • Python ord函数()案例详解
    python中ord函数 Python ord()函数 (Python ord() function) ord() function is a libr...
    99+
    2024-04-02
  • SpringBoot之使用枚举参数案例详解
    接口开发过程中不免有表示类型的参数,比如 0 表示未知,1 表示男,2 表示女。通常有两种做法,一种是用数字表示,另一种是使用枚举实现。 使用数字表示就是通过契约形式,约定每个数字表...
    99+
    2024-04-02
  • Java System.getProperty()-获取系统参数案例详解
    因为所有在java.io中的类都是将相对路径名解释为起始于用户的当前工作目录,所以应该清楚当前的目录。 可以通过调用System.getProperty("user.dir");...
    99+
    2024-04-02
  • Mybatis获取参数值和查询功能的案例详解
    目录一、MyBatis的增删改查1.1、新增1.2、删除1.3、修改1.4、查询一个实体类对象1.5、查询list集合二、MyBatis获取参数值的两种方式2.1、单个字面量类型的参...
    99+
    2023-03-21
    Mybatis获取参数值 Mybatis查询
  • Python实现地图可视化案例详解
    目录​前言一、pyechartsMapGeoBmap二、folium结 语​前言 Python的地图可视化库很多,Matplotlib库虽然作图很强大,但只能做静态地图。而我今天要讲...
    99+
    2024-04-02
  • Python实现图片压缩的案例详解
    目录1、引言2、PIL模块2.1 quality 方式2.2 thumbnail方式3、OpenCV模块3.1 安装3.2 执行代码4、总结1、引言 小屌丝:鱼哥,求助,求助 小鱼:...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作