selenium库

发布于:2025-03-09 ⋅ 阅读:(109) ⋅ 点赞:(0)

一、什么是selenium库?

selenim是一个用于Web应用程序自动化测试工具,selenium测试直接运行在浏览器中

像真正的用户在操作一样,驱动浏览器执行特定的动作,如点击,下拉等操作

二、selenium在爬虫中的应用

  1. 获取动态网页中的数据,一些动态的数据我们在获取的源码中并没有显示的这一类动态加载数据
  2. 用于模拟登录

三、selenium库支持的浏览器

支持的浏览器包括phantomjs,IE(7,8,9,10,11),Mozilla Firefox,Safari,Google Chrome,Opera等

在这里插入图片描述

四、driver下载地址


firefox浏览器
https://github.com/mozilla/geckodriver/releases/

Chrome浏览器

http://chromedriver.storage.googleapis.com/index.html

113-133版本

https://googlechromelabs.github.io/chrome-for-testing/known-good-versions-with-downloads.json

134版本及以后

https://googlechromelabs.github.io/chrome-for-testing/

链接是实时更新的

4.1 selenium调用Chrome浏览器访问动态网页数据

查看Chrome版本:
在这里插入图片描述

下载对应chromedriver,并配置环境变量

查看:
在这里插入图片描述

编写代码:

import time
from selenium import webdriver

test_webdriver = webdriver.Chrome(executable_path="D:\chromedriver\chromedriver-win64\chromedriver-win64\chromedriver.exe")

test_webdriver.get("https://echarts.apache.org/examples/zh/index.html")
test_webdriver.maximize_window()


for item in test_webdriver.find_elements_by_xpath('//div[@class="example-title"]'):
    print(item.text)


print(test_webdriver.title)
time.sleep(10)
test_webdriver.quit()








这样就可以访问动态网页数据


在这里插入图片描述


网站公告

今日签到

点亮在社区的每一天
去签到