Python 网络爬虫 —— 提交信息到网页

发布于:2025-07-18 ⋅ 阅读:(12) ⋅ 点赞:(0)

一、模块核心逻辑

“提交信息到网页” 是网络交互关键环节,借助 requests 库的 post() 函数,能模拟浏览器向网页发数据(如表单、文件 ),实现信息上传,让我们能与网页背后的服务器 “沟通”,像改密码、传文件等操作,都可通过它完成 。

二、浏览器提交请求流程(以改密码为例 )

  1. 操作触发:登录账户进改密码页面,填 “当前密码”“新密码” 等表单 。
  2. 抓包分析:网页空白处右键 → 检查 → Network 窗口,输密码点 “修改密码”,Network 会捕获交互信息,能看到请求方法是 POST,还能找到提交的密码等数据 。
  3. 数据传递:浏览器把表单里的密码等信息,通过 POST 请求发给服务器,服务器验证、处理后返回结果 。

三、post() 函数详解

(一)基本形式 

requests.post(url, data=None, json=None, **kwargs)

 

二)参数说明

  • url:必填,要提交信息的网页地址(如改密码的接口地址 ),告诉 post() 该把数据发哪 。
  • data:选填,要发送的数据,可是字典、元组、列表等(常用来传表单数据,像 {'old_pwd':'123','new_pwd':'456'} )。
  • json:选填,专门传 JSON 格式数据(当服务器要求接收 JSON 时用 ),传参后 requests 会自动设请求头 Content-Type 为 application/json 。
  • **kwargs:选填,额外配置(如设置请求头 headers、超时时间 timeout 等 ),让请求更灵活 。

(三)返回值

执行 post() 后,返回 Response 对象,和 get() 类似,可通过 r.text 看响应内容、r.status_code 查状态码等 。

(四)示例理解

import requests
# 表单数据,存字典里
data = {'OldPassword':'123456python','NewPassword':'123python','ConfirmPassword':'123python'}  
# 发 POST 请求,提交数据到指定 url
r = requests.post('https://account.ryjiaoyu.com/change-password', data=data)  
# 打印响应内容
print(r.text)  

这里 data 存改密码的表单数据,post() 带着数据发给服务器,虽然实际改密码还得先登录,但演示了 “传数据” 的核心流程 。

四、上传文件的方法(files 参数 )

想把文件(如图片、文档 )传到网页,用 files 参数,步骤:

  1. 打开文件:用 open() 函数以二进制模式(rb )打开文件,得到文件对象 。
  2. 构造参数:建字典,键是服务器接收文件的字段名(如 file ),值是文件对象 。
  3. 发起请求post() 里传 files 参数,把文件数据发出去 。

示例代码

import requests
# 打开文件,'rb' 是二进制读模式
fp = {'file':open('bitbug.ico', 'rb')}  
# 发 POST 请求,上传文件到指定 url
r = requests.post('可上传图片的网址', files=fp)  
# 打印响应内容
print(r.text)  

代码里,open() 拿到文件对象,files 带着它发请求,服务器接收后,就能把文件存到指定位置(实际要填正确的上传网址 )。

总之,“提交信息到网页” 靠 post() 函数实现,不管是传表单改密码,还是传文件,都能通过配置参数完成,理解浏览器抓包和函数参数,就能灵活模拟各种提交操作啦 ~

 


网站公告

今日签到

点亮在社区的每一天
去签到