curl
利用URL规则在命令行下工作的文件传输工具
补充说明
curl命令 是一个利用URL规则在命令行下工作的文件传输工具。它支持文件的上传和下载,所以是综合传输工具,但按传统,习惯称curl为下载工具。作为一款强力工具,curl支持包括HTTP、HTTPS、ftp等众多协议,还支持POST、cookies、认证、从指定偏移处下载部分文件、用户代理字符串、限速、文件大小、进度条等特征。做网页处理流程和数据检索自动化,curl可以祝一臂之力。
语法
curl [选项] [参数]
选项
- -a/–append:上传文件时,附加到目标文件
- -A/–user-agent:设置用户代理发送给服务器
- -anyauth:可以使用“任何”身份验证方法
- -b/–cookie:cookie字符串或文件读取位置
- –basic:使用HTTP基本验证
- -B/–use-ascii:使用ASCII /文本传输
- -c/–cookie-jar:操作结束后把cookie写入到这个文件中
- -C/–continue-at:断点续传
- -d/–data:HTTP POST方式传送数据
- –data-ascii:以ascii的方式post数据
- –data-binary:以二进制的方式post数据
- –negotiate:使用HTTP身份验证
- –digest:使用数字身份验证
- –disable-eprt:禁止使用EPRT或LPRT
- –disable-epsv:禁止使用EPSV
- -D/–dump-header:把header信息写入到该文件中
- –egd-file:为随机数据(SSL)设置EGD socket路径
- –tcp-nodelay:使用TCP_NODELAY选项
- -e/–referer:来源网址
- -E/–cert:客户端证书文件和密码 (SSL)
- –cert-type:证书文件类型 (DER/PEM/ENG) (SSL)
- –key:私钥文件名 (SSL)
- –key-type:私钥文件类型 (DER/PEM/ENG) (SSL)
- –pass:私钥密码 (SSL)
- –engine:加密引擎使用 (SSL). “–engine list” for list
- –cacert:CA证书 (SSL)
- –capath:CA目录 (made using c_rehash) to verify peer against (SSL)
- –ciphers:SSL密码
- –compressed:要求返回是压缩的形势 (using deflate or gzip)
- –connect-timeout:设置最大请求时间
- –create-dirs:建立本地目录的目录层次结构
- –crlf:上传是把LF转变成CRLF
- -f/–fail:连接失败时不显示http错误
- –ftp-create-dirs:如果远程目录不存在,创建远程目录
- –ftp-method [multicwd/nocwd/singlecwd]:控制CWD的使用
- –ftp-pasv:使用 PASV/EPSV 代替端口
- –ftp-skip-pasv-ip:使用PASV的时候,忽略该IP地址
- –ftp-ssl:尝试用 SSL/TLS 来进行ftp数据传输
- –ftp-ssl-reqd:要求用 SSL/TLS 来进行ftp数据传输
- -F/–form:模拟http表单提交数据
- –form-string:模拟http表单提交数据
- -g/–globoff:禁用网址序列和范围使用{}和[]
- -G/–get:以get的方式来发送数据
- -H/–header:自定义头信息传递给服务器
- –ignore-content-length:忽略的HTTP头信息的长度
- -i/–include:输出时包括protocol头信息
- -I/–head:只显示请求头信息
- -j/–junk-session-cookies:读取文件进忽略session cookie
- –interface:使用指定网络接口/地址
- –krb4:使用指定安全级别的krb4
- -k/–insecure:允许不使用证书到SSL站点
- -K/–config:指定的配置文件读取
- -l/–list-only:列出ftp目录下的文件名称
- –limit-rate:设置传输速度
- –local-port:强制使用本地端口号
- -m/–max-time:设置最大传输时间
- –max-redirs:设置最大读取的目录数
- –max-filesize:设置最大下载的文件总量
- -M/–manual:显示全手动
- -n/–netrc:从netrc文件中读取用户名和密码
- –netrc-optional:使用 .netrc 或者 URL来覆盖-n
- –ntlm:使用 HTTP NTLM 身份验证
- -N/–no-buffer:禁用缓冲输出
- -o/–output:把输出写到该文件中
- -O/–remote-name:把输出写到该文件中,保留远程文件的文件名
- -p/–proxytunnel:使用HTTP代理
- –proxy-anyauth:选择任一代理身份验证方法
- –proxy-basic:在代理上使用基本身份验证
- –proxy-digest:在代理上使用数字身份验证
- –proxy-ntlm:在代理上使用ntlm身份验证
- -P/–ftp-port:使用端口地址,而不是使用PASV
- -q:作为第一个参数,关闭 .curlrc
- -Q/–quote:文件传输前,发送命令到服务器
- -r/–range:检索来自HTTP/1.1或FTP服务器字节范围
- –range-file:读取(SSL)的随机文件
- -R/–remote-time:在本地生成文件时,保留远程文件时间
- –retry:传输出现问题时,重试的次数
- –retry-delay:传输出现问题时,设置重试间隔时间
- –retry-max-time:传输出现问题时,设置最大重试时间
- -s/–silent:静默模式。不输出任何东西
- -S/–show-error:显示错误
- –socks4:用socks4代理给定主机和端口
- –socks5:用socks5代理给定主机和端口
- –stderr:
- -t/–telnet-option:Telnet选项设置
- –trace:对指定文件进行debug
- –trace-ascii:Like --跟踪但没有hex输出
- –trace-time:跟踪/详细输出时,添加时间戳
- -T/–upload-file:上传文件
- –url:Spet URL to work with
- -u/–user:设置服务器的用户和密码
- -U/–proxy-user:设置代理用户名和密码
- -w/–write-out [format]:什么输出完成后
- -x/–proxy:在给定的端口上使用HTTP代理
- -X/–request:指定什么命令
- -y/–speed-time:放弃限速所要的时间,默认为30
- -Y/–speed-limit:停止传输速度的限制,速度时间
实例
文件下载
curl命令可以用来执行下载、发送各种HTTP请求,指定HTTP头部等操作。如果系统没有curl可以使用yum install curl安装,也可以下载安装。curl是将下载文件输出到stdout,将进度信息输出到stderr,不显示进度信息使用–silent选项。
将下载文件输出到终端,所有下载的数据都被写入到stdout:
curl URL --silent
使用选项-O将下载的数据写入到文件,必须使用文件的绝对地址:
curl http://example.com/text.iso --silent -O
选项-o将下载数据写入到指定名称的文件中,并使用–progress显示进度条:
curl http://example.com/test.iso -o filename.iso --progress
输出示例:######################################### 100.0%
不输出错误和进度信息
-s 参数将不输出错误和进度信息。
curl -s https://www.example.com
上面命令一旦发生错误,不会显示错误信息。不发生错误的话,会正常显示运行结果。
如果想让 curl 不产生任何输出,可以使用下面的命令。
curl -s -o /dev/null https://google.com
断点续传
curl能够从特定的文件偏移处继续下载,它可以通过指定一个便宜量来下载部分文件:
curl URL/File -C 偏移量
偏移量是以字节为单位的整数,如果让curl自动推断出正确的续传位置使用-C -:
curl -C -URL
使用curl设置参照页字符串
参照页是位于HTTP头部中的一个字符串,用来表示用户是从哪个页面到达当前页面的,如果用户点击网页A中的某个连接,那么用户就会跳转到B网页,网页B头部的参照页字符串就包含网页A的URL。
使用–referer选项指定参照页字符串:
curl --referer http://www.google.com http://wangchujiang.com
用curl设置用户代理字符串
有些网站访问会提示只能使用IE浏览器来访问,这是因为这些网站设置了检查用户代理,可以使用curl把用户代理设置为IE,这样就可以访问了。使用–user-agent或者-A选项:
curl URL --user-agent "Mozilla/5.0"
curl URL -A "Mozilla/5.0"
其他HTTP头部信息也可以使用curl来发送,使用-H"头部信息"传递多个头部信息,例如:
curl -H "Host:wangchujiang.com" -H "accept-language:zh-cn" URL
从零学 python
【从零学习python 】92.使用Python的requests库发送HTTP请求和处理响应
【从零学习python 】91. 使用装饰器和字典管理请求路径的简洁Web应用
【从零学习python 】93.使用字典管理请求路径
【从零学习python 】89. 使用WSGI搭建简单高效的Web服务器
【从零学习python 】88. WSGI接口详解:实现简单高效的Web开发
【从零学习python 】87. 手动搭建HTTP服务器的Python实现及多线程并发处理
【从零学习python 】86. 深入了解HTTP协议及其在浏览器和服务器通信中的作用
【从零学习python 】85.Python进程池的并行计算技术应用
【从零学习python 】84.深入理解线程和进程
【从零学习python 】83. Python多进程编程与进程池的使用
【从零学习python 】82. 基于多线程的聊天程序实现
【从零学习python 】81.Python多线程通信与队列的应用
【从零学习python 】80.线程访问全局变量与线程安全问题
【从零学习python 】79. 线程访问全局变量与线程安全问题
【从零学习python 】78. 文件下载案例
【从零学习python 】77. TCP服务端编程及注意事项
【从零学习python 】76.服务器与客户端:网络通信的关键组成部分
【从零学习python 】75. TCP协议:可靠的面向连接的传输层通信协议
【从零学习python 】74. UDP网络程序:端口问题与绑定信息详解
【从零学习python 】73. UDP网络程序-发送数据
【从零学习python 】72. 深入理解Socket通信及创建套接字的方法
【从零学习python 】71. 网络端口及其作用
【从零学习python 】70.网络通信方式及其应用:从直接通信到路由器连接多个网络
【从零学习python 】69. 网络通信及IP地址分类解析
【从零学习python 】68. Python正则表达式中的贪婪和非贪婪模式
【从零学习python 】67.Python中的re模块:正则替换与高级匹配技术
【从零学习python 】66.深入了解正则表达式:模式匹配与文本处理的利器
【从零学习python 】65. Python正则表达式修饰符及其应用详解
【从零学习python 】64. Python正则表达式中re.compile方法的使用详解
【从零学习python 】63.正则表达式中的re.Match类及其属性和方法介绍
【从零学习python 】62. Python正则表达式:强大的字符串匹配工具
【从零学习python 】61.Python中的property属性详解和应用示例
【从零学习python 】60.探索生成器:迭代的灵活利器
【从零学习python 】59.迭代器:优化数据遍历的高效工具
【从零学习python 】58.Python中的自定义异常及引发异常的方法
【从零学习python 】57.Python中使用with关键字正确关闭资源
【从零学习python 】56. 异常处理在程序设计中的重要性与应用
【从零学习python 】55.Python中的序列化和反序列化,JSON与pickle模块的应用
【从零学习python 】54. 内存中写入数据
【从零学习python 】53. CSV文件和Python的CSV模块
【从零学习python 】52.文件的读写 - Python文件操作指南
【从零学习python 】51.文件的打开与关闭及其在Python中的应用
【从零学习python 】49. Python中对象相关的内置函数及其用法
【从零学习python 】48.Python中的继承与多继承详解
【从零学习python 】47. 面向对象编程中的继承概念及基本使用
【从零学习python 】46. Python中的__new__和__init__方法解析及单例设计模式
【从零学习python 】45.Python中的类方法和静态方法
【从零学习python 】44.面向对象编程中的私有属性和方法
【从零学习python 】43. Python面向对象编程中的实例属性和类属性
【从零学习python 】42.Python中的内置属性和方法
【从零学习python 】41.python魔法方法(二)
【从零学习python 】40.python魔法方法(一)
【从零学习python 】39.面向对象基本语法及应用示例
【从零学习python 】38.Python包的使用及导入方式
【从零学习python 】37.Python自定义模块的使用和注意事项
【从零学习python 】36.Python中使用pip进行第三方包管理的方法与技巧
【从零学习python 】35. Python常见系统模块及其用法
【从零学习python 】34.Python模块的导入和使用方法详解
【从零学习python 】33.装饰器的作用(二)
【从零学习python 】32.装饰器的作用(一)
【从零学习python 】31.深入理解Python中的高阶函数和闭包
【从零学习python 】30.深入理解递归函数和匿名函数
【从零学习python 】29. 「函数参数详解」——了解Python函数参数的不同用法
【从零学习python 】28. Python中的局部变量和全局变量
【从零学习python 】27. Python 函数的使用及嵌套调用
【从零学习python 】25.函数:提高代码编写效率的利器
【从零学习python 】24. Python中的字符串操作与遍历方法
【从零学习python 】23. Python中集合(set)的使用方法和常见操作
【从零学习python 】22. Python中的字典的增删改查及字典的变量
【从零学习python 】21.Python中的元组与字典
【从零学习python 】20. Python列表操作技巧及实例
【从零学习python 】19. 循环遍历列表和列表嵌套的应用
【从零学习python 】18. Python列表的基本操作详解(一)
【从零学习python 】17. Python字符串的format方法(二)
【从零学习python 】16. Python字符串的format方法(一)
【从零学习python 】15.深入了解字符串及字符集编码
【从零学习python 】14.Python字符串常见操作(二)
【从零学习python 】13.Python字符串常见操作(一)
【从零学习python 】12.Python字符串操作与应用
【从零学习python 】11.Python循环语句和控制流程
【从零学习python 】10.Python条件语句和if嵌套详解
【从零学习python 】09.Python 中的条件判断语句
【从零学习python 】08.Python了解位运算符, 运算符优先级
【从零学习python 】07.Python运算符详解:赋值、比较和逻辑运算符
【从零学习python 】06. Python中运用算数运算符进行计算和字符串拼接
【从零学习python 】05. Python中的输出和输入
【从零学习python 】04. Python编程基础:变量、数据类型与标识符
【从零学习python 】03. Python交互式编程及注释详解
【从零学习python 】02. 开发工具介绍
【从零学习python 】01. 安装配置python