正则表达式常用示例

发布于:2023-01-27 ⋅ 阅读:(646) ⋅ 点赞:(0)

 


 
 

  
正则表达式可视化工具

 

IP地址

  IP 地址由 4 个字节构成(这 4 个字节的取值范围都是 0~255)。IP 地址通常被写成 4 组以 . 字符分隔的整数(每个整数由 1~3 位数字构成)。
【文本】
localhost is 127.0.0.1
【正则表达式】

(((\d{1,2})|(1\d{2})|(2[0-4]\d)|(25[0-5]))\.){3}((\d{1,2})|(1\d{2})|(2[0-4]\d)|(25[0-5]))

【结果】
localhost is 127.0.0.1
【分析】
  该模式使用了一系列嵌套子表达式。( ( ( \d{1, 2} ) | ( 1 \d{2}) | ( 2 [0-4] \d) | (25 [0-5]) ) .) 由 4 个嵌套子表达式组成:( \d{1, 2} ) 匹配任意 1 位或 2 位数字 ( 0~99 ),( 1 \d{2}) 匹配以 1 开头的任意 3 位数字 ( 100~1999),( 2 [0-4] \d) 匹配整数 200~249;(25 [0-5]) 匹配整数 250~255。这 4 部分通过 | 操作符(其含义是只需匹配其中一部分即可)形成了一个子表达式。随后的 . 用来匹配 . 字符,它与前面又形成了一个更大的子表达式,接下来的 { 3 } 表明需要重复 3 次。最后,取值区间又出现了 1 次(这次省略了尾部的 . ),以匹配最后一组数字。通过把 4 组数字全都限制在 0 到 255 之间,这个模式准确无误地做到了只匹配有效的 IP 地址,排除无效的 IP 地址。

 
 

 
 

URL

  下面介绍匹配 URL 的正则表达式,匹配协议(http 或 https)、主机名、可选的端口号和路径。
【文本】
http://www.forta.com/blog
https://www.forta.com:80/blog/index.cfm
http://www.forta.com
http://ben:password@www.forta.com/
http://localhost/index.php?ab=1&c=2
http://localhost:8500/
【正则表达式】

https?:\/\/[-\w.]+(:\d+)?(\/([\w\/_.]*)?)?

【结果】
http://www.forta.com/blog
https://www.forta.com:80/blog/index.cfm
http://www.forta.com
http://ben:password@www.forta.com/
http://localhost/index.php?ab=1&c=2
http://localhost:8500/
【分析】
  https? : \ / \ / 匹配 http: / / 或 https : / /(? 使得字符 是成为可选项)。[-\w.]+ 匹配主机名。(:\d+)? 匹配一个可选的端口号(参见上例中的第 2 行和第 6 行)。(\ / ([ \w \ / _.]*)?)? 匹配路径:外层的子表达式匹配 /(如果存在的话),内层的子表达式匹配路径本身。如你所见,这个模式无法处理查询字符串,也不能正确解读嵌在 URL 之中的“username:password”(用户名:密码)。不过,它已经足以处理绝大多数的 URL 了(匹配主机名、端口号和路径)。
  这个匹配 URL 的正则表达式不用区分字母大小写。
  匹配 ftp 协议的 URL,把 https? 替换为 (http | https | ftp) 即可。

 
 

 
 

完整的 URL

  匹配完整的 URL 信息。
【文本】
http://www.forta.com/blog
https://www.forta.com:80/blog/index.cfm
http://www.forta.com
http://ben:password@www.forta.com/
http://localhost/index.php?ab=1&c=2
http://localhost:8500/
【正则表达式】

https?:\/\/(\w*:\w*@)?[-\w.]+(:\d+)?(\/([\w\/_.]*(\?\S+)?)?)?

【结果】
http://www.forta.com/blog
https://www.forta.com:80/blog/index.cfm
http://www.forta.com
http://ben:password@www.forta.com/
http://localhost/index.php?ab=1&c=2
http://localhost:8500/
【分析】
  该模式是在前一个例子的基础上改进而来的。这次紧跟在 https?: \ / \ / 后面的是 (\w*:\w*@)?,它匹配嵌入在 URL 之中的用户名和密码(用户名和密码要用 : 隔开,后面还要跟上一个 @ 字符),参见这个例子中的第 4 行。另外,路径之后的 (?\S+)? 负责匹配查询字符串,出现在 ? 后面的文本是可选的,这可以使用 ? 来表示。
  这个匹配 URL 的正则表达式不用区分字母大小写。
  为什么不使用这个模式代替上一个模式呢?就性能来说,越复杂的模式,执行速度越慢。如果不需要额外的功能,还是不使用它比较好。

 
 

 
 

电子邮件地址

【文本】
My name is Ben Forta, and my
email address is ben@forta.com
【正则表达式】

(\w+\.)*\w+@(\w+\.)+[A-Za-z]+

【结果】
My name is Ben Forta, and my
email address is ben@forta.com
【分析】
  (\w+.)\w+ 负责匹配电子邮件地址里的用户名部分(@之前的所有内容):(\w+.) 匹配零次或多次出现的文本以及之后的 . ,\w+ 匹配必需的文本(例如,这种组合能够匹配 ben 和 ben.forta)。接下来,@匹配@字符本身。(\w+.)+ 至少匹配一个以 . 结束的字符串,[A-Za-z]+ 匹配顶层域名(com、edu、us、uk等)。
  决定电子邮件地址格式有效性的规则极其复杂。该模式无法验证所有可能的电子邮件地址。比如说,这个模式会认为 ben…forta@forta.com 是有效的(显然无效),也不允许主机名部分使用 IP 地址(这种形式是可以的)。还是那句话,它足以验证大部分电子邮箱地址,所以还是可以拿来一用的。
  这个匹配电子邮箱地址的正则表达式不用区分字母大小写。

 
 

 
 

HTML注释

   HTML 页面里的注释必须位于 标签之间(这两个标签必须至少包含两个连字符,多于两个也没有关系)。在浏览(或调试)Web页面的时候,找出所有的注释是有用的。
【文本】

<!-- Start of page -->
<html>
<!-- Start of head -->
<head>
<title>My Title</title> <!-- Page title -->
</head>
<!-- Body -->
<body>

【正则表达式】

<!-{2,}.*?-{2,}>

【结果】
<!- - Start of page -->
< html>
<!- - Start of head -->
< head>
< title>My Title <!- - Page title -->
< /head>
<!- - Body -->
< body>
【分析】
   <!-{2,} 匹配 HTML 注释的开始标签,也就是 <! 后面紧跟着两个或更多个连字符的情况。.*? 匹配 HTML 注释的文字部分(这里用的是懒惰型量词)。-{2, }> 匹配 HTML 注释的结束标签。
  该模式匹配两个或更多个连字符,所以还可以用来查找 CFML 注释(这种注释的开始 / 结束标签里包含 3 个连字符)。不过,这个模式没有检查 HTML 注释的开始标签和结束标签中的连字符的个数是否匹配(可以用来检查 HTML 注释的格式是否有误)。

 
 

 
 

常用正则表达式

该部分内容转载至Road To Coding

数字校验

描述 正则表达式 备注
数字 ^[0-9]*$
n位数字 ^\d{n}$
至少n位数字 ^\d{n,}$
m~n位数字 ^\d{m,n}$
整数 ^(-?[1-9]\d*)$ 非0开头,包括正整数和负整数
正整数 ^[1-9]\d*$
负整数 ^-[1-9]\d*$
非负整数 ^(([1-9]\d*)|0)$
非正整数 ^((-[1-9]\d*)|0)$
浮点数 ^-?(?:[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0\.0+|0)$ 包括正浮点数和负浮点数
正浮点数 ^(?:[1-9]\d*\.\d*|0\.\d*[1-9]\d*)$
负浮点数 ^-(?:[1-9]\d*\.\d*|0\.\d*[1-9]\d*)$
非正浮点数 ^(?:-(?:[1-9]\d*\.\d+|0\.\d*[1-9]\d*)|0\.0+|0)$ 包含0
非负浮点数 ^(?:[1-9]\d*\.\d+|0\.\d+|0\.0+|0)$ 包含0
仅一位小数 ^-?(?:0|[1-9][0-9]*)\.[0-9]{1}$
最少一位小数 ^-?(?:0|[1-9][0-9]*)\.[0-9]{1,}$
最多两位小数 ^-?(?:0|[1-9][0-9]*)\.[0-9]{1,2}$
连续重复的数字 ^(\d)\1+$ 例如:111,222

 
 

字符校验

描述 正则表达式 备注
中文 ^[\u4E00-\u9FA5]+$
全角字符 ^[\uFF00-\uFFFF]+$
半角字符 ^[\u0000-\u00FF]+$
英文字符串(大写) ^[A-Z]+$
英文字符串(小写) ^[a-z]+$
英文字符串(不区分大小写) ^[A-Za-z]+$
中文和数字 ^(?:[\u4E00-\u9FA5]{0,}|\d)+$
英文和数字 ^[A-Za-z0-9]+$
数字、英文字母或者下划线组成的字符串 ^\w+$
中文、英文、数字包括下划线 ^[\u4E00-\u9FA5\w]+$
不含字母的字符串 ^[^A-Za-z]*$
连续重复的字符串 ^(.)\1+$ 例如:aa,bb
长度为n的字符串 ^.{n}$
ASCII ^[ -~]$

 
 

日期和时间校验

描述 正则表达式 备注
日期 ^\d{1,4}-(?:1[0-2]|0?[1-9])-(?:0?[1-9]|[1-2]\d|30|31)$ 弱校验,例如:2022-06-12
日期 ^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)$ 严格校验,考虑平闰年
时间 ^(?:1[0-2]|0?[1-9]):[0-5]\d:[0-5]\d$ 12小时制,例如:11:21:31
时间 ^(?:[01]\d|2[0-3]):[0-5]\d:[0-5]\d$ 24小时制,例如:23:21:31
日期+时间 ^(\d{1,4}-(?:1[0-2]|0?[1-9])-(?:0?[1-9]|[1-2]\d|30|31)) ((?:[01]\d|2[0-3]):[0-5]\d:[0-5]\d)$ 例如:2000-11-11 23:20:21

 
 

日常生活相关

描述 正则表达式 备注
中文名 ^[\u4E00-\u9FA5·]{2,16}$
英文名 ^[a-zA-Z][a-zA-Z\s]{0,20}[a-zA-Z]$
车牌号 ^[京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼使领][A-HJ-NP-Z][A-HJ-NP-Z0-9]{4}[A-HJ-NP-Z0-9挂学警港澳]$ 不含新能源
车牌号 ^[京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼使领][A-HJ-NP-Z](?:(?:[A-HJ-NP-Z0-9]{4}[A-HJ-NP-Z0-9挂学警港澳])|(?:(?:\d{5}[A-HJK])|(?:[A-HJK][A-HJ-NP-Z0-9][0-9]{4})))$ 包含新能源
火车车次 ^[GCDZTSPKXLY1-9]\d{1,4}$ 例如:G1234
手机号 ^(?:(?:\+|00)86)?1[3-9]\d{9}$ 弱匹配
手机号 ^(?:(?:\+|00)86)?1(?:(?:3[\d])|(?:4[5-79])|(?:5[0-35-9])|(?:6[5-7])|(?:7[0-8])|(?:8[\d])|(?:9[189]))\d{8}$ 严格匹配
固话号码 ^(?:(?:\d{3}-)?\d{8}|^(?:\d{4}-)?\d{7,8})(?:-\d+)?$
手机IMEI码 ^\d{15,17}$ 一般是15位
邮编 ^(?:0[1-7]|1[0-356]|2[0-7]|3[0-6]|4[0-7]|5[1-7]|6[1-7]|7[0-5]|8[013-6])\d{4}$ 例如:211100
统一社会信用代码 ^[0-9A-HJ-NPQRTUWXY]{2}\d{6}[0-9A-HJ-NPQRTUWXY]{10}$
身份证号码(1代) ^[1-9]\d{7}(?:0\d|10|11|12)(?:0[1-9]|[1-2][\d]|30|31)\d{3}$ 15位数字
身份证号码(2代) ^[1-9]\d{5}(?:18|19|20)\d{2}(?:0[1-9]|10|11|12)(?:0[1-9]|[1-2]\d|30|31)\d{3}[0-9Xx]$ 18位数字
QQ号 ^[1-9][0-9]{4,}$ 一般是5到10位
微信号 ^[a-zA-Z][-_a-zA-Z0-9]{5,19}$ 一般6~20位,字母开头,可包含字母、数字、-、_,不含特殊字符
股票代码 ^(s[hz]|S[HZ])(000[\d]{3}|002[\d]{3}|300[\d]{3}|600[\d]{3}|60[\d]{4})$ A股,例如:600519
银行卡卡号 ^[1-9]{1}(?:\d{15}|\d{18})$ 一般为19位

 
 

互联网相关

描述 正则表达式 备注
域名 ^[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(?:\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+$ 例如:qwjy.top
网址 ^(?:https?:\/\/)?[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(?:\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+$ 例如:https://www.qwjy.top/
带端口号的网址(或IP) ^(?:https?:\/\/)?[\w-]+(?:\.[\w-]+)+:\d{1,5}\/?$ 例如:http://127.0.0.1:8888/
URL ^https?:\/\/(?:www\.)?[-a-zA-Z0-9@:%._\+~#=]{1,256}\.[a-zA-Z0-9()]{1,6}\b(?:[-a-zA-Z0-9()!@:%_\+.~#?&\/\/=]*)$ 例如:https://www.r2coding.com/#/README?id=1
邮箱email ^[A-Za-z0-9\u4e00-\u9fa5]+@[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(?:\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+$ 支持中文,例如:codesheep@cs.com
用户名 ^[a-zA-Z0-9_-]{4,20}$ 4到20位
弱密码 ^[\w]{6,16}$ 6~16位,包含大小写字母和数字的组合
强密码 ^.*(?=.{6,})(?=.*\d)(?=.*[A-Z])(?=.*[a-z])(?=.*[!@\.#$%^&*? ]).*$ 至少6位,包括至少1个大写字母,1个小写字母,1个数字,1个特殊字符
端口号 ^(?:[0-9]|[1-9][0-9]{1,3}|[1-5][0-9]{4}|6[0-4][0-9]{3}|65[0-4][0-9]{2}|655[0-2][0-9]|6553[0-5])$ 例如:65535
IPv4地址 ^(?:(?:\d|[1-9]\d|1\d\d|2[0-4]\d|25[0-5])\.){3}(?:\d|[1-9]\d|1\d\d|2[0-4]\d|25[0-5])$ 例如:192.168.31.1
IPv4地址+端口 ^(?:(?:\d|[1-9]\d|1\d\d|2[0-4]\d|25[0-5])\.){3}(?:\d|[1-9]\d|1\d\d|2[0-4]\d|25[0-5])(?::(?:[0-9]|[1-9][0-9]{1,3}|[1-5][0-9]{4}|6[0-4][0-9]{3}|65[0-4][0-9]{2}|655[0-2][0-9]|6553[0-5]))?$ 例如:192.168.31.1:8080
IPv6地址 ^(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:){1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))$ 例如:CDCD:910A:2222:5498:8475:1111:3900:2020
IPv6地址+端口 ^\[(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:){1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))\](?::(?:[0-9]|[1-9][0-9]{1,3}|[1-5][0-9]{4}|6[0-4][0-9]{3}|65[0-4][0-9]{2}|655[0-2][0-9]|6553[0-5]))?$ 例如:[CDCD:910A:2222:5498:8475:1111:3900:2020]:9800
子网掩码 ^(?:254|252|248|240|224|192|128)\.0\.0\.0|255\.(?:254|252|248|240|224|192|128|0)\.0\.0|255\.255\.(?:254|252|248|240|224|192|128|0)\.0|255\.255\.255\.(?:255|254|252|248|240|224|192|128|0)$ 例如:255.255.255.0
MAC地址 ^(?:(?:[a-f0-9A-F]{2}:){5}|(?:[a-f0-9A-F]{2}-){5})[a-f0-9A-F]{2}$
Version版本号 ^\d+(?:\.\d+){2}$ 例如:12.1.1
图片后缀 \.(gif|png|jpg|jpeg|webp|svg|psd|bmp|tif)+ 可按需增删扩展名集合
视频后缀 \.(swf|avi|flv|mpg|rm|mov|wav|asf|3gp|mkv|rmvb|mp4)+ 可按需增删扩展名集合
图片链接 (?:https?:\/\/)?[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(?:\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+.+\.(gif|png|jpg|jpeg|webp|svg|psd|bmp|tif) 可按需增删扩展名集合
视频链接 (?:https?:\/\/)?[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(?:\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+.+\.(swf|avi|flv|mpg|rm|mov|wav|asf|3gp|mkv|rmvb|mp4) 可按需增删扩展名集合
迅雷链接 thunderx?:\/\/[a-zA-Z\d]+=
ed2k链接 ed2k:\/\/\|file\|.+\|\/
磁力链接 magnet:\?xt=urn:btih:[0-9a-fA-F]{40,}.*

 
 

其他

描述 正则表达式 备注
MD5格式 ^(?:[a-f\d]{32}|[A-F\d]{32})$ 32位MD5,例如:7552E7071B118CBFFEC8C930455B4297
BASE64格式 ^\s*data:(?:[a-z]+\/[a-z0-9-+.]+(?:;[a-z-]+=[a-z0-9-]+)?)?(?:;base64)?,([a-z0-9!$&',()*+;=\-._~:@/?%\s]*?)\s*$ 例如:
UUID ^[a-f\d]{4}(?:[a-f\d]{4}-){4}[a-f\d]{12}$ 例如:94f9d45a-71b0-4b3c-b69d-20c4bc9c8fdd
16进制 ^[A-Fa-f0-9]+$ 例如:FFFFFF
16进制颜色 ^#?([0-9a-fA-F]{3}|[0-9a-fA-F]{6})$ 例如:#FFFFFF
SQL语句 ^(?:select|drop|delete|create|update|insert).*$
Java包名 ^(?:[a-zA-Z_]\w*)+(?:[.][a-zA-Z_]\w*)+$ 例如:com.r2coding.controller
文件扩展名 \.(?:doc|pdf|txt) 可按需增删扩展名集合
Windows文件路径 ^[a-zA-Z]:(?:\\[\w\u4E00-\u9FA5\s]+)+[.\w\u4E00-\u9FA5\s]+$ 例如:C:\Users\Administrator\Desktop\a.txt
Windows文件夹路径 ^[a-zA-Z]:(?:\\[\w\u4E00-\u9FA5\s]+)+$ 例如:C:\Users\Administrator\Desktop
Linux文件路径 ^\/(?:[^/]+\/)*[^/]+$ 例如:/root/library/a.txt
Linux文件夹路径 ^\/(?:[^/]+\/)*$ 例如:/root/library/

网站公告

今日签到

点亮在社区的每一天
去签到