JavaScript 正则表达式学习

发布于:2023-01-16 ⋅ 阅读:(473) ⋅ 点赞:(0)

1. 正则表达式的创建:

正则表达式是由一个字符序列形成的搜索模式。
当你在文本搜索数据时,你可以用搜索模式来描述你要查询的内容
正则表达式可以是一个简单的字符,或一个更复杂的模式
正则表达式可用于所有文本搜索和文本替换的操作

  • 字面量形式创建
// var reg = /正则表达式/修饰符
//修饰符:i/g/m
var reg = /hello/g
  • 构造函数
//构造正则表达式的实例,如new RexExp('abc')
//内部传入的参数为字符串/字符串的变量
// var reg =new RegExp("正则表达式","修饰符")
var reg =new RegExp("hello","g");

2. 字符分类

普通字符:
字母、数字、下划线、汉字、,没有特殊含义的符号(如,。!@等)
实际上不是特殊字符的字符都是普通字符
特殊修饰符:
\:将特殊字符转义成普通字符
模式修饰符:
i: ignoreCase,匹配时忽视大小写
m: multiline,多行匹配
g: global,全局匹配
字面创建正则时,模式修饰符写在一对反斜线后

3. 正则表达式实例方法:

1. exec

可用来匹配字符串中符合正则表达式的字符串
如果匹配到,返回值是一个result数组:
[匹配的内容,index:在str中匹配的起始位置,input:参数字符串,groups:undefined]
否则返回null

var str = "I apple dont't like apple";
var reg1=/apple/g;
// console.log(reg1.exec(str));
var reg2=/banana/g;
// console.log(reg2.exec(str));
while(true){
	var result = reg1.exec(str);
	if(!result){
		break;
	}
  console.log(result);
	// console.log(result[0],result["index"],reg1.lastIndex);
}

注意:

  1. 只有开启全局匹配模式时,即有修饰符g时,正则表达式的实例reg中会维护lastIndex属性,记录下一次开始的位置;第二次执行exec的时候,从lastIndex开始检索。

  2. 如果正则表达式没有修饰符g时,每次执行实例方法都从开始位置检索

2. test

用来检测字符串中是否有符合正则表达式的字符串,如果有返回true,否则返回false

var str = 'hello world';
var reg1 = /world/;
var reg2 = /window/;
console.log(reg1.test(str)); //返回true
console.log(reg2.test(str)); //返回false
3. toString/toLocaleString

把正则表达式的内容转换成字面量形式字符串/有本地特色的字符串(js中没效果)

var reg1 = /hello/;
console.log(reg1.toString()); //返回 /hello/ 字符串  String类型
console.log(reg1.toLocaleString()); //返回 /hello/ 字符串 String类型
4. valueOf返回正则表达式本身
var reg1 = /hello/;
console.log(reg1.valueOf());  // 返回正则表达式本身/hello/g

4. 正则表达式实例属性

  • lastIndex
    当正则表达式没设置全局模式g时,该属性值始终为0
    设置全局模式g后,每执行一次exec/test方法时,lastIndex就会移向匹配到的字符串的下一个位置;当指向的位置后没有可以再次匹配的字符串时,下一次执行exec返回nulltest执行返回false,然后lastIndex归零,从字符串的开头重新匹配一轮
var str = 'hello hello hello';
var reg1 = /hello/;
var reg2 = /hello/g;
console.log(reg1.lastIndex);  // 0
console.log(reg1.exec(str));  // 返回第一个hello
console.log(reg1.lastIndex);  // 0

console.log(reg2.lastIndex);  // 0
console.log(reg2.exec(str));  // 返回第一个hello
console.log(reg2.lastIndex);  // 5

console.log(reg2.lastIndex);  // 5
console.log(reg2.exec(str));  // 返回第二个hello
console.log(reg2.lastIndex);  // 11

console.log(reg2.lastIndex);  // 11
console.log(reg2.exec(str));  // 返回第三个hello
console.log(reg2.lastIndex);  // 17

5. 正则表达式语法

  • 直接量字符
字符 匹配
字母和数字字符 自身
\o Null字符
\t 制表符
\n 换行符
\v 垂直制表符
\f 换页符
\r 回车符
  • 字符集合
    一个字符集合,也叫字符组。匹配集合在中的任意一个字符。你可以使用连字 ‘-’ 指定一个范围
    反括号用于查找某个范围内的字符
    [abc] 查找abc中任何字符
var str = 'abc qwe abd'
var reg1 = /[abc]/;// 只要包含有a 或者 包含有b 或者包含有c 都返回为true
console.log(reg1.test(str)); //true

[0-9] 查找任何从0至9的数字

var str = 'abc qwe abd1'
var reg1 = /[0-9]/igm;
console.log(reg1.test(str)); //true

[^xyz] 一个反义或补充字符集,也叫反义字符组。也就是说,它匹配任意不在括号内的字符。你也可以通过使用连字符 ‘-’ 指定一个范围内的字符。
注意:^写在[]里面是反义字符组

var str = 'abc qwe abd1,2'
console.log(str);
var reg1 = /[^abc ]/igm;
console.log(reg1.exec(str)); //true
  • 边界符
    ^ 匹配输入开始。表示匹配行首的文本(以谁开始)。如果多行(multiline)标志被设为 true,该字符也会匹配一个断行(line break)符后的开始处。

$匹配输入结尾。表示匹配行尾的文本(以谁结束)。如果多行(multiline)标志被设为 true,该字符也会匹配一个断行(line break)符的前的结尾处。

如果 ^和 $ 在一起,表示必须是精确匹配。

 //必须是以abc开头的字符串才可以
var reg =/^abc/ 
console.log(reg.test('abcjk')) //返回true
//必须是以abc结尾的字符串才会满足
var reg = /abc$/;
console.log(reg.test('abc')); // true
  • 字符类
字符类 含义
. 匹配除换行符\n和回车符之外的任何单个字符,等效于 [^\n\r]
\d 匹配一个数字字符,等效于[0-9]
\D [^0-9]
\w 匹配包括下划线的任何单个字符,包括AZ,az,0~9和下划线"",等效于 [a-zA-Z0-9]
\W [^a-zA-Z0-9_]
\s 匹配任何Unicode空白字符,包括空格、制表符、换页符等,等效于[\f\t\n\r]
\S [^\f\t\n\r]

6. 数量词

字符 含义
* >=0次
+ ≥1 次
0或1次
{n} n 次
{n,} ≥n 次
{n,m} n到m 次

7. 重复方式

  1. 贪婪模式:尽可能多的匹配(首先取最多可匹配的数量为一组进行匹配),当匹配剩余的字符串,还会继续尝试新的匹配,直到匹配不到为止,为默认模式。
var str = "123456789";
var reg = /\d{3,6}/g;
//对于字符串str,尽可能多的匹配,匹配其中的数字3-6次,选最多的次数,即6次
console.log(reg.exec(str)); //[ '123456', index: 0, input: '123456789', groups: undefined ] 
  1. 非贪婪模式:尽可能少的匹配(每次取最少匹配的数量为一组进行匹配),直到匹配不到为止

使用方法:在量词后加?

var str = "123456789";
var reg = /\d{3,6}?/g;
console.log(reg.exec(str));//[ '123', index: 0, input: '123456789', groups: undefined ]
本文含有隐藏内容,请 开通VIP 后查看

网站公告

今日签到

点亮在社区的每一天
去签到