javascript 正则表达式（一）

阅读量：6800 次

发布时间：2019-06-26

本文共 7412 字，大约阅读时间需要 24 分钟。

很久以前的文章做迁移

在JavaScript中，正则表达式也是对象。这种模式可以被用于 RegExp 的 exec 和 test 方法以及 String 的 match、replace、search 和 split 方法。

创建正则表达式

第一种使用正则表达式字面量。

//examplevar re = /a/igm; //i 不区分大小写 g全局匹配 m多行

第二种调用RegExp构造函数。

调用RegExp对象的方法，参数只支持字符串。在ES6版本开始支持字面量和变量当参数。

//examplevar re  = new RegExp('a','igm');

正则表达式的元字符

常见的元字符

^    //匹配字符串的开始$    //匹配字符串的结束.    //匹配除换行符以外的任意字符\w    //匹配字母或数字或下划线或汉字\s    //匹配任意的空白符\d    //匹配数字\b    //匹配单词的开始或结束

'^' 匹配开始位置。

匹配字符开始位置

//匹配字符串的开始/^a/.test('ba');false/^a/.test('ab');true//例如相匹配以数字开始数字字母或下划线结尾的字符串。/^\d+\w+/.test('98273918jdsdhkajsd')true/\d+\w+/.test('98273918jdsdhkajsd')true//如果没有加^，就会匹配不准确。/\d+\w+/.test('ldksjaksjd98273918jdsdhkajsd')true

如果多行标示被设置为true,同时匹配换行后紧跟的字符。

//examplevar str = "first second\nthird fourth\nfifth sixth";var patt = /^(\w+)/gm;console.log(str.match(patt));["first", "third", "fifth"]

字符出现在一个字符集合模式的第一个字符的时候. 表示匹配非字符集合里边的字符。

//example/[^abc]/.test('abc');false/[^abc]/.test('c');false/[^abc]/.test('kjhkjh');true

'$' 匹配字符串结尾位置

//example/a$/.test('abc');false/a$/.test('abca');true//同匹配开始字符一样 添加一个限制。

'/^xxx$/' 准确匹配例如校验手机号邮箱身份证号密码格式 ...

//example//只匹配字符串'a'/^a$/.test('a');true/^a$/.test('aa');false//只匹配字符串'5-11位的数字 例如QQ'/^\d{5,11}$/.test('123');false/^\d{5,11}$/.test('1237657');//如果不加会出现以下匹配不准确，正则只要匹配到符合规则的就会返回true/\d{5,11}/.test('aaaa1237657');true/\d{5,11}/.test('aaaa1237657lll');true

'\w' 匹配字母或数字或下划线或汉字

//example/\w+/.test('987987hbdkjahsiuyo979')true/\w+/.test('987987')true/\w+/.test('kjhkhkhj')true/\w+/.test('kj1312_')true/\w+/.test('kj1312_你好')true//需要注意的是 匹配密码或者邮箱... 的时候不要直接用\w 因为出现中文也会匹配成功。 最好写[a-zA-Z]\d_。

'\' 转义符

/b/匹配字符串b，/b/ 反斜杠通常在正则里边是转义，把字符转移成特殊意义的字符。意思是匹配一个字符边界。比如：/bs/ 其实就是匹配字符串是以空格s' s'开始的字符串。

//examplevar re = /\ba/;undefinedre.test('ba');falsere.test('ab');true

'*' 特殊字符转义为普通字符

相反也会把特殊字符转移成普通字符串例如： 代表着前一项匹配0次或者多次的特殊字符，/a/ 匹配最少一个a或者多个连续'aaa'，而a/*就只能匹配字符串a*

//examplevar re = /a*/;re.test('a');truere.test('aa');truere.test('aaaaaaaaa');truevar re = /a\*/;re.test('a');falsere.test('a*');true

'' 本身用在字符串里边是也需要转义

例如：你相匹配字符串'ab'

//example/a\\/.test('a\\');true/a\\/.test('ab\\');false**'ab\\' // 字符串本身的反斜杠也是需要转义的。**

重复

* 重复零次或更多次

//example/a*/.test('aaaa')true/a*/.test('')true/a*/.test('a')true

+ 重复一次或更多次

//example/a*/.test('aaaa')true/a*/.test('')false/a*/.test('a')true

? 重复零次或一次

//example/a*/.test('aaaa')false/a*/.test('')true/a*/.test('a')true

{n} 重复n次

//example/a{1}/.test('a')true/a{2}/.test('a')false/a{5}/.test('aaaaa')true

{n,} 重复n次或更多次

//example/^a{1,}$/.test('aaaaaa')true/^a{1,}$/.test('a')true/^a{2,}$/.test('a')false

{n,m} 重复n到m次

//example/^a{1,5}$/.test('aaaaaaa')false/^a{1,5}$/.test('')false/^a{1,5}$/.test('aa')true/^a{1,5}$/.test('aaaaa')true/^a{1,5}$/.test('aaaaaa')false

反义

\W 匹配任意不是字母，数字，下划线，汉字的字符

//example/\W/.test('@')true/\W/.test('1')false/\W/.test('a')false/\W/.test('！')true/\W/.test('hjdgsjahg!!!')true/^\W$/.test('hjdgsjahg!!!')false

\S 匹配任意不是空白符的字符

//example/\S/.test('')false/\S/.test('1')true/\S/.test('jsdhaj12121!@#')true

\D 匹配任意非数字的字符

//example/^\D$/.test('q')true/^\D$/.test('qkjshdj')false/^\D+$/.test('qkjshdj')true/^\D+$/.test('1')false/^\D+$/.test('13423')false/^\D$/.test('13423')false

\B 匹配不是单词开头或结束的位置

//example/\B/.test('1jkdsh')true/\B$/.test('1jkdsh')false/^\B/.test('1jkdsh')false/^\B/.test(' 1jkdsh')true

匹配除了x以外的任意字符

//example/[^a]/.test('a')false/[^a]/.test('b')true/[^a]/.test('bs')true/[^a]/.test('bsdsjkhd')true

//example

匹配除了aeiou这几个字母以外的任意字符

/[^aeiou]/.test('bsdsjkhd')true/[^aeiou]/.test('bsdsjkhdi')true/[^aeiou]/.test('a')false/[^aeiou]/.test('aeiou')false/[^aeiou]/.test('akjdhk')true/[^aeiou]/.test('u')false/[^aeiou]/.test('us')true

替换和 '|'

不知道为什么叫替换我感觉就是用'或'来匹配的

例如匹配电话号码（座机）'规则前边3位区号后边八位数字|前边四位数字区号后边7位数字 前边区号首数字为0 后边数字第一位不为零',正则表达式里的替换指的是有几种规则，如果满足其中任意一种规则都应该当成匹配，具体方法是用|把不同的规则分隔开。

//example例如规则：(010)87654321 010-87654321 0311-8765432 (0311)8765432//匹配前三位区号后8位区号/0\d{2}-[1-9]{1}\d{7}/.test('010-85697103')true//匹配区号三位或者四位的电话/0\d{2}-[1-9]{1}\d{7}|0\d{3}-[1-9]{1}\d{6}/.test('010-85697103')true//匹配区号三位或者四位或者被小括号括起来的的，后边是7位或者8位的电话号码/\(0\d{2}\)[1-9]{1}\d{7}|\(0\d{3}\)[1-9]{1}\d{6}|0\d{2}-[1-9]{1}\d{7}|0\d{3}-[1-9]{1}\d{6}/.test('0311-8569710')true/\(0\d{2}\)[1-9]{1}\d{7}|\(0\d{3}\)[1-9]{1}\d{6}|0\d{2}-[1-9]{1}\d{7}|0\d{3}-[1-9]{1}\d{6}/.test('(0311)8765432')true/\(0\d{2}\)[1-9]{1}\d{7}|\(0\d{3}\)[1-9]{1}\d{6}|0\d{2}-[1-9]{1}\d{7}|0\d{3}-[1-9]{1}\d{6}/.test('0311-8765432')true/\(0\d{2}\)[1-9]{1}\d{7}|\(0\d{3}\)[1-9]{1}\d{6}|0\d{2}-[1-9]{1}\d{7}|0\d{3}-[1-9]{1}\d{6}/.test('031-87654321')true//注：以下是为什么呢？？ 因为没有开始结尾符。正则表达式匹配的时候 匹配到合适的就会返回true 所以在校验时最好加上开始结尾符。/\(0\d{2}\)[1-9]{1}\d{7}|\(0\d{3}\)[1-9]{1}\d{6}|0\d{2}-[1-9]{1}\d{7}|0\d{3}-[1-9]{1}\d{6}/.test('031-87654321比较好开奖号')true//正确的写法/^\(0\d{2}\)[1-9]{1}\d{7}$|^\(0\d{3}\)[1-9]{1}\d{6}$|^0\d{2}-[1-9]{1}\d{7}$|^0\d{3}-[1-9]{1}\d{6}$/.test('031-87654321比较好开奖号')false/^\(0\d{2}\)[1-9]{1}\d{7}$|^\(0\d{3}\)[1-9]{1}\d{6}$|^0\d{2}-[1-9]{1}\d{7}$|^0\d{3}-[1-9]{1}\d{6}$/.test('031-87654321')true/^\(0\d{2}\)[1-9]{1}\d{7}$|^\(0\d{3}\)[1-9]{1}\d{6}$|^0\d{2}-[1-9]{1}\d{7}$|^0\d{3}-[1-9]{1}\d{6}$/.test('0311-8765431')true

分组

上边介绍了单个字符重复匹配 a* 类似这个。重复一个字符串又该怎么办？当！当！当！看这里！你可以用小括号来指定子表达式(也叫做分组)，然后你就可以指定这个子表达式的重复次数了，你也可以对子表达式进行其它一些操作

//ip地址匹配 规则四组数字每组1-3个数字每一组数字用.隔开每组数字不能大于255

//example/^((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)$/.test('1.3.4.5')true/^((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)$/.test('134.345.4.5')false/^((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)$/.test('134.245.254.125')true/^((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)$/.test('234.456.678.789')false

(2[0-4]d|25[0-5]|[01]?dd?) 重要的是看明白这个正则， 2[0-4]d 第一位2开始第二位0-4第三位d 25[0-5] 如果前两位是25第三位0-5 才能保证不会大于255 [01]?dd? 如果第一位0或者1可有可无第二位d 第三位d可有可无

再没看明白给我十块钱我再给你唠一遍重申一遍别忘了写^$

反向引用

反向引用的作用通常是用来查找或限定重复、查找或限定指定标识配对出现等等。 反向引用必须要和捕获组一同使用

反向引用“1”的限制，要求必须是两个相同的字符

example：

//examplevar str = 'aabb';str.match(/([ab])\1/)["aa", "a"]var str = 'bbaa';str.match(/([ab])\1/)["bb", "b"]

1{x} {x} 匹配的个数是x+1;

var str = 'bbaa';str.match(/([ab])\1{2}/)nullvar str = 'bbaaa';str.match(/([ab])\1{2}/)["aaa", "a"]var str = 'bbbaaa';str.match(/([ab])\1{2}/)["bbb", "b"]

复杂一点的

'aa'.match(/(\w)((?=\1\1\1)(\1))+/)null'aaaa'.match(/(\w)((?=\1\1\1)(\1))+/)["aa", "a", "a", "a"]'aaa'.match(/(\w)((?=\1\1\1)(\1))+/)null'aaa'.match(/(\w)((?=\1\1)(\1))+/)["aa", "a", "a", "a"]'aaa'.match(/(\w)((?=\1)(\1))+/)["aaa", "a", "a", "a"]'aaa'.match(/(\w)((?=\1)(\1))/)["aa", "a", "a", "a"]

千分符

'100000000'.replace(/\B(?=(\d{3})+$)/g,',');"100,000,000"

B 匹配不是开始或者结尾的位置

?=exp 匹配 exp前面的位置

//再来一个例子'http://www.pkbug.com/jpg/kjdskddlk/img.jpg'.replace(/(jpg(?=(\/|\b)))+/g,'png');"http://www.pkbug.com/png/kjdskddlk/img.png"'http://www.pkbug.com/jpg/kjdskddlk/img.jpg'.replace(/(\w{1}(?=(\/|\b)))+/g,'png');"httpng://wwpng.pkbupng.copng/jppng/kjdskddlpng/impng.jppng"//就是前边写要匹配的规则 类似jpg  \w 后边（？= exp  exp就是jpg或者\w后边有什么 例如有/  通过/ 来找jpg）

（?:exp）分组不捕获

/industr(?:y|ies)/.test('industries')true'aaa'.match(/(?:\w)\1/)null

其他？...

俩字'前端不支持'(?<=exp)    匹配exp后面的位置(?

贪婪与懒惰

最后聊一下正则的贪婪和懒惰。

## 贪婪*    重复零次或更多次+    重复一次或更多次//当正则表达式包含重复的限定符时，会尽可能多的去匹配。'aakjhjkakjhaaahkjahkajha'.match(/a.*a/);["aakjhjkakjhaaahkjahkajha"]  //匹配结果 是尽可能的多匹配 这种通常我们说是贪婪匹配

懒惰

有时候我们需要匹配尽量少的字符我们就聊一下懒惰贼简单。

'aakjhjkakjhaaahkjahkajha'.match(/a.*?a/);["aa"]'aakjhjkakjhaaahkjahkajha'.match(/a.*?/);["a"]//很明显在重复限定符后边加一个？ 匹配零次或者一次 这样就会变成尽量少的匹配。

聊到现在正则也聊差不多了。当然这只是我了解的一丢丢东西如有其它正则需求请留言。一块学习学习。我有什么新学到的东西也会及时更新上来谢谢关注！

aeiou

转载地址：http://dnywl.baihongyu.com/

你可能感兴趣的文章

（二）Mocha源码阅读: 测试执行流程一之引入用例

线程和进程基础以及多线程的基本使用（iOS）

查看>>

typeof vs instanceof

查看>>

Array.from方法具体理解（3分钟）

Javascript实现冒泡排序与快速排序以及对快速排序的性能优化

笔记(2) 从webpack到vue-cli3.0

查看>>

记一次阿里巴巴一面的经历

查看>>

用前端最舒服的躺姿 "搞定" Flutter （组件篇）

查看>>

Android开发无线调试工具adbwireless的使用简介（附AirADB）

PHP从二维数组获取指定数据，组成新维二数组

查看>>

TCP详解

查看>>

在JavaScript中，正则表达式也是对象。这种模式可以被用于 RegExp 的 exec 和 test 方法以及 String 的 match、replace、search 和 split 方法。

创建正则表达式

第一种使用正则表达式字面量。

第二种调用RegExp构造函数。

正则表达式的元字符

'^' 匹配开始位置。

'$' 匹配字符串结尾位置

'/^xxx$/' 准确匹配 例如校验手机号 邮箱 身份证号 密码格式 ...

'\w' 匹配字母或数字或下划线或汉字

'\' 转义符

'*' 特殊字符转义为普通字符

'' 本身用在字符串里边是也需要转义

重复

* 重复零次或更多次

+ 重复一次或更多次

? 重复零次或一次

{n} 重复n次

{n,} 重复n次或更多次

{n,m} 重复n到m次

反义

\W 匹配任意不是字母，数字，下划线，汉字的字符

\S 匹配任意不是空白符的字符

\D 匹配任意非数字的字符

\B 匹配不是单词开头或结束的位置

匹配除了x以外的任意字符

匹配除了aeiou这几个字母以外的任意字符

替换 和 '|'

分组

反向引用

反向引用“1”的限制，要求必须是两个相同的字符

1{x} {x} 匹配的个数是x+1;

复杂一点的

千分符

（?:exp） 分组不捕获

其他 ？...

贪婪与懒惰

懒惰

'/^xxx$/' 准确匹配例如校验手机号邮箱身份证号密码格式 ...

替换和 '|'

（?:exp）分组不捕获

其他？...