正则表达式 (1)

合集下载

01到20的正则表达式

01到20的正则表达式
摘要：
1.正则表达式的概念
2.01 到20 的正则表达式的规则
3.01 到20 的正则表达式的应用
正文：
正则表达式是一种用于匹配字符串模式的字符集，通常用于文本搜索和数据提取工具中。

在计算机科学中，正则表达式通常被用来检查一个字符串是否符合某种模式。

01 到20 的正则表达式，是指匹配0 到20 之间的任意数字的正则表达式。

01 到20 的正则表达式的规则，通常可以写作d{1,20}，其中d表示匹配任意一个数字，{1,20}表示匹配的字符数量在1 到20 之间。

这个正则表达式可以匹配0 到20 之间的任意数字，无论是一位数、两位数还是三位数。

01 到20 的正则表达式的应用非常广泛，例如在文本搜索中，可以用来查找文本中出现的0 到20 之间的数字。

在数据提取中，可以用来提取数据中的0 到20 之间的数字。

在编程中，可以用来检查用户输入的数字是否在0 到20 之间。

整数或小数正则表达式

整数或小数正则表达式
在编程中，经常需要使用正则表达式来匹配数字，尤其是整数和小数。

以下是一些常用的正则表达式：
1. 匹配整数：
^[1-9]d*$
解析：^ 表示开头，[1-9] 表示第一个数字不能为0，d* 表示0个或多个数字，$ 表示结尾。

例如，123、456、789 这些都是符合要求的整数。

2. 匹配负整数：
^-[1-9]d*$
解析：与匹配整数相同，只是在开头加了一个负号。

例如，-123、-456、-789 这些都是符合要求的负整数。

3. 匹配小数：
^[1-9]d*.d+|0.d*[1-9]d*$
解析：^ 表示开头，[1-9]d* 表示整数部分为1-9开头的数字，.d+ 表示小数点后面至少有一位数字，| 表示或者，0.d*[1-9]d* 表示小数点前面为0，小数点后面至少有一位数字，$ 表示结尾。

例如，3.14、0.5、123.456 这些都是符合要求的小数。

4. 匹配负小数：
^-([1-9]d*.d+|0.d*[1-9]d*)$
解析：与匹配小数相同，只是在整个正则表达式开头和结尾加了一个负号，表示匹配负数。

例如，-3.14、-0.5、-123.456 这些都是符合要求的负小数。

以上是一些常用的正则表达式，可以方便地匹配整数和小数。

在实际编程中，可以根据需要进行调整和扩展。

jmeter正则表达式提取器里正则表达式语法简介（一）

jmeter正则表达式提取器⾥正则表达式语法简介（⼀）jmeter⾥接⼝请求结束后，如果后续接⼝请求想要获取本次返回结果的内容，就需要正则表达式提取器来获取参数，当然也可以⽤json path extractor来提取（这个简单⼀些）。

不过Jmeter⾥很多地⽅的约束条件和断⾔都是需要正则表达式来匹配的，所以⼤家还是要学习⼀下正则表达式的语法，以便更好更效率的完成测试内容。

下⾯简单介绍⼀下常⽤的语法，这次先写⼀半，下次再补另⼀半。

正则表达式的内容还是很多的，我也只是学了其中的⼀些⽪⽑，通⽤的东西，后期再慢慢深⼊吧，⽽且要学以致⽤，学的东西⼀定要亲⾃实际体验⼀下才会记得牢，好了，⾔归正转。

我参考的⽹站是，作者真是伟⼤，⽂章也很幽默，也是⽼资格的⼈了，哈哈。

也可以直接忽略我的⽂章，直接看⼤⽜的⽂章学习。

那这⾥我就直接从字符匹配的语法来进⾏实例讲解了，可以下载⽹站⾥的正则表达式测试⼯具，直接在⼯具⾥体验。

下⾯列举元字符语法：1.\bhi\b : 匹配只有hi的字符，\b代表的位置，第⼀个\b代表单词开始的位置，第⼆个\b代表单词结束的位置2.\bhi\b.*\bthis\b : 匹配hi的字符后，中间有任意个字符后，后⾯是this的字符3. . : 表⽰任意字符的元字符4. *：表⽰任意数量的元字符5. \d ：表⽰任意⼀个数字6. \d{2}: 表⽰任意⼀个数字出现两次，相当于\d\d7. \s : 匹配任意的空⽩符，包括空格，换⾏符，制表符（tab），中⽂全⾓空格8. \w : 匹配字母，数字，下划线或汉字9. \d+ ：匹配⼀个或更多连续的数字10. \b\w{2}\b : 匹配刚好有两个字符的单词11. \b : 匹配单词的开始和结束12. ^ : 匹配字符串的开始13. $ : 匹配字符串的结束, 例： ^\d{2,5}$ 表⽰输⼊的数字必须是2位（包含）到5位（包含）之间14. \ : 转义字符，如果要查找元字符就需要⽤转义字符来完成，⽐如： deerchao\.net 实际上是15. 重复次数说明： *是重复0次或多次，+是重复1次或多次，？是重复零次或⼀次，{n} 是重复n次，{n,}是重复n次到多次，{n,m}是重复n次到m次16. [] : 括号⾥的字符会被匹配，⽐如[ab]匹配a或b字符，[,?]匹配逗号或问号17. [a-z0-9A-Z] : 相当于匹配\w18. | : 匹配或规则。

1到任意多个空格正则表达式 -回复

1到任意多个空格正则表达式-回复标题：理解和运用空格正则表达式空格，这个在我们日常生活中看似微不足道的字符，在计算机科学和编程领域中却有着重要的作用。

特别是在正则表达式（Regular Expression，简称regex）中，对空格的精确匹配和处理是许多复杂字符串操作的基础。

本文将深入探讨1到任意多个空格的正则表达式，并逐步解析其含义和使用方法。

首先，我们需要理解什么是正则表达式。

正则表达式是一种强大的文本处理工具，它提供了一种灵活且高效的方式来描述、查找、替换和提取文本中的模式。

在正则表达式中，我们可以使用各种特殊字符和符号来表示不同的字符类、数量、位置和逻辑关系。

那么，如何用正则表达式来匹配1到任意多个空格呢？答案是使用“\s”和“+”这两个符号。

“\s”是正则表达式中的一个特殊字符，它代表任何空白字符，包括空格、制表符、换页符等等。

因此，"\s"可以用来匹配一个空格。

而“+”则是正则表达式中的量词，它表示前面的元素可以出现一次或多次。

所以，“\s+”就表示一个或多个连续的空格。

以下是一个简单的例子，假设我们有一段文本：text = "Hello world! This is a test."如果我们想找出这段文本中所有1到任意多个空格的情况，可以使用以下的Python代码：pythonimport repattern = r"\s+"matches = re.findall(pattern, text)print(matches)运行这段代码，我们会得到结果：[' ', ' ', ' ']这表明，文本中存在三个满足条件的空格序列：三个连续的空格、“”和一个空格。

理解了这个基本的正则表达式之后，我们还可以进一步扩展和应用它。

例如，如果我们只想匹配至少两个空格的情况，可以稍微修改一下我们的模式：pythonpattern = r"\s{2,}"这里的“{2,}”是一个量词范围，表示前面的元素至少出现两次。

php正则表达式1

\w : 表示任意一个字 a-zA-Z0-9_ [a-zA-Z_]
ห้องสมุดไป่ตู้ \W : 表示任意一个非字，除了a-zA-Z0-9_以外的任意一个字符 [^a-zA-Z0-9_]
4. 自己定义一个原子表[], 可以匹配方括号中的任何一个原子
[a-z5-8]
}else{
echo "<font color='red'>正则表达式{$pattern} 和字符串 {$string} 匹配失败</font>";
}
除了字母、数字和正斜线\ 以外的任何字符都可以为定界符号
| |
/ /
{ }
! !
没有特殊需要，我们都使用正斜线作为正则表达式的定界符号
2. 原子 img \s .
注意：原子是正则表达式的最基本组成单位，而且必须至少要包含一个原子
POSIX 扩展正则表达式函数（ereg_）
Perl 兼容正则表达式函数(preg_)
这个函数功能一样，找一个处理字符串效率高的
注意：推荐使用Perl 兼容正则表达式函数库（只学这一种）
学习正则表达式时，有两方面需要学习：
一、正则表达式的模式如何编写
语法：
1. 定界符号 //
"/\<img\s*src=\".*?\"\/\>/"
一、正则表达式也是一个字符串
二、由具有特殊意义的字符组成的字符串
三、具有一点编写规则，也是一种模式
四、看作是一种编程语言（是用一些特殊字符，按规则编写出一个字符串，形成一种模式---正则表达式）
[^a-z] 表示取反，就是除了原子表中的原子，都可以表示(^必须在［］内的第一个字符处出现)

字母、数字、下划线、符号等组合常用正则表达式

字母、数字、下划线、符号等组合常⽤正则表达式字母、数字、下划线、符号等组合常⽤正则表达式1.由数字、26个英⽂字母或者下划线组成的字符串:^[0-9a-zA-Z_]{1,}$2.⾮负整数（正整数 + 0 ）:^/d+$3. 正整数:^[0-9]*[1-9][0-9]*$4.⾮正整数（负整数 + 0）：^((-/d+)|(0+))$5. 负整数 :^-[0-9]*[1-9][0-9]*$6.整数:^-?/d+$7.⾮负浮点数（正浮点数 + 0）:^/d+(/./d+)?$8.正浮点数 :^(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*))$9. ⾮正浮点数（负浮点数 + 0）:^((-/d+(/./d+)?)|(0+(/.0+)?))$10.负浮点数 :^(-(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*)))$11. 浮点数 :^(-?/d+)(/./d+)?$12.由26个英⽂字母组成的字符串 :^[A-Za-z]+$13. 由26个英⽂字母的⼤写组成的字符串 :^[A-Z]+$14.由26个英⽂字母的⼩写组成的字符串 :^[a-z]+$15. 由数字和26个英⽂字母组成的字符串 :^[A-Za-z0-9]+$16.由数字、26个英⽂字母或者下划线组成的字符串 :^/w+$17.email地址 :^[/w-]+(/.[/w-]+)*@[/w-]+(/.[/w-]+)+$18.url:^[a-zA-z]+://(/w+(-/w+)*)(/.(/w+(-/w+)*))*(/?/S*)?$19. 年-⽉-⽇:/^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$/20.⽉/⽇/年:/^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$/21.Emil:^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(]?)$22. 电话号码:(d+-)?(d{4}-?d{7}|d{3}-?d{8}|^d{7,8})(-d+)?23.IP地址:^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$24. 匹配中⽂字符的正则表达式：[/u4e00-/u9fa5]25.匹配双字节字符(包括汉字在内)：[^/x00-/xff]26. 匹配空⾏的正则表达式：/n[/s| ]*/r27.匹配HTML标记的正则表达式：/<(.*)>.*<///1>|<(.*) //>/28.匹配⾸尾空格的正则表达式：(^/s*)|(/s*$)29.匹配Email地址的正则表达式：/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*30. 匹配⽹址URL的正则表达式：^[a-zA-z]+://(//w+(-//w+)*)(//.(//w+(-//w+)*))*(//?//S*)?$31. 匹配帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$32. 匹配国内电话号码：(/d{3}-|/d{4}-)?(/d{8}|/d{7})?33.匹配腾讯QQ号：^[1-9]*[1-9][0-9]*$34. 只能输⼊数字：^[0-9]*$35.只能输⼊n位的数字：^/d{n}$36.只能输⼊⾄少n位的数字：^/d{n,}$37.只能输⼊m~n位的数字：^/d{m,n}$38.只能输⼊零和⾮零开头的数字：^(0|[1-9][0-9]*)$39.只能输⼊有两位⼩数的正实数：^[0-9]+(.[0-9]{2})?$40. 只能输⼊有1~3位⼩数的正实数：^[0-9]+(.[0-9]{1,3})?$41.只能输⼊⾮零的正整数：^/+?[1-9][0-9]*$42. 只能输⼊⾮零的负整数：^/-[1-9][0-9]*$43.只能输⼊长度为3的字符：^.{3}$44. 只能输⼊由26个英⽂字母组成的字符串：^[A-Za-z]+$45.只能输⼊由26个⼤写英⽂字母组成的字符串：^[A-Z]+$46. 只能输⼊由26个⼩写英⽂字母组成的字符串：^[a-z]+$47.只能输⼊由数字和26个英⽂字母组成的字符串：^[A-Za-z0-9]+$48. 只能输⼊由数字和26个英⽂字母或者下划线组成的字符串：^/w+$49.验证⽤户密码(正确格式为：以字母开头，长度在5~17 之间，只能包含字符、数字和下划线)^[a-zA-Z]/w{5,17}$50.验证是否包含有 ^%&',;=?$/"等字符：[^%&',;=?$/x22]+51.只能输⼊汉字：^[\u4e00-\u9fa5]{0,}$52、只含有汉字、数字、字母、下划线不能以下划线开头和结尾^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$53、只含有汉字、数字、字母、下划线，下划线位置不限^[a-zA-Z0-9_\u4e00-\u9fa5]+$54、2~4个汉字@"^[\u4E00-\u9FA5]{2,4}$55、第⼀位是【1】开头，第⼆位则则有【3,4,5,7,8】，第三位则是【0-9】，第三位之后则是数字【0-9】。

正则表达式1

“^d+$”//非负整数（正整数+ 0）“^[0-9]*[1-9][0-9]*$”//正整数“^((-d+)|(0+))$”//非正整数（负整数+ 0）“^-[0-9]*[1-9][0-9]*$”//负整数“^-?d+$”//整数“^d+(.d+)?$”//非负浮点数（正浮点数+ 0）“^(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*))$”//正浮点数“^((-d+(.d+)?)|(0+(.0+)?))$”//非正浮点数（负浮点数+ 0）“^(-(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*)))$”//负浮点数“^(-?d+)(.d+)?$”//浮点数“^[A-Za-z]+$”//由26个英文字母组成的字符串“^[A-Z]+$”//由26个英文字母的大写组成的字符串“^[a-z]+$”//由26个英文字母的小写组成的字符串“^[A-Za-z0-9]+$”//由数字和26个英文字母组成的字符串“^w+$”//由数字、26个英文字母或者下划线组成的字符串“^[w-]+(.[w-]+)*@[w-]+(.[w-]+)+$”//email地址“^[a-zA-z]+://(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$”//url^([-+]?[0-9]+.?[0-9]+)$ //小数在使用RegularExpressionValidator验证控件时的验证功能及其验证表达式介绍如下:只能输入数字：“^[0-9]*$”XX只能输入n位的数字：“^d{n}$”只能输入至少n位数字：“^d{n,}$”只能输入m-n位的数字：“^d{m,n}$”只能输入零和非零开头的数字：“^(0|[1-9][0-9]*)$”只能输入有两位小数的正实数：“^[0-9]+(.[0-9]{2})?$”只能输入有1-3位小数的正实数：“^[0-9]+(.[0-9]{1,3})?$”只能输入非零的正整数：“^+?[1-9][0-9]*$”只能输入非零的负整数：“^-[1-9][0-9]*$”只能输入长度为3的字符：“^.{3}$”只能输入由26个英文字母组成的字符串：“^[A-Za-z]+$”只能输入由26个大写英文字母组成的字符串：“^[A-Z]+$”只能输入由26个小写英文字母组成的字符串：“^[a-z]+$”只能输入由数字和26个英文字母组成的字符串：“^[A-Za-z0-9]+$”只能输入由数字、26个英文字母或者下划线组成的字符串：“^w+$”验证用户密码:“^[a-zA-Z]w{5,17}$”正确格式为：以字母开头，长度在6-18之间，验证用户密码(大于6个字符小于20、必须包含一个特殊字符、至少包含一个数字: (?=^.{6,20}$)(?=(.*d){1,})(?=(.*W){1,}).*只能包含字符、数字和下划线。

正则表达式（正则表达式括号的作用）

正则表达式（正则表达式括号的作⽤）正则表达式之前学习的时候，因为很久没怎么⽤，或者⽤的时候直接找⽹上现成的，所以都基本忘的差不多了。

所以这篇⽂章即是笔记，也让⾃⼰再重新学习⼀遍正则表达式。

其实平时在操作⼀些字符串的时候，⽤正则的机会还是挺多的，之前没怎么重视正则，这是⼀个错误。

写完这篇⽂章后，发觉⼯作中很多地⽅都可以⽤到正则，⽽且⽤起来其实还是挺爽的。

正则表达式作⽤正则表达式，⼜称规则表达式，它可以通过⼀些设定的规则来匹配⼀些字符串，是⼀个强⼤的字符串匹配⼯具。

正则表达式⽅法基本语法，正则声明js中，正则的声明有两种⽅式1. 直接量语法：1var reg = /d+/g/2. 创建RegExp对象的语法1var reg = new RegExp("\\d+", "g");这两种声明⽅式其实还是有区别的，平时的话我⽐较喜欢第⼀种，⽅便⼀点，如果需要给正则表达式传递参数的话，那么只能⽤第⼆种创建RegExp的形式格式：var pattern = new RegExp('regexp','modifier');regexp：匹配的模式，也就是上⽂指的正则规则。

modifier: 正则实例的修饰符,可选值有：i : 表⽰区分⼤⼩写字母匹配。

m ：表⽰多⾏匹配。

g : 表⽰全局匹配。

传参的形式如下：我们⽤构造函数来⽣成正则表达式1var re = new RegExp("^\\d+$","gim");这⾥需要注意，反斜杠需要转义，所以，直接声明量中的语法为\d，这⾥需要为\\d那么，给它加变量，就和我们前⾯写的给字符串加变量⼀样了。

1 2var v = "bl";var re =new RegExp("^\\d+" + v + "$","gim"); // re为/^\d+bl$/gim⽀持正则的STRING对象⽅法1. search ⽅法作⽤：该⽅法⽤于检索字符串中指定的⼦字符串，或检索与正则表达式相匹配的字符串基本语法：stringObject.search(regexp);返回值：该字符串中第⼀个与regexp对象相匹配的⼦串的起始位置。

js正则表达式或的用法

js正则表达式或的用法正则表达式是一种用于在文本中查找匹配模式的强大工具。

JavaScript 中的正则表达式由斜杠之间的文本字符串定义，比如：/pattern/. 正则表达式可以用于执行多种操作，比如验证表单输入、从字符串中提取数据、搜索并替换文本等。

在 JavaScript 中，正则表达式是一个对象，可以通过 new RegExp() 构造函数或直接写出来的字面量形式来创建。

1. 正则表达式的基本语法正则表达式由两部分组成：模式(pattern)和标志(flags)。

其中，模式是由字符和元字符组成的序列，它描述了我们要查找的文本模式。

标志是可选的，用于指定匹配的行为，比如是否区分大小写，是否全局匹配等。

在 JavaScript 中，有下列的一些字符和元字符：（1）字符字元记含义a-zA-Z 任何字母0-9 任何数字\s 任何空白字符（包括空格和制表符）\S 任何非空白字符\t 制表符\n 换行符\r 回车符（2）元字符元字符描述. 匹配除换行符以外的任何单个字符^ 匹配字符串的开始$ 匹配字符串的结束* 匹配前一个字符出现0次或多次+ 匹配前一个字符出现1次或多次匹配前一个字符出现0次或1次{N} 匹配前一个字符出现 N 次{N,} 匹配前一个字符出现 N 次或更多次{N,M} 匹配前一个字符出现 N 到 M 次2. 使用RegExp对象创建正则表达式可以使用构造函数RegExp() 来创建一个正则表达式。

其语法为: var regExpObj = new RegExp(q - expression[, flags]);q-expression是正则表达式的文本字符串，而flags是可选的，表示这个正则表达式的匹配行为。

它可以有下列的一些值：1. g：全局匹配，查找所有的匹配项。

2. i：不区分大小写3. m：多行匹配。

如果我们想匹配字符串中的一个讲究整洁的单词，但并不需要全匹配单词，可以使用如下的正则表达式：var str = "The quick brown fox jumps over the lazy dog.";var regex = /the/gi;var result = str.match(regex);console.log(result); // ["The", "the", "the"]这段代码中，我们创建了一个正则表达式 /the/gi，并用它在字符串str中查找所有的匹配项。

VBA之正则表达式（1）--基础篇

VBA之正则表达式（1）--基础篇正则表达式（Regular Expression），常被用来检验、替换符合某个模式(规则)的字符串，在代码中常缩写为regexp。

VBA中并没有直接提供正文表达式对象，需要借助VBScript的正则对象。

如果使用前期绑定，那么就需要在VBE中引用如下扩展库:也可以使用后期绑定的方式创建正则对象，代码如下。

Set objRegEx = CreateObject('vbscript.regexp')正则对象有四个属性和三个方法。

假设待处理的文本如下，现需要提取其中的姓名汉字和电话数字。

Name:张三丰,Phone:138****0000示例代码如下。

Sub RegExpDemoSyntax()Dim objRegEx As ObjectSet objRegEx = CreateObject('vbscript.regexp')objRegEx.Pattern = 'Name:(.*?),Phone:(\d+)'objRegEx.Global = TruemyString = 'Name:张三丰,Phone:138****0000'Set objMH = objRegEx.Execute(myString)If objMH.Count > 0 ThenWith objMH(j)Debug.Print .submatches(0), .submatches(1)End WithEnd IfSet objRegEx = NothingEnd Sub代码在立即窗口输出结果如下：张三丰138****0000由示例可以看到正则对象的属性和方法并不复杂，也可以说too simple。

但是想用好正则就不是那么简单的事情，其核心在于如何编写正确高效的正则匹配模式，即设置Pattern参数。

在接下来的几篇推文中将介绍一些Excel中正则应用实例当当、天猫、京东各大商城均有出售。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

正则表达式(regular expression)描述了一种字符串匹配的模式，可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。

列目录时，dir *.txt或ls *.txt中的*.txt就不是一个正则表达式,因为这里*与正则式的*的含义是不同的。

正则表达式是由普通字符（例如字符a 到z）以及特殊字符（称为元字符）组成的文字模式。

正则表达式作为一个模板，将某个字符模式与所搜索的字符串进行匹配。

3.1 普通字符由所有那些未显式指定为元字符的打印和非打印字符组成。

这包括所有的大写和小写字母字符，所有数字，所有标点符号以及一些符号。

3.2 非打印字符字符含义\cx 匹配由x指明的控制字符。

例如，\cM 匹配一个Control-M 或回车符。

x 的值必须为A-Z 或a-z 之一。

否则，将c 视为一个原义的‘c’ 字符。

\f 匹配一个换页符。

等价于\x0c 和\cL。

\n 匹配一个换行符。

等价于\x0a 和\cJ。

\r 匹配一个回车符。

等价于\x0d 和\cM。

\s 匹配任何空白字符，包括空格、制表符、换页符等等。

等价于[ \f\n\r\t\v]。

\S 匹配任何非空白字符。

等价于[^ \f\n\r\t\v]。

\t 匹配一个制表符。

等价于\x09 和\cI。

\v 匹配一个垂直制表符。

等价于\x0b 和\cK。

3.5 定位符用来描述字符串或单词的边界，^和$分别指字符串的开始与结束，\b描述单词的前或后边界，\B表示非单词边界。

不能对定位符使用限定符。

3.6 选择用圆括号将所有选择项括起来，相邻的选择项之间用|分隔。

但用圆括号会有一个副作用，是相关的匹配会被缓存，此时可用?:放在第一个选项前来消除这种副作用。

其中?:是非捕获元之一，还有两个非捕获元是?=和?!，这两个还有更多的含义，前者为正向预查，在任何开始匹配圆括号内的正则表达式模式的位置来匹配搜索字符串，后者为负向预查，在任何开始不匹配该正则表达式模式的位置来匹配搜索字符串。

3.7 后向引用对一个正则表达式模式或部分模式两边添加圆括号将导致相关匹配存储到一个临时缓冲区中，所捕获的每个子匹配都按照在正则表达式模式中从左至右所遇到的内容存储。

存储子匹配的缓冲区编号从1 开始，连续编号直至最大99 个子表达式。

每个缓冲区都可以使用‘\n’ 访问，其中n 为一个标识特定缓冲区的一位或两位十进制数。

可以使用非捕获元字符‘?:’, ‘?=’, or ‘?!’ 来忽略对相关匹配的保存。

4. 各种操作符的运算优先级相同优先级的从左到右进行运算，不同优先级的运算先高后低。

各种操作符的优先级从高到低如下：操作符描述\ 转义符(), (?:), (?=), [] 圆括号和方括号*, +, ?, {n}, {n,}, {n,m} 限定符^, $, \anymetacharacter 位置和顺序| “或”操作5. 全部符号解释7. 正则表达式匹配规则7.1 基本模式匹配一切从最基本的开始。

模式，是正规表达式最基本的元素，它们是一组描述字符串特征的字符。

模式可以很简单，由普通的字符串组成，也可以非常复杂，往往用特殊的字符表示一个范围内的字符、重复出现，或表示上下文。

例如：^once这个模式包含一个特殊的字符^，表示该模式只匹配那些以once开头的字符串。

例如该模式与字符串”once upon a time”匹配，与”There once was a man from NewYork”不匹配。

正如如^符号表示开头一样，$符号用来匹配那些以给定模式结尾的字符串。

bucket$这个模式与”Who kept all of this cash in a bucket”匹配，与”buckets”不匹配。

字符^和$同时使用时，表示精确匹配（字符串与模式一样）。

例如：^bucket$只匹配字符串”bucket”。

如果一个模式不包括^和$，那么它与任何包含该模式的字符串匹配。

例如：模式once与字符串There once was a man from NewYorkWho kept all of his cash in a bucket.是匹配的。

在该模式中的字母(o-n-c-e)是字面的字符，也就是说，他们表示该字母本身，数字也是一样的。

其他一些稍微复杂的字符，如标点符号和白字符（空格、制表符等），要用到转义序列。

所有的转义序列都用反斜杠(\)打头。

制表符的转义序列是：\t。

所以如果我们要检测一个字符串是否以制表符开头，可以用这个模式：^\t类似的，用\n表示“新行”，\r表示回车。

其他的特殊符号，可以用在前面加上反斜杠，如反斜杠本身用\\表示，句号.用\.表示，以此类推。

7.2 字符簇在INTERNET的程序中，正规表达式通常用来验证用户的输入。

当用户提交一个FORM以后，要判断输入的电话号码、地址、EMAIL地址、信用卡号码等是否有效，用普通的基于字面的字符是不够的。

所以要用一种更自由的描述我们要的模式的办法，它就是字符簇。

要建立一个表示所有元音字符的字符簇，就把所有的元音字符放在一个方括号里：[AaEeIiOoUu]这个模式与任何元音字符匹配，但只能表示一个字符。

用连字号可以表示一个字符的范围，如：[a-z] //匹配所有的小写字母[A-Z] //匹配所有的大写字母[a-zA-Z] //匹配所有的字母[0-9] //匹配所有的数字[0-9\.\-] //匹配所有的数字，句号和减号[ \f\r\t\n] //匹配所有的白字符同样的，这些也只表示一个字符，这是一个非常重要的。

如果要匹配一个由一个小写字母和一位数字组成的字符串，比如”z2″、”t6″或”g7″，但不是”ab2″、”r2d3″ 或”b52″的话，用这个模式：^[a-z][0-9]$尽管[a-z]代表26个字母的范围，但在这里它只能与第一个字符是小写字母的字符串匹配。

前面曾经提到^表示字符串的开头，但它还有另外一个含义。

当在一组方括号里使用^是，它表示“非”或“排除”的意思，常常用来剔除某个字符。

还用前面的例子，我们要求第一个字符不能是数字：^[^0-9][0-9]$这个模式与”&5″、”g7″及”-2″是匹配的，但与”12″、”66″是不匹配的。

下面是几个排除特定字符的例子：[^a-z] //除了小写字母以外的所有字符[^\\\/\^] //除了(\)(/)(^)之外的所有字符[^\”\’] //除了双引号(”)和单引号(’)之外的所有字符特殊字符”.” (点，句号)在正规表达式中用来表示除了“新行”之外的所有字符。

所以模式”^.5$”与任何两个字符的、以数字5结尾和以其他非“新行”字符开头的字符串匹配。

模式”.”可以匹配任何字符串，除了空串和只包括一个“新行”的字符串。

PHP的正规表达式有一些内置的通用字符簇，列表如下：字符簇含义[[:alpha:]] 任何字母[[:digit:]] 任何数字[[:alnum:]] 任何字母和数字[[:space:]] 任何白字符[[:upper:]] 任何大写字母[[:lower:]] 任何小写字母[[:punct:]] 任何标点符号[[:xdigit:]] 任何16进制的数字，相当于[0-9a-fA-F]7.3 确定重复出现到现在为止，你已经知道如何去匹配一个字母或数字，但更多的情况下，可能要匹配一个单词或一组数字。

一个单词有若干个字母组成，一组数字有若干个单数组成。

跟在字符或字符簇后面的花括号({})用来确定前面的内容的重复出现的次数。

字符簇含义^[a-zA-Z_]$ 所有的字母和下划线^[[:alpha:]]{3}$ 所有的3个字母的单词^a$ 字母a^a{4}$ aaaa^a{2,4}$ aa,aaa或aaaa^a{1,3}$ a,aa或aaa^a{2,}$ 包含多于两个a的字符串^a{2,} 如：aardvark和aaab，但apple不行a{2,} 如：baad和aaa，但Nantucket不行\t{2} 两个制表符.{2} 所有的两个字符这些例子描述了花括号的三种不同的用法。

一个数字，{x}的意思是“前面的字符或字符簇只出现x次”；一个数字加逗号，{x,}的意思是“前面的内容出现x或更多的次数”；两个用逗号分隔的数字，{x,y}表示“前面的内容至少出现x次，但不超过y次”。

我们可以把模式扩展到更多的单词或数字：输入：public string keywod = "abc"; string value = "test";目的：匹配关键字=""，例如获得关键字keyword，value；获得等于的值abc和test 表达式：string (?<x>[^=]*?) *= *(?<y>[^;]*?);代码：private void ParseKeywords(string input){System.Text.RegularExpressions.MatchCollection mc =System.Text.RegularExpressions.Regex.Matches(input, @"string(?<x>[^=]*?) *= *(?<y>[^;]*?);");if (mc != null && mc.Count > 0){foreach (System.Text.RegularExpressions.Match m in mc)正则表达式替换的其他功能：3. 匹配URL中文件名输入：/page1.htm 目的：从URL地址中提取文件名表达式：s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$2") ; 代码：string s = "/page1.htm";s = s.replace(/(.*\/){0,}([^\.]+).*/ig, "$2") ;。