[VIP专享]经典正则表达式QRegExp的解析

合集下载

正则表达式解释

正则表达式解释正则表达式，也称为规则表达式、正规表示式，是一种特殊的字符序列，它能描述一些文本模式。

它可以帮助我们快速的匹配某些特定的文本文件，可以用来搜索、编辑等，是模糊匹配也可以是精确匹配。

在许多字符串处理方面，正则表达式都是非常有用的。

正则表达式主要由字母、数字、专用字符（称为meta字符）组成，比如：d+表示匹配以一个或多个数字开头的字符串；[a-z0-9]表示匹配以字母或数字开头的字符串；[^a-z]表示匹配非字母开头的字符串等等。

正则表达式分为基本正则表达式(basic regular expressions)和扩展正则表达式(extended regular expressions)。

基本正则表达式只支持一些简单的匹配策略，比如匹配字符，只能支持精确匹配。

而扩展正则表达式支持更多的匹配策略，它可以帮助我们更好的匹配特定的文本文件，可以模糊匹配，也可以进行精确的匹配。

正则表达式的应用非常广泛，可以用在编辑器、程序语言、网络抓取、数据库、搜索引擎等场景中。

在编辑器中，可以使用正则表达式来搜索替换文本，做到一次性替换多行文本中的某些字符或模式；在程序语言中，也可以使用正则表达式来验证用户输入的信息，检查是否符合某些格式要求；在网络抓取中，可以使用正则表达式来抓取网络上的某些特定信息；在数据库中，可以使用正则表达式来查找满足特定格式的数据；在搜索引擎中，可以使用正则表达式来快速搜索到所需信息等等。

正则表达式的使用也是一门技术，学会了正则表达式的用法，可以极大的提高我们的效率，帮助我们有效的完成一些复杂的任务。

但是，学习正则表达式也是一项技术性很强的工作，需要花费大量的时间和精力去研究学习。

总之，正则表达式是一种非常有用的工具，在我们日常的工作中能够帮助我们不断提高效率，节省大量的时间。

学习正则表达式也是一门技术，通过不断的学习和研究，希望能够在有效的时间内掌握这门技术，为我们的学习和工作带来更多的便利。

正则表达式知识详解

正则表达式知识详解一、什么是正则表达式？1.定义：正则表达式(regular expression)描述了一种字符串匹配的模式，可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。

构造正则表达式的方法和创建数学表达式的方法一样。

也就是用多种元字符与运算符可以将小的表达式结合在一起来创建更大的表达式。

正则表达式的组件可以是单个的字符、字符集合、字符范围、字符间的选择或者所有这些组件的任意组合。

2.组成：正则表达式是由普通字符（例如字符 a 到 z）以及特殊字符（称为"元字符"）组成的文字模式。

模式描述在搜索文本时要匹配的一个或多个字符串。

正则表达式作为一个模板，将某个字符模式与所搜索的字符串进行匹配。

3.何时使用：验证——从头到尾完整匹配！查找——只要部分匹配即可！二、正则表达式的基本语法和规则1.备选字符集：规定某*一位字符*可用的备选字符的集合语法：[可选字符列表]强调：1. 无论备选字符集包含多少字符，只能选1个2. 必须选1个！比如：6位数字的密码[0123456789][0123456789][0123456789][0123456789][012 3456789][0123456789]简化：1. 当备选字符连续时，可用-表示范围的区间比如：[0123456789]-->[0-9][0-9][0-9][0-9][0-9][0-9][0-9][a-z]-->1位小写字母[A-Z]-->1位大写字母[A-Za-z]-->1位字母，大小写都行[0-9a-zA-Z]-->1位字母或数字都行反选：[^不能选的字符列表]比如：[^47] 强调：^作“除了”使用时，只能放在开头2. 预定义字符集：为常用的字符集专门提供的简化写法！“\d”-->[0-9]-->1位数字“\w”-->[0-9a-zA-Z_]-->1位字母,数字或_“\s”-->1位空字符：匹配任何空白字符，包括空格、制表符、换页符等等。

QT-正则表达式

QRegExp是Qt的正则表达式类.Qt中有两个不同类的正则表达式.第一类为元字符.它表示一个或多个常量表达式.令一类为转义字符,它代表一个特殊字符.一.元字符. 匹配任意单个字符.例如, 1.3 可能是1. 后面跟任意字符,再跟3^ 匹配字符串首. 例如, ^12可能是123,但不能是312$ 配字符串尾. 例如, 12$可以是312, 当不能是 123[] 匹配括号内输入的任意字符.[123]可以为1, 2 或3* 匹配任意数量的前导字符. 例如, 1*2可以为任意数量个1(甚至没有), 后面跟一个2 + 匹配至少一个前导字符. 例如, 1+2必须为一个或多个1, 后跟一个2? 匹配一个前导字符或为空. 例如 1?2可以为2或这12二.统配模式通过 QRegExp::setPatternSyntax(QRegExp::Wildcard);可以将元字符设置为统配模式.在统配模式下,只有3个元字符可以使用.他们的功能没有变化.? 匹配任意单个字符, 例如, 1?2可以为1,后面跟任意单个字符, 再跟2* 匹配任意一个字符序列. 例如, 1*2, 可以为1, 后面跟任意数量的字符, 再跟一个2 [] 匹配一个定义的字符集合. 例如, [a-zA-Z\.]可以匹配 a到z之间任意一个字符和.[^a]匹配出小写a以外的字符.三.转义序列\. 匹配”.”//？？我做实验的结果是 /. 而非反斜杠QRegExpexp("^([0-9]+[/.][0-9]+[/.][0-9]+[/.][0-9]+)$");\^ 匹配”^”\$ 匹配”$”\[ 匹配”[”\] 匹配”]”\* 匹配”*”\+ 匹配”+”\? 匹配”?”\b 匹配响铃字符,使计算机发出嘟的一声.\t 制表符号\n 换行符号\r回车符鉿\s任意空格\xnn 匹配16进制为nn的字符\0nn 匹配8进制的nn字符这些表达式均以\开始, 与C++的转义字符相同,所以为了定义QRegExp中的一个转义序列, 需要在前面添加两个\\用正则表达式验证文本有效性你可以使用QRegExp::exactMatch来判断一个字符串是否符合一个pattern。

regexpreplace正则表达式

regexpreplace正则表达式全文共四篇示例，供读者参考第一篇示例：正则表达式是一种强大的工具，可以帮助我们在处理文本数据时实现复杂的匹配和替换操作。

其中的regexpreplace函数是一个常用的函数，它可以根据正则表达式来进行字符串替换。

在本文中，我们将深入探讨regexpreplace函数的用法，并通过实例来演示其在实际应用中的作用。

让我们先来了解一下正则表达式的基本概念。

正则表达式是一种用来描述字符串模式的表达式，它由普通字符（例如a到z）和特殊字符（例如*和+）组成，可以用来匹配特定的文本。

正则表达式在处理文本数据时非常灵活和高效，可以帮助我们快速地定位和操作符合某种规则的字符串。

在正则表达式中，通常会使用一些特殊字符来表示不同的意义。

^表示匹配字符串的开头，表示匹配字符串的结尾， . 表示匹配任意字符，*表示匹配零个或多个前面的字符，+表示匹配一个或多个前面的字符等等。

这些特殊字符的组合和排列可以构成不同的模式，用来匹配不同的字符串。

而在regexpreplace函数中，我们可以使用正则表达式来指定需要替换的字符串的模式。

该函数通常包含三个参数：原始字符串、替换模式和替换字符串。

原始字符串是需要进行替换操作的字符串，替换模式是一个正则表达式，用来匹配原始字符串中需要替换的部分，替换字符串则是用来替换匹配到的部分的新字符串。

我们可以使用regexpreplace函数将一个字符串中的所有数字替换为"x"：```regexpreplace("123abc456def789ghi", "[0-9]", "x")```上面的代码中，正则表达式[0-9]表示匹配所有数字，因此该函数会将原始字符串中的所有数字都替换为"x"，最终得到的结果是"x23abcxdefxghi"。

Regexp函数使用教学课件

2
Regexp函数的语法分析
• 该函数4个参数，其中第3第4参数是可选参数，第一参数必须放置在英文双引号里面。 • 参数1：表示引用或直接输入的常量数据； • 参数2：根据需要编写的相关正则表达式，可以是英文、数字、汉字及其混合体； • 参数3：【匹配模式】可选参数，分别是0\1\2，可以忽略不写，不写默认为0； • 参数4：【替换内容】可选参数，受第3参数的影响，参数选择不同，功能就不同，可以实现替换功能。
备注
分析
其后经常搭配?或*或+
单词data数据的首字母
其没前有搭其配他特\，殊可含以义表了示。普通的点，\. 转义。
其前经常搭配\d
表示连续若干数字
其前经常搭配\d
不能单独使用
其前经常搭配\d
不能单独使用
其后经常搭配{1,}等
英文中括号
其前（左）经常搭配[0-9]
表示分组，对目标代码分组其后经常跟?或*
3
4
Regexp函数常用汉字代码分析
• 掌握必备的汉字关键字
符号 [一-龢]
释义表示单元格中的任意一个汉字
备注其后经常搭配?或*或+
分析音su
[一-龟]
表示单元格中的任意一个汉字其后经常搭配?或*或+
[一-龥]
表示单元格中的任意一个汉字其后经常搭配?或*或+
音yu
+
表示1个或多个
其后经常搭配[一-龟]+
13
案例分析2、index函数在regexp函数中的应用
• regexp返回的数据实际上是一行多列的动态数组，通过index函数索引目标位置上的数据 • =INDEX(REGEXP(A2,"\d+\.?\d*"),1)

QRegExp的用法

QRegExp的⽤法bool QRegExp::exactMatch(const &str) constReturns true if str is matched exactly by this regular expression; otherwise returns false. You can determine how much of the string was matched by calling ().For a given regexp string R, exactMatch("R") is the equivalent of ("^R$") since exactMatch() effectively encloses the regexp in the start of string and end of string anchors, except that it sets () differently.代码：QRegExp reg("^.+.mp3$");if (!reg.exactMatch(fi.fileName())){continue;}要判断fi的filename是不是“.map”格式的。

^的作⽤：^The caret signifies the beginning of the string. If you wish to match a literal ^ you must escape it by writing \\^. For example, ^#include will only match strings which begin with the characters '#include'. (When the caret is the first character of a character set it has a special meaning, see .)简单总结：起始符，如果要加⼊^,就⽤\\^$的作⽤：$The dollar signifies the end of the string. For example \d\s*$ will match strings which end with a digit optionally followed by whitespace. If you wish to match a literal $ you must escape it by writing \\$.简单总结：终⽌符，同上。

正则表达式详解

正则表达式详解正则表达式1．什么是正则表达式简单的说，正则表达式是一种可以用于文字模式匹配和替换的强有力的工具。

是由一系列普通字符和特殊字符组成的能明确描述文本字符串的文字匹配模式。

正则表达式并非一门专用语言，但也可以看作是一种语言，它可以让用户通过使用一系列普通字符和特殊字符构建能明确描述文本字符串的匹配模式。

除了简单描述这些模式之外，正则表达式解释引擎通常可用于遍历匹配，并使用模式作为分隔符来将字符串解析为子字符串，或以智能方式替换文本或重新设置文本格式。

正则表达式为解决与文本处理有关的许多常见任务提供了有效而简捷的方式。

正则表达式具有两种标准：·基本的正则表达式(BRE –Basic Regular Expressions)·扩展的正则表达式(ERE – Extended Regular Expressions)。

ERE包括BRE功能和另外其它的概念。

正则表达式目前有两种解释引擎：·基于字符驱动(text-directed engine)·基于正则表达式驱动(regex-directed engine)Jeffery Friedl把它们称作DFA和NFA解释引擎。

约定：为了描述起来方便，在本文中做一些约定：1.本文所举例的所有表达时都是基于NFA解释引擎的。

2.正则表达式，也就是匹配模式，会简写为Regex。

3. Regex的匹配目标，也就是目标字符串，会简写为String。

4.匹配结果用会用黄色底色标识。

5.用1\+1=2 括起来的表示这是一个regex。

6.举例会用以下格式：testThis is a test会匹配test，testcase等2．正则表达式的起源正则表达式的”祖先”可以一直上溯至对人类神经系统如何工作的早期研究。

Warren McCulloch 和 Walter Pitts 这两位神经生理学家研究出一种数学方式来描述这些神经网络。

RegExp正则表达式

RegExp正则表达式RegExp正则表达式什么是 RegExp？RegExp 是正则表达式的缩写。

当您检索某个⽂本时，可以使⽤⼀种模式来描述要检索的内容。

RegExp 就是这种模式。

简单的模式可以是⼀个单独的字符。

更复杂的模式包括了更多的字符，并可⽤于解析、格式检查、替换等等。

您可以规定字符串中的检索位置，以及要检索的字符类型，等等。

RegExp 对象RegExp 对象表⽰正则表达式，它是对字符串执⾏模式匹配的强⼤⼯具。

直接量语法/pattern/attributes创建 RegExp 对象的语法：new RegExp(pattern, attributes);参数参数pattern是⼀个字符串，指定了正则表达式的模式或其他正则表达式。

参数attributes是⼀个可选的字符串，包含属性 "g"、"i" 和 "m"，分别⽤于指定全局匹配、区分⼤⼩写的匹配和多⾏匹配。

ECMAScript 标准化之前，不⽀持 m 属性。

如果pattern是正则表达式，⽽不是字符串，则必须省略该参数。

返回值⼀个新的 RegExp 对象，具有指定的模式和标志。

如果参数pattern是正则表达式⽽不是字符串，那么 RegExp() 构造函数将⽤与指定的RegExp 相同的模式和标志创建⼀个新的 RegExp 对象。

如果不⽤ new 运算符，⽽将 RegExp() 作为函数调⽤，那么它的⾏为与⽤ new 运算符调⽤时⼀样，只是当pattern是正则表达式时，它只返回pattern，⽽不再创建⼀个新的 RegExp 对象。

抛出SyntaxError - 如果pattern不是合法的正则表达式，或attributes含有 "g"、"i" 和 "m" 之外的字符，抛出该异常。

TypeError - 如果pattern是 RegExp 对象，但没有省略attributes参数，抛出该异常。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

QRegExp正则表达式
2010-03-20 17:00
"^\d+$" //非负整数（正整数 + 0）
"^[0-9]*[1-9][0-9]*$" //正整数
"^((-\d+)|(0+))$" //非正整数（负整数 + 0）
"^-[0-9]*[1-9][0-9]*$" //负整数
"^-?\d+$" //整数
"^\d+(\.\d+)?$" //非负浮点数（正浮点数 + 0）
"^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$" //正浮点数
"^((-\d+(\.\d+)?)|(0+(\.0+)?))$" //非正浮点数（负浮点数 + 0）
"^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-
9]*[1-9][0-9]*)))$" //负浮点数
"^(-?\d+)(\.\d+)?$" //浮点数
"^[A-Za-z]+$" //由26个英文字母组成的字符串
"^[A-Z]+$" //由26个英文字母的大写组成的字符串
"^[a-z]+$" //由26个英文字母的小写组成的字符串
"^[A-Za-z0-9]+$" //由数字和26个英文字母组成的字符串
"^\w+$" //由数字、26个英文字母或者下划线组成的字符串
"^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$" //email地址
"^[a-zA-z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$" //url
"^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$" // 年-月-日
"^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$" // 月/日/年
"^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(]?)$" //Email
"(d+-)?(d{4}-?d{7}|d{3}-?d{8}|^d{7,8})(-d+)?" //电话号码
"^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-
5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$"
//IP地址
^([0-9A-F]{2})(-[0-9A-F]{2}){5}$ //MAC地址的正则表达式
^[-+]?\d+(\.\d+)?$ //值类型正则表达式
QRegExp是Qt的正则表达式类.
Qt中有两个不同类的正则表达式.
第一类为元字符.它表示一个或多个常量表达式.
令一类为转义字符,它代表一个特殊字符.
一.元字符
. 匹配任意单个字符.例如, 1.3 可能是1. 后面跟任意字符,再跟3
^ 匹配字符串首. 例如, ^12可能是123,但不能是312
$ 配字符串尾. 例如, 12$可以是312, 当不能是 123
[] 匹配括号内输入的任意字符.[123]可以为1, 2 或3
* 匹配任意数量的前导字符. 例如, 1*2可以为任意数量个1(甚至没有), 后面跟一个2
+ 匹配至少一个前导字符. 例如, 1+2必须为一个或多个1, 后跟一个2
? 匹配一个前导字符或为空. 例如 1?2可以为2或这12
二.统配模式
通过 QRegExp::setPatternSyntax(QRegExp::Wildcard);可以将元字符设置为统配模式.在统配模式下,只有3个元字符可以使用.他们的功能没有变化.
? 匹配任意单个字符, 例如, 1?2可以为1,后面跟任意单个字符, 再跟2
* 匹配任意一个字符序列. 例如, 1*2, 可以为1, 后面跟任意数量的字符, 再跟一个2
[] 匹配一个定义的字符集合. 例如, [a-zA-Z\.]可以匹配 a到z之间任意一个字符和. [^a]匹配出小写a以外的字符.
三.转义序列
\. 匹配"."
\^ 匹配"^"
\$ 匹配"$"
\[ 匹配"["
\] 匹配"]"
\* 匹配"*"
\+ 匹配"+"
\? 匹配"?"
\b 匹配响铃字符,使计算机发出嘟的一声.
\t 制表符号
\n 换行符号
\r 回车符鉿
\s 任意空格
\xnn 匹配16进制为nn的字符
\0nn 匹配8进制的nn字符
这些表达式均以\开始, 与C++的转义字符相同,所以为了定义QRegExp中的一个转义序列,
需要在前面添加两个\\
引言
正则表达式（regular expression）就是用一个“字符串”来描述一个特征，然后去验证另一个“字符串”是否符合这个特征。

比如表达式“ab+” 描述的特征是“一个'a' 和任意个'b'
匹配正浮点数
^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$匹配非正浮点数（负浮点数+ 0）
^((-\d+(\.\d+)?)|(0+(\.0+)?))$
匹配负浮点数
^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$匹配浮点数
^(-?\d+)(\.\d+)?$
匹配由26个英文字母组成的字符串
^[A-Za-z]+$
匹配由26个英文字母的大写组成的字符串
^[A-Z]+$
匹配由26个英文字母的小写组成的字符串
^[a-z]+$
匹配由数字和26个英文字母组成的字符串
^[A-Za-z0-9]+$
匹配由数字、26个英文字母或者下划线组成的字符串
^\w+$
匹配email地址
^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$
匹配url
^[a-zA-z]+://匹配(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$
匹配html tag
<\s*(\S+)(\s[^>]*)?>(.*?)<\s*\/\1\s*>。