java正则表达式替换字符串

正则表达式

1.验证用户名和密码：（"^[a-zA-Z]\w{5,15}$"）正确格式："[A-Z][a-z]_[0-9]"组成,并且第一个字必须为字母6~16位； 2.验证电话号码：（"^(\d{3,4}-)\d{7,8}$"）正确格式：xxx/xxxx-xxxxxxx/xxxxxxxx； 3.验证手机号码："^1[3|4|5|7|8][0-9]\\d{8}$"； 4.验证身份证号（15位或18位数字）："\d{14}[[0-9],0-9xX]"； 5.验证Email地址：("^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$")； 6.只能输入由数字和26个英文字母组成的字符串：("^[A-Za-z0-9]+$")； 7.整数或者小数：^[0-9]+([.][0-9]+){0,1}$ 8.只能输入数字："^[0-9]*$"。 9.只能输入n位的数字："^\d{n}$"。 10.只能输入至少n位的数字："^\d{n,}$"。 11.只能输入m~n位的数字："^\d{m,n}$"。 12.只能输入零和非零开头的数字："^(0|[1-9][0-9]*)$"。 13.只能输入有两位小数的正实数："^[0-9]+(\.[0-9]{2})?$"。 14.只能输入有1~3位小数的正实数："^[0-9]+(\.[0-9]{1,3})?$"。 15.只能输入非零的正整数："^\+?[1-9][0-9]*$"。 16.只能输入非零的负整数："^\-[1-9][0-9]*$"。 17.只能输入长度为3的字符："^.{3}$"。 18.只能输入由26个英文字母组成的字符串："^[A-Za-z]+$"。 19.只能输入由26个大写英文字母组成的字符串："^[A-Z]+$"。 20.只能输入由26个小写英文字母组成的字符串："^[a-z]+$"。 21.验证是否含有^%&',;=?$\"等字符："[%&',;=?$\\^]+"。 22.只能输入汉字："^[\u4e00-\u9fa5]{0,}$"。 23.验证URL："^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$"。 24.验证一年的12个月："^(0?[1-9]|1[0-2])$"正确格式为："01"～"09"和"10"～"12"。 25.验证一个月的31天："^((0?[1-9])|((1|2)[0-9])|30|31)$"正确格式为；"01"～"09"、"10"～"29"和“30”~“31”。 26.获取日期正则表达式：\\d{4}[年|\-|\.]\d{\1-\12}[月|\-|\.]\d{\1-\31}日? 评注：可用来匹配大多数年月日信息。 27.匹配双字节字符(包括汉字在内)：[^\x00-\xff] 评注：可以用来计算字符串的长度（一个双字节字符长度计2，ASCII字符计1） 28.匹配空白行的正则表达式：\n\s*\r 评注：可以用来删除空白行 29.匹配HTML标记的正则表达式：<(\S*?)[^>]*>.*?|<.*? /> 评注：网上流传的版本太糟糕，上面这个也仅仅能匹配部分，对于复杂的嵌套标记依旧无能为力 30.匹配首尾空白字符的正则表达式：^\s*|\s*$

正则表达式

本文分十四个类别对正则表达式的意义进行了解释，这十四各类别是：字符/字符类/预定义字符类/POSIX字符类/https://www.360docs.net/doc/d014009308.html,ng.Character类/Unicode块和类别的类/边界匹配器/Greedy数量词/Reluctant数量词/Possessive数量词/Logical运算符/Back引用/引用/特殊构造。 1.1.字符 x 字符 x。例如a表示字符a \\ 反斜线字符。在书写时要写为\\\\。（注意：因为java在第一次解析时把\\\\解析成正则表达式\\，在第二次解析时再解析为\，所以凡是不是1.1列举到的转义字符，包括1.1的\\,而又带有\的都要写两次） \0n 带有八进制值 0的字符 n (0 <= n <= 7) \0nn 带有八进制值 0的字符 nn (0 <= n <= 7) \0mnn 带有八进制值 0的字符 mnn（0 <= m <= 3、0 <= n <= 7） \xhh 带有十六进制值 0x的字符 hh \uhhhh 带有十六进制值 0x的字符 hhhh \t 制表符 ('\u0009') \n 新行（换行）符 ('\u000A') \r 回车符 ('\u000D') \f 换页符 ('\u000C') \a 报警 (bell) 符 ('\u0007') \e 转义符 ('\u001B') \cx 对应于 x 的控制符 1.2.字符类 [abc] a、b或 c（简单类）。例如[egd]表示包含有字符e、g或d。 [^abc] 任何字符，除了 a、b或 c（否定）。例如[^egd]表示不包含字符e、g或d。 [a-zA-Z] a到 z或 A到 Z，两头的字母包括在内（范围） [a-d[m-p]] a到 d或 m到 p：[a-dm-p]（并集） [a-z&&[def]] d、e或 f（交集） [a-z&&[^bc]] a到 z，除了 b和 c：[ad-z]（减去） [a-z&&[^m-p]] a到 z，而非 m到 p：[a-lq-z]（减去） 1.3.预定义字符类(注意反斜杠要写两次，例如\d写为\\d) . 任何字符（与行结束符可能匹配也可能不匹配） \d 数字：[0-9] \D 非数字： [^0-9] \s 空白字符：[ \t\n\x0B\f\r] \S 非空白字符：[^\s] \w 单词字符：[a-zA-Z_0-9] \W 非单词字符：[^\w] 1.4.POSIX 字符类（仅 US-ASCII)(注意反斜杠要写两次，例如\p{Lower}写为\\p{Lower})

正则表达式

[23:39:35] 王尧说："^\d+$"//非负整数（正整数+ 0） "^[0-9]*[1-9][0-9]*$"//正整数 "^((-\d+)|(0+))$"//非正整数（负整数+ 0） "^-[0-9]*[1-9][0-9]*$"//负整数 "^-?\d+$"//整数 "^\d+(\.\d+)?$"//非负浮点数（正浮点数+ 0） "^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$"//正浮点数 "^((-\d+(\.\d+)?)|(0+(\.0+)?))$"//非正浮点数（负浮点数+ 0） "^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$"//负浮点数 "^(-?\d+)(\.\d+)?$"//浮点数 "^[A-Za-z]+$"//由26个英文字母组成的字符串 "^[A-Z]+$"//由26个英文字母的大写组成的字符串 "^[a-z]+$"//由26个英文字母的小写组成的字符串 "^[A-Za-z0-9]+$"//由数字和26个英文字母组成的字符串 "^\w+$"//由数字、26个英文字母或者下划线组成的字符串 "^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$"//email地址 "^[a-zA-z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$"//url /^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$/ //年-月-日 /^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$/ //月/日/年 ^(\w+((-\w+)|(\.\w+))*)\+\w+((-\w+)|(\.\w+))*\@[A-Za-z0-9]+((\.|-)[A-Za-z0-9]+)*\.[A-Za-z0-9]+$ //Emil "(d+-)?(d{4}-?d{7}|d{3}-?d{8}|^d{7,8})(-d+)?" //电话号码 "^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1, 2}|1dd|2[0-4]d|25[0-5])$" //IP地址匹配中文字符的正则表达式：[\u4e00-\u9fa5] 匹配双字节字符(包括汉字在内)：[^\x00-\xff] 匹配空行的正则表达式：\n[\s| ]*\r 匹配HTML标记的正则表达式：/<(.*)>.*<\/\1>|<(.*) \/>/ 匹配首尾空格的正则表达式：(^\s*)|(\s*$) 匹配Email地址的正则表达式：^(\w+((-\w+)|(\.\w+))*)\+\w+((-\w+)|(\.\w+))*\@[A-Za-z0-9]+((\.|-)[A-Za-z0-9]+)*\.[A-Za-z0-9]+$ 匹配网址URL的正则表达式：^[a-zA-z]+://(\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\S*)?$ 匹配帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 匹配国内电话号码：(\d{3}-|\d{4}-)?(\d{8}|\d{7})? 匹配腾讯QQ号：^[1-9]*[1-9][0-9]*$ 漢字 Private Ps_KanjiRegex As String = "\u00A0-\u303F\u3200-\u33CF\u4E00-\uFF60\uFFA0-\uFFE5" ''入力可能漢字のコード（正規表現チェック用）

正则表达式快速记忆法

要想学会正则表达式，理解元字符是一个必须攻克的难关。不用刻意记 .：匹配任何单个字符。例如正则表达式“b.g”能匹配如下字符串：“big”、“bug”、“bg”，但是不匹配“buug”，“b..g”可以匹配“buug”。 [ ] ：匹配括号中的任何一个字符。例如正则表达式“b[aui]g”匹配bug、big和bag，但是不匹配beg、baug。可以在括号中使用连字符“-”来指定字符的区间来简化表示，例如正则表达式[0-9]可以匹配任何数字字符，这样正则表达式“a[0-9]c”等价于“a[0123456789]c”就可以匹配“a0c”、“a1c”、“a2c”等字符串；还可以制定多个区间，例如“[A-Za-z]”可以匹配任何大小写字母，“[A-Za-z0-9]”可以匹配任何的大小写字母或者数字。 ( ) ：将()之间括起来的表达式定义为“组”(group)，并且将匹配这个表达式的字符保存到一个临时区域,这个元字符在字符串提取的时候非常有用。把一些字符表示为一个整体。改变优先级、定义提取组两个作用。 | ：将两个匹配条件进行逻辑“或”运算。 'z|food'能匹配"z"或"food"。'(z|f)ood'则匹配"zood"或"food"。 *：匹配0至多个在它之前的子表达式，和通配符*没关系。例如正则表达式“zo*”能匹配“z”、“zo”以及“zoo”；因此“.*”意味着能够匹配任意字符串。"z(b|c)*"→zb、zbc、zcb、zccc、zbbbccc。"z(ab)*"能匹配z、zab、zabab（用括号改变优先级）。 + ：匹配前面的子表达式一次或多次，和*对比（0到多次）。例如正则表达式9+匹配9、99、999等。“zo+”能匹配“zo”以及“zoo”，不能匹配"z"。 ? ：匹配前面的子表达式零次或一次。例如，"do(es)?"可以匹配"do"或"does"。一般用来匹配“可选部分”。 {n} ：匹配确定的n次。 "zo{2}"→zoo。例如，“e{2}”不能匹配“bed”中的“e”，但是能匹配“seed”中的两个“e”。 {n,} :至少匹配n次。例如，“e{2,}”不能匹配“bed”中的“e”，但能匹配“seeeeeeeed”中的所有“e”。 {n,m}：最少匹配n次且最多匹配m次。 “e{1,3}”将匹配“seeeeeeeed”中的前三个“e” ^（shift+6）：匹配一行的开始。例如正则表达式“^regex”能够匹配字符串“regex我会用”的开始，但是不能匹配“我会用regex”。 ^另外一种意思：非！（暂时不用理解） $ ：匹配行结束符。例如正则表达式“浮云$”能够匹配字符串“一切都是浮云”的末尾，但是不能匹配字符串“浮云呀”

字符串处理常用方法

C# string类应用判断是否包含子串想要判断一个字符串中是否包含某个子串，可以用Contains方法来实现： public bool Contains (string value) 参数value为待判定的子串。如果包含，返回true；否则返回false。下面的代码判断“Hello”中是否包含两个子串。 1.bool b1 = strA.Contains("ll"); //true 2.Bool b1=strA.Contains("MM"); //false 4.1.4 定位字符和子串定位子串是指在一个字符串中寻找其中包含的子串或者某个字符。在String类中，常用的定位子串和字符的方法包括IndexOf/LastIndexOf及IndexOfAny/LastIndexOfAny，下面进行详细介绍。 1．IndexOf/LastIndexOf IndexOf方法用于搜索在一个字符串中，某个特定的字符或者子串第一次出现的位置，该方法区分大小写，并从字符串的首字符开始以0计数。如果字符串中不包含这个字符或子串，则返回-1。常用的重载形式如下所示。（1）定位字符 int IndexOf(char value) int IndexOf(char value, int startIndex)

int IndexOf(char value, int startIndex, int count) （2）定位子串： int IndexOf(string value) int IndexOf(string value, int startIndex) int IndexOf(string value, int startIndex, int count) 在上述重载形式中，其参数含义如下： value：待定位的字符或者子串。 startIndex：在总串中开始搜索的其实位置。 count：在总串中从起始位置开始搜索的字符数。下面的代码在“Hello”中寻找字符…l?第一次出现的位置。代码4-7 使用IndexOf寻找字符第一次出现位置：Default.aspx.cs 1. String s=”Hello”; 2. int I = s.IndexOf(…l?)); //2 同IndexOf类似，LastIndexOf用于搜索在一个字符串中，某个特定的字符或者子串最后一次出现的位置，其方法定义和返回值都与IndexOf相同，不再赘述。 2．IndexOfAny/LastIndexOfAny IndexOfAny方法功能同IndexOf类似，区别在于，它可以搜索在一个字符串中，出现在一个字符数组中的任意字符第一次出现的位置。同样，该方法区分大小写，并从字符串的首字符开始以0计数。如果字符串中不包含这个字符或子串，则返回-1。常用的IndexOfAny 重载形式有3种：

C_字符串处理：截取、替换、移除

C#字符串处理系列之——裁剪，替换，移除问题1：我想删除字符串中指定的字符。解答：技巧性的方法，用Replace（）。例如：string str = " how are you ! "。现在我们删除它中间的空格，则str = str.Replace（" ",""）。懂了吧，把要删除的字符替换成""就OK了！问题2：我想删除字符串开头和结尾的空格。解答：用Trim（）系列。Trim（char a）删除字符串开头和结尾的字符a，TrimEnd（char a）删除结尾的，TrimStart(char a )删除开头的。若不指定a，即Trim（），TrimEnd（），TrimStart（）则表示删除空格。问题3：我想移除某段字符串。解答：用Remove(int n1,int n2),其中n1指索引位置，n2指长度。例如：string str = "how are you ! "，str1 = str.Remove(1,2),则str1 = "h are you ! "。问题4：我想删除字符串中一系列的字符，难道要用一系列的Replace或者用一系列的Trim吗？解答：1.如果要移除字符串开头或者结尾处的一系列字符，那么可以使用到ToCharArray （），因为 Trim()系列提供了两种方法，Trim(char a),Trim(char [])。例如：string str = "how are you ! "，现在我想删除str开头和结尾的所有'h','!','u','a'那么我可以这样写 str1 = str.Trim("h!au".ToCharArray(),""); 2.如果要删除字串中一系列的字符，无论这些字符在开头，结尾，还是在中间，都一律删除，用个for循环就行了。还是上例。我们这样写，string c = "h!ua"; for(int i =0;i

常用正则表达式字符及其含义

1. [……] : 匹配括号中的任何一个字符. [^……] : 匹配不在括号中的任何一个字符. \w : 匹配任何一个字符（a~z , A~Z , 0~9）. \W : 匹配任何一个空白字符. \s : 匹配任何一个非空白字符. \S : 与任何非单词字符匹配. \d : 匹配任何一个数字. \D : 匹配任何一个非数字. [\b] : 匹配一个退格键字母. {n,m} : 最少匹配前面表达式n次，最大为m次. {n,} : 最少匹配前面表达式n次. {n} : 恰好匹配前面表达式为n次. ? : 匹配前面表达式0或1 次{0,1} + : 至少匹配前面表达式1 次{1,} * : 至少匹配前面表达式0次{0,} | : 匹配前面表达式或后面表达式. (…) : 在单元中组合项目. ^ : 匹配字符串的开头. $ : 匹配字符串的结尾. \b : 匹配字符边界. \B : 匹配非字符边界的某个位置.

2．举几个常用的正则表达式：（1）验证电子邮件. \w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)* 或 \S+@\S+\ .\S+ (2) 验证网址： HTTP://\S+\ .\S+ : 验证网址为大写字母 . http://\S+\ . \S + : 验证网址为小写字母. (3) 验证邮政编码： \d{6} (4) 其他 [0-9] : 表示0~9 十个数字. \d* : 表示任意个数字. \d{3,4}-\d{7,8} : 表示中国大陆的固定电话号码. \d{2}-\d{5} : 验证由两位数字. 一个连字符再加5位数字组成的ID号. <\s*(\S+)(\s[^>]*)?>[\s\S]*<\s*\/\1\s*> : 匹配HTML标记.

正则表达式语法及常用规则

正则表达式语法正则表达式是一种文本模式，包括普通字符（例如，a 到 z 之间的字母）和特殊字符（称为“元字符”）。模式描述在搜索文本时要匹配的一个或多个字符串。正则表达式示例

常用正则表达式：整数或者小数：^[0-9]+\.{0,1}[0-9]{0,2}$只能输入数字："^[0-9]*$"。只能输入n位的数字："^\d{n}$"。只能输入至少n位的数字："^\d{n,}$"。只能输入m~n位的数字：。"^\d{m,n}$"

只能输入零和非零开头的数字："^(0|[1-9][0-9]*)$"。只能输入有两位小数的正实数："^[0-9]+(.[0-9]{2})?$"。只能输入有1~3位小数的正实数："^[0-9]+(.[0-9]{1,3})?$"。只能输入非零的正整数："^\+?[1-9][0-9]*$"。只能输入非零的负整数："^\-[1-9][]0-9"*$。只能输入长度为3的字符："^.{3}$"。只能输入由26个英文字母组成的字符串："^[A-Za-z]+$"。只能输入由26个大写英文字母组成的字符串："^[A-Z]+$"。只能输入由26个小写英文字母组成的字符串："^[a-z]+$"。只能输入由数字和26个英文字母组成的字符串："^[A-Za-z0-9]+$"。只能输入由数字、26个英文字母或者下划线组成的字符串："^\w+$"。验证用户密码："^[a-zA-Z]\w{5,17}$"正确格式为：以字母开头，长度在6~18之间，只能包含字符、数字和下划线。验证是否含有^%&',;=?$\"等字符："[^%&',;=?$\x22]+"。只能输入汉字："^[\u4e00-\u9fa5]{0,}$" 验证Email地址："^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([- .]\w+)*$"。验证InternetURL："^http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?$"。验证电话号码："^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$"正确格式为："XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX"。验证11位的手机号：/^1[3|5][0-9]\d{4,8}$/ 验证身份证号（15位或18位数字）："^\d{15}|\d{18}$"。验证一年的12个月："^(0?[1-9]|1[0-2])$"正确格式为："01"～"09"和"1"～"12"。验证一个月的31天："^((0?[1-9])|((1|2)[0-9])|30|31)$"正确格式为；"01"～"09"和"1"～"31"。匹配中文字符的正则表达式： [\u4e00-\u9fa5]

三十分钟学会正则表达式

最重要的是——请给我30分钟，如果你没有使用正则表达式的经验，请不要试图在30秒内入门——除非你是超人 :) 别被下面那些复杂的表达式吓倒，只要跟着我一步一步来，你会发现正则表达式其实并没有你想像中的那么困难。当然，如果你看完了这篇教程之后，发现自己明白了很多，却又几乎什么都记不得，那也是很正常的——我认为，没接触过正则表达式的人在看完这篇教程后，能把提到过的语法记住80%以上的可能性为零。这里只是让你明白基本的原理，以后你还需要多练习，多使用，才能熟练掌握正则表达式。除了作为入门教程之外，本文还试图成为可以在日常工作中使用的正则表达式语法参考手册。就作者本人的经历来说，这个目标还是完成得不错的——你看，我自己也没能把所有的东西记下来，不是吗？清除格式文本格式约定：专业术语元字符/语法格式正则表达式正则表达式中的一部分(用于分析)对其进行匹配的源字符串对正则表达式或其中一部分的说明隐藏边注本文右边有一些注释，主要是用来提供一些相关信息，或者给没有程序员背景的读者解释一些基本概念，通常可以忽略。在编写处理字符串的程序或网页时，经常会有查找符合某些复杂规则的字符串的需要。正则表达式就是用于描述这些规则的工具。换句话说，正则表达式就是记录文本规则的代码。很可能你使用过Windows/Dos下用于文件查找的通配符(wildcard)，也就是*和?。如果你想查找某个目录下的所有的Word文档的话，你会搜索*.doc。在这里，*会被解释成任意的字符串。和通配符类似，正则表达式

也是用来进行文本匹配的工具，只不过比起通配符，它能更精确地描述你的需求——当然，代价就是更复杂——比如你可以编写一个正则表达式，用来查找所有以0开头，后面跟着2-3个数字，然后是一个连字号“-”，最后是7或8位数字的字符串(像或)。学习正则表达式的最好方法是从例子开始，理解例子之后再自己对例子进行修改，实验。下面给出了不少简单的例子，并对它们作了详细的说明。假设你在一篇英文小说里查找hi，你可以使用正则表达式hi。这几乎是最简单的正则表达式了，它可以精确匹配这样的字符串：由两个字符组成，前一个字符是h,后一个是i。通常，处理正则表达式的工具会提供一个忽略大小写的选项，如果选中了这个选项，它可以匹配 hi,HI,Hi,hI这四种情况中的任意一种。不幸的是，很多单词里包含hi这两个连续的字符，比如 him,history,high等等。用hi来查找的话，这里边的hi也会被找出来。如果要精确地查找hi这个单词的话，我们应该使用\bhi\b。 \b是正则表达式规定的一个特殊代码（好吧，某些人叫它元字符，metacharacter），代表着单词的开头或结尾，也就是单词的分界处。虽然通常英文的单词是由空格，标点符号或者换行来分隔的，但是\b并不匹配这些单词分隔字符中的任何一个，它只匹配一个位置。假如你要找的是hi后面不远处跟着一个Lucy，你应该用 \bhi\b.*\bLucy\b。这里，.是另一个元字符，匹配除了换行符以外的任意字符。*同样是元字符，不过它代表的不是字符，也不是位置，而是数量——它指定*前边的内容可以连续重复使用任意次以使整个表达式得到匹配。因此，.*连在一起就意味着任意数量的不包含换行的字符。现在\bhi\b.*\bLucy\b的意

删除字符串中所有给定的子串---已测试

1. 删除字符串中所有给定的子串（40分）问题描述：在给定字符串中查找所有特定子串并删除，如果没有找到相应子串，则不作任何操作。要求实现函数： int delete_sub_str(const char *str, const char *sub_str, char *result_str) 【输入】str：输入的被操作字符串 sub_str：需要查找并删除的特定子字符串【输出】result_str：在str字符串中删除所有sub_str子字符串后的结果【返回】删除的子字符串的个数注： I、子串匹配只考虑最左匹配情况，即只需要从左到右进行字串匹配的情况。比如：在字符串"abababab"中，采用最左匹配子串"aba",可以匹配2个"aba"字串。如果匹配出从左到右位置2开始的"aba"，则不是最左匹配，且只能匹配出1个"aba"字串。II、输入字符串不会超过100 Bytes，请不用考虑超长字符串的情况。示例输入：str = "abcde123abcd123" sub_str = "123" 输出：result_str = "abcdeabcd" 返回：2 输入：str = "abcde123abcd123" sub_str = "1234" 输出result_str = "abcde123abcd123" 返回：0 view plaincopy to clipboardprint? 01.#include 02.#include 03.#include 04. 05./*删除字串函数，在src中删除sub子串，并将结果保存在result字符串中*/ 06.int delSubStr(char * src,char * sub,char * result) 07.{ 08. char * src_p=src; 09. char * sub_p=sub; 10. char * res_p=result; 11. int count=0;//记录包含子串的个数 12. int sub_len=strlen(sub);//记录子串的长度 13. char * temp;//临时保存子串的副本 14. temp=(char *)malloc(sub_len+1); 15. memset(temp,'\0',sub_len+1); 16. while(*src_p) 17. { 18. memcpy(temp,src_p,sub_len); 19. 20. /*原串中包含与sub完全匹配的子串*/

正则表达式字符匹配

正则表达式字符匹配普通字符由所有那些未显式指定为元字符的打印和非打印字符组成。这包括所有的大写和小写字母字符，所有数字，所有标点符号以及一些符号。最简单的正则表达式是一个单独的普通字符，可以匹配所搜索字符串中的该字符本身。例如，单字符模式'A' 可以匹配所搜索字符串中任何位置出现的字母'A'。这里有一些单字符正则表达式模式的示例： /a/ /7/ /M/ 等价的VBScript 单字符正则表达式为： "a" "7" "M" 可以将多个单字符组合在一起得到一个较大的表达式。例如，下面的JScript 正则表达式不是别的，就是通过组合单字符表达式'a'、'7'以及'M' 所创建出来的一个表达式。 /a7M/ 等价的VBScript 表达式为： "a7M" 请注意这里没有连接操作符。所需要做的就是将一个字符放在了另一个字符后面。特殊字符有不少元字符在试图对其进行匹配时需要进行特殊的处理。要匹配这些特殊字符，必须首先将这些字符转义，也就是在前面使用一个反斜杠(/)。下表给出了这些特殊字符及其含义：

非打印字符有不少很有用的非打印字符，偶尔必须使用。下表显示了用来表示这些非打印字符的转义序列：字符匹配

句点(.) 匹配一个字符串中任何单个的打印或非打印字符，除了换行符(/n) 之外。下面的JScript 正则表达式可以匹配'aac'、'abc'、'acc'、'adc'如此等等，同样也可以匹配'a1c'、'a2c'、a-c'以及a#c'： /a.c/ 等价的VBScript 正则表达式为： "a.c" 如果试图匹配一个包含文件名的字符串，其中句点(.) 是输入字符串的一部分，则可以在正则表达式中的句点前面加上一个反斜杠(/) 字符来实现这一要求。举例来说，下面的JScript 正则表达式就能匹配'filename.ext'： /filename/.ext/ 对VBScript 而言，等价的表达式如下所示： "filename/.ext" 这些表达式仍然是相当有限的。它们只允许匹配任何单字符。很多情况下，对从列表中匹配特殊字符十分有用。例如，如果输入文字中包含用数字表示为Chapter 1, Chapter 2诸如此类的章节标题，你可能需要找到这些章节标题惊悚乐园。括号表达式可以在一个方括号([ 和]) 中放入一个或多个单字符，来创建一个待匹配的列表。如果字符被放入括号中括起来，则该列表称为括号表达式。括号内和其他任何地方一样，普通字符代表其本身，也就是说，它们匹配输入文字中出现的一处自己。大多数特殊字符在位于括号表达式中时都将失去其含义。这里有一些例外： ?']' 字符如果不是第一项，则将结束一个列表。要在列表中匹配']' 字符，请将其放在第一项，紧跟在开始的'[' 后面。 ?'/' 仍然作为转义符。要匹配'/' 字符，请使用'//'。括号表达式中所包含的字符只匹配该括号表达式在正则表达式中所处位置的一个单字符。下面的JScript 正则表达式可以匹配'Chapter 1'、'Chapter 2'、'Chapter 3'、'Chapter 4' 以及'Chapter 5'：

替换字符串中指定字符

C语言实现：替换字符串中指定字符不用多介绍了，可以在LoadRunner里直接使用，挺好的！ int ReplaceStr(char* sSrc, char* sMatchStr, char* sReplaceStr) { int StringLen; char caNewString[64]; char* FindPos; FindPos =(char*)strstr(sSrc, sMatchStr); if( (!FindPos) || (!sMatchStr) ) return-1; while( FindPos ) { memset(caNewString, 0, sizeof(caNewString)); StringLen = FindPos - sSrc; strncpy(caNewString, sSrc, StringLen); strcat(caNewString, sReplaceStr); strcat(caNewString, FindPos + strlen(sMatchStr)); strcpy(sSrc, caNewString); FindPos =(char*)strstr(sSrc, sMatchStr); } free(FindPos); return0; } 譬如：ReplaceStr("abcd-efgh-ijklm-nopq","-","");//把字符串中的“-”删除掉！ #include #include main() { int n,i,k; for(n=100;n>0;n--) { k=sqrt(n); for(i=2;i<=k;i++) if(n%i==0) break; if(i>k) {

正则表达式和字符串处理(全)

正则表达式和字符串处理(全) 第一章正则表达式概述正则表达式(Regular Expression)起源于人类神经系统的研究。正则表达式的定义有以下几种： ●用某种模式去匹配一类字符串的公式，它主要是用来描述字符串匹配的工具。 ●描述了一种字符串匹配的模式。可以用来检查字符串是否含有某种子串、将匹配的子串做替换或者从中取出符合某个条件的子串等。 ●由普通字符(a-z)以及特殊字符（元字符）组成的文字模式，正则表达式作为一个模版，将某个字符模式与所搜索的字符串进行匹配。 ●用于描述某些规则的的工具。这些规则经常用于处理字符串中的查找或替换字符串。也就是说正则表达式就是记录文本规则的代码。 ●用一个字符串来描述一个特征，然后去验证另一个字符串是否符合这个特征。以上这些定义其实也就是正则表达式的作用。第二章正则表达式基础理论这些理论将为编写正则表达式提供法则和规范，正则表达式主要包括以下基础理论： ●元字符 ●字符串 ●字符转义 ●反义 ●限定符 ●替换 ●分组 ●反向引用 ●零宽度断言 ●匹配选项 ●注释 ●优先级顺序 ●递归匹配 2．1 元字符在正则表达式中，元字符（Metacharacter）是一类非常特殊的字符，它能够匹配一个位置或字符集合中的一个字符，如：、 \w等。根据功能，元字符可以分为两种类型：匹配位置的元字符和匹配字符的元字符。 2．1．1 匹配位置的元字符包括：^、$、和\b。其中^（脱字符号）和$（美元符号）都匹配一个位置，分别匹配行的开始和结尾。比如，^string匹配以string开头的行，string$匹配以string结尾的行。^string$匹配以string开始和结尾的行。单个$匹配一个空行。单个^匹配任意行。\b匹配单词的开始和结尾，如：\bstr匹配以str开始的单词，但\b不匹配空格、标点符号或换行符号，所以，

删除指定字符1-19

1、(1) 0 (2) i++ (3)2.0*i (1)void fun ( char *s , char *t ) (2)t[2*d]='\0'; 除了下标为奇数ASCII值也为奇数的字符外，其他删除 void fun(char *s, char t[]) {int i,j=0,n; n=strlen(s); for(i=0;i=num) (2)t=s/n; 删除字符串中指定下标的字符 void fun (char a[], char b[], int n) {int i,k=0; for(i=0;a[i]!='\0';i++) if(i!=n) b[k++]=a[i]; b[k]='\0'; } 3(1)0 (2)|| (3)1 (1)t-=1.0/i; (2)return t; 删除字符串中所有空格 void fun (char *str) {int i=0; char *p=str; while(*p) {if(*p!=' ') { str[i]=*p; i++;} p++; } str[i]='\0'; } 4(1)1 (2) j++ (3)j (1)t=a;a=b;b=t; (2)return(b); 删除字符串中所有*号 void fun( char *a ) {int i,j=0; for(i=0;a[i]!='\0';i++) if(a[i]!='*') a[j++]=a[i]; a[j]='\0';} 5(1)N (2)i (3) -1 (1)a2=k/10; (2)return i; 删除字符串尾部的*号，其余不动 void fun( char *a ) {while(*a!='\0') a++; a--; while(*a=='*') a--; *(a+1)='\0'; } 7(1) a[i]%2 (2) a[j] (3) j (1)int fun (int n) (2)if (n==1) 字符串中尾部的*号不多于n个，多则删 void fun( char *a,int n ) {int i=0,k=0;char *p, *t; p=t=a; while(*t) t++; t--; while(*t=='*') if(k>n) {while(*p&&p0.001) 除了前导与尾部*，其它删 void fun( char *a, char *h,char *p ) { int i=0; char *q=a; while(qa[mid]) 除了尾部*号，其他删除 void fun( char *a, char *p ) {char *t=a; for(;t<=p;t++) if(*t!='*') *(a++)=*t; for(;*t!='\0';t++) *(a++)=*t; *a='\0';} 13(1) N (2) substr (3) 0 (1)fun(int x,int y, int z) (2)return j; 只删除字符前导和尾部*号 void fun( char *a, int n,int h,int e ) {int i,j=0; for(i=h;in) { while(*p) { a[i]=*(p+k-n); i++; p++;} a[i]='\0';}} 17(1)data (2) next (3) head

正则表达式是一个描述字符模式的对象。

正则表达式是一个描述字符模式的对象。 javascript的RegExp对象和String对象定义了使用正则表达式来执行强大的模式匹配和文本检索与替换函数的方法. 在javascript中,正则表达式是由一个RegExp对象表示的.当然,可以使用一个RegExp()构造函数来创建RegExp对象,也可以用javascript 1.2中的新添加的一个特殊语法来创建RegExp对象.就像字符串直接量被定义为包含在引号内的字符一样,正则表达式直接量也被定义为包含在一对斜杠(/)之间的字符.所以,javascript可能会包含如下的代码: var pattern = /s$/; 这行代码创建一个新的RegExp对象,并将它赋给变量parttern.这个特殊的RegExp对象和所有以字母"s"结尾的字符串都匹配.用RegExp()也可以定义一个等价的正则表达式,代码如下: var pattern = new RegExp("s$"); 无论是用正则表达式直接量还是用构造函数RegExp(),创建一个RegExp对象都是比较容易的.较为困难的任务是用正则表达式语法来描述字符的模式.javascript采用的是Perl语言正则表达式语法的一个相当完整的子集. 正则表达式的模式规范是由一系列字符构成的.大多数字符(包括所有字母数字字符)描述的都是按照字面意思进行匹配的字符.这样说来,正则表达式 /java/就和所有包含子串 "java" 的字符串相匹配.虽然正则表达式中的其它字符不是按照字面意思进行匹配的,但它们都具有特殊的意义.正则表达式 /s$/ 包含两个字符. 第一个特殊字符 "s" 是按照字面意思与自身相匹配.第二个字符 "$" 是一个特殊字符,它所匹配的是字符串的结尾.所以正则表达式 /s$/ 匹配的就是以字母 "s" 结尾的字符串.