4第四章 字符串 (String)

合集下载

严蔚敏数据结构-第四章 串

严蔚敏数据结构-第四章 串
S1 4 a b c d S2 2 e f T 6 a b c d e f
15
(2)S1串长 最大串长 串长<最大串长 串长 最大串长; S1,S2串长和 最大串长 串长和>最大串长 串长和 最大串长;
S1 6 a b c d e f S2 6 g h i j k l T 8 a b c d e f g h
3
串的抽象数据类型的定义: 串的抽象数据类型的定义: ADT String{ 数据对象: 数据对象:D={ai|ai∈CharacterSet, i=1,2,...,n, n>=0} 数据关系: 数据关系:R1={<ai-1,ai>|ai-1,ai∈D, i=2,...,n} 基本操作: 基本操作: StrAssign(&T, chars)
11
作业: 作业: 1.用5种串的基本操作(StrAssign、StrCompare、StrLen Concat、SubString)来逻辑实现StrInsert(&S, pos, T)操作 、 操作. )
Status StrInsert(String S, int pos , String T) { if ……….. return error; , , ); ); ); );
chars是字符串常量。生成一个其值等于chars的串 。 是字符串常量。生成一个其值等于 的串T。 是字符串常量 的串
StrCopy(&T, S)
存在则由串S复制得串 串S存在则由串 复制得串 存在则由串 复制得串T
StrEmpty(S)
存在则若S为空串 串S存在则若 为空串 返回真否则返回假 存在则若 为空串,返回真否则返回假
Sub返回串 的第pos个字符起长度为 返回串S的第 个字符起长度为len的子串 用Sub返回串S的第pos个字符起长度为len的子串

第4章 字符串v

第4章 字符串v

空串: 空串: 长度为0的字符串 的字符串; 长度为 的字符串; 空格串: 空格串: 由空格字符组成的字符串,长度>1 由空格字符组成的字符串,长度 主串: 主串: 包含该子串的字符串; 包含该子串的字符串; 字符的位置: 字符的位置: 从1开始 开始 子串的位置: 子串的位置: 该子串第一个字符的位置
定长顺序存储标识串的实际长度时可有三种方式: 定长顺序存储标识串的实际长度时可有三种方式:
(1)用一个指针指向最后一个字符,串描述类似顺序表 用一个指针指向最后一个字符, 用一个指针指向最后一个字符 #define MAXSIZE 256 typedef struct { char data[MAXSIZE]; int curlen; }SeqString; 定义一个串变量:SeqString s; 定义一个串变量
1.串的 定长 顺序存储 串的(定长 串的 定长)顺序存储
(定长 顺序存储结构类似于C语言的字符数组,以一 定长)顺序存储结构类似于 语言的字符数组, 定长 顺序存储结构类似于 语言的字符数组 组地址连续的存储单元存放串值中的字符序列, 组地址连续的存储单元存放串值中的字符序列,定长即是预 先为每一个串变量分配一个固定长度的存储区,例如: 先为每一个串变量分配一个固定长度的存储区,例如: #define MAXSIZE 256 char s[MAXSIZE] 那么,串的最大长度就不能超过 那么,串的最大长度就不能超过256。 。
第4章 串 章
4.1 字符串的基本概念
4. 2 串的存储结构
4.3 模式匹配
(1) 串的基本概念
串(string)是由零个或多个任意字符组成的字符序列, )是由零个或多个任意字符组成的字符序列, 又称为字符串( 又称为字符串(character string),一般记为: ) 一般记为: s=〝a1 a2 a3 … an〞

第4章 C++ 标准库STL string类

第4章 C++ 标准库STL string类



String的第一个下标为0,最后一个为length-1
5
第4章 String类与字符串流处理
C++标准库中的String类
String的特性 String的构造函数, 求属性函数 String的赋值,连接,比较,子串,交换 String的查找,替换,插入 String到 char *的转换 String迭代器
21
第4章 String类与字符串流处理
C++标准库中的String类
String的特性 String的构造函数, 求属性函数 String的赋值,连接,比较,子串,交换 String的查找,替换,插入 String到 char *的转换 String迭代器
22
String到 char *的转换
I1指向第一个字符
26
符的起始下标, 此刻为0 („c‟ 出现)
s3.find_last_not_of(“spqtw”) –在s3中从0下标开始向后 末次出现 “spqtw”5个字符中任意一个字 符的起始下标, 此刻为5 („a‟ 出现)
19
String的查找,替换,插入
String s1(“cat”), s2(“cap”), s3(“cap cat ”)
s2=s2+ “ is good! ” --- s2: cap is good! s1.append( “ is white”) ---s1: cat is white s3.append(s2, 3, s2.size()) ---s3: pat is good!
13
String的比较
String s1(“cat”), s2(“cap”), s3(“cat cap”) if (s1==s2) cout<<“true”; else cout<<“false”‟ ---false

(个人收集学习笔记)4字符串处理与正则表达式

(个人收集学习笔记)4字符串处理与正则表达式

(个人收集学习笔记)4字符串处理与正则表达式第四章字符串处理与正则表达式一、字符串处理介绍1、如果字符串处理函数和正则表达式都可以实现字符串操作,建议使用字符串处理函数,因为效率高。

2、因为PHP 是弱类型语言,所以其他类型的数据一般都可以直接应用于字符串操作函数里,而自动转换成字符串类型进行处理。

3、还可以将字符串视为数组,或当作字符集合来看待。

$str[0]$str{0}二、常用的字符串输出函数1、echo()函数:使用它的效率要比其他字符串输出函数高。

2、print()函数:功能和echo()一样,但它有返回值,成功返回1,不成功返回0。

3、die()函数:exit()函数的别名。

1)参数如果是字符串,则该函数会在退出前输出它。

2)如果参数是一个整数,这个值会被用做退出状态。

值在0-254之间,退出状态255由PHP 保留,不会使用。

状态0用于成功终止程序。

4、printf():用于输出格式化字符串。

1)例子:printf(“%s age is $d”,$str,$num);2)%d :带符号十进制数%u :无符号十进制数%f :浮点数%s :字符串%b :二进制数%c :依照ASCII 值的字符%%:返回百分比符号%o :八进制数%x :十六进制数(小写字母)%X :十六进制数(大写字母)3)如果%符号多于arg 参数,则必须使用占位符。

占位符被插入到%符号之后,由数字和\$组成。

如:printf(“The %2\$s book contains %1\$d pages.That’s a nice %2\$s full of %1\$d pages”,$num,$str);%2\$s 代表$str 。

5、sprintf()函数:用法和printf()一样,但它不是输出字符串,而是把格式化的字符串以返回值的形式写入到一个变量中。

三、常用的字符串格式化函数字符串的格式化就是将字符串处理为某种特定的格式。

第四章 串

第四章 串
主串S首次出现的位置;否则返回0
– 例如
• 主串S = • 子串T = CD • 则index(S,T),返回子串T在S中,第一次出现的位置3
19
串的模式匹配
Brute-Force算法基本思想: • 从目标串s 的第一个字符起和模式串t的第一个字符进行比较 • 若相等,则继续逐个比较后续字符,否则从串s 的第二个字 符起再重新和串t进行比较。 • 依此类推,直至串t 中的每个字符依次和串s的一个连续的字 符序列相等,则称模式匹配成功,此时串t的第一个字符在串s 中的位置就是t 在s中的位置,否则模式匹配不成功。
两式联立可得:“T0…Tk-1”= “Tj-k…Tj-1”
注意:j为当前已知的失配位置,我们的目标是计算新起点k。式中仅剩 一个未知数k,理论上已可解!
奇妙的结果:k仅与模式串T有关!
27
新起点k怎么求?
根据模式串T的规律:“T0…Tk-1”=“Tj-k …Tj-1” 由当前失配位置j(已知),归纳计算新起点k的表达式。
j=next[j]的位置(即模式串继续向右移动),再比较 si 和 tj 。
依次类推,直到下列两种情况之一: 1)j退回到某个j=next[j]时有 si = tj,则指针各增1,继续匹配; 2)j退回至j=0,此时令指针各增1,即下一次比较 si+1和 t0 。
30
串的模式匹配:KMP算法
• 模式串的next函数
6
串的基本概念
4.两个字符串相等的充分必要条件为两个字符串的长度相等,并 且对应位置上的字符相等。
例如:‘abcd’ ≠ ‘bacd’ ‘abcd’ = ‘abcd’
7
串的基本操作
1.给串变量赋值 ASSIGN(S1,S2)

数据结构中的串

数据结构中的串
if(pos>=0) { n=StrLength(S); m=StrLength(T); i=pos; while ( i<=n-m ) { SubString( sub,S,i,m );//返回S中从i起长度为m的子串 if( SubCompare (sub,T)!= 0 ) i++; else return i; } // while
StrCompare(S, T) : 若S>T 返回>0;若S=T 返回=0;若
S<T 返回<0;
StrLength( S ) :串S存在,返回S中元素的个数,称为串
的长度
more
串的基本操作
Concat( &T, S1,S2 ) : 用T返回S1和S2联接而成的新串 SubString( &Sub,S,pos,len ) : 用Sub返回串S的第pos个
▪ 两个串之间可以进行比较。 ▪ 称两个串相等,当且仅当这两个串的值相等,包括
两个串的长度相等,并且各个对应位置的字符都相 等。
▪ 当两个串不相等时,可按“字典顺序”分大小。令
s= “s0s1…sm-1” (m>0) t= “t0t1…tn-1” (n>0) ▪ 假设,两者最大有前k个子序列相等(最大相等前缀子
▪ 串中任意个连续的字符组成的子序列称为该串的子串。包含 子串的的串相应地称为主串。通常称字符在序列中的序列号 为该字符在串中的位置。子串在主串中的位置则以子串第0 个字符在主串的位置来表示。
4.1 串的定义和操作
▪ 例如:下面a,b,c,d都是串
▪ a=“BEI”
长度为3
▪ b=“JING”
长度为4
44
第4章 串

字符串string常用方法

字符串string常用方法

字符串string常用方法字符串是编程中常用的数据类型之一,它是由一系列字符组成的序列。

在Python中,字符串是不可变的,也就是说,一旦创建了一个字符串,就不能再对它进行修改。

在本文中,我们将介绍一些常用的字符串方法,以帮助您更好地处理字符串。

1. len()方法len()方法用于获取字符串的长度,即字符串中字符的个数。

例如,如果我们有一个字符串s,我们可以使用len(s)来获取它的长度。

下面是一个示例:s = "Hello, World!"print(len(s))输出结果为:132. lower()方法lower()方法用于将字符串中的所有字符转换为小写字母。

例如,如果我们有一个字符串s,我们可以使用s.lower()来将它转换为小写字母。

下面是一个示例:s = "Hello, World!"print(s.lower())输出结果为:hello, world!3. upper()方法upper()方法用于将字符串中的所有字符转换为大写字母。

例如,如果我们有一个字符串s,我们可以使用s.upper()来将它转换为大写字母。

下面是一个示例:s = "Hello, World!"print(s.upper())输出结果为:HELLO, WORLD!4. strip()方法strip()方法用于去除字符串中的空格或指定的字符。

例如,如果我们有一个字符串s,我们可以使用s.strip()来去除它的空格。

下面是一个示例:s = " Hello, World! "print(s.strip())输出结果为:Hello, World!5. replace()方法replace()方法用于将字符串中的指定字符替换为另一个字符。

例如,如果我们有一个字符串s,我们可以使用s.replace("H", "J")来将其中的"H"替换为"J"。

数据结构第四章:串

数据结构第四章:串

例2、串的定位 、串的定位index(s,t,pos)
在主串s中取从第 个字符起、 相等的子串和T比较 在主串 中取从第pos个字符起、长度和串 相等的子串和 比较,若 中取从第 个字符起 长度和串T相等的子串和 比较, 相等,则求得函数值为i,否则值增1直至 中不存在和串T相等的子串 直至S中不存在和串 相等,则求得函数值为 ,否则值增 直至 中不存在和串 相等的子串 为止。 为止。
}
4.2 串的表示和实现
首先强调:串与线性表的运算有所不同,是以“串的整体” 首先强调:串与线性表的运算有所不同,是以“串的整体”作 为操作对象,例如查找某子串, 为操作对象,例如查找某子串,在主串某位置上插入一个子串 等。 串有三种机内表示方法: 串有三种机内表示方法:
定长顺序存储表示
顺序 存储 ——用一组地址连续的存储单元存储串值的字 用一组地址连续的存储单元存储串值的字 符序列, 静态存储方式 方式。 符序列,属静态存储方式。
4.1 串类型的定义 4.2 串的表示和实现
4.1 串的类型定义
4.1.1串的定义
定义:串(string)是由零个或多个任意字符组成的字 符序列,是数据元素为单个字符的特殊线性表。 的特殊线性表。 是数据元素为单个字符的特殊线性表 记为:an”
(n≥0 )
第4章 串(String) 章 )
本章主题:串的各种基本运算及其实现 本章主题: 教学目的:了解数据结构的基本概念, 教学目的:了解数据结构的基本概念,理解常用术语 教学重点: 教学重点: 掌握串的基本概念及其基本运算 掌握串的存储结构 主要内容: 主要内容: 1.串的基本概念 2.串的存储结构 2.串的存储结构 3.串的基本运算及其实现 3.串的基本运算及其实现
串其中0<=pos<=strlen(s)-1,且数组 且数组sub至少可容纳 至少可容纳len+1个字符。*/ 个字符。 串其中 且数组 至少可容纳 个字符
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
typedef struct{
char *str;
int length;
} HSstrtype;
4.2.2 串名的存储映象 串名的存储映象就是建立了串名和串值之间的对应关系的一个符 号表。在这个表中的项目可以依据实际需要来设置,以能方便地 存取串值为原则。 如: s1=〃data〃 s2=〃structure〃 假若一个单元仅存放1个字符,则上面两个串的串值顺序存储如图 4-5所示。 若符号表中每行包含有串名、串值的始地址、尾地址,则如图4-6 (a)所示,也可以不设尾地址,而设置串和长度值。则如图4-6 (b)所示。
用块链存放字符串时,其结构用C语言定义如下:
typedef struct node{
char str[4];
struct node *next;
} slstrtype;
(2)堆存储结构
堆存储结构的特点是,仍以一组空间足够大的、地址连续的存储单元存放串值 字符序列,但它们的存储空间是在程序执行过程中动态分配的。每当产生一个 新串时,系统就从剩余空间的起始处为串值分配一个长度和串值长度相等的存 储空间。 在C语言中,存在一个称为“堆”的自由空间,由动态分配函数malloc()分配一 块实际串长所需的存储空间,如果分配成功,则返回这段空间的起始地址,作 为串的基址。由free()释放串不再需要的空间。 用堆存放字符串时,其结构用C语言定义如下:
另一种是定义字符指针变量,存储串值的首地址 ,通过字符指针变量名访问串值,串的存储空间 分配是在程序运行时动态分配的,这种方式称为 串的动态存储结构。
4.2.1 串值的存储
我们称串是一种特殊的线性表,因此串的存储结构表示也有两种方法:静态存储采用 顺序存储结构,动态存储采用的是链式存储和堆存储结构。
1.串的静态存储结构
类似于线性表的顺序存储结构,用一组地
址连续的存储单元存储串值的字符序列。由
于一个字符只占1个字节,而现在大多数计算
图机的存储器地址是采用的字编址,一个字(
4
即 -
1


















串值储结构方式有两种:

紧 缩
(1)紧缩格式:即一个字节存储一个字符

。 式


对于链式存储串值的方式,如果要建立串变量的符号表,则只需要存入一个链 表的表头指针即可。
4.3 串的基本运算及其实现
串的基本运算有赋值、联接、求串长、求子串、求子串在主串中出现的位置、判断两个 串是否相等、删除子串等。在本节中,我们尽可能以C语言的库函数表示其中的一些运 算,若没有库函数,则用自定义函数说明。
(1)链式存储结构
串的链式存储结构中每个结点包含字符域和结点链接指针域,字符域用于
存放字符,指针域用于存放指向下一个结点的指针,因此,串可用单链表表 示。 用链表存放字符串时,其结构用C语言定义如下:
typedef struct node{
char str;
struct node *next;
} slstrtype; 用单链表存放串,每个结点仅存储一个字符,如图4-3所示,因此,每个结 点的指针域所占空间比字符域所占空间要大得多。为了提高空间的利用率, 我们可以使每个结点存放多个字符,称为块链结构,如图4-4所示每个结点 存放4个字符。
例如, S = “Tsinghua University”
4.1 串的基本概念
4.1.1 串的定义 串(或字符串)(String)是由零个或多个字 符组成的有限序列。一般记作 s=〃c0c1c2…cn-1〃 (n≥0)
4.1.2 主串和子串
一个串的任意个连续的字符组成的子序列称为该串的子串 ,包含该子串的串称为主串。
第四章 字符串 (String)(4学时)
重点:串的基本运算、串的匹配算法; 难点:KMP算法。 知识点: 串的基本概念 串所支持的9种基本运算 表示串的数据结构
串的匹配算法。
字符串 (String)
字符串是 n ( 0 ) 个字符的有限序列, 记作 S : “c1c2c3…cn” 其中,S 是串名字 “c1c2c3…cn”是串值 ci 是串中字符 n 是串的长度。
称一个字符在串序列中的序号为该字符在串中的位置,子 串在主串中的位置是以子串的第一个字符在主串中的位置来 表示的。当一个字符在串中多次出现时,以该字符第一次在 主串中出现的位置为该字符在串中的位置。
例 如 : s1 、 s2 、 s3 为 如 下 的 三 个 串 : s1=〃I’m a teacher〃;s2=〃
义串的最大长度,这在程序运行前是很难估计的。二是由于定义了串的最
大长度,使得串的某些操作受限,如串的联接运算等。
2.串的动态存储结构
我们知道,串的各种运算与串的存储结构有着很大的关系,在随机取子串时 ,顺序存储方式操作起来比较方便,而对串进行插入、删除等操作时,就会 变得很复杂。因此,有必要采用串的动态存储方式。 串的动态存储方式采用链式存储结构和堆存储结构两种形式:
用字符数组存放字 <允许的最大的字符数>

4
-
2
typedef struct {

值 的
char str[MAXNUM];
非 紧
int length; /*串长度*/
缩 格
} stringtype; /* 串类型定义*/



由上述讨论可知,串的顺序存储结构有两大不足之处:一是需事先预定
student〃;s3=〃teacher〃。 则它们的长度分别为13、7、7;串s3是s1的子串,子串s3在s1中的位
置为7,也可以说s1是s3的主串;串s2不是s1的子串,串s2和s3不相等。
4.2 串的存储结构
在C语言中可以有两种方式: 一是可以将串定义为字符型数组,数组名就是串 名,串的存储空间分配在编译时完成,程序运行 时不能更改。这种方式为串的静态存储结构。

















储多个字符,充分地利用了存储空间。但在串
的操作运算时,若要分离某一部分字符时,
则变得非常麻烦。
da t a
└s t r ┘ uc tu
r e \0
图4-1 串值的紧缩格式存储
(2)非紧缩格式:这种方式是以一个存储单元为单位,每 个存储单元仅存放一个字符。这种存储方式的空间利用率较 低,如一个存储单元有4个字节,则空间利用率仅为25%。但 这种存储方式中不需要分离字符,因而程序处理字符的速度 高。图4-2即为这种结构的示意图。
相关文档
最新文档