一个字符串没有字节怎么表示
Jimmy1224 ?
码龄11年
关注
字符串是一种重要的数据类型,但是C语言并没有显式的字符串数据类型,因为字符串以字符串常量的形式出现或者存储于字符数组中。字符串常量适用于那些程序不会对它们进行修改的字符串。所有其他字符串都必须存储于字符数组或动态分配的内存中。本文描述处理字符串和字符的库函数,以及一些相关的,具有类似能力的,既可以处理字符串也可以处理非字符串数据的函数。
1.1 字符串基础
字符串是一串零个或多个字符,并且以一个位模式全0的NUL字节('\0')结尾。NUL字节是字符串的终止符,但它本身并不是字符串的一部分,所以字符串长度并不包括NUL字节。
头文件string.h包含了字符串函数所需的圆形和声明。在程序中包含这个头文件确实是个好主意,因为有了它所包含的原型,编译器可以更好地为程序执行错误检查。
1.2字符串长度
字符串的长度是它所包含的字符个数,不包含NUL字节。我们很容易对字符进行计数来计算字符串的长度。需要说明的是,如果strlen函数的参数不是一个以NUL字节结尾的字符序列,它将继续进行查找,直到发现一个NUL字节为止,这样strlen函数的返回值将是不确定数!
库函数strlen的源码如下:
size_t strlen(char const * string)
{
int length;
for (length = 0; *string++ != '\0'; ;)
{
length += 1;
}
return length;
}
注意:
strlen返回一个类型为size_t的值,它是一个无符号整数类型。在表达式中使用无符号可能导致不可预料的结果。
例如:
if ( strlen(x) >= strlen(y) )
{
...
}
if (strlen(x) - strlen(y) >= 0)
{
...
}
上面两个表达式看似相等,但事实上它们是不想等的。第一条语句是我们所预想的那样工作,但第2条语句的结果永远为真。因为strlen的结果是无符号,所以strlen(x)-strlen(y)的结果也是个无符号数,而无符号数都是大于等于“0”的。在表达式中如果同时包含了无符号和有符号数同样会产生奇怪的结果。
1.3 不受限制的字符串函数
最常用的字符串函数都是“不受限制”的,就是说它们只是通过寻找字符串参数结尾的NUL字节来判断它们的长度。这些函数一般都指定一块内存用于存放结果字符串。在使用这些函数时,程序员必须保证结果字符串不会溢出这块内存。
1.3.1 复制字符串
用于复制字符串的函数是strcpy,它的原型如下:
char *strcpy( char *dst, char const *src);
这个函数把参数src字符串复制到dst参数。如果参数src和dst在内存中出现重叠,其结果是未定义的。由于dst参数将进行修改,所以它必须是个字符数组或者是一个指向动态分配内存的数组指针,不能使用字符串常量。
目标参数以前的内容将被覆盖丢失。即使新的字符串比dst原先的内存更短,由于新的字符串是以NUL字节结尾,所以老字符串最后剩余的几个字符也会被有效地删除。需要注意的是字符结束标志也将被复制。
例如:
char message[] = "message";
...
if (...)
{
strcpy( message, "Dif");
}
如果条件为真并且复制顺利执行,数组将包含下面的内容:
第一个NUL字节后面的几个字符再也无法被字符串函数访问,因此从任何角度实现看,它们都已经是丢失的了。
注意:
程序员必须保证目标字符数组的空间足以容纳需要复制的字符串。如果字符串比数组长,多余的字符仍被复制,它们将覆盖原先存储于数组后面的内存空间的值。strcpy无法解决这个问题,因为它无法判断目标字符数组的长度。
1.3.2 连接字符串
strcat函数可以实现一个字符串添加到另一个字符串的后面。函数原型如下:
char *strcat( char *dst, char const *src);
strcat函数要求dst参数原先已经包含一个字符串(可以是空字符串)。它找到这个字符串的末尾,并把src字符串的一份拷贝添加到这个位置。如果src和dst的位置发生重叠,其结果是未定义的。
下面是这个函数的常见用法:
strcpy( message, "hello");
strcpy( message, customer_name);
注意:程序员必须保证目标字符数组剩余的空间足以保存整个src源字符串。
1.3.3 字符串比较
库函数strcmp的原型如下:
int strcmp( char const *s1, char const *s2);
字符串比较的规则:
对两个字符串自左向右逐个字符比较(按ASCII码值大小比较),直到出现不同的字符或遇到‘\0’为止,如果全部相同则认为相等。
1. s1小于s2,函数返回负整数;
2. s1大于s2,函数返回正整数;
3. s1等于s2,函数返回0;
注意:比较两个字符串更好的方法是把返回值与零进行比较。
if ( 0 == strcmp(str1,str2))
{
...
}
注意:
由于strcmp并不修改它的任一个参数,所以不存在溢出字符数组的危险。strcmp函数的字符串参数也必须以一个NUL字节结尾。如果不是,strcmp就可能对参数后面的字节进行比较,这个比较结果无意义!
1.4 长度受限的字符串函数
标准库函数还包含了一些函数,这些函数接受一个显式的长度参数,用于限定进行复制或比较的字符数。这些函数提供了一种方便的机制,可以防止难以预料的长字符串从它们的目标数组溢出。
这些函数的原型如下所示,和不受限制版本一样,如果源参数和目标参数发生重叠,strncpy和strncat的结果都是未定义。
char *strncpy(char *dst, char const *src, size_t len );
char *strncat(char *dst, char const *src, size_t len );
char *strncmp(char const *s1, char const *s2, size_t len );
1.4.1 strncpy
和strcpy一样,strncpy把源字符串的字符复制到目标数组。但它总是向dsr写入len个字符。如果strlen(src)的值小于len,dst数组就用额外的NUL字节填充到len长度。如果strlen(src)的值大于或等于len,那么只有len个字符被复制到dst中。此时,它的结果将可能不会以NUL字节结尾。
例如:
char dst[10];
char src[] = "abcdefghijklmn";
strncpy(dst, src,5);
//dst字符数组不是以NUL结尾,len是23,是个随机数
int len = strlen(dst);
警告:
strncpy调用的结果可能不是一个字符串,因此字符串必须是以NUL字节结尾。如果在一个需要字符串的地方(例如:strlen函数参数)使用了没有以NUL字节结尾的字符序列,会发生什么情况呢?strlen函数不知道NUL字节是没有的,所以它将继续一个字符一个字符的查找,知道发现NUL字节为止。或者如果函数试图访问系统分配给这个程序以外的内存范围,程序就会崩溃。
这个问题只有当你使用strncpy函数创建字符串,然后或者对它们使用str开头的库函数,或者在printf中使用%s格式打印它们时才会发生。考虑如下代码:
char buffer[BSIZE];
...
strncpy(buffer,name,BSIZE);
buffer[BSIZE-1] = '\0';
如果strlen(name)小于BSIZE,之后的赋值语句不起作用。但是,name长度很长,这条赋值语句可以保证buffer中的字符串是以NUL字节结尾。以后对这个数组使用strlen等其它函数就会正常工作。
1.4.2 strncat
strncat也是一个长度受限的函数,但它和strncpy不同,strncat从src中最多复制len个字符到目标数组的后面。并且,strncat总是在结果字符串后面添加一个NUL字节。它不管目标参数除去原先存在的字符串之后留下的空间够不够。
1.4.3 strncmp
strncmp用于比较两个字符串,但它最多比较len个字节。如果两个字符串在第len个字符之前存在不等的字符,这个函数停止比较,返回结果。如果两个字符串的前len个字符相等,函数就返回零。
1.5 字符串查找基础
标准库中存在许多函数,它们用各种不同的方法查找字符串。
1.5.1 查找一个字符
在一个字符串中查找一个特定字符最容易的方法是使用strchr和strchr函数,它们的原型如下:
char *strchr( char const *str, int ch);
char *strrchr( char const *str, int ch);
它们的第二个参数是一个整型值。但是,它包含了一个字符值(ASCII)。strchr在字符串中str查找字符ch第1次出现的位置,找到后函数返回一个指向该位置的指针。如果该字符并不存在于字符串中,函数就返回一个NUL指针。
strrchr的功能与strchr基本一致,只是它所返回的是一个指向字符串中该字符最后一次出现的位置(r:最右边)。
例如:
char src[] = "abc12def12";
printf("the first = %s\n",strchr(src,49));//strchr(src,'1')
1.5.2 查找任何几个字符
strprk是个更为常见的函数,它是查找任何一组字符第一次在字符串中出现的位置,它的原型如下:
char *strpbrk( char const *str, char const *group);
这个函数返回一个指向str中第1个匹配group中任何一个字符的字符位置。如果未找到函数返回一个NULL指针。
例如:
char src[] = "123qaz!@#";
char group[] = "aq!";
printf("location = %s\n",strpbrk(src,group));//qaz!@#,group中的字符第1次出现的位置是q
1.5.3 查找一个子串
为了在字符串中查找一个子串,我们可以使用strstr函数,它的原型如下:
char *strstr( char const *s1, char const *s2 );
这个函数在s1中查找整个s2第1次出现的位置,并返回一个指向该位置的指针。如果s2没有完整的出现在s1中任何地方,函数返回NULL指针。如果s2是一个空字符串,函数就返回s2。
1.6 高级字符串查找
1.6.1 查找一个字符串前缀
strspn和strcspn函数用于在字符串的起始位置对字符计数。它们的函数原型如下:
size_t strspn( char const *str, char const *group );
size_t strcspn( char const *str, char const *group );
1.6.2 查找标记
一个字符串常常包含几个单独的部分,它们彼此分隔开来。每次为了处理这些部分,你首先必须把它们从字符串中抽取出来。这个任务正是strtok函数所实现的功能。它从字符串中隔离各个单独的称为标记(token)的部分,并丢弃分割符。它的原型如下:
char *strtok( char *str, char const *sep);
sep参数是个字符串,定义了用作分隔符的字符集。str指定一个字符串,它包含零个或多个有sep字符串中一个或多个分隔符分隔的标记。strtok找到str的下一个标记,并将其用NUL结尾,然后返回一个指向这个标记的指针。
高级字符串查找将另外详解描述!
1.7 字符操作
标准库包含了两组函数,用于操作单独的字符,它们的原型位于头文件ctype.h。第一组函数用于字符分类,第二组函数用于转换字符。
1.7.1 字符分类
每个分类函数接受一个包含字符值的整型参数。函数测试这个字符并返回一个整型值,表示真或假。
int isalnum( int ch );
int iscntrl( int ch );
int islower( int ch );
int isprint( int ch );
int isupper( int ch );
int isspace( int ch );
1.7.2 字符转换
转换函数把大写字母转换为小写字母或把小写字母转换为大写字母。它们的函数原型如下:
int tolower( int ch );
int toupper( int ch );
toupper函数返回其参数的对应大写形式,tolower函数返回其参数的对应的小写形式。如果函数参数并不是处于一个适当的大小写的字符,函数将不修改直接返回。
提示:
直接测试或操纵字符将会降低程序的可移植性。例如,考虑下面这条语句,它试图测试ch是否是一个大写字符。
if( ch >= 'A' && ch /dev/null2、按指定的字符串截取(1)第一种方法:从左向右截取最后一个s...
继续访问
Linux操作字符串
目录 获取字符串长度: 提取子字符串: 子字符串消除 字符串替换 子字符串所在位置 获取字符串长度: 从字符串开始的地方匹配子字符串的长度: 1.expr match "$string" '$substring' 2.expr "$string" : '$substring 注释:$substring是一个正则表达式 提取子字符串: 1.${string:position} 在string 中从位置$position 开始提取子字符串. 如果$string为"*"或"@",
继续访问
Linux字符串操作
Linux字符串操作 描述 shell内置一系列的操作符合,可以对字符串进行操作; 常用操作 表达式 含义 ${#string} $string的长度 ${string:position} 在string中从位置position开始提取子串 ${string:position:length} 在string中从位置position开始提取长度为$length的子串 ${string#substring} 从变量string的开头删除最短匹配substring的子串 ${s
继续访问
linux 字符串比较、数值比较
字符串相等: [[ $str1 == $str2 ]] 字符串不相等: [[ $str1 != $str2 ]] 字符串大小比较: [[ $str1 > $str2 ]] 字符串等于空: [[ -z $str2 ]] 字符串不等于空: [[ -n $str2 ]] 二元比较操作符,比较变量或者比较数字.注意数字与字符串的区别. 整数比较 -eq 等于,如:if [ "$a" -eq "$b" ] -ne
继续访问
Linux下常用的字符串函数合集分享
转自:Linux下常用的字符串函数一、字符间的转换1 tolower(将大写字母转换成小写字母)相关函数isalpha,toupper表头文件 include定义函数int tolower(int c);函数说明。。。https://www.pinlue.com/article/2019/04/1316/558651446754.html ...
继续访问
字符串(Linux应用编程篇)
关于字符串的相关操作有 输入、输出、合并、修改、比较、转换、复制、搜索等等 一、字符串I/O 宏定义文件指针:标准输入设备stdin、标准输出设备stdout、标准错误设备stderr 字符串输出 putchar()、puts()、fputc()、fputs()这些函数也是标准 I/O 函数,标准C库函数,且应层的函数是有缓冲的,性能和效率要比系统调用要高。 /* @ puts函数 @ 头文件:#include @ s:需要进行输出的字符串 @ 返回值:成功返回一
继续访问
Linux下的基本C编程的三类高频函数操作第二类——字符串操作函数(str)
一,strlen和sizeof strlen一般用来求字符串长度,而sizeof是求这一段储存空间的大小。它们的区别在于strlen不计算空白符的大小,且遇到\0就会停止工作。 例如 #include #include int main(int argc, char **argv) { printf("%ld\n",strlen("hello baby"));//结果为10; printf("%ld
继续访问
linux shell 函数返回字符串,如何从Bash函数返回字符串值
您可以让函数将变量作为第一个arg,然后使用要返回的字符串修改变量。#!/bin/bashset -xfunction pass_back_a_string() {eval "$1='foo bar rab oof'"}return_var=''pass_back_a_string return_varecho $return_var打印“ foo bar rab oof”。编辑:在适当的位置添加...
继续访问
字符串长度与字节个数
在纯ASCII码下,字节数=字符串长度=字符个数,因为每个字符就一个字节。 在Unicode下,字节数/2=字符串长度=字符个数,因为每个字符都是2个字节。 在ASCII码与其它双字节字符系统混用时,字节数=ASCII码字符个数+双字节字符个数*2,而此时字符串长度到底怎么统计就不好说了,有的语言如C语言,此时字符串长度=字节数,有的语言如JS,此时字符产长度=字符个数。
继续访问
Linux 常用C函数(内存及字符串操作篇2)
Linux 常用C函数(内存及字符串操作篇2)2007-03-22 11:36 strcat(连接两字符串)
继续访问
c
c++
字符串处理
写评论评论
1
strstr()、strchr()、strpbrk()
strstr() 原型:extern char *strstr(char *haystack, char *needle); 用法:#include 功能:从字符串haystack中寻找needle第一次出现的位置(不比较结束符NULL)。 说明:返回指向第一次出现needle位置的指针,如果没找到则返回NULL。 举例: // strstr.c #include #include main() { char *s="Golden Global View"; char *l="lob"; char *p; clrscr(); p=strstr(s,l); if(p)
printf("%s",p); else printf("Not Found!"); getchar();
return 0; } strchr() 原型:extern char *strchr(const char *s,char c); 用法:#include 功能:查找字符串s中首次出现字符c的位置 说明:返回首次出现c的位置的指针,返回的地址是字符串在内存中随机分配的地址再 加上你所搜索的字符在字符串位置,如果s中不存在c则返回NULL。 举例: #include #include intmain(void) { charstring[17]; char*ptr,c='r'; strcpy(string,"Thisisastring");
ptr=strchr(string,c); if(ptr) printf("Thecharacter%cisatposition:%s\n",c,ptr); else printf("Thecharacterwasnotfound\n");return0;
} strpbrk()
函数原型:extern char *strpbrk(char *str1, char *str2);
函数功能:比较字符串str1和str2中是否有相同的字符,如果有,则返回该字符在str1
中的位置的指针。
返回说明:返回指针,搜索到的字符在str1中的索引位置的指针。
#include
#includeint main()
{ char *str1="please try again,sky2098!";
char *str2="Hello,I am sky2098,I like writing!"; char *strtemp;
strtemp=strpbrk(str1,str2); //搜索进行匹配 printf("Result is:
%s ",strtemp); return 0;
}
鹏仔微信 15129739599 鹏仔QQ344225443 鹏仔前端 pjxi.com 共享博客 sharedbk.com
图片声明:本站部分配图来自网络。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!