C语言字符函数和字符串函数

发布于:2024-05-07 ⋅ 阅读:(22) ⋅ 点赞:(0)

今天我们来学习一下C语言中的一些字符函数和字符串函数。在编程的过程中,我们经常要处理字符和字符串,为了⽅便操作字符和字符串,C语⾔标准库中提供了⼀系列库函数,接下来我们就学习⼀下这些函数。

目录

1.字符函数

2.字符转换函数

3.strlen函数的使用和实现

4.strcpy函数的使用和实现

5.strcat函数的使用和实现

6.strcmp函数的使用和实现

7.strncpy函数的使⽤

8.strncat 函数的使⽤

9.strncmp函数的使用

10.strstrr 的使⽤和模拟实现

11. strtok 函数的使⽤

12. strerror 函数的使⽤


1.字符函数
C语⾔中有⼀系列的函数是专⻔做字符分类的,也就是⼀个字符是属于什么类型的字符的。

这些函数的使⽤都需要包含⼀个头⽂件是<ctype.h>,

函数 如果它的参数符合下列就返回真
iscntrl 任何控制字符
isspace 空白字符:空格' ',换页'\f',换行'\n',回车'\r',制表符'\t'或垂直制表符'\v'
isdigit     十进制数字,'0'~'9'字符
isxdigit 十六进制数字,包括所有十进制数字字符,小写字母a~f,大写字母A~F
islower 小写字母a~z
isupper 大写字母A~Z
isalpha 字母a~z或A~Z
isalnum 字母或者数字a~z,A~Z,0~9
ispunct 标点符号,任何不属于数字或字母的图形字符(可打印)
isgraph 任何图形字符
isprint 任何可打印字符,包括图形字符和空白字符

上述这些函数的使用方式非常相似,所以这里只拿一个函数作为举例:

int islower ( int c );

islower函数是用来判断参数c是否是小写字母,通过返回值来说明是否是⼩写字⺟,如果是⼩写字⺟就返回⾮0的整数,如果不是⼩写字⺟,则返回0。

所以我们可以通过这个函数来实现小写到大写:

#include<stdio.h>
#include<ctype.h>
int main()
{
	char str[] = { "Hello World" };
	char c;
	int i = 0;
	while (str[i])
	{
		c = str[i];
		if (islower(c))
		{
			c -= 32;
		}
		putchar(c);
		i++;
	}
}

因为小写字符和大写字符的ASCII码值相差32,所以小写字符的ASCII码-32就得到对应大写字符的ASCII码值,字符串中的大写字符直接打印,小写字符转化为大写字符再打印。

而对于这种大小写字符的转换,C语言有专门的函数可以使用,让我们来看一下:

2.字符转换函数
int tolower ( int c ); //将参数传进去的⼤写字⺟转⼩写 
int toupper ( int c ); //将参数传进去的⼩写字⺟转⼤写
上⾯的代码,我们将⼩写转⼤写,是-32完成的效果,有了转换函数,就可以直接使⽤ tolower
数。
#include<stdio.h>
#include<ctype.h>
int main()
{
	char str[] = { "Hello World" };
	char c;
	int i = 0;
	while (str[i])
	{
		c = str[i];
		if (islower(c))
		{
			c = toupper(c);
		}
		putchar(c);
		i++;
	}
}

首先判断是不是小写字符,若是则通过toupper函数来实现大小写转换,若不是,则可以直接打印。

字符函数我们就先学习到这里,接下来我们来看字符串函数。

3.strlen函数的使用和实现
size_t strlen ( const char * str );

对于strlen函数,需要注意的点有:

  • 字符串以 '\0' 作为结束标志,strlen函数返回的是在字符串中 '\0' 前⾯出现的字符个数(不包含 '\0' )。
  • 参数指向的字符串必须要以 '\0' 结束。
  • 注意函数的返回值为 size_t,是⽆符号的( 易错 )
  • strlen的使⽤需要包含头⽂件<sreing.h>

接下来我们来看一下strlen函数的实现:

我们知道strlen函数统计的是对字符串'\0' 前的字符的个数,所以我们首先可以创建一个变量来专门统计字符个数,这也就是第一种方法:

size_t my_strlen(const char* str)
{
	int count = 0;
	assert(str);
	while (*str)
	{
		count++;
		str++;
	}
	return count;
}

那么,如果无法创建临时变量那么应该如何统计字符个数呢?不难发现,strlen函数是一次一次循环直到字符串中出现'\0' ,所以可以把循环写成函数的一种形式:递归。这也是实现strlen函数的第二种方式:

size_t my_strlen(const char* str)
{
	assert(str);
	if (*str == '\0')
	{
		return 0;
	}
	else
	{
		return 1 + my_strlen(str + 1);
	}
}

我们在学习指针的时候学习到了指针-指针的操作,当时说结果是两个指针间的数据个数,所以我们可以使用指针-指针来计算字符个数:

size_t my_strlen(const char* str)
{
	assert(str);
	char* p = str;
	while (*p != '\0')
	{
		p++;
	}
	return p - str;
}

strlen函数先学习到这里,我们来看下一个函数:

4.strcpy函数的使用和实现
char* strcpy(char * destination, const char * source );

strcpy函数的用处是将source的字符串复制到destination中,

strcpy函数需要注意的有:

  • 源字符串必须以 '\0' 结束。
  • 会将源字符串中的 '\0' 拷⻉到⽬标空间。
  • ⽬标空间必须⾜够⼤,以确保能存放源字符串。
  • ⽬标空间必须可修改。

我们下面来看strcpy函数的实现:

既然我们要将source中的字符串复制到destination中,我们可以创建一个指针存放destination的地址,然后遍历两个字符串进行复制,又由于会将source中的'\0' 一同复制,所以在循环结束后需要再复制一次。

char* my_strcpy(char* dest, const char* str)
{
	assert(dest && str);
	char* ret = dest;
	while (*str)
	{
		*dest++ = *str++;
	}
	*dest = *str;
	return ret;
}

代码中*dest++=*str++;++的优先级比*高,但是++自增产生的效果是滞后的,也就是说先完成赋值后自增,所以这里不使用()也是可以的。

5.strcat函数的使用和实现
char * strcat ( char * destination, const char * source );

strcat函数作用是完成两个字符串的追加,将source中的字符串追加到destination中。

strcat函数需要注意的有:

  • 源字符串必须以 '\0' 结束。
  •  ⽬标字符串中也得有 \0 ,否则没办法知道追加从哪⾥开始。
  •  ⽬标空间必须有⾜够的⼤,能容纳下源字符串的内容。
  •  ⽬标空间必须可修改。
char* my_strcat(char* dest, const char* str)
{
	assert(dest && str);
	char* ret = dest;
	while (*dest)
	{
		dest++;
	}
	while (*str)
	{
		*dest = *str;
	}
	*dest = *str;
	return ret;
}

先找到dest字符串中'\0' 的位置,从此向后进行追加,后面与strcpy的复制部分相同。

6.strcmp函数的使用和实现
int strcmp ( const char * str1, const char * str2 );

对两个字符串进行比较,我们在上一篇文章中的qsort函数中有介绍到strcmp函数,

strcmp函数的标准规定:
  • 第⼀个字符串⼤于第⼆个字符串,则返回⼤于0的数字
  • 第⼀个字符串等于第⼆个字符串,则返回0
  • 第⼀个字符串⼩于第⼆个字符串,则返回⼩于0的数字
  • 那么如何判断两个字符串? ⽐较两个字符串中对应位置上字符ASCII码值的⼤⼩。

因为strcmp函数比较的是两个字符串的每个字符的ASCII码值,所以我们可以通过ASCII码的差值来确定两个字符的大小。

int my_strcmp(const char* str1, const char* str2)
{
	int ret = 0;
	assert(str1 && str2);
	while (*str1 == *str2)
	{
		if (*str1 == '\0')
			return 0;
		str1++;
		str2++;
	}
	return *str1 - *str2;
}

若当前比较的两个字符相等的话,则比较下两个字符。 

我们已经学习完了三个函数,接下来我们看一下这三个函数的“兄弟”

7.strncpy函数的使⽤
char * strncpy ( char * destination, const char * source, size_t num );

我们可以看到,相比strcpy函数,多了一个参数num,这个函数的意思是从source中复制num个字符到destination中。

需要注意的是如果源字符串的⻓度⼩于num,则拷⻉完源字符串之后,在⽬标的后边追加0,直到num个。

8.strncat 函数的使⽤
char * strncat ( char * destination, const char * source, size_t num );

同样的,strnact函数就是从source中向destination中追加num个字符,再追加⼀个 ‘\0’ 字符。

如果source 指向的字符串的⻓度⼩于num的时候,只会将字符串中到 ‘\0’ 的内容追加到destination指向的字符串末尾。
我们来看下一个函数:
9.strncmp函数的使用
int strncmp ( const char * str1, const char * str2, size_t num );

 ⽐较str1和str2的前num个字符,如果相等就继续往后⽐较,最多⽐较num个字⺟,如果提前发现不⼀样,就提前结束,⼤的字符所在的字符串⼤于另外⼀个。如果num个字符都相等,就是相等返回0。

这些都是比较常见的字符串函数,当然还有一些不常见的,我们来继续向下学习。

10.strstrr 的使⽤和模拟实现
char * strstr ( const char * str1, const char * str2);

strstr函数的作用是返回字符串str2在字符串str1中第一次出现的位置。

需要注意的是:字符串的⽐较匹配不包含 ‘\0’ 字符,以 ‘\0’ 作为结束标志。

我们来看一个代码,体会一下strstr函数的使用:

#include <stdio.h>
#include <string.h>
int main()
{
	char str[] = "This is a simple string";
	char* pch;
	pch = strstr(str, "simple");
	strncpy(pch, "sample", 6);
	printf("%s\n", pch);
	return 0;
}

我们来分析一下这个代码,代码首先将simple首次出现的位置返回给了pch,随后对pch进行了strncpy带长度的复制,由于simple的长度就是6,所以在复制时没有复制'\0',所以pch的打印结果为 simple string

接下来我们看strstr的实现:

当str2为空字符串时,返回的是str1,所以我们在函数一开始就要判断str2是哪一种。

char* strstr(const char* str1, const char* str2)
{
	char* cp = (char*)str1;
	char* s1, * s2;
	if (!*str2)
		return((char*)str1);
	while (*cp)
	{
		s1 = cp;
		s2 = (char*)str2;
		while (*s1 && *s2 && !(*s1 - *s2))
			s1++, s2++;
		if (!*s2)
			return(cp);
		cp++;
	}
	return NULL;
}

首先判断若str2是空字符串时,返回str1,随后创建变量调整每次进入循环时的位置,若s1与s2当前都不为空字符串且相等时,进入内层循环,继续判断下一个字符是否相等,以此类推,在出内层循环时判断s2是否是空字符串,若是,说明str2在str1中出现,此时cp的位置就是str2首次出现的位置,若s2不为空字符串,说明s1和s2此时不相等或有s1已经遍历完了,则调整cp的位置继续循环。

11. strtok 函数的使⽤
char * strtok ( char * str, const char * sep);

对于strtok函数,它的用法如下: 

  • sep参数指向⼀个字符串,定义了⽤作分隔符的字符集合
  • 第⼀个参数指定⼀个字符串,它包含了0个或者多个由sep字符串中⼀个或者多个分隔符分割的标记。
  • strtok函数找到str中的下⼀个标记,并将其⽤ \0 结尾,返回⼀个指向这个标记的指针。(注: strtok函数会改变被操作的字符串,所以在使⽤strtok函数切分的字符串⼀般都是临时拷⻉的内容并且可修改。)
  • 当strtok函数的第⼀个参数不为NULL时,函数将找到str中第⼀个标记,strtok函数将保存它在字符串中的位置。
  • 当strtok函数的第⼀个参数为 NULL时,函数将在同⼀个字符串中被保存的位置开始(上一次调用函数标记的位置),查找下⼀个标记。
  • 如果字符串中不存在更多的标记,则返回 NULL 指针。

我们看下面一个代码来理解会更好一点:

#include <stdio.h>
#include <string.h>
int main()
{
	char arr[] = "192.168.6.111";
	char* sep = ".";
	char* str = NULL;
	for (str = strtok(arr, sep); str != NULL; str = strtok(NULL, sep))
		{
			printf("%s\n", str);
		}
	return 0;
}

我们先看循环,初始时str被赋值为strtok函数的返回值,也就是数组arr第一次出现 ‘.’ 的位置,循环的条件是str不为NULL,我们根据上面的strtok的用法可以知道,当字符串中不存在给定sep中的标记后,就会返回NULL,而每次strtok函数调用结束后会将返回值赋值给str,当再次调用strtok函数时,就会从上次调用函数对sep中标记出现的地方开始遍历。

接下来来看我们今天要学习的最后一个函数:

12. strerror 函数的使⽤
char * strerror ( int errnum );
strerror 函数可以把参数部分错误码对应的错误信息的字符串地址返回来。
我们先来看一下什么是错误码:
在不同的系统和C语⾔标准库的实现中都规定了⼀些错误码,⼀般是放在 errno.h 这个头⽂件中说明的,C语⾔程序启动的时候就会使⽤⼀个全局的变量errno来记录程序的当前错误码,只不过程序启动的时候errno是0,表⽰没有错误,当我们在使⽤标准库中的函数的时候发⽣了某种错误,就会将对应的错误码,存放在errno中,⽽⼀个错误码的数字是整数很难理解是什么意思,所以每⼀个错误码都是有对应的错误信息的。strerror函数就可以将错误对应的错误信息字符串的地址返回。

我们可以通过代码来打印出来不同错误码对应的错误:

#include <errno.h>
#include <string.h>
#include <stdio.h>
int main()
{
	int i = 0;
	for (i = 0; i <= 10; i++) {
		printf("%s\n", strerror(i));
	}
	return 0;
}

 

这是在Windows11+VS2022环境下输出的结果, 打印的分别是0(无错误)和错误码从1到10的每种错误原因,有了这个函数,我们可以确定代码是哪里出了错误,方便我们改正。

在错误这方面还有另一个函数perror,二者的区别我们可以用代码来观察:

#include <stdio.h>
#include <string.h>
#include <errno.h>
int main()
{
	FILE* pFile;
	pFile = fopen("unexist.ent", "r");
	if (pFile == NULL)
		printf("Error opening file unexist.ent: %s\n", strerror(errno));
	return 0;
}

#include <stdio.h>
#include <string.h>
#include <errno.h>
int main()
{
	FILE * pFile;
	pFile = fopen("unexist.ent", "r");
	if (pFile == NULL)
		perror("Error opening file unexist.ent");
	return 0;
}

两个代码打印的结果是相同的,perror函数可以直接将错误信息打印出来。perror函数打印完参数部分的字符串后,再打印⼀个冒号和⼀个空格,再打印错误信息。

本章C语言字符函数和字符串函数的学习就先到这里,我们下次再见。