【C基础】字符函数和字符串函数

发布于:2022-12-13 ⋅ 阅读:(855) ⋅ 点赞:(0)

        C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在常量字符串中或者字符数组中。
        字符串常量适用于那些对它不做修改的字符串函数。

        一、字符串函数

        1.求字符串长度 strlen

        字符串以 '\0' 作为结束标志,strlen函数返回的是在字符串中 '\0' 前面出现的字符个数(不包
含 '\0' );
        size_t strlen ( const char * str );
        参数指向的字符串必须要以 '\0' 结束,否则在内存中一直寻找,直到遇见'\0'停止;
        注意函数的返回值为size_t,是无符号的。

//strlen
//string length
//求字符串长度的,统计的是字符串中\0之前出现的字符个数
#include <stdio.h>
#include <string.h>
int main()
{
	//a b c \0 d e f \0
	char arr1[] = "abc\0def";    //三个字符之后遇上'\0',所以字符串长度为3
	char arr2[] = "abcdef";    //在f后面自动添加'\0',所以字符串长度为6
	char arr3[] = { 'a', 'b', 'c' };    //这种方式不会在末尾自动加上'\0',
                                        //所以会一直往后,字符串长度为大于3的随机值
	printf("%d\n", strlen(arr1));
	printf("%d\n", strlen(arr2)); 
	printf("%d\n", strlen(arr3));

	return 0;
}

        2.长度不受限制的字符串函数

        1)strcpy 复制字符串

        源字符串必须以 '\0' 结束。
        目标空间必须有足够的大,能容纳下源字符串的内容。
        目标空间必须可修改。

int main()
{
	char arr1[10] = {0};
	char arr2[] = "abcdef";
	char arr3[] = "abc\0def";

	strcpy(arr1, arr2);     //从arr2处开始复制字符到arr1中,直到遇到'\0'
	printf("%s\n", arr1);

	strcpy(arr1, arr3);     //从arr2处开始复制字符到arr1中,直到遇到'\0'
	printf("%s\n", arr1);

	return 0;
}

        模拟实现strcpy函数

//模拟实现strcpy函数
char* my_strcpy(char* dest, const char* src)
{
	assert(dest);
	assert(src);
	char* ret = dest;
	while (*dest++ = *src++)
	{
		;
	}

	return ret;
}

         2)strcat 拼接两个字符串

         源字符串必须以 '\0' 结束。
        目标空间必须有足够的大,能容纳下源字符串的内容。
        目标空间必须可修改。

int main()
{
	char arr1[20] = "hello ";
	char arr2[] = "world";
	printf("%s\n", strcat(arr1, arr2));

	return 0;
}

        3)strcmp 比较两个字符串大小

         这里比较的不是字符串的长度,而是比较每一位字符的ASCII码值,如果str1大于str2,则返回一个大于0的整型值;反之,返回一个大于0的整型值;若两个字符串相等,则返回0。

int main()
{

	char arr1[] = "abcc";
	char arr2[] = "abcd";
	char arr3[] = "abcdef";

	int ret = strcmp(arr1, arr2);
	printf("%d\n", ret);

	if (ret < 0)
		printf("arr1<arr2\n");
	else if(ret>0)
		printf("arr1>arr2\n");
	else
		printf("arr1==arr2\n");


	return 0;
}

        模拟实现strcmp字符串函数

​//模仿strcmp函数,比较两个字符串大小
int my_strcmp(const char* s1, const char* s2)
{
	assert(s1 && s2);
	while (*s1 == *s2)
	{
		if (*s1 == '\0')
		{
			return 0;
		}
		s1++;
		s2++;
	}
	return *s1 - *s2;
}

​

         前面的字符串函数针对的都是整个字符串,从起始位置一直到'\0',那么如果只想复制、拼接、比较其中的一部分呢?

        下面介绍一些长度可控制的字符串函数:

        3.长度受限制的字符串函数

        1)strncpy 复制字符串中的前num个字符

        拷贝num个字符从源字符串到目标空间。
        如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。

 

         2)strncat 拼接字符串的前num个字符到另一个字符串

         需要注意的是,是从字符串的'\0'位置处开始拼接。

int main()
{
	char arr1[20] = "abcdef\0qqqqqq";
	char arr2[] = "xyz";
	strncat(arr1, arr2, 2);
	printf("%s\n", arr1);

	return 0;
}

         也可以拼接字符串本身。

int main()
{
	char arr1[20] = "abc";
	strncat(arr1, arr1, 2);
	printf("%s\n", arr1);

	return 0;
}

        模拟实现strcat函数

//模拟实现strcat函数
char* my_strcat(char* dest, const char*src)
{
	//1.找目标空间中的\0
	char* cur = dest;
	while (*cur)
	{
		cur++;
	}
	//2.拷贝源头数据到\0之后的空间
	while (*cur++ = *src++)
	{
		;
	}

	return dest;
}

         3)strncmp 比较两个字符的前num个字符

int main()
{
	int ret = strncmp("abcdef", "abcda", 4);
	printf("%d\n", ret);

	return 0;
}

 

        

         4.字符串查找        

        1)strstr

        在一个字符串中寻找另外一个字符串是否存在,如果找到,返回其地址;如果找不到返回空地址NULL。

int main()
{
	char arr1[] = "abcdefabcdef";
	char arr2[] = "cde";

	char* p = strstr(arr1, arr2);
	if (p == NULL)
	{
		printf("不存在\n");
	}
	else
	{
		printf("%s\n", p);
	}
	return 0;
}

 

         模拟实现strstr函数

//暴力求解,实现查找子串
char* my_strstr(const char* str1, const char* str2)
{
	const char* s1 = str1;
	const char* s2 = str2;
	const char* p = str1;
	if (*str2 == '\0')
	{
		return str1;
	}
	while (*p)
	{
		s1 = p;
		s2 = str2;
		while (*s1!='\0' && *s2!='\0' && (*s1 == *s2))
		{
			s1++;
			s2++;
		}
		if (*s2 == '\0')
		{
			return (char*)p;//找到了
		}
		p++;
	}
	return NULL;//找不到子串

        2)strtok 对字符串按照分割符进行分割

        sep参数是个字符串,定义了用作分隔符的字符集合。
        第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
        strtok函数找到str中的下一个标记,并将其用 \0 结尾,返回一个指向这个标记的指针。(注:strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
        strtok函数的第一个参数不为NULL ,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
        strtok函数的第一个参数为NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
        如果字符串中不存在更多的标记,则返回 NULL 指针。

#include <stdio.h>
#include <string.h>
int main()
{
	char arr[] = "email@qq.com";
	char buf[200] = { 0 };
	strcpy(buf, arr);
	const char* p = "@.";    //分割符号集合
	char* str = NULL;

	for (str=strtok(buf, p); str!=NULL; str=strtok(NULL, p))
	{
		printf("%s\n", str);
	}

	return 0;
}

 

         5.错误信息报告

         strerror 把错误码转换成对应的信息

//strerror
//把错误码转换成错误信息

int main()
{
	//printf("%s\n", strerror(0));
	//printf("%s\n", strerror(1));
	//printf("%s\n", strerror(2));
	//printf("%s\n", strerror(3));
	//printf("%s\n", strerror(4));

	//错误码记录到错误码的变量中
	//errno - C语言提供的全局的错误变量
	//#include <errno.h>

	FILE* pf = fopen("test.txt", "r");

	if (pf == NULL)
	{
		perror("");//打印的依然是errno变量中错误码对应的错误信息
		//printf("%s\n", strerror(errno));
		return 1;
	}
	
	//读文件

	fclose(pf);
	pf = NULL;
	return 0;
}

        6.内存操作函数

        1)memcpy 从内存中复制num个字节的内容到新的内存位置

        函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。

        这个函数在遇到 '\0' 的时候并不会停下来。

        如果source和destination有任何的重叠,复制的结果都是未定义的。

//从内存中复制num个字节的内容
int main()
{
	int arr1[] = { 1,2,3,4,5,6,7,8,9,10 };
	int arr2[10] = { 0 };
	memcpy(arr2, arr1, 16);    //注意,这里的16指的是16个字节,所以复制了4个整型数过去

	for (int i = 0; i < 10; i++)
	{
		printf("%d ", arr2[i]);
	}

	return 0;
}

         模拟实现memcpy函数

void* my_memcpy(void* dest, void* src, size_t num)
{
	void* ret = dest;
	assert(dest);
	assert(src);

	while(num--)
	{
		*(char*)dest = *(char*)src;    //复制都是按照字节为单位
		dest = (char*)dest + 1;
		src = (char*)src + 1;
	}

	return ret;
}

        2)memmove 功能同memcopy

        和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。

        如果源空间和目标空间出现重叠,就得使用memmove函数处理。

void* my_memmove(void* dest, void* src, size_t num)
{
	void* ret = dest;
	assert(dest);
	assert(src);
    
    //针对源和目标的不同位置,采取不同的拷贝顺序
	if (dest < src)//1 前->后
	{
		while(num--)
		{
			*(char*)dest = *(char*)src;
			dest = (char*)dest + 1;
			src = (char*)src + 1;
		}
	}
	else //2 3 后->前
	{
		while (num--)
		{
			*((char*)dest + num) = *((char*)src + num);
		}
	}
	return ret;
}

        3)memset 对一段内存空间初始化

        这里的num指的是字节数。

int main()
{
	int arr[5] = { 0 };
	memset(arr, 1, 4);    //4指的是字节数

	for (int i = 0; i < 5; i++)
	{
		printf("%d ", arr[i]);
	}

	return 0;
}

 

        为什么这里的数组第一个元素变成了这么奇怪的一个数?

        调试看看内存就知能发现,memset初始化的时候是按照字节来的,把前面4个字节的内容全部设置成1,那么就刚好对应第一个整型元素,其十六进制被改为:01010101,换算成十进制就是16843009 。

        4)memcmp 比较从ptr1和ptr2指针开始的num个字节

         如果ptr1指向的内存的值比ptr2指向的内存的值小,则返回一个小于0的整型数;反之,返回一个大于0的整型数;如果这两段内存存放的数据相同,则返回0。

        注意这里比较的是按照每个字节比较。

int main()
{
	int arr1[] = { 1,2,3,0,5 };//01 00 00 00 02 00 00 00 03 00 00 00 00 00 00 00 ..
	int arr2[] = { 1,2,3,4,0 };//01 00 00 00 02 00 00 00 03 00 00 00 04 00 00 00 ..
	int ret = memcmp(arr1, arr2, 13);    //这里的13表示13个字节
	printf("%d\n", ret);

	return 0;
}

 二、总结

        字符串在程序中会经常使用到,所以字符串函数也非常重要,主要是能理解字符串在内存中的存储、字符的比较、字符串的结束标志'\0'等。

本文含有隐藏内容,请 开通VIP 后查看

网站公告

今日签到

点亮在社区的每一天
去签到