C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在常量字符串中或者字符数组中。
字符串常量适用于那些对它不做修改的字符串函数。
一、字符串函数
1.求字符串长度 strlen
字符串以 '\0' 作为结束标志,strlen函数返回的是在字符串中 '\0' 前面出现的字符个数(不包
含 '\0' );
size_t strlen ( const char * str );
参数指向的字符串必须要以 '\0' 结束,否则在内存中一直寻找,直到遇见'\0'停止;
注意函数的返回值为size_t,是无符号的。
//strlen
//string length
//求字符串长度的,统计的是字符串中\0之前出现的字符个数
#include <stdio.h>
#include <string.h>
int main()
{
//a b c \0 d e f \0
char arr1[] = "abc\0def"; //三个字符之后遇上'\0',所以字符串长度为3
char arr2[] = "abcdef"; //在f后面自动添加'\0',所以字符串长度为6
char arr3[] = { 'a', 'b', 'c' }; //这种方式不会在末尾自动加上'\0',
//所以会一直往后,字符串长度为大于3的随机值
printf("%d\n", strlen(arr1));
printf("%d\n", strlen(arr2));
printf("%d\n", strlen(arr3));
return 0;
}
2.长度不受限制的字符串函数
1)strcpy 复制字符串
源字符串必须以 '\0' 结束。
目标空间必须有足够的大,能容纳下源字符串的内容。
目标空间必须可修改。
int main()
{
char arr1[10] = {0};
char arr2[] = "abcdef";
char arr3[] = "abc\0def";
strcpy(arr1, arr2); //从arr2处开始复制字符到arr1中,直到遇到'\0'
printf("%s\n", arr1);
strcpy(arr1, arr3); //从arr2处开始复制字符到arr1中,直到遇到'\0'
printf("%s\n", arr1);
return 0;
}
模拟实现strcpy函数
//模拟实现strcpy函数
char* my_strcpy(char* dest, const char* src)
{
assert(dest);
assert(src);
char* ret = dest;
while (*dest++ = *src++)
{
;
}
return ret;
}
2)strcat 拼接两个字符串
源字符串必须以 '\0' 结束。
目标空间必须有足够的大,能容纳下源字符串的内容。
目标空间必须可修改。
int main()
{
char arr1[20] = "hello ";
char arr2[] = "world";
printf("%s\n", strcat(arr1, arr2));
return 0;
}
3)strcmp 比较两个字符串大小
这里比较的不是字符串的长度,而是比较每一位字符的ASCII码值,如果str1大于str2,则返回一个大于0的整型值;反之,返回一个大于0的整型值;若两个字符串相等,则返回0。
int main()
{
char arr1[] = "abcc";
char arr2[] = "abcd";
char arr3[] = "abcdef";
int ret = strcmp(arr1, arr2);
printf("%d\n", ret);
if (ret < 0)
printf("arr1<arr2\n");
else if(ret>0)
printf("arr1>arr2\n");
else
printf("arr1==arr2\n");
return 0;
}
模拟实现strcmp字符串函数
//模仿strcmp函数,比较两个字符串大小
int my_strcmp(const char* s1, const char* s2)
{
assert(s1 && s2);
while (*s1 == *s2)
{
if (*s1 == '\0')
{
return 0;
}
s1++;
s2++;
}
return *s1 - *s2;
}
前面的字符串函数针对的都是整个字符串,从起始位置一直到'\0',那么如果只想复制、拼接、比较其中的一部分呢?
下面介绍一些长度可控制的字符串函数:
3.长度受限制的字符串函数
1)strncpy 复制字符串中的前num个字符
拷贝num个字符从源字符串到目标空间。
如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。
2)strncat 拼接字符串的前num个字符到另一个字符串
需要注意的是,是从字符串的'\0'位置处开始拼接。
int main()
{
char arr1[20] = "abcdef\0qqqqqq";
char arr2[] = "xyz";
strncat(arr1, arr2, 2);
printf("%s\n", arr1);
return 0;
}
也可以拼接字符串本身。
int main()
{
char arr1[20] = "abc";
strncat(arr1, arr1, 2);
printf("%s\n", arr1);
return 0;
}
模拟实现strcat函数
//模拟实现strcat函数
char* my_strcat(char* dest, const char*src)
{
//1.找目标空间中的\0
char* cur = dest;
while (*cur)
{
cur++;
}
//2.拷贝源头数据到\0之后的空间
while (*cur++ = *src++)
{
;
}
return dest;
}
3)strncmp 比较两个字符的前num个字符
int main()
{
int ret = strncmp("abcdef", "abcda", 4);
printf("%d\n", ret);
return 0;
}
4.字符串查找
1)strstr
在一个字符串中寻找另外一个字符串是否存在,如果找到,返回其地址;如果找不到返回空地址NULL。
int main()
{
char arr1[] = "abcdefabcdef";
char arr2[] = "cde";
char* p = strstr(arr1, arr2);
if (p == NULL)
{
printf("不存在\n");
}
else
{
printf("%s\n", p);
}
return 0;
}
模拟实现strstr函数
//暴力求解,实现查找子串
char* my_strstr(const char* str1, const char* str2)
{
const char* s1 = str1;
const char* s2 = str2;
const char* p = str1;
if (*str2 == '\0')
{
return str1;
}
while (*p)
{
s1 = p;
s2 = str2;
while (*s1!='\0' && *s2!='\0' && (*s1 == *s2))
{
s1++;
s2++;
}
if (*s2 == '\0')
{
return (char*)p;//找到了
}
p++;
}
return NULL;//找不到子串
2)strtok 对字符串按照分割符进行分割
sep参数是个字符串,定义了用作分隔符的字符集合。
第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
strtok函数找到str中的下一个标记,并将其用 \0 结尾,返回一个指向这个标记的指针。(注:strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
strtok函数的第一个参数不为NULL ,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
strtok函数的第一个参数为NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
如果字符串中不存在更多的标记,则返回 NULL 指针。
#include <stdio.h>
#include <string.h>
int main()
{
char arr[] = "email@qq.com";
char buf[200] = { 0 };
strcpy(buf, arr);
const char* p = "@."; //分割符号集合
char* str = NULL;
for (str=strtok(buf, p); str!=NULL; str=strtok(NULL, p))
{
printf("%s\n", str);
}
return 0;
}
5.错误信息报告
strerror 把错误码转换成对应的信息
//strerror
//把错误码转换成错误信息
int main()
{
//printf("%s\n", strerror(0));
//printf("%s\n", strerror(1));
//printf("%s\n", strerror(2));
//printf("%s\n", strerror(3));
//printf("%s\n", strerror(4));
//错误码记录到错误码的变量中
//errno - C语言提供的全局的错误变量
//#include <errno.h>
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("");//打印的依然是errno变量中错误码对应的错误信息
//printf("%s\n", strerror(errno));
return 1;
}
//读文件
fclose(pf);
pf = NULL;
return 0;
}
6.内存操作函数
1)memcpy 从内存中复制num个字节的内容到新的内存位置
函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。
这个函数在遇到 '\0' 的时候并不会停下来。
如果source和destination有任何的重叠,复制的结果都是未定义的。
//从内存中复制num个字节的内容
int main()
{
int arr1[] = { 1,2,3,4,5,6,7,8,9,10 };
int arr2[10] = { 0 };
memcpy(arr2, arr1, 16); //注意,这里的16指的是16个字节,所以复制了4个整型数过去
for (int i = 0; i < 10; i++)
{
printf("%d ", arr2[i]);
}
return 0;
}
模拟实现memcpy函数
void* my_memcpy(void* dest, void* src, size_t num)
{
void* ret = dest;
assert(dest);
assert(src);
while(num--)
{
*(char*)dest = *(char*)src; //复制都是按照字节为单位
dest = (char*)dest + 1;
src = (char*)src + 1;
}
return ret;
}
2)memmove 功能同memcopy
和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。
如果源空间和目标空间出现重叠,就得使用memmove函数处理。
void* my_memmove(void* dest, void* src, size_t num)
{
void* ret = dest;
assert(dest);
assert(src);
//针对源和目标的不同位置,采取不同的拷贝顺序
if (dest < src)//1 前->后
{
while(num--)
{
*(char*)dest = *(char*)src;
dest = (char*)dest + 1;
src = (char*)src + 1;
}
}
else //2 3 后->前
{
while (num--)
{
*((char*)dest + num) = *((char*)src + num);
}
}
return ret;
}
3)memset 对一段内存空间初始化
这里的num指的是字节数。
int main()
{
int arr[5] = { 0 };
memset(arr, 1, 4); //4指的是字节数
for (int i = 0; i < 5; i++)
{
printf("%d ", arr[i]);
}
return 0;
}
为什么这里的数组第一个元素变成了这么奇怪的一个数?
调试看看内存就知能发现,memset初始化的时候是按照字节来的,把前面4个字节的内容全部设置成1,那么就刚好对应第一个整型元素,其十六进制被改为:01010101,换算成十进制就是16843009 。
4)memcmp 比较从ptr1和ptr2指针开始的num个字节
如果ptr1指向的内存的值比ptr2指向的内存的值小,则返回一个小于0的整型数;反之,返回一个大于0的整型数;如果这两段内存存放的数据相同,则返回0。
注意这里比较的是按照每个字节比较。
int main()
{
int arr1[] = { 1,2,3,0,5 };//01 00 00 00 02 00 00 00 03 00 00 00 00 00 00 00 ..
int arr2[] = { 1,2,3,4,0 };//01 00 00 00 02 00 00 00 03 00 00 00 04 00 00 00 ..
int ret = memcmp(arr1, arr2, 13); //这里的13表示13个字节
printf("%d\n", ret);
return 0;
}
二、总结
字符串在程序中会经常使用到,所以字符串函数也非常重要,主要是能理解字符串在内存中的存储、字符的比较、字符串的结束标志'\0'等。