CSDN话题挑战赛第2期
参赛话题:学习笔记
c语言自定义类型(c语言进阶自定义类型——结构体,详细介绍


结构体的基础知识
结构是一些值的集合,这些值称为成员变量,结构的每个成员可以是不同类型的变量。(区别数组:数组是一组相同类型的值的集合)
结构体是用来描述复杂对象的
结构体的声明
语法

比如,我们在此用结构体定义一个人这个类型
struct Peo
{
char name[20];//名字
char tele[12];//电话//字符串要多一个来打印/0
char sex[5];//性别
int high;//身高
};//注意这个;
注:
1.注意结构体定义之后的;
2.变量列表可以没有,如果是在main函数之外创建的结构体变量属于全局变量
特殊的声明
//匿名结构体类型
struct
{
char name[20];
char tele[12];
char sex[5];
int high;
}s1;
结构体标签可以省略,为匿名结构体类型,但是使用匿名结构体类型创建的变量只可以使用一次
特点:虽然是匿名结构体类型,但是创建出两个匿名结构体类型依然不是相同的类型
两种创建方法
struct Peo
{
char name[20];//名字
char tele[12];//电话
char sex[5];//性别
int high;//身高
}p1;
int main()
{
struct Peo p2;
return 0;
}
这里的p1和p2都可以创建类型为struct Peo的结构体类型,但是p1创建的属于全局变量,全局变量不利于模块化和空间节约所以应该尽量避免使用全局变量,使用p2创建的方法来创建结构体变量。
结构的自引用
在结构中包含一个类型为该结构本身的成员(为实现链表做铺垫)
错误方法
struct Node
{
int data;
struct Node next;
};
此时无法得到sizeof(struct Node)大小,会无限套娃
typedef struct
{
int data;
Node* next;
}Node;
此处矛盾,现有结构体类型才能重命名,但是此处又要重命名了才能创建结构体类型
正确方法
存放结构体指针
struct Node
{
int data;
struct Node* next;//存的是结构体指针
};
结构体变量的定义和初始化
结构成员的类型
结构的成员可以是标量、数组、指针,甚至是其他结构体。
定义和初始化
struct Point
{
int x;
int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2
struct Point p3 = {x, y};//初始化,定义时直接赋值
使用{}来进行初始化
struct Node
{
int data;
struct Point p;
struct Node* next;
}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化
struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化
结构体成员的访问
结构体变量访问成员
结构变量的成员是通过点操作符(.)访问的。点操作符接受两个操作数。
结构体指针访问指向变量的成员
有时候我们得到的不是一个结构体变量,而是指向一个结构体的指针,此时使用->
struct Peo
{
char name[20];//名字
char tele[12];//电话
char sex[5];//性别
int high;//身高
};
void print1(struct Peo sp)//用对象
{
printf("%s %s %s %d\n", sp.name, sp.tele, sp.sex, sp.high);
}
void print2(struct Peo* p)//用地址
{
printf("%s %s %s %d\n", p->name, p->tele, p->sex, p->high);
}
int main()
{
struct Peo p1 = {"张三","123456789","男",180};
print1(p1);
print2(&p1);
return 0;
}

结构体内存对齐
现在我们深入讨论一个问题:计算结构体的大小。
结构体的对齐规则:
- 第一个成员在与结构体变量偏移量为0的地址处。
- 其他成员变量要对齐到某个数字**(对齐数)的整数倍**的地址处。
对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。
VS中默认的值为8(没有对齐数的编译器默认对齐数就是本身) - 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
- 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整
体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
举例画图计算结果体大小
struct S1
{
char c1;
int i;
char c2;
};

计算S1的大小:
- 对于c1来说,c1存放在偏移量为0的地方,大小为1字节,vs的默认对齐数是8,对齐数为1,占0

- 对于i来说,大小是4个字节,vs的默认对齐数是8,i的对齐数是4,需要对齐到对齐数的整数倍处,因为对齐数是4,所以占4-7

- 对于c2来说,大小为1字节,vs的默认对齐数是8,对齐数为1,占8

- 此时所占大小为0-8,共9个字节,但是结构体总大小为最大对齐数的整数倍,这里最大对齐数为4,所以大小应该是4的整数倍,离9最近的就是12

使用offsetof宏验证我们的计算
offsetof
返回一个结果体类型的成员的偏移量
头文件:<stddef.h>
struct S1
{
char c1;
int i;
char c2;
};
int main()
{
printf("%d\n", offsetof(struct S1, c1));
printf("%d\n", offsetof(struct S1, i));
printf("%d\n", offsetof(struct S1, c2));
return 0;
}

可以看到我们刚刚的计算是正确的
为什么存在内存对齐
1.平台原因
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2.性能原因
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。(比如32位机器一次可以控制32个字节,也就是4个字节)
结构体的内存对齐是拿空间来换取时间的做法
在设计结构体的时候,既要满足对齐,又要节省空间,就可以让占用空间小的成员尽量集中在一起。
struct S1
{
char c1;
int i;
char c2;
};
struct S2
{
char c1;
char c2;
int i;
};
S1和S2类型的成员一模一样,但是S1(12)和S2(8)所占空间的大小有了一些区别
修改默认对齐数
可以使用 #pragma 这个预处理指令,改变我们的默认对齐数。
#pragma pack(4)//设置默认对齐数为4
#pragma pack()//取消设置的默认对齐数,还原为默认
结构在对齐方式不合适的时候,我么可以自己更改默认对齐数。尽量是2的次方数
结构体传参
int main()
{
struct Peo p1 = {"张三","123456789","男",180};
print1(p1);
print2(&p1);
return 0;
}
上面的 print1 和 print2 函数哪个好些?
答案是:首选print2函数
原因
函数传参的时候,参数是需要压栈的。
如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
结论:结构体传参的时候,要传结构体的地址。
结构体体实现位段
什么是位段
位段的声明和结构是类似的,有两个不同:
1.位段的成员必须是 int、unsigned int 或signed int 。(整型家族的都可以,还有char)
2.位段的成员名后边有一个冒号和一个数字。
struct A
{
int _a:2;
int _b:5;
int _c:10;
int _d:30;
};
位段的位指的是比特位,后面的数字就是需要多少比特位的大小,注意这个数字不能超过自身类型的大小(char类型不能超过8,int类型不能超过32)
作用就是为了节省空间
位段的内存分配
- 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
- 位段的空间上是按照需要以 4个字节( int )或者1个字节( char )的方式来开辟的。
- 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
计算举例
struct S
{
char a:3;
char b:4;
char c:5;
char d:4;
};
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
环境为vs2019
一.计算S的大小
首先开辟1个字节,也就是8比特位,分配给a3个比特位,还剩5个比特位,分配给b4个比特位还剩一个比特位,这时c还需要5个比特位而只剩1个比特位,就会将这1个比特位浪费了,再开辟1个字节,得到8个比特位,然后分配给c5个比特位,剩下的3个比特位不够d的空间就会再次被浪费,然后再开辟1个字节给d。所以一共开辟了3个字节的大小
二.观察数据在内存中如何存放

规则:
1.在开辟出来的字节空间里从低位向高位存放,也就是从右往左存
2.存放的值所需的空间大于位段给以的空间,则会发生截断
由上文只此处开辟3字节
在第一个字节里:
对于a:存入10,二进制为1010,而位段只给了3个位,所以发生截断,存入010
对于b:存入12,二进制为1100,位段给4个位,全部存入
所以第一个字节里面为:0110 0010,十六进制表示为0x62
在第二个字节里:
对于c:存入3,二进制为0011,位段给了5个位,全部存入
所以第二个字节里面为:0000 0011,十六进制表示为0x03
在第三个字节里:
对于d:存入4,二进制为0100,位段给了4个位,全部存入
所以第二个字节里面为:0000 0100,十六进制表示为0x04
所以内存中为

位段的跨平台问题
- int 位段被当成有符号数还是无符号数是不确定的。(标准未定义)
- 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。)
- 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
- 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是
舍弃剩余的位还是利用,这是不确定的。
可以针对不同的平台写不同的代码才可以破解位段的问题
位段的应用
在网络编程上使用比较多

