1.结构体类型的声明
1.1.1结构的声明
struct tag
{
member-list;
}variable-list;
描述一个学生:只包含了学生的名字、年龄、性别、学号
struct Stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
};
1.1.2 结构体变量的创建和初始化
struct Stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
};
//初始化
int main()
{
struct Stu s1 = { "zhangsan",20,"男","2023010101"};
struct Stu s2 = { .age = 19, .name="lisi",.id="2025202020",.sex="nv"};
printf("%s %d %s %s\n", s1.name, s1.age, s1.sex, s1.id);
printf("%d %s %s %s\n", s2.age, s2.id, s2.name, s2.sex);
return 0;
}
1.2结构的特殊声明
在声明结构的时候,可以不完全的声明
例子:
struct
{
int a;
char b;
float c;
}x;
上面的结构体在声明的时候省略掉了结构体标签(tag)
那么下面书写的代码对吗?
struct
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}* p;//匿名结构体指针???
int main()
{
p = &x;//???
return 0;
}
上面的写法是错误的,即使两个匿名结构体的内容是一样的,但是,内存会默认上面的两个结构体的类型是不一样的,所以不能将x的地址直接赋值给指针p
警告:
编译器会把上面的两个声明当成完全不同的两个类型,所以是非法的。
匿名的结构体类型,如果没有对结构体类型重命名的话,基板上只能使用一次。
1.3结构的自引用
在结构体中包含一个类型为该结构本身的成员是可以的吗?
例子:定义一个链表的节点:
struct Node
{
int data;//存放数据
struct Node next;//存放下一个结点的地址
};
上面书写的代码是正确的吗?
若正确,那么 sizeof(struct Node) 是多大的?
仔细分析的话,就会发现 struct Node 结构体中里面含有很多个 struct Node next,而 struct Node next 中还含有 struct Node next ,那么究竟有多少个呢?以此来说明,这样是不行的,因为一个结构体中再包含一个同类型的结构体变量,这样结构体变量的大小就会无穷的大,是不合理的。
正确的结构体自引用方式:
struct Node
{
int data;//存放数据
struct Node* next;//存放下一个结点的地址
};
在结构体自引用使用的过程中,夹杂了 typedef 对匿名结构体类型的重命名,也容易出现问题,如下代码,正确吗?
typedef struct
{
int data;//存放数据
Node* next;
}Node;
是不正确的,因为Node是对前面的匿名结构体类型的重命名产生的,但是在匿名结构体内部提前使用Node类型来创建成员变量,这是不行的。
正确的代码如下:定义结构体的时候不要使用匿名结构体
typedef struct Node
{
int data;//存放数据
struct Node* next;
}Node;
2.结构体内存对齐
下面的代码中的变量仅仅是创建的顺序不同,为何运行出来的结果会不同??这是声明原因呢?
struct S1
{
char c1;
char c2;
int i;
};
struct S2
{
char c1;
int i;
char c2;
};
int main()
{
printf("%d\n", sizeof(struct S1));
printf("%d\n", sizeof(struct S2));
return 0;
}
上面出现上面结果的不同是因为结构体内存的对齐的问题
2.1 对齐规则
1.结构体的第一个成员对齐到和结构体变量起始位置偏移量为0的地址处
2.其他成员变量对齐到某个数字(对齐数)的整数倍的地址处
对齐数=编译器默认的一个对齐数 与 该成员变量大小的较小值(vs 中默认的值是 8)
linux 中 gcc 没有默认对齐数,对齐数就是成员自身的大小
3.结构体总大小为最大对齐数(结构体中每一个成员变量都有一个对齐数,所有对齐数最大的)的整数倍。
4.如果嵌套了结构体的情况,嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍,结构体的整体大小就是所有最大对齐数(含嵌套结构体中成员的对齐数)的整数倍。
struct S1
{
char c1;
char c2;
int i;
};
printf("%d\n", sizeof(struct S1));
struct S2
{
char c1;
int i;
char c2;
};
printf("%d\n", sizeof(struct S2));
struct S3
{
double d;
char c;
int i;
};
printf("%d\n", sizeof(struct S3));
//练习4-结构体嵌套问题
struct S4
{
char c1;
struct S3 s3;//16
double d;//8
};
printf("%d\n", sizeof(struct S4));
2.2为什么存在内存对齐?
1.平台原因(移植原因)
不是所有的硬件平台都能访问到任意地址上的任意数据的,某些硬件平台只能在某些地址处取某些特定的数据,否则会抛出硬件异常。
2.性能原因
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要做两次的访问;而对齐的内存访问只需要一次访问。假设一个处理器总是从内存中取8个字节,则地址必须是8的倍数。如果我们能够保证将所有的double类型的数据的地址都对齐成8的倍数,那么就可以用一个内存操作来读或者写值了。否则,我们可能需要执行两次内存访问,因为对象被分放在了两个8字节内存块中。
总的来说:结构体的内存对齐是拿空间来换时间的做法。
在设计结构体的时候,我们既要满足对齐,又要满足空间,该如何操作?
让占用空间少的尽量集中写在一块:
struct S1
{
char c1;
char c2;
int i;
};
struct S2
{
char c1;
int i;
char c2;
};
s1 和 s2 类型的成员一摸一样,但是 s1 和 s2 所占空间的大小是不一样的。
如果想判断我们分析的是否正确?
#include<stio.h>
#include<stddef.h>
struct S1
{
char c1;
char c2;
int i;
};
struct S2
{
char c1;
int i;
char c2;
};
int main()
{
//printf("%zd\n", sizeof(struct S1)); //8
//printf("%zd\n", sizeof(struct S2)); //12
printf("%zd\n", offsetof(struct S1,c1));//计算的是S1中 c1 的偏移量 以此来验证我们分析的图是否正确
printf("%zd\n", offsetof(struct S1, c2));//计算的是S1中 c2 的偏移量
printf("%zd\n", offsetof(struct S1, i));//计算的是S1中 i 的偏移量
printf("%zd\n", offsetof(struct S2, c1));
printf("%zd\n", offsetof(struct S2, c2));
printf("%zd\n", offsetof(struct S2, i));
return 0;
}
正确的就可以用 offsetof 来查看一下,任意一个字符的偏移量:
2.3 修改默认的对齐数
#pragma 这个预处理指令,可以改变编译器的默认对齐数。
#pragma pack(1) //设置vs默认的对齐数为 1
struct S1
{
char c1;
char c2;
int i;
};
#pragma pack() //取消设置的对齐数,还原为默认的对齐数
int main()
{
printf("%d\n", sizeof(struct S1));//1
return 0;
}
当我们再次运行这个代码的时候,结果就不是8了,而是6
结构体在对齐方式不合适的时候,我们可以自己修改默认的对齐数。
3.结构体传参
struct S
{
int data[1000];
int num;
};
//结构体传参
void print1(struct S t) //结构体名不是结构体的地址
{
printf("%d %d\n", t.data[0], t.num);
}
//结构体地址传参
void print2(const struct S* ps)
{
printf("%d %d\n", ps->data[0], ps->num);
}
//两种方法都可以实现,但是最好是第二种的写法
int main()
{
struct S s = { {1,2,3,4,5},122 };//初始化
print1(s);
print2(&s);
return 0;
}
原因:
函数传参的时候,参数需要压栈,会有时间和空间上的系统开销
如果传递的是一个结构体对象的时候,结构体过大,参数压栈的系统开销比较大,所以会导致性能的下降。
结论:
结构体传参的时候,要传结构体的地址。
4.结构体实现位段
4.1 什么是位段?
位段的声明和结构体是类似的,有两个不同:
1.位段的成员必须是 int 、unsigned int 或 signed int,在C99中位段成员的类型也可以是选择其他类型
2.位段的成员名后边有一个冒号和一个数字
例子:
struct A
{
//_ a是变量名
//变量名:
//1.字母、数字、下划线
//2.不能是数字开头
int _a : 2;// 2 比特位
int _b : 5;
int _c : 10;
int _d : 30;
};
int main()
{
printf("%d\n", sizeof(struct A));//理论上:2+5+10+30= 47bit/8 约等于 6 byte
}
A就是一个位段类型
那位段A所占内存的大小是多少?
4.2 位段的内存分配
1.位段的成员可以是 int 、unsigned int signed int 或者是 char 等类型
2.位段的空间是按照需要以4个字节(int)或者1个字节(char)的方式来开辟
3.位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
struct S
{
char a : 3;
char b : 4;
char c : 5;
char d : 4;
};
int main()
{
struct S s = { 0 };
s.a = 10;
s.b = 8;
s.c = 3;
s.d = 4;
printf("%d\n", sizeof(s));// 3字节
return 0;
}
按照我们约定的方法的分析的话,刚好就是我们在vs2022下运行出来的:字节3,说明有可能vs2022就是这样规定的
4.3 位段跨平台问题
位段这么好,那我们应该多多使用位段这种方法???显然是不行的:
1.int 位段被当成有符号数还是无符号数这是不确定的
2.位段中最大位的数目是不能能确定的。(16位机器上最大是16,32位机器上最大是32,当我们写成27的时候,在16位机器上是会出现问题的)
3.位段中的成员在内存中是从从左向右分配,还是从右向左分配,标准是未定义的
4.当一个结构体包含两个位段,第二个位段成员比较大时,无法容纳于第一个位段剩余的位时,是舍弃还是利用剩余的位,这也是不确定
总结:
跟结构相比,位段可以达到相同的效果,并且可以很好的节省空间,但是有跨平台的问题存在
4.4 位段的应用
在网络协议中,IP数据包的格式的实现就需要用位段的实现是最好的,也节省了空间,这样网络传输的数据报大小也会较小一点,对网络的畅通是有帮助的
4.5 位段使用的注意事项
位段的几个成员共有同⼀个字节,这样有些成员的起始位置并不是某个字节的起始位置,那么这些位置处是没有地址的。内存中每个字节分配⼀个地址,⼀个字节内部的bit位是没有地址的。
所以不能对位段的成员使⽤&操作符,这样就不能使用scanf直接给位段的成员输⼊值,只能是先输入放在⼀个变量中,然后赋值给位段的成员。