自定义类型:结构体

发布于:2025-05-16 ⋅ 阅读:(11) ⋅ 点赞:(0)

1.结构体类型的声明

1.1.1结构的声明

struct tag
{
	member-list;
}variable-list;

描述一个学生:只包含了学生的名字、年龄、性别、学号

struct Stu 
{
	char name[20];//名字
	int age;//年龄
	char sex[5];//性别
	char id[20];//学号
};

 1.1.2 结构体变量的创建和初始化

struct Stu 
{
	char name[20];//名字
	int age;//年龄
	char sex[5];//性别
	char id[20];//学号
};
//初始化
int main()
{
	struct Stu s1 = { "zhangsan",20,"男","2023010101"};
	struct Stu s2 = { .age = 19, .name="lisi",.id="2025202020",.sex="nv"};
	printf("%s %d %s %s\n", s1.name, s1.age, s1.sex, s1.id);
	printf("%d %s %s %s\n", s2.age, s2.id, s2.name, s2.sex);
	return 0;
}

1.2结构的特殊声明

在声明结构的时候,可以不完全的声明

例子:

struct
{
	int a;
	char b;
	float c;

}x;

上面的结构体在声明的时候省略掉了结构体标签(tag)

那么下面书写的代码对吗?

struct
{
	int a;
	char b;
	float c;

}x;

struct
{
	int a;
	char b;
	float c;
}* p;//匿名结构体指针???

int main()
{
	p = &x;//???
	return 0;
}

上面的写法是错误的,即使两个匿名结构体的内容是一样的,但是,内存会默认上面的两个结构体的类型是不一样的,所以不能将x的地址直接赋值给指针p

警告:

编译器会把上面的两个声明当成完全不同的两个类型,所以是非法的。

匿名的结构体类型,如果没有对结构体类型重命名的话,基板上只能使用一次。

1.3结构的自引用

在结构体中包含一个类型为该结构本身的成员是可以的吗?

例子:定义一个链表的节点:

struct Node
{
	int data;//存放数据
	struct Node next;//存放下一个结点的地址 
};

上面书写的代码是正确的吗?

若正确,那么 sizeof(struct Node) 是多大的?

仔细分析的话,就会发现 struct Node 结构体中里面含有很多个  struct Node next,而  struct Node next 中还含有  struct Node next ,那么究竟有多少个呢?以此来说明,这样是不行的,因为一个结构体中再包含一个同类型的结构体变量,这样结构体变量的大小就会无穷的大,是不合理的。

正确的结构体自引用方式:

struct Node
{
	int data;//存放数据
	struct Node* next;//存放下一个结点的地址 
};

在结构体自引用使用的过程中,夹杂了 typedef 对匿名结构体类型的重命名,也容易出现问题,如下代码,正确吗?

typedef struct 
{
	int data;//存放数据
	Node* next;
}Node;

 是不正确的,因为Node是对前面的匿名结构体类型的重命名产生的,但是在匿名结构体内部提前使用Node类型来创建成员变量,这是不行的。

正确的代码如下:定义结构体的时候不要使用匿名结构体

typedef struct Node
{
	int data;//存放数据
	struct Node* next;
}Node;

2.结构体内存对齐

下面的代码中的变量仅仅是创建的顺序不同,为何运行出来的结果会不同??这是声明原因呢?

struct S1
{
	char c1;
	char c2;
	int i;
};

struct S2
{
	char c1;
	int i;
	char c2;
};

int main()
{
	printf("%d\n", sizeof(struct S1));
	printf("%d\n", sizeof(struct S2));
	return 0;
}

上面出现上面结果的不同是因为结构体内存的对齐的问题

2.1 对齐规则

1.结构体的第一个成员对齐到和结构体变量起始位置偏移量为0的地址处

2.其他成员变量对齐到某个数字(对齐数)的整数倍的地址处

对齐数=编译器默认的一个对齐数 与 该成员变量大小的较小值(vs 中默认的值是 8)

linux 中 gcc 没有默认对齐数,对齐数就是成员自身的大小

3.结构体总大小为最大对齐数(结构体中每一个成员变量都有一个对齐数,所有对齐数最大的)的整数倍。

4.如果嵌套了结构体的情况,嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍,结构体的整体大小就是所有最大对齐数(含嵌套结构体中成员的对齐数)的整数倍。

struct S1
{
	char c1;
	char c2;
	int i;
};
printf("%d\n", sizeof(struct S1));

struct S2
{
	char c1;
	int i;
	char c2;
};
printf("%d\n", sizeof(struct S2));

struct S3
{
	double d;
	char c;
	int i;
};
printf("%d\n", sizeof(struct S3));

//练习4-结构体嵌套问题
struct S4
{
	char c1;
	struct S3 s3;//16
	double d;//8
};
printf("%d\n", sizeof(struct S4));

2.2为什么存在内存对齐?

1.平台原因(移植原因)

不是所有的硬件平台都能访问到任意地址上的任意数据的,某些硬件平台只能在某些地址处取某些特定的数据,否则会抛出硬件异常。

2.性能原因

数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要做两次的访问;而对齐的内存访问只需要一次访问。假设一个处理器总是从内存中取8个字节,则地址必须是8的倍数。如果我们能够保证将所有的double类型的数据的地址都对齐成8的倍数,那么就可以用一个内存操作来读或者写值了。否则,我们可能需要执行两次内存访问,因为对象被分放在了两个8字节内存块中。

总的来说:结构体的内存对齐是拿空间来换时间的做法。

在设计结构体的时候,我们既要满足对齐,又要满足空间,该如何操作?

让占用空间少的尽量集中写在一块:

struct S1
{
	char c1;
	char c2;
	int i;
};

struct S2
{
	char c1;
	int i;
	char c2;
};

s1 和 s2 类型的成员一摸一样,但是 s1 和 s2 所占空间的大小是不一样的。

 

 

如果想判断我们分析的是否正确?

#include<stio.h>
#include<stddef.h>
struct S1
{
	char c1;
	char c2;
	int i;
};

struct S2
{
	char c1;
	int i;
	char c2;
};
int main()
{
	//printf("%zd\n", sizeof(struct S1)); //8
	//printf("%zd\n", sizeof(struct S2)); //12
    printf("%zd\n", offsetof(struct S1,c1));//计算的是S1中 c1 的偏移量 以此来验证我们分析的图是否正确
	printf("%zd\n", offsetof(struct S1, c2));//计算的是S1中 c2 的偏移量
	printf("%zd\n", offsetof(struct S1, i));//计算的是S1中 i 的偏移量

	printf("%zd\n", offsetof(struct S2, c1));
	printf("%zd\n", offsetof(struct S2, c2));
	printf("%zd\n", offsetof(struct S2, i));
	return 0;
}

正确的就可以用 offsetof 来查看一下,任意一个字符的偏移量:

2.3 修改默认的对齐数

#pragma 这个预处理指令,可以改变编译器的默认对齐数。

#pragma pack(1) //设置vs默认的对齐数为 1
struct S1
{
	char c1;
	char c2;
	int i;
};
#pragma pack() //取消设置的对齐数,还原为默认的对齐数

int main()
{
	printf("%d\n", sizeof(struct S1));//1
	return 0;
}

当我们再次运行这个代码的时候,结果就不是8了,而是6

 结构体在对齐方式不合适的时候,我们可以自己修改默认的对齐数。

3.结构体传参  

struct S
{
	int data[1000];
	int num;
};

//结构体传参
void print1(struct S t) //结构体名不是结构体的地址
{
	printf("%d %d\n", t.data[0], t.num);
}
//结构体地址传参
void print2(const struct S* ps)
{
	printf("%d %d\n", ps->data[0], ps->num);
}
//两种方法都可以实现,但是最好是第二种的写法
int main()
{
	struct S s = { {1,2,3,4,5},122 };//初始化
	print1(s);
	print2(&s);
	return 0;
}

原因:

函数传参的时候,参数需要压栈,会有时间和空间上的系统开销

如果传递的是一个结构体对象的时候,结构体过大,参数压栈的系统开销比较大,所以会导致性能的下降。

结论:

结构体传参的时候,要传结构体的地址。

4.结构体实现位段

4.1 什么是位段?

位段的声明和结构体是类似的,有两个不同:

1.位段的成员必须是 int 、unsigned int 或 signed int,在C99中位段成员的类型也可以是选择其他类型

2.位段的成员名后边有一个冒号和一个数字

例子:

struct A
{
	//_ a是变量名
	//变量名:
	//1.字母、数字、下划线
	//2.不能是数字开头
	int _a : 2;// 2 比特位
	int _b : 5;
	int _c : 10;
	int _d : 30;
};
int main()
{
	printf("%d\n", sizeof(struct A));//理论上:2+5+10+30= 47bit/8 约等于 6 byte 
}

A就是一个位段类型

那位段A所占内存的大小是多少?

4.2 位段的内存分配

1.位段的成员可以是 int 、unsigned int signed int 或者是 char 等类型

2.位段的空间是按照需要以4个字节(int)或者1个字节(char)的方式来开辟

3.位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。

struct S
{
	char a : 3;
	char b : 4;
	char c : 5;
	char d : 4;
};

int main()
{
	struct S s = { 0 };
	s.a = 10;
	s.b = 8;
	s.c = 3;
	s.d = 4;
	printf("%d\n", sizeof(s));// 3字节
	return 0;
}

按照我们约定的方法的分析的话,刚好就是我们在vs2022下运行出来的:字节3,说明有可能vs2022就是这样规定的

4.3 位段跨平台问题

位段这么好,那我们应该多多使用位段这种方法???显然是不行的:

1.int 位段被当成有符号数还是无符号数这是不确定的

2.位段中最大位的数目是不能能确定的。(16位机器上最大是16,32位机器上最大是32,当我们写成27的时候,在16位机器上是会出现问题的)

3.位段中的成员在内存中是从从左向右分配,还是从右向左分配,标准是未定义的

4.当一个结构体包含两个位段,第二个位段成员比较大时,无法容纳于第一个位段剩余的位时,是舍弃还是利用剩余的位,这也是不确定

总结:

跟结构相比,位段可以达到相同的效果,并且可以很好的节省空间,但是有跨平台的问题存在

4.4 位段的应用

在网络协议中,IP数据包的格式的实现就需要用位段的实现是最好的,也节省了空间,这样网络传输的数据报大小也会较小一点,对网络的畅通是有帮助的

4.5 位段使用的注意事项

位段的几个成员共有同⼀个字节,这样有些成员的起始位置并不是某个字节的起始位置,那么这些位置处是没有地址的。内存中每个字节分配⼀个地址,⼀个字节内部的bit位是没有地址的。
所以不能对位段的成员使⽤&操作符,这样就不能使用scanf直接给位段的成员输⼊值,只能是先输入放在⼀个变量中,然后赋值给位段的成员。 


网站公告

今日签到

点亮在社区的每一天
去签到