数据在内存中的存储——深度解析

发布于:2023-01-23 ⋅ 阅读:(232) ⋅ 点赞:(0)

数据在内存中的存储

开篇:
我们先来观察一下下面的这段代码
例一:

#include <stdio.h>
int main()
{
	float a = 3.141592;
	int b = a;
	printf("%f\n", a);
	printf("%d\n", b);
	printf("%d\n", a);
	return 0;
}

输出结果:在这里插入图片描述
我们都知道当把一个浮点数赋值给一个整数类型的变量时,会丢弃小数部分,那当我们直接将一个浮点数以%d打印的时候,为什么输出的会是0呢?

例二:

int main()
{
	int n = 9;
	float* p = (float*)&n;
	printf("n的值是: %d\n", n);
	printf("*p的值是:%f\n", *p);

	*p = 9.0;
	printf("n的是:   %d\n", n);
	printf("*p的值是:%f\n", *p);
	return 0;
}

大家可以先思考一下这里的输出结果是什么,在文章的最后,会给出解释和答案

数据类型

我们本文学习的是数据在内存中的存储的深度解析,那么我们首先来回归一下C语言中的数据类型
C语言中的数据类型大致可以分为两类

- 整形类型

char
short
int
long (int)
long long (int)

- 浮点型类型

float
double

- 构造类型

数组类型–int [] float [] …
结构体类型 struct
枚举类型 enum
联合类型 union

- 空类型

void
常用于表示函数的返回值,函数的参数以及指针类型

我们今天要讨论的是数据在内存中的存储,所以下面将对两大基本类型展开讨论

整形

关于整形又可以分为无符号整形(unsigned)和有符号整形(signed)我们平常写的char,short,int,long,long long都是有符号的整形,关于无符号的整形在定义时只需要在前面加上关键字unsigned就可以了。

unsigned int a = 1118;

为什么我们要在这里讲无符号整形呢?
是因为无符号值和有符号值在内存中的存储是不同的,我们从一列代码来看

#include <stdio.h>
int main()
{
	char a = -1;
	signed char b = -1;
	unsigned char c = -1;
	printf("a=%d\nb=%d\nc=%d\n", a, b, c);
	return 0;
}

在这里插入图片描述
这里我们可以看到当输出c时,结果却是255,和我们的-1相差很大,这又是为什么呢?下面我们就来介绍unsigned和signed的转换规则

我们都知道,数据在计算机中是以补码的形式存放的,最高位为1时表示是个负数,最高位为0时表示是个整数。
我们可以先把-1的二进制写出来

char类型是一个字节—8位
10000001----原码
111111110----反码->原码的符号位不变其他位按位取反
111111111----补码->反码加一

这样的一个负数在内存中的补码是11111111,当我们将这样的一个有符号数赋值给一个无符号数的时候,它的最高位便不再是符号位了,而全是数值为,那么11111111二进制转换位十进制的时候便是255,所以c的输出结果就是255而不是-1。
在这里插入图片描述
也就是说当一个有符号数转换为一个无符号数的时候,最高也是数值位。
那么我们就可以写出char和unsigned char的取值范围了

char的最大值
01111111--------127
01111111再加1之后变成
10000000---------C语言中规定是-128
再加1
10000001--------- -1
10000010--------- -2

所以char的取值范围就是-128~127

unsigned char的最小值
00000000-------0
unsigned char的最大值
11111111-------255

所以unsigned类型的取值范围是0~255
其他类型比如short,int等也可以这么来确定范围
在这里插入图片描述
这里再给出一个例子,大家可以对比着观察一下,%u是以无符号打印%d是以有符号打印
接下来我们再来看一段代码

#include <stdio.h>
int main()
{
	char a = -1;
	printf("%u\n", a);
	return 0;
}

这里我们直接把一个char类型的值以%u进行输出,而不是将一个unsigned char的值进行输出
结果却是
在这里插入图片描述
是一个非常非常大的值,这又是为什么呢?在刚才我们的c是一个存放在一个unsigned char类型的变量当中的,输出结果是255,这次我们将char类型的a直接以无符号%u进行输出,结果却又是一个值。
下面我们就来解析一下为什么会输出4294967295这个值。
当-1被放进char类型的变量a时只存入了8位(发生了截断)

1000000000000000000000000001 --原码
11111111111111111111111111111110 --反码
11111111111111111111111111111111 --补码
当被存放在char类型的变量中时,发生截断(后8位)
11111111

当以%u的形式进行输出的时候,输出的是32位的数据(整形提升)

11111111111111111111111111111111
此时的最高位不再是符号位,而是数值位,所以输出的结果便是4294967295
在这里插入图片描述

那么将-1改成-2又会是什么值呢?

在这里插入图片描述
在这里插入图片描述
所以当我们把-1放到一个unsigned char类型的变量中再以%u的形式进行输出的时候,便不会出现整型提升的情况,因为unsigned与%u是对应输出的关系,就像%d和signed一样。

浮点型

浮点型数在内存中的存储和整形还是有很大的差异的
下面先给出浮点型存入内存的规则:
根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式

(-1)^ S * M * 2 ^ E
(-1)^S表示符号位,当S=0,V位整数,当S=1,V位负数
M表示有效数字,大于等1小于2
2^E表示指数位

我们还是通过一个例子来解释一下上面的这段话
我们给出一个浮点数5.5写出它对应的二进制,小数点前面的5直接写出它对应得二进制就好

小数点后面的5写出对应的二进制时是1

101.1

因为小数点前面的二进制权重是从0开始,而后面的权重从-1开始的,那么2^-1就是0.5,这里给大家画图解释一下
在这里插入图片描述
那么这个怎么转换成上面的那种形式呢? (-1)^ S * M * 2 ^ E
首先我们知道5.5是一个正数,所以S=0,那么M规定是大于等于1小于2的,所以101.1向前进2位即得到了,1.011 * 2 ^ 2,所以E=2,M=1.011

IEEE 754规定:
对于32位的浮点数,最高的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M。
在这里插入图片描述
对于64位的浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M。
在这里插入图片描述
IEEE 754对有效数字M和指数E,还有一些特别规定。
前面说过, 1≤M<2 ,也就是说,M可以写成 1.xxxxxx 的形式,其中xxxxxx表示小数部分。
IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的
xxxxxx部分。比如保存1.01的时
候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。以32位
浮点数为例,留给M只有23位,
将第一位的1舍去以后,等于可以保存24位有效数字

至于指数E,情况就比较复杂。
首先,E为一个无符号整数(unsigned int)

这意味着,如果E为8位,它的取值范围为0255;如果E为11位,它的取值范围为02047。但是,我们
知道,科学计数法中的E是可以出
现负数的,所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数
是127;对于11位的E,这个中间
数是1023。比如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即
10001001。
然后,指数E从内存中取出还可以再分成三种情况:
E不全为0或不全为1

这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将
有效数字M前加上第一位的1。
比如:
0.5(1/2)的二进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为
1.0*2^(-1),其阶码为-1+127=126,表示为
01111110,而尾数1.0去掉整数部分为0,补齐0到23位00000000000000000000000,则其二进
制表示形式为:
0 01111110 00000000000000000000000

E全为0

这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,
有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于
0的很小的数字

E全为1

这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s)

还记得我们在前言部分给出的代码吗

int main()
{
	int n = 9;
	float* p = (float*)&n;
	printf("n的值是: %d\n", n);
	printf("*p的值是:%f\n", *p);

	*p = 9.0;
	printf("n的是:   %d\n", n);
	printf("*p的值是:%f\n", *p);
	return 0;
}

在这里插入图片描述

我们先来看第一个printf。
很简单打印的就是我们的9。

再来看第二个printf,输出的结果竟然是0.000000!
注意我们是使用的float*类型的指针去指向int类型的数字,那么我们在读取内存中9的二进制的时候就要以浮点数存放数据的角度去读取

首先我们先把9的二进制写出来

00000000000000000000000000001001

前面我们说32位的浮点数,最高的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M。那么这里S=0,E是全0,结合E全位0的情况,E=-126,M=0.00000000000000000001001
结果就是:(-1)^ 0 * 0.00000000000000000001001 * 2 ^ (-126),是一个无限接近0的数,最终打印出十进制的浮点数就是0.000000。

然后

*p = 9.0;
printf(“n的是: %d\n”, n);
printf(“*p的值是:%f\n”, *p);

的第一个printf就是以一个整形去看浮点型的存放,我们先写出9.0的二进制

1001.0
1.001 * 2 ^ 3

最高位S=0,M=1.001, E=3
那么,第一位的符号位S=0,有效数字M等于001后面再加20个0,凑满23位,指数E等于3+127=130即

0 10000010 001 0000 0000 0000 0000 0000

这个二进制以整形来读取的时候,最高位0表示为整数,剩下的10000010 001 0000 0000 0000 0000 0000转换为十进制就是1091567616
在这里插入图片描述
最后的printf就是正常的输出一个浮点数了9.000000

以上就是本文的全部内容了,欢迎留言+评论哦

本文含有隐藏内容,请 开通VIP 后查看

网站公告

今日签到

点亮在社区的每一天
去签到