深层剖析【C语言】----- 数据的存储
目录
数据类型的基本归类
一、整形的存储
二、浮点数的存储
数据类型的基本归类
整形家族:
char (字符存储的时候存储的是ASCII码值,归类为整形家族)
unsigned char signed char
short
unsigned short [int] signed short [int]
int
unsigned int signed int
long
unsigned long [int] signed long [int]
浮点数家族:
float double
构造类型(自定义类型):
数组类型
结构体类型 struct
枚举类型 enum
联合体类型 union
指针类型:
int* pi char* pc float* pf void* pv
空类型:
void表示空类型(无类型) 通常应用于函数的返回类型,函数的参数,指针类型。
整形家族的类型表示范围在 limits.h 文件中
一、整形的存储
数据在内存中以二进制的形式存储。对于整数来说,整数二进制有3种表示形式:原码、反码、补码。
int a = 1;
//00000000 00000000 00000000 00000001 - 原码
//00000000 00000000 00000000 00000001 - 反码
//00000000 00000000 00000000 00000001 - 补码
正整数
原码 、 反码、 补码相同
负整数
原码:按照整数的数值翻译成二进制数
反码:符号位不变,其他位按位取反
补码:反码加一
int a = -1;
//10000000 00000000 00000000 00000001 原码
//11111111 11111111 11111111 11111110 反码
//11111111 11111111 11111111 11111111 补码
对于整形来说,存储的是补码。
原因:
在计算机中,数值一律用补码来进行表示和存储。原因在于可以将符号位和数值位统一处理;同时,加法和减法也可以统一处理(cpu只有加法器),此外,补码和原码相互转换,其运算过程是相同的不需要额外的硬件电路。
数据在内存中的存储
内存中存储的是补码,而且是倒着存储的,上图

可以看到,在我的机器上数组在内存中的存储方式是小端存储。要注意大端或小端存储是由机器本身决定的
截断和整型提升
char到底是signed char 还是 unsigned char ,C语言标准并没有规定,这取决于编译器
char a = -1;
//10000000 00000000 00000000 00000001 原码
//11111111 11111111 11111111 11111110 反码
//11111111 11111111 11111111 11111111 补码
//11111111 截断signed char b = -1;
//10000000 00000000 00000000 00000001 原码
//11111111 11111111 11111111 11111110 反码
//11111111 11111111 11111111 11111111 补码
//11111111unsigned char c = -1;
//10000000 00000000 00000000 00000001 原码
//11111111 11111111 11111111 11111110 反码
//11111111 11111111 11111111 11111111 补码
//11111111printf("%d %d %d", a, b, c);
//a 11111111 11111111 11111111 11111111
//b 11111111 11111111 11111111 11111111
//c 00000000 00000000 00000000 11111111
//a = -1, b = -1, c = 255
测试得知,在VS2022编译器下,char是signed char

在VS编译器下,char(即signed char)的取值范围是 -128——127之间
unsigned char的取值范围位0——255
举两个例子:
int main()
{char a[1000];int i;for (i = 0; i < 1000; i++){a[i] = -1 - i;}printf("%d", strlen(a));return 0;
}
//char的范围是-128——127,a[i]存放的元素为 -1,-2,...,-128,127,126,...,2,1,0,-1,...
//strlen找\0,ASCII码值为0,统计0之前的元素个数 ——255
unsigned char i = 0;int main()
{for (i = 0; i <= 255; i++){//i = 0,1,2,,3,...,255, 100000000(256)截断 i = 0,1,2... printf("hello world!\n"); //死循环打印}return 0;
}
二、浮点数的存储
常见的浮点数: 3.1415926 1E10 (1.0 * 10 ^ 10)。
浮点数家族包括:float,double,long double类型。
表示范围:浮点数表示的范围在float.h 文件中定义。
在内存中整数和浮点数的存储方式是不一样的,举例说明
int n = 9;float* pf = (float*)&n;printf("n=%d\n", n); //以整数形式存储,以整数形式取出 9printf("*pf=%f\n", *pf); //以整数形式存储,以浮点数形式取出 0.000000 实际上是一个非常小的数字,超出了表示范围*pf = 9.0;printf("n=%d\n", n); //以浮点数形式存储,以整数形式取出 1091567616printf("*pf=%f\n", *pf); //以浮点数形式存储,以浮点数形式取出 9.000000
根据国际标准IEEE(电气和电子工程协会)754,任意一个二进制浮点数v可以表示成以下形式:
· (-1) ^ S * M * 2 ^ E
· (-1) ^ S表示符号位,当S = 0,V为正数;当S = 1,V为负数
· M表示有效数字,大小等于1,小于2
· 2 ^ E表示指数位
例如:十进制浮点数 5.5 -> 二进制 101.1 -> 1.011 * 2 ^ 2 -> (-1) ^ 0 * 1.011 * 2 ^ 2
在内存中浮点数的存储如图所示


IEEE 754 对于有效数字M和指数E还有一些特别的规定
因为1 <=M<=2,M可以写成1.xxxxxxxxx,的形式,xxxxxxxxxxx表示小数部分

而指数E,情况相对复杂
首先,指数E是一个无符号整数(unsigned int),意味着E为8位取值范围为0-255,E为11位,取值范围为0-2047.但是科学计数法中的E是可以出现负数的。
因此,IEEE 754 规定,存入内存时E的真实值必须加上一个中间数,8位的E中间数为127,11位的E中间数位1023。
比如 2 ^ 10的E是10,保存成32位浮点数时,E必须保存成10 + 127 即 10001001
说到这大家应该知道浮点数如何存储到内存中的了
套用公式 (-1) ^ S * M * 2 ^ E ,存入对应的位置
举例说明:
float n = 5.5f;
//101.1
//(-1) ^ 0 * 1.011 * 2 ^ 2
//S = 0 M = 1.011 E = 2
//2+127=129 -> 10000001 M去掉整数部分 补齐0到23位
//0100 0000 1011 0000 0000 0000 0000 0000
//40 b0 00 00

指数E从内存中取出,还可以分为三种情况
E不全为0或不全为1
这时,浮点数采用以下规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1.
比如:

00111111 00000000 00000000 00000000
E全为0

E全为1
![]()
关于浮点数的表示规则就介绍到这里。如果大家觉得有帮助,一键三连,感谢支持❤️❤️❤️
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
