深层剖析【C语言】----- 数据的存储

目录

数据类型的基本归类

一、整形的存储

二、浮点数的存储


数据类型的基本归类

整形家族:

char   (字符存储的时候存储的是ASCII码值,归类为整形家族)

    unsigned char    signed char

short

    unsigned short [int]      signed short [int]

int 

    unsigned int       signed int

long

    unsigned long [int]       signed long [int]

浮点数家族:

float     double

构造类型(自定义类型):

数组类型

结构体类型       struct

枚举类型           enum

联合体类型       union

指针类型:

int* pi      char* pc       float* pf        void* pv

空类型:

void表示空类型(无类型)    通常应用于函数的返回类型,函数的参数,指针类型。

整形家族的类型表示范围在 limits.h 文件中

一、整形的存储

数据在内存中以二进制的形式存储。对于整数来说,整数二进制有3种表示形式:原码、反码、补码。

int a = 1;
//00000000 00000000 00000000 00000001 - 原码
//00000000 00000000 00000000 00000001 - 反码
//00000000 00000000 00000000 00000001 - 补码

正整数

原码 、 反码、 补码相同

负整数

原码:按照整数的数值翻译成二进制数

反码:符号位不变,其他位按位取反

补码:反码加一

int a = -1;
//10000000 00000000 00000000 00000001  原码
//11111111 11111111 11111111 11111110  反码
//11111111 11111111 11111111 11111111  补码

对于整形来说,存储的是补码。

原因:

在计算机中,数值一律用补码来进行表示和存储。原因在于可以将符号位和数值位统一处理;同时,加法和减法也可以统一处理(cpu只有加法器),此外,补码和原码相互转换,其运算过程是相同的不需要额外的硬件电路。

数据在内存中的存储

内存中存储的是补码,而且是倒着存储的,上图

 可以看到,在我的机器上数组在内存中的存储方式是小端存储。要注意大端或小端存储是由机器本身决定的

截断和整型提升

char到底是signed char 还是 unsigned char ,C语言标准并没有规定,这取决于编译器

char a = -1;
//10000000 00000000 00000000 00000001  原码
//11111111 11111111 11111111 11111110  反码
//11111111 11111111 11111111 11111111  补码
//11111111 截断signed char b = -1;
//10000000 00000000 00000000 00000001  原码
//11111111 11111111 11111111 11111110  反码
//11111111 11111111 11111111 11111111  补码
//11111111unsigned char c = -1;
//10000000 00000000 00000000 00000001  原码
//11111111 11111111 11111111 11111110  反码
//11111111 11111111 11111111 11111111  补码
//11111111printf("%d %d %d", a, b, c);
//a  11111111 11111111 11111111 11111111  
//b  11111111 11111111 11111111 11111111
//c  00000000 00000000 00000000 11111111
//a = -1, b = -1, c = 255 

测试得知,在VS2022编译器下,char是signed char

在VS编译器下,char(即signed char)的取值范围是 -128——127之间 

unsigned char的取值范围位0——255

举两个例子:

int main()
{char a[1000];int i;for (i = 0; i < 1000; i++){a[i] = -1 - i;}printf("%d", strlen(a));return 0;
}
//char的范围是-128——127,a[i]存放的元素为 -1,-2,...,-128,127,126,...,2,1,0,-1,...
//strlen找\0,ASCII码值为0,统计0之前的元素个数  ——255
unsigned char i = 0;int main()
{for (i = 0; i <= 255; i++){//i = 0,1,2,,3,...,255, 100000000(256)截断 i = 0,1,2... printf("hello world!\n"); //死循环打印}return 0;
}

二、浮点数的存储

常见的浮点数:  3.1415926   1E10 (1.0 * 10 ^ 10)。

浮点数家族包括:float,double,long double类型。
表示范围:浮点数表示的范围在float.h 文件中定义。

在内存中整数和浮点数的存储方式是不一样的,举例说明

    int n = 9;float* pf = (float*)&n;printf("n=%d\n", n);     //以整数形式存储,以整数形式取出     9printf("*pf=%f\n", *pf); //以整数形式存储,以浮点数形式取出   0.000000   实际上是一个非常小的数字,超出了表示范围*pf = 9.0;printf("n=%d\n", n);     //以浮点数形式存储,以整数形式取出   1091567616printf("*pf=%f\n", *pf); //以浮点数形式存储,以浮点数形式取出 9.000000  

根据国际标准IEEE(电气和电子工程协会)754,任意一个二进制浮点数v可以表示成以下形式:

· (-1) ^ S * M * 2 ^ E

· (-1) ^ S表示符号位,当S = 0,V为正数;当S = 1,V为负数

· M表示有效数字,大小等于1,小于2

· 2 ^ E表示指数位

例如:十进制浮点数   5.5   ->  二进制    101.1  ->   1.011 * 2 ^ 2 ->  (-1) ^ 0 * 1.011 * 2 ^ 2

在内存中浮点数的存储如图所示

  

 IEEE 754 对于有效数字M和指数E还有一些特别的规定

因为1 <=M<=2,M可以写成1.xxxxxxxxx,的形式,xxxxxxxxxxx表示小数部分

 而指数E,情况相对复杂

首先,指数E是一个无符号整数(unsigned int),意味着E为8位取值范围为0-255,E为11位,取值范围为0-2047.但是科学计数法中的E是可以出现负数的。

因此,IEEE 754 规定,存入内存时E的真实值必须加上一个中间数,8位的E中间数为127,11位的E中间数位1023。

比如 2 ^ 10的E是10,保存成32位浮点数时,E必须保存成10 + 127 即 10001001

说到这大家应该知道浮点数如何存储到内存中的了

套用公式   (-1) ^ S * M * 2 ^ E ,存入对应的位置

举例说明:

float n = 5.5f;
//101.1
//(-1) ^ 0 * 1.011 * 2 ^ 2
//S = 0  M = 1.011  E = 2  
//2+127=129 -> 10000001  M去掉整数部分 补齐0到23位
//0100 0000 1011 0000 0000 0000 0000 0000
//40 b0 00 00

 指数E从内存中取出,还可以分为三种情况

E不全为0或不全为1

这时,浮点数采用以下规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1.

比如:

 00111111 00000000 00000000 00000000

E全为0

E全为1 

 关于浮点数的表示规则就介绍到这里。如果大家觉得有帮助,一键三连,感谢支持❤️❤️❤️


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部