有符号数
有符号整数中用来表示符号的是最高位,最高位为0表示正数,最高位为1表示负数。在内存中同样占4个字节,由于最高位为符号位,不能用于表示数值,因些有符号整数的取值范围要比无符号数取值范围少1位,
既0x80000000~0x7FFFFFFF;
负数在内存中都是以补码的形式存放。
补码:
正数的补码是其本身
负数的补码:先求其相反数的补码,然后对该补码的二进制逐位求反,最后加 1。
-10
10二进制:1010
扩展为32位:1000,0000,0000,0000,000,0000,0000,1010 最高位为符号位
补码: 1111,1111,1111,1111,1111,1111,1111,0101 + 1
=1111,1111,1111,1111,1111,1111,1111,0110
=0xfffffff6
x + x(反码) + 1 = 0
补码 = 0 - x = x(反码) + 1
-69DA H
二进制: 1000,0000,0000,0000,0110,1001,1101,1010 B
按位求反:1111,1111,1111,1111,1001,0110,0010,0101 B
加一: 1111,1111,1111,1111,1001,0110,0010,0110 B
f f f f 9, 6, 2, 6 H
6 9 D A
+ ? ? ? ? (9625H)
--------------------
F F F F
浮点数
在C++中,使用浮点方式存储实数,用两种数据类型来保存浮点数:float(单精度)、double(双精度)。Float在内存中占4个字节,double在内存中占8字节空间。
浮点数的编码方式
浮点数编码转换采用的是IEEE规定的编码标准,float和double这两类型数据的转换原理相同。IEEE规定的浮点数编码会将一个浮点数转换为二进制数。以科学记数法划法,将浮点数拆分为3部分:符号、指数、尾数。
float类型的IEEE编码
float类型在内存中占4个字节(32位),最高位用于表示符号;在剩下的31位中,从右向左了8位用于表示指数,其余用于表示尾数。如图:
正指数情况
例:将float类型10.625转换为IEEE编码,需要将10.625转换成对应的二进制数(10.625 * 2^3 = 85 (1010101)):1010.101,
整数部分为1010,小数部分为101;然后对单精度数进行科学记数法转换:将小数点向左移动,每个移动1次指数加1,移动到除符号位的最高位为1处,停止移动,这里移动3次(移动多少次指数部分就是多少)。
对10.625进行科学记数法转换后二进制部分为1.010101,指数部分为3。在IEEE编码中,由于在二进制情况下最高位始终为1,为一个恒定值,故将其忽略不计。
这里是一个正数,所以符号位为0,指数部分:由于指数部分可能出现负数,十进制数127可表示为二进制数01111111。
IEEE编码方式规定,当指数小于01111111时为一个负数,反之为一个正数。
10.625经IEEE转换后各位的情况如下:
符号位:0
指数位:3+127(十进制),转为二进制 10000010
尾数位:01010100000000000000000(当不足23位时,低位补0填充)
10.625转换后的IEEE编码按二进制拼接为:01000001001010100000000000000000
转换成十六进制数为:0x412A0000,由于内存以小尾方式进行排列,故为:00 00 2a 41
负指数
-0.8125经IEEE转换后各位的情况如下:
-0.8125的二进制为-0.1101
符号位:1
指数位:-1+127(十进制),转为二进制 01111110(如果不足8位,高位补0)
尾数位:10100000000000000000000(当不足23位时,低位补0填充)
-0.8125转换后的IEEE编码按二进制拼接为:10111111010100000000000000000000
转换成十六进制数为:0xBF500000,由于内存以小尾方式进行排列,故为:00 00 50 BF
如果小数部分转换为二进制时得到一个无穷值,则根据尾数长度舍弃多余部分。
Double类型的IEEE编码
Double类型的和float类型大同小异,只是double类型表示的范围更大,占用的空间更多,是float类型所占空间的两倍。
double类型:指数用11位正数表示,加上1023用于指数符号判断。
字符编码
在C++中,字符的编码格式分两种:ASCII和Unicode.
ASCII编码在内存中占一个字节大小,只能表示26个字母和常用符号。
Unicode编码在内存中占两个字节大小,表示的范围是0~65535.
在Microsoft Visual C++ 6.0中,使用char定义ASCII编码格式的字符,使用wchar_t定义Unicode编码格式字符。
#include <iostream> void fun(bool flag) { if (flag) { printf("hello world\n"); } else { printf("sorry.\n"); } //int a = 0, b = 4; //int c = b / a; } int main() { bool m = false; unsigned int a = 10; int b = -10; float c = 10.625; fun(m); const char *p = "Hello World!\n"; const wchar_t* w = L"hello Unicode"; system("pause"); return 0; }