float類型的表現形式:
默認情況下,賦值運算符右側的實數被視為 double。 因此,應使用后綴 f 或 F 初始化浮點型變量,如以下示例中所示:
如果在以上聲明中不使用后綴,則會因為您嘗試將一個 double值存儲到 float 變量中而發生編譯錯誤。
float的取值范圍
float占用4個字節,和int是一樣,也就是32bit.
1bit(符號位) 8bits(指數位) 23bits(尾數位)
存儲方式如下圖:
取值范圍基本表達法
(浮點)數值 = 尾數 × 底數 ^ 指數,(附加正負號)----------------
於是,float的指數范圍為-127~128,而double的指數范圍為-1023~1024,並且指數位是按補碼的形式來划分的。其中負指數決定了浮點數所能表達的絕對值最小的數;而正指數決定了浮點數所能表達的絕對值最大的數,也即決定了浮點數的取值范圍。
float的范圍為-2^128 ~ +2^128,也即-3.40E+38 ~ +3.40E+38;double的范圍為-2^1024 ~ +2^1024,也即-1.79E+308 ~ +1.79E+308。
其他特殊表示
1.當指數部分和小數部分全為0時,表示0值,有+0和-0之分(符號位決定),0x00000000表示正0,0x80000000表示負0. 2.指數部分全1,小數部分全0時,表示無窮大,有正無窮和負無窮,0x7f800000表示正無窮,0xff800000表示負無窮. 3.指數部分全1,小數部分不全0時,表示NaN,分為QNaN和SNaN,Java中都是NaN.
結論: 可以看出浮點數的取值范圍是:2^(-149)~~(2-2^(-23))*2^127,也就是Float.MIN_VALUE和Float.MAX_VALUE.
精度
float和double的精度是由尾數的位數來決定的。浮點數在內存中是按科學計數法來存儲的,其整數部分始終是一個隱含着的“1”,由於它是不變的,故不能對精度造成影響。
float:2^23 = 8388608,一共七位,這意味着最多能有7位有效數字,但絕對能保證的為6位,也即float的精度為6~7位有效數字;