在『代碼之謎』系列的前幾篇文章中,很多次出現(xiàn)了浮點數(shù)。 浮點數(shù)在很多編程語言中被稱為簡單數(shù)據(jù)類型,其實,浮點數(shù)比起那些復(fù)雜數(shù)據(jù)類型(比如字符串)來說, 一點都不簡單。
單單是說明 IEEE浮點數(shù) 就可以寫一本書了,我將用幾篇博文來簡單的說說我所理解的浮點數(shù),算是拋磚引玉吧。
記得多年前我招聘 Java 程序員時的一次關(guān)于浮點數(shù)、二分法、編碼的面試, 多年以后,他已經(jīng)稱為了一名很出色的程序員。 每次聚會他都會告訴我,“那次面試徹底改變了我的過去的學(xué)習(xí)方式, 我以前?只是盲目接受知識,根本就沒有自己思考過, 那次對話,比我大學(xué)四年學(xué)到的知識都多”。
我看他簡歷上寫到讀過《信息論》才談了很多關(guān)于二分法以及編碼的話題, 整個過程大概3個小時——這是我面試時間最長的一次。
因為時間久遠(yuǎn),我把一些我能回憶起來的關(guān)于浮點數(shù)的內(nèi)容整理在這篇博客中。
格式說明:
所有我說的話,都放在引用里面。他的話放在了引號(“”)里面。沒有加引號的是我的心理活動或者說明。
在 8 位計算機上,浮點數(shù)一共有多少個呢?
“8 位的好像太過時了,現(xiàn)在主流的是 32 位的,好像可以表示3 x 10^38。”
果然不出我所料,?很多畢業(yè)生都把計算機學(xué)成了文科,他們不是在學(xué)習(xí)理論知識,而是接受/背誦這些知識。
8 位計算機可以表示的整數(shù)是多少個呢?
“這個簡單,2的8次方,應(yīng)該是 256 個。N 位計算機表示的整數(shù)就是 2 的 N 次方?!?/p>
他回答時顯得很興奮,因為他終于可以反駁我的觀點了,他沒有把計算機當(dāng)作死記硬背的學(xué)科。
8 位計算機,或者說?8bit 可以表示 2^8 個整數(shù)。 如果用這 8bit 來表示字符,可以表示多少個呢?
“呵呵,當(dāng)然也是 2 的 8 次方了,否則就沒有必要再發(fā)明16位或者32位的 unicode 去表示漢字了。”
如你剛才所說,8bit 可以表示 3 x 10^38 個浮點數(shù)。那么你估算一下,2bit 可以表示多少個浮點數(shù)呢?
“既然 2bit 可以表示 4 個整數(shù),浮點數(shù)嘛肯定比這個多,最少也得能表示 10 幾個浮點數(shù)吧。”
好吧,按照你的思路,我說幾個數(shù)。
- 0總該有吧,用 00 表示。
- 0.1 用 01 表示
- 0.2 用 10 表示
- 0.3 用 11 表示
現(xiàn)在你把 0.4 給我表示出來?
『他思索了片刻』“哦。我明白了,?2bit 可以表示 4 個數(shù),不管是整數(shù)、小數(shù)或者字符,就算是用 2bit 表示蘋果,我們也只能表示 4 個,如果想要表示更多,就得用更多的 bit 位?!?/p>
雖然他在簡歷中寫到讀過《信息論》,他對?N bit可以表示的信息量是 2^N?肯定沒有完全理解,或者只是被動接受了這個定理。
過了一會兒他又繼續(xù)說:“按照這個邏輯,8bit 只能表示 256 個浮點數(shù)了,這也太少了。 我有點糊涂了,浮點數(shù)的表示范圍一般都得幾萬甚至幾億啊。”
于是我在 firebug 里面寫了幾行代碼(可以在本系列第一篇的?序言?部分找到這些代碼)。
0.2 + 0.4
0.1 + 0.1 + 0.1 + 0.1 + 0.1 + 0.1 + 0.1 + 0.1 + 0.1
“這怎么可能呢?JS 居然這么不嚴(yán)格?”
顯然他把這種現(xiàn)象歸結(jié)于 js(謝天謝地,他沒有把罪過加在 firebug 身上)。 于是我用 Java 重寫了上面的代碼,這回他只剩目瞪口呆了。
既然他已經(jīng)開始?驚訝,那么下一步就是?思考。我又稍作了解釋:
任何語言都宣稱他們的浮點數(shù)的表示范圍是 3 x 10^38,這個數(shù)到底多大呢?目前所知宇宙的年齡是 1.373 x 10^10 年。
但是 32bit 最多只能表示 2^32 個數(shù),大約是 4 x 10^9。
對比一下你就會發(fā)現(xiàn)令人震驚的結(jié)果。 如果把浮點數(shù)的范圍比做地球,那么可以精確表示的浮點數(shù)還不到一粒芝麻大。
“這么說,0.2+0.4 是因為他不能夠精確表示,所以出現(xiàn)了計算錯誤的現(xiàn)象。那在編程中如何避免這種問題呢?”
用?定點數(shù)表示小數(shù)。
“定點數(shù)不是整數(shù)嗎?定點數(shù)怎么表示小數(shù)???”
很顯然,有一個理論性概念錯誤。他沒有真正理解什么是定點,什么是浮點。
浮點數(shù)可以表示整數(shù)嗎?比如,float a = 2 可以嗎?
“可以是可以,這個 2 在計算機里面應(yīng)該存儲的是 2.0 吧?”
計算機肯定沒有存儲 2.0。百分之一萬的肯定。計算機存儲的是0、1串。呵呵。
“我覺得浮點數(shù)應(yīng)該不會存儲整數(shù)的2,他存儲的應(yīng)該是小數(shù)的2.0,然后轉(zhuǎn)換成0、1串,是這樣嗎?”
他一連問了我?guī)讉€問題,使我感覺到,我不是在面試,而是在上課。
整數(shù)和小數(shù)是數(shù)學(xué)里面的概念,在計算機中,只有定點數(shù)和浮點數(shù),沒有整數(shù)和小數(shù)。
定點數(shù)在課本里如何定義的?
“忘了,只知道定點數(shù)就是整數(shù),浮點數(shù)就是小數(shù)。好像老師也是這么講的?!?/p>
那是因為你們老師不是我,如果我當(dāng)老師,肯定不會這么教學(xué)生。『笑』
定點、浮點,“點”是什么意思?“點”就是小數(shù)點。 把小數(shù)點固定,通常固定在最右面,就是定點數(shù)。 把小數(shù)點浮動,就是浮點數(shù)。浮點在哪兒?這個在 IEEE 浮點數(shù)標(biāo)準(zhǔn)里面定義的。
回到前面話題,如何精確的表示小數(shù)呢?其中一種方案就是定點數(shù)。 拿 8bit 舉例吧。我們可以把小數(shù)點定在中間,用 4bit 表示整數(shù)部分,4bit 表示小數(shù)部分。 這樣構(gòu)造方式(專業(yè)點我們稱他為數(shù)據(jù)結(jié)構(gòu),一般語言把整數(shù)和小數(shù)稱為簡單數(shù)據(jù)類型,其實他們一點都不簡單,而且比那些成了復(fù)合數(shù)據(jù)類型的字符串都要復(fù)雜的多),
我們可以精確的表示64個小數(shù),我們可以精確的表示 2^8 = 256 個小數(shù)(謝謝?mfkvfn?在 iteye 上的指正)。
在下一章,我們將構(gòu)造一個 8bit 的浮點數(shù)表示形式,來深入探索浮點數(shù)不為人知的秘密。 我稱它為 JJFN-134(JustJavac Float Notation,justjavac浮點數(shù)表示法),1bit符號,3bit指數(shù),4bit尾數(shù)。
更多建議: