全書是算法入門,從生活中的各種問題說起:租房、談戀愛、老*虎*機、拍電影、面試、買彩票、各種排序、找停車位、尋找新葯、臨床試驗、奧巴馬拉贊助、預估電影票房,講數學家對這些問題的解決辦法(也就是算法),一般從算法的由來開始說起,到現在的實際應用情況,還有各種變化與爭議,比較有意思。
租房與談戀愛在書中都被歸入“最優停止”問題,算法的答案是在37%的時候做選擇。細節可以看書。
涉及到一些技術細節,我估計高中畢業就能看明白。
我認為全書的內容還是比較有幫助的,比雞湯類讀物要有用一個數量級。
翻譯不錯。有一個地方我感覺有問題:#174:‘“算法”(algorithm)一詞得名於波斯數學家花拉子密。’。這里的“花拉子密”一般譯作“花剌子模”。
總體評價4星,比較有價值。
以下是書中一些內容的摘抄,#號后面是kindle電子版中的頁碼,【】中是我根據上下文補充的信息:
1:如果你希望選中最合適公寓的可能性達到最大,那么在看前37%的房子時不要做出任何決定(如果你准備花一個月的時間挑選房子,那么在前11天不要做出決定)。#145
2:我們知道這個答案,是因為找房子問題屬於數學上被稱作“最優停止”(optimalstopping)的一類問題。37%法則明確了解決這些問題的一系列簡單步驟(計算機科學稱之為“算法”)。#150
3:舒普指出,當停車位占用率從90%升至95%時,盡管僅多停了5%的車,但是大家尋找停車位的時間就會翻一番。#526
4:事實證明,探索與利用的取舍問題在網頁設計與臨床試驗(以及其他領域)中占有核心地位——正常情況下,這兩個名詞不會出現在同一個句子中。#688
5:《經濟學人》雜志指出:“在成本上升、收益下降的雙重壓力下,大型電影公司的應對之策是制作續集、前傳或者邀請名演員擔綱主演,因為他們相信這些電影肯定會火起來。”換句話說,在被淘汰出局之前,他們正爭分奪秒,在他們發現的最容易吐錢的“老*虎*機”上進行賭博游戲。#727
6:基廷斯把這個問題【制葯公司篩選葯品】變成了盡可能簡單的形式:有多個可選方案,每個可選方案得到回報的概率不同,可分配的精力(金錢或時間)是確定的。於是,這個問題變成了多臂老*虎*機問題的另外一個化身。
7:西羅克在奧巴馬捐贈頁面上完成的A/B測試反映了一些問題。對於第一次訪問競選網站的用戶,“捐贈並領取禮物”按鈕取得了最好的成績,即使把發放禮物的成本剔除之后,仍然效果最佳。#906
8:優化網站配置的實驗會造成成千上萬美元的影響,但是在臨床試驗中,尋找最有效治療方案的實驗直接關乎病人的生死。越來越多的醫生和統計人員認為我們的做法是不正確的。他們主張,我們應該把醫療方案選擇問題視為多臂老*虎*機問題,在實驗正在進行的同時努力尋找更好的治療方法。#967
9:1969年,馬文·澤倫(現在是哈佛大學的一名生物統計學家)建議采用“自適應性”試驗。他提出的一個建議是隨機化“勝者優先”算法——另外一個版本的贏留輸變算法。根據這個算法,使用某個特定治療方案的可能性隨着每次成功治愈有所增加,反之則會減少。#969
10:也就是說,我們在招聘秘書時會過早地遞出橄欖枝,但是在放棄新航空公司這個方面,我們的決定又往往來得過晚。#1046
11:探索者為了獲得知識,付出的代價是心情愉悅。我們已經知道,因為意外驚喜有可能帶給我們多倍補償,所以基廷斯指數和上限置信區間都誇大了對未知選擇方案吸引力的期望值。但是,與此同時,這也意味着在大多數情況下,探索必然會讓人失望。#1126
12:這種方法現在被稱作“合並排序”,是計算機科學中的傳奇算法之一。正如1997年的一篇論文所指出的:“合並排序在排序歷史中的重要地位與排序在計算歷史中的重要地位旗鼓相當。”#1312
13:一些動物很幸運,也建立了非常明確的優勢等級。諾依曼說:“比如說魚。它們的關系就非常簡單,大魚居於優勢地位。”正因為簡單,所以魚類可以和平相處。與雞和靈長類動物不同,魚可以在不流血的情況下建立秩序。#1595
14:在直接應用之外,約翰遜的研究還揭示了更深層次的兩點內容:第一,時序安排可以通過算法表達;第二,存在最優時序安排方案。這引發了一項龐大的研究,為大量假定工廠中不同數量和種類的機器運行提供策略。#2026
15:【1997年】當噴氣推進實驗室團隊的工程師將探路者號的這一問題識別為優先級反轉的情況后,他們立即編寫了一個修正代碼,並將新代碼數傳送到百萬英里之外的探路者號上。他們穿越太陽系發射的解決方案是什么呢?那就是優先級繼承。#2147
16:事實證明,即使你不知道什么時候會開始工作,最早到期日和最短加工時間仍然是最佳的策略,這能夠保證你在面對不確定性時表現出最佳狀態(平均來說)。#2227
17:事實上,如果買n張彩票共w張中獎,那么中獎率就是中獎數加1,除以所購買的數目加2,即(w+1)/(n+2)。這種令人難以置信的簡單的方法估計概率的簡單方法被稱為拉普拉斯定律,它很容易就能適用於任何你需要通過歷史事件來評估概率的情況。#2459
18:戈特看到柏林牆時已經建成8年了,所以他最好的猜測是,它將再存在8年。(最終,這個數字是20年。)這個簡單的推理,被戈特稱為哥白尼原則,它可以得出一個簡單的算法,能為各類事件做出預測判斷。#2515
19:20世紀20年代中期,貝葉斯統計學家哈羅德·傑佛利曾考慮僅僅通過一輛城市有軌電車的序號來確定一個城市有軌電車的數量,並得出了相同的答案:該數字的雙倍。#2551
20:在第二次世界大戰期間,同盟國試圖估計由德國制造的坦克數量。他們通過所捕獲的坦克的序列號,在純數學估計的基礎上進行預測,得出的結果是德國每月生產246輛坦克,而通過廣泛的(高度危險的)空中偵察所獲得的估計表明,這個數字更接近於1400。而戰后,德國記錄顯示的真實數字是:245。#2553
21:對於任何冪律分布,貝葉斯法則表明,一個合適的預測策略就是相乘法則:將迄今觀察到的數量乘以一些常數。對於無信息先驗,這個常數一般是2,哥白尼預測的方法由此得來;在其他冪律的情況下,所乘的數將取決於你工作的精確分布。例如,對於電影票房,它正好是1.4。#2596
22:丹麥數學家瓦格納·厄蘭研究了這種現象,他將獨立事件之間的間隔形式化並推導出帶有他名字的函數:厄蘭分布。這條曲線的形狀不同於正態分布或冪律分布:它有一個類似翅膀的形狀,峰值上升較緩,尾部下降的趨勢比冪律分布得快,但比正態分布得緩。#2617
23:厄蘭分布給出了第三種預測法則——相加法則:總是預測事物只會再持續一個常量。我們經常聽到的“只需5分鍾!#2624
24:這三個非常不同的最佳預測模式——相乘法則、平均法則和相加法則都是通過將貝葉斯法則應用到冪律、正態和厄蘭分布上得出結果的。#2633
25:事實證明,人們所做的預測與貝葉斯法則所得出的預測非常接近。直覺上,人們做出不同類型的預測也是遵循在現實世界中的不同分布——冪律、正態和厄蘭分布。#2665
26:對於布馮來說,推導出這個公式就已經足夠了。但在1812年,皮埃爾-西蒙·拉普拉斯(也就是我們在第6章提到的英雄)指出,這個結果還有另一層含義:一個人可以僅通過針掉在紙上來估計π的值。#3273
27:但是,對這種基於類比的方法的不信任很快便會消失:在IBM公司,柯克帕特里克和蓋拉特使用模擬退火算法設計出比那些專家設計的更好的芯片布局。#3556
28:從1971年開始,指數退避算法就成為阿羅哈網絡成功運作的一個重要組成部分,20世紀80年代,它被應用於傳輸控制協議,並成為互聯網的一個重要組成部分。幾十年后的現在,它仍然是如此重要。#3803
29:事實上,在美國,過去的十年見證了一場悄無聲息的革命的開始,這場革命讓司法系統本身就能處理好對毒品犯罪者的社會監控。這場革命是由一個名為“希望”的試點項目發起的,該項目采用了阿羅哈網絡的指數避退原則。而這也是一個驚人的巧合,它也始於阿羅哈網絡的誕生地——檀香山。#3830
30:緩沖膨脹的感覺就像是需要在互聯網上查看每一件東西,要閱讀所有可能的書籍,或要看所有可能的節目。你錯過了你最喜歡的連續劇的一集,然后看了一小時,一天,十年。你去度假,回到家看到一大堆信件。之前若有人敲你家的門,沒人應答,他就走了。現在,當你回家時,他們已經在門外排隊等待。#4011
31:令人驚訝的是,蒂姆·拉夫加登和康奈爾大學的伊娃·塔多斯在2002年證明了“自私路由”方法的調和率僅僅是4/3。也就是說,完全公開只比組織嚴密的完美的協調差33%。#4186
32:的確,自動駕駛汽車應該減少交通事故的數量,並且能夠使汽車更緊密地往前行駛,實現這兩方面都能加快交通速度。但從擁塞的角度來看,調和率只有4/3,而完美的協調意味着完全協調的通勤只能是現在的3/4。#4193
33:對於博弈理論家來說,維克瑞拍賣有很多吸引人的地方。特別是對於一個算法博弈理論家來說,這其中有一種特性尤其突出:鼓勵參與者誠實。#4451
更多良心書評參見我的公眾號:左其盛經管新書點評