這本書中的一個個小故事(知識點)是源自於吳軍博士在Google的黑板報,所以整本書是由許多個小部分組成的。整本書主要的宗旨還是在講述數學在自然語言處理、語音識別、搜索、通信等領域的作用,大致按照下面的流程講述:
- 語言的興起
- 人工智能
- 自然語言處理
- 中文分詞
- 隱馬爾可夫
- 信息熵
- 賈里尼克
- 布爾與搜索
- 圖論與爬蟲
- PageRank——相關性與可信度
- TF-IDF
- 余弦定理與分類
- 矩陣運算與文本處理
- 信息指紋
- 密碼學
- 搜索引擎
- 最大熵模型
- 拼音輸入法
- 馬庫斯
- 布隆過濾
- 貝葉斯網絡
- 條件隨機場
- 維特比
- K均值與分類
- 邏輯回歸與廣告
- MapReduce

可以看到內容還是很多的,讀者可以根據自己感興趣的章節從前往后跳躍性的閱讀。閱讀之后,我想應該可以對搜索排名、文本分類、輸入法優化等方面有一些收獲。
