從2014年8月開始在博客園寫博客,至今已經積累了82篇,集中在機器學習、NLP、數據結構與算法、大數據、編程語言等方面。在此做個總結,以后還會陸續更新……
1. 機器學習
【十大經典數據挖掘算法】系列:
2. NLP
中文分詞
【中文分詞】理論篇:
- 【中文分詞】簡單高效的MMSeg.
- 【中文分詞】隱馬爾可夫模型HMM.
- 【中文分詞】二階隱馬爾可夫模型2-HMM.
- 【中文分詞】最大熵馬爾可夫模型MEMM.
- 【中文分詞】條件隨機場CRF.
- 【中文分詞】結構化感知器SP.
【中文分詞】實踐篇:
- 開源中文分詞工具探析(一):ICTCLAS (NLPIR)
- 開源中文分詞工具探析(二):Jieba
- 開源中文分詞工具探析(三):Ansj
- 開源中文分詞工具探析(四):THULAC
- 開源中文分詞工具探析(五):FNLP
- 開源中文分詞工具探析(六):Stanford CoreNLP
3. 數據結構與算法
數據結構篇:
算法篇:
- 【模式匹配】KMP算法的來龍去脈.
- 【模式匹配】更快的Boyer-Moore算法.
- 【模式匹配】Aho-Corasick自動機.
- 【圖論】深入理解Dijsktra算法.
- 【圖論】求無向連通圖的割點.
- 【圖論】有向無環圖的拓撲排序.
- 【動態規划】最長公共子序列與最長公共子串.
- 連續子數組最大和.
- 最長回文子串.
- Top K問題的兩種解決思路.
信息論與編碼篇:
【LeetCode題解】系列:
4. 大數據
SQL on Hadoop (Hive、Pig)系列:
OLAP (Kylin)系列:
- Kylin的cube模型.
- Apache Kylin 部署之不完全指南.
- 【Kylin實戰】Hive復雜數據類型與視圖.
- 【Kylin實戰】郵件報表生成.
- 輕量級OLAP(一):Cube計算.
- 輕量級OLAP(二):Hive + Elasticsearch.
工作流調度系列:
5. 編程語言
Java
探究篇:
實戰篇:
Python
實戰篇: