鄭昀 最后更新於2016/10/17
之前提到過『2007年年底,時任阿里巴巴和中國雅虎CTO的吳炯給我們提出針對股票輿情的情感趨勢分析方向建議后,我們兩周時間就完成了前后端的開發,迅速上線』,有的同學說哎呀是不是太快了點兒?光是收集語料,收集領域新詞,訓練和優化,都需要好久呢。
還有更快的呢。
08年12月13日,受到劉未鵬在 TopLanguage 組《一個整合的閱讀共享方案》帖子的啟發,我有了一個 memeTracker mashup 的思路。問了一下周圍人的看法,大家竟然覺得這思路不靠譜,於是身為全棧工程師的我挽起袖子開工了。先從算法開始,受到谷文棟撰寫的 Reddit 算法介紹文章啟發,12月19日我畫出了社會化推薦的算法腦圖:
有了算法,剩下的代碼部分就容易多了。所以想法誕生后的第7天,玩聚SR的爬蟲(基於 Twisted)、NLP(實體識別、標簽提取和文章相似性計算,在張博士現成的引擎上構架了一層)、存儲(基於MySQL)、統計(基於上圖的 SRRank 算法)和網站(基於 Django)就上線發布了,全是用 Python 寫的。
等了兩天,看看熱文榜效果確實比預計得還要好,我就在08年12月22日發了博文《來,做一個社會化推薦引擎》,正式公開了 SR 的思路和算法。
就這樣,一個 idea 從產生到上線發布,過去了七天。全棧工程師就是有這樣的好處。
隨后1月10日我又正式推出了 SRBacks,一段 JavaScript Widget,利用 JsonP 技術,在博客自己的頁面上顯示哪些人在哪些社交媒體上推薦或分享過他的文章,有人感慨:這下我終於知道誰在分享我的文章了。這個博客插件最開始長這樣:
很快就有人做了自定義版本插件:
迅速推出的 SR 和 SRBacks,欣喜地獲得了 Keso “SR 確實很酷”的評價,也獲得了國內外新聞媒體高度評價。
現如今,移動應用有更加便利的開發條件,從前到后的全棧方便程度更是讓人羡慕。
舉個例子,前兩天看 InfoQ,攜程的技術團隊輸出了一個 ReactMix,它實際上是在 React Native 和 ReactJs 的基礎上,又構架一層 Framework 和自動化翻譯工具,基於自動化腳本動態翻譯的方式,使得他們團隊存量的大量的 HTML+CSS+JS 的代碼可以無修改地直接轉換成為 React Native 代碼,而且是一套不需要修改的代碼,在 iOS、Andorid、PC 等平台上展現完全一致。
類似這種輔助性框架有很多。快速試錯成為可能。
回到過去,最開始玩聚SR長這個樣子:
后來長這個樣子:
09年2月8日,我又乘勝追擊,推出了 Hot Retweets,也就是那兩年被人熟知的 @rtmeme,一個基於 Twitter API (后來又加入了飯否API)的 mashup 應用。最開始它長這個樣子:
此時離 Google 退出中國還有一年零一個月,信息自由流動的大門正在緩緩關閉。
-EOF-
不妨訂閱我的微信訂閱號『老兵筆記』:

