Facebook的用戶推薦和話題推薦算法


用戶推薦和話題推薦是SNS的重要課題,效果的好壞是社交網站的區別指標之一,直接關系到用戶體驗,甚至是SNS的活力。國內的一些社交網站,比如新浪微博等,在功能上和UI上做的已經達到國際一流,然而,在推薦算法方面,仍有相當距離。推薦算法屬於SNS的內功,對於SNS的用戶體驗的作用,和搜索算法對搜索網站的用戶體驗的作用相似。改進推薦算法,是社交網站的下一步方向之一。本文用圖示法非常簡單形象的描述了兩種話題推薦法,兩種用戶推薦法,一種用戶間相關度計算法。其中有些方法是非死不可用的。

用戶推薦和話題推薦對社交網絡的重要性,來自與社交網絡的基本價值定位:讓讀者感到有趣,作者感到被欣賞和贊同。這兩者間的一個重要紐帶是用戶推薦和帖子推薦。如果推薦系統除了會推薦名人以外,別的基本不靠譜,那么,由於名人不是有趣的充分條件,別的又不靠譜,這樣的推薦系統太過單薄。如此,漸漸的,其中的用戶關系體系可能會變得僵硬。讀者感到無趣,作者感到孤冷,社交網絡也枯萎。當然,社會是多層次的,確實存在着名人和鐵桿粉絲這么一種現象,但這些人只占很小的一部分。多數人上社交網站,是要解決自己的問題,那就是信息獲取與推廣交流。

作者認為,社交網絡還有更高一層的意義,第一,可以比做是社會神經網絡,是集體智慧(Collective Intelligence)框架工具。第二,可以比做是是思想碰撞,增值,成長與結果的大型鏈式核反應堆。我們知道,在一個神經網絡中,非常重要的一個功能就是聯想。社交網絡也是如此。從計算機實施的角度來說,聯想就是相關性發掘,以及根據發掘結果進行推薦,本文介紹的算法,處處體現着聯想的特征。推薦不好,會導致無趣和冷漠,或者無聊與低俗泛濫->最終結果仍然是無趣和冷漠。

我假定一個user case, 某大學研究生A,研究中西文化差異問題,有一天他讀到一篇有關高場景文化和低場景文化的文章,然后發了一篇帖子。新浪微博(國內的都一樣)會對此視而不見,繼續為他推薦姚晨和"鄭伊健結婚前任祝福"。但是,FB會以此為線索,為他推薦有類似興趣的人B。這樣,他就會在FB上和此人結成一定的關系,並經經常交流。而這兩個人都從FB獲得了好處。FB獲得了流量。

這里面用到了FB的相關性算法(如圖5所示)。它的基本思想是,分析每個人的各種屬性,比如,標簽,愛好,高頻詞等等,然后,他和另一個人的相關性,是由這些詞的重疊程度,重疊越多則相關性越大,以及這些詞在用戶中總的分布概率所決定的,這個分布概率越低,則相關性越大。為了說明后一點,我還舉剛才那個例子,假如,A發的帖子是關於姚晨,盡管B也對姚晨感興趣,但用戶中對姚感興趣的很多,所以,A和B,因為這點重疊所貢獻的相關性就很小。假如,A的帖子是關於"High context culture vs Low context culture",對這個感興趣的用戶的比例很低,那么,A和B因為這項重疊所具有的相關性就很大。

插圖1和插圖2描述了非死不可的話題推薦的兩個方法。基本上這是一種相關搜索法。在話題推薦方法2中,"相關話題"的含義是,比如,籃球,CBA,NBA,喬丹,等等,這些都是相關話題。其中"Sort SX for all X"的含義,是對所有的X的SX進行排序,取其前幾名作為待推薦話題,以下"Sort..."多次出現,其含義相似。

插圖3中描述的用戶推薦方法1,是最簡單的用戶推薦方法,估計新浪微博用的基本上就是這種方法或者其某種變形,比如,把所有的關注強度按照1來近似。實際上,A對I的關注強度,應該和A對I的貼子的轉發/評論頻率有關的。

插圖4中描述的用戶推薦方法2,是一種相關法。如果仔細分析可以看出,插圖3中的用戶推薦方法1是插圖1中的話題推薦方法1的變形,插圖4中的用戶推薦方法2是插圖2中的話題推薦方法2的變形。

========================== 

========================== 

 

插圖5是Facebook的計算用戶相關度的方法。這也可以用於用戶推薦,只需要找出相關度最大的前幾名用戶X即可。 

插圖5補充說明:

I和J相同時,相關度Cor(I,J)=1/P(i),含義是如果兩個人具有一個共同的興趣,而該興趣越稀有,那么興趣I對相關度貢獻就高。其中“AtoI強度", “XtoJ強度", 簡單一點,可以直接用1代入。其中的"項目",可以是社交網絡中的任何對象,比如,興趣愛好,話題,學校,工作單位,Tag(標簽),等等。甚至也可以是社交網絡中的用戶。如果把用戶也包括在項目中進行求和的話,則可以得到最全面的用戶間相關度評價,這時候,“AtoI強度"應該是和A對I的貼子的轉發/評論頻率有關的。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM