花費 61 ms
在微博中應用PageRank算法

這個想法很早就有了,因為我是做搜索引擎背景的,能夠深刻的理解PageRank算法在搜索引擎中的重要性,絕對的核心技術之一。不過,這篇博客,並不打算介紹PageRank算法的原理,而是,讓我們來看看,這 ...

Fri Dec 14 02:44:00 CST 2012 39 6697
large graph挖掘的技術基礎

我一直在做社交網絡的挖掘工作,深感目前的一些技術並不能滿足社交挖掘的需要。我並沒有用過太多的工具,而且圖計算的平台也沒有用過,涉及到大規模數據的離線分析,主要是依賴hadoop。不過,這並不妨礙,我從 ...

Mon Nov 19 02:45:00 CST 2012 27 3449
大數據與復雜網絡

寫這篇文章,有兩個原因: 看了李院士的《大數據研究的科學價值》,有些感觸。 我自己做了一段時間社交,也有一些想法。 之前也寫過復雜網絡的東西,但是都非常膚淺,沒有真正的理解復雜網 ...

Tue Nov 06 01:16:00 CST 2012 7 3492
計算微博垂直領域的傳播力排名

這幾天,我計算了幾個領域的PageRank,包括投資人,程序員這種大的垂直領域,也包括“機器學習”“數據挖掘”等這樣的小的領域。在挖掘的過程中,也遇到很多有意思的事情。不過,做這個,並不是要給誰排座次 ...

Mon Dec 17 19:45:00 CST 2012 12 1964
社交圈子挖掘的問題

這是博客搬家到博客園之后的第一篇文章,也是我最近對微博社交圈子挖掘的一些思考和總結,最近主要的思考和研究,主要針對一下幾個問題: 層次性 重疊性 ego network 有向社交網 ...

Thu Nov 15 21:26:00 CST 2012 7 3196
社交圈子挖掘的一種快速的方法--label propagation

這幾天做復雜網絡相關的學習研究,越發覺得網絡科學的內容會越來越豐富,應用會越來越多。會為人類進步,產生巨大的貢獻。我又激動了。 這篇博客介紹的方法,可以應用在大規模的復雜網絡中,有着近乎線性的復雜 ...

Fri Mar 16 01:20:00 CST 2012 2 4403
微博社交圈子挖掘的一種有趣的思路

這是我在一篇論文中看到的思路,與之前的一些思路有比較大的不同。論文沒有通篇看完,只看到算法描述部分,我就迫不及待的實驗,對於同學,同事圈子的挖掘有一定的效果。我之前了解的一些算法的思路可以總結如下: ...

Sat Mar 03 00:25:00 CST 2012 8 771

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM