花费 8 ms
在微博中应用PageRank算法

这个想法很早就有了,因为我是做搜索引擎背景的,能够深刻的理解PageRank算法在搜索引擎中的重要性,绝对的核心技术之一。不过,这篇博客,并不打算介绍PageRank算法的原理,而是,让我们来看看,这 ...

Fri Dec 14 02:44:00 CST 2012 39 6697
large graph挖掘的技术基础

我一直在做社交网络的挖掘工作,深感目前的一些技术并不能满足社交挖掘的需要。我并没有用过太多的工具,而且图计算的平台也没有用过,涉及到大规模数据的离线分析,主要是依赖hadoop。不过,这并不妨碍,我从 ...

Mon Nov 19 02:45:00 CST 2012 27 3449
大数据与复杂网络

写这篇文章,有两个原因: 看了李院士的《大数据研究的科学价值》,有些感触。 我自己做了一段时间社交,也有一些想法。 之前也写过复杂网络的东西,但是都非常肤浅,没有真正的理解复杂网 ...

Tue Nov 06 01:16:00 CST 2012 7 3492
计算微博垂直领域的传播力排名

这几天,我计算了几个领域的PageRank,包括投资人,程序员这种大的垂直领域,也包括“机器学习”“数据挖掘”等这样的小的领域。在挖掘的过程中,也遇到很多有意思的事情。不过,做这个,并不是要给谁排座次 ...

Mon Dec 17 19:45:00 CST 2012 12 1964
社交圈子挖掘的问题

这是博客搬家到博客园之后的第一篇文章,也是我最近对微博社交圈子挖掘的一些思考和总结,最近主要的思考和研究,主要针对一下几个问题: 层次性 重叠性 ego network 有向社交网 ...

Thu Nov 15 21:26:00 CST 2012 7 3196
社交圈子挖掘的一种快速的方法--label propagation

这几天做复杂网络相关的学习研究,越发觉得网络科学的内容会越来越丰富,应用会越来越多。会为人类进步,产生巨大的贡献。我又激动了。 这篇博客介绍的方法,可以应用在大规模的复杂网络中,有着近乎线性的复杂 ...

Fri Mar 16 01:20:00 CST 2012 2 4403
微博社交圈子挖掘的一种有趣的思路

这是我在一篇论文中看到的思路,与之前的一些思路有比较大的不同。论文没有通篇看完,只看到算法描述部分,我就迫不及待的实验,对于同学,同事圈子的挖掘有一定的效果。我之前了解的一些算法的思路可以总结如下: ...

Sat Mar 03 00:25:00 CST 2012 8 771

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM