原文鏈接:http://tecdat.cn/?p=18770
為了用R來處理網絡數據,我們使用婚禮數據集。
-
-
> nflo=network(flo,directed=FALSE)
-
> plot(nflo, displaylabels = TRUE,
-
+ boxed.labels =
-
+ FALSE)
下一步是igraph。由於我們有鄰接矩陣,因此可以使用它
-
-
graph_from_adjacency_matrix(flo,
-
+ mode = "undirected")
我們可以在兩個特定節點之間獲得最短路徑。我們給節點賦予適當的顏色
-
all_shortest_paths(iflo,
-
)
-
-
-
> plot(iflo)
我們還可以可視化邊,需要從輸出中提取邊緣
-
> lins=c(paste(as.character(L)[1:4],
-
+ "--"
-
+ as.character(L)[2:5] sep="" ,
-
+ paste(as.character(L) 2:5],
-
+ "--",
-
-
> E(ifl )$color=c("grey","black")[1+EU]
-
> plot(iflo)
也可以使用D3js可視化
-
> library( networkD3 )
-
> simpleNetwork (df)
下一個問題是向網絡添加一個頂點。最簡單的方法是通過鄰接矩陣實現概率
-
-
> flo2["f","v"]=1
-
> flo2["v","f"]=1
然后,我們進行集中度測量。
目的是了解它們之間的關系。
-
betweenness(ilo)
-
-
> cor(base)
-
betw close deg eig
-
betw 1.0000000 0.5763487 0.8333763 0.6737162
-
close 0.5763487 1.0000000 0.7572778 0.7989789
-
deg 0.8333763 0.7572778 1.0000000 0.9404647
-
eig 0.6737162 0.7989789 0.9404647 1.0000000
可以使用層次聚類圖來可視化集中度度量
-
hclust(dist( ase ,
-
+ method="ward")
查看集中度度量的值,查看排名
-
-
> for(i in 1:4) rbase[,i]=rank(base[,i])
在此,特征向量測度非常接近頂點的度數。
最后,尋找聚類(以防這些家庭之間爆發戰爭)
> kc <- fastgreedy.community ( iflo )
在這里,我們有3類
最受歡迎的見解
1.采用spss-modeler的web復雜網絡對所有腧穴進行分析
3.R語言文本挖掘NASA數據網絡分析,tf-idf和主題建模