R語言中有很多現成的R包,可以繪制venn圖,但是最多支持5組,當組別數大於5時,venn圖即使能夠畫出來,看上去也非常復雜,不夠直觀;
在實際的數據分析中,組別大於5的情況還是經常遇到的,這是就可以考慮用花瓣圖來進行數據的可視化
比如下面這個例子:
來源於該鏈接 https://www.researchgate.net/figure/235681265_fig3_The-pan-genome-of-Sinorhizobium-The-flower-plots-and-Venn-diagrams-illustrate-the-number
A和D是我們常見的venn圖,B和C 就是花瓣圖了
在花瓣圖中,我們能夠看到兩種信息;
1)所有樣本共有的信息;
2)每個樣本獨有的信息;
花瓣圖既美觀,展示信息也很直觀,那么這樣的圖如何畫呢?
我在網上找了半天,也沒找到現成的工具,只能自己寫代碼來畫!
在寫代碼之前,首先來分析下這張圖,每一片花瓣就是一個橢圓型,整幅圖片可以看做有1個橢圓通過旋轉得到
通過以上分析,我們只需要先畫一個橢圓,然后循環旋轉即可
中間的調試過程就不細講了,直接看寫好的代碼
flower_plot <- function(sample, value, start, a, b, ellipse_col = rgb(135, 206, 235, 150, max = 255), circle_col = rgb(0, 162, 214, max = 255), circle_text_cex = 1.5 ) { par( bty = "n", ann = F, xaxt = "n", yaxt = "n", mar = c(1,1,1,1)) plot(c(0,10),c(0,10),type="n") n <- length(sample) deg <- 360 / n res <- lapply(1:n, function(t){ draw.ellipse(x = 5 + cos((start + deg * (t - 1)) * pi / 180), y = 5 + sin((start + deg * (t - 1)) * pi / 180), col = ellipse_col, border = ellipse_col, a = a, b = b, angle = deg * (t - 1)) text(x = 5 + 2.5 * cos((start + deg * (t - 1)) * pi / 180), y = 5 + 2.5 * sin((start + deg * (t - 1)) * pi / 180), value[t] ) if (deg * (t - 1) < 180 && deg * (t - 1) > 0 ) { text(x = 5 + 3.3 * cos((start + deg * (t - 1)) * pi / 180), y = 5 + 3.3 * sin((start + deg * (t - 1)) * pi / 180), sample[t], srt = deg * (t - 1) - start, adj = 1, cex = circle_text_cex ) } else { text(x = 5 + 3.3 * cos((start + deg * (t - 1)) * pi / 180), y = 5 + 3.3 * sin((start + deg * (t - 1)) * pi / 180), sample[t], srt = deg * (t - 1) + start, adj = 0, cex = circle_text_cex ) } }) draw.circle(x = 5, y = 5, r = 1.3, col = circle_col, border = circle_col) }
這里我寫成了1個函數,函數的調用方式如下;
flower_plot(c("WSM419", "A321", "M1", "M2", "M22", "M58", "M102", "M161", "KH36b", "KH36c", "KH36d", "KH53a", "KH53b"), c(519, 556, 83, 62, 415, 425, 357, 441, 22, 41, 33, 44, 43), 90, 0.5, 2)
第一個參數為樣本名字構成的向量,第二個參數為每個樣本獨有的數目,第三個參數為起始橢圓的角度,第四個參數為橢圓的短軸的長度,第五個參數為橢圓的長軸的長度
效果圖如下: