歡迎來到"bio生物信息"的世界
BMC Bioinformatics前幾天發布了一個畫曼哈頓圖的工具Manhattan++
, 這個名字很好理解,Manhattan的升級版。
這個工具與之前畫曼哈頓圖的工具有什么區別呢。
最大的特點是能將顯著的位點以及注釋信息顯示在曼哈頓圖上。
可視化很漂亮,特別有高級感。
好了,以下進入主題,講講怎么畫這個圖。
1 准備需要的輸入文件
需要的輸入文件有三個,分別是infile, configfile, snpfile
infile的文件格式如下:
infile文件每一列所代表的內容如下:
chr - chromosome (must be numeric)
pos - position
pvalue - p-value (please do not log-transform)
maf - Minor Allele Frequency
conseq - Flag of whether variant has HIGH functional consequence (使用VEP計算)
Loci information (snpfile)的文件格式如下:
Loci information (snpfile)文件提供顯著位點的Loci即可,不需要把整個基因組都放上去。
snpfile文件每一列所代表的內容如下:
markername - The name of the variant
gene - The gene name associated with the variant
chr - chromosome
pos - position
eaf - effect allele frequency
OR - Odds Ratio
Pvalue - P-value
novel - The novel flag indicates whether the loci is a new finding in the GWAS being reported.
Configuration file(configfile)文件格式如下:
configfile文件是對曼哈頓圖顏色的注釋,不同顏色代表不同的情況。
不同顏色所代表的信息可以看下表:
2 畫圖
運行命令:
安裝包:
install.packages("devtools")
library(devtools)
install_github("cgrace1978/manhplot", dependencies = T, force = T)
library(manhplot)
infile<-system.file("extdata","cad.add.160614_manhformat.txt.gz",package = "manhplot")
configfile<-system.file("extdata","config.txt", package = "manhplot")
snpfile<-system.file("extdata","56cad.add.160614.variants.txt", package = "manhplot")
manhplusplot(infile = infile,outfile = "test", configfile = configfile, snpfile = snpfile)
以下是示例圖:
感興趣的請看文章:BMC Bioinformatics. 2019 Nov 27;20(1):610. doi: 10.1186/s12859-019-3201-y.Manhattan++: displaying genome-wide association summary statistics with multiple annotation layers.