下載和安裝
從官網(https://genomics.ut.ee/en/tools/gwama-download)上下載或:
wget http:/www.geenivaramu.ee/tools/sample.zip
unzip gwama.zip (解壓)
make (安裝)
運行命令:
../GWAMA --filelist gwama.in --output gwama_xp_wz_jp --quantitative
其中,
gwama.in為輸入文件,內容如下
每一行對應一個人群的gwas分析結果,需要的文件格式如下:
MARKERNAME
代表SNP位點的名稱,EA
代表effect allele, NEA
代表other allele,EAF代表EA的頻率, 對於連續型的性狀,要求輸入BETA
和SE
兩列,對於二分類的性狀,要求輸入OR
, OR_95L
, OR_95U
3列,代表odd ratio以及95%置信區間。
以上是最基礎的數據,如果有額外的數據也可以加入,比如STRAND
代表鏈的方向,IMPUTED
代表該位點是否是填充得到的等
gwama_xp_wz_jp為輸出文件的前綴,輸出結果保存在gwama_xp_wz_jp.out文件中,內容如下
--quantitative 表示使用的表型數據是連續變量。
其它需要請看官方文檔:https://genomics.ut.ee/en/tools/gwama-tutorial
為什么需要做meta分析?
群體分層是GWAS研究中一個比較常見的假陽性來源。
具體來說,GWAS的核心在於SNP與表型的關聯,具體來說,我們觀測到每一個genome位點會有許多不同的SNP,如果某個SNP總是與某種表型/疾病同時出現,那么我們可以推測這個SNP極有可能會導致這個表型/疾病。如果存在群體分層,那么發現的SNP可能是群體的一個特征而不是與表型相關,也就是假陽性位點。
當群體出現分層時,常規手段時將分層的群體獨立分析,最后做meta分析。
如何判斷群體分層?
用plink計算PCA,畫PC1和PC2在不同群體的散點圖,看是否將人群分開,如果能觀察到幾個group,就是出現群體分層。
什么是meta分析?
GWAS meta analysis應該翻譯成整合分析,略區別於醫學的薈萃分析。GWAS中的meta analysis,是將不同的GWAS整合在一起,減少群體分層的影響,提升了power。(還是不知道原理)
一般用的軟件有:plink、GWAMA、METAL
關於Meta的在不同場景下的意思
Meta的字面意思:Meta means about the thing itself. It's seeing the thing from a higher perspective instead of from within the thing, like being self-aware
Metadata is "data that provides information about other data"
在計算機里,meta就是描述數據的數據。
META是一種思想概念,一種抽象思維,用來描述數據的數據,比如有一張學生表,記錄着學生的基本信息,我們通過表可以獲取學生信息(數據),但是有時候也要得到表本身的信息數據(比如表結構信息:字段名稱,字段數據類型,長度等信息),對於這種基礎信息的描述,就會使用META的概念,使用META元數據來描述表本身。放到HTML中也是一樣的,HTML用來描述網頁信息,但是HTML自己也有一些信息(比如網頁標題,網頁描述,搜索關鍵字),這些信息也就稱之為HTML META信息,並且HTML也定義了專門的META標簽。
在醫學里,meta就是薈萃分析。
Meta分析是對具有相同目的且相互獨立的多個研究結果進行系統的綜合評價和定量分析的一種研究方法。它不僅僅是搜集很多以往的研究成果,同時進行全面系統的質量評價,另外還要對符合條件的研究進行定量分析。
在微生物里,宏基因組學(Metagenomics),又稱元基因組學。是以特定生境中的整個微生物群落作為研究對象,無需分離培養,直接提取環境樣本DNA進行測序,研究環境微生物的群落結構、物種分類、系統進化、基因功能及代謝網絡等,已廣泛應用於微生物領域。
Reference:
https://genomics.ut.ee/en/tools/gwama
https://www.cnblogs.com/chenwenyan/p/10912521.html
https://www.cnblogs.com/leezx/p/13369846.html