原文:plink 進行PCA分析

當我們進行群體遺傳分析時,得到vcf后,可利用plink進行主成分 PCA 分析 一 軟件安裝 二 使用流程 第一步:將vcf轉換為plink格式 上述會得到.map, .nosex和.ped結尾的三個文件。 第二步:基於.ped生成一個bed文件 二進制文件 上述得到.bim, .bed 結尾的兩個文件 第三步:PCA分析 上述得到.eigenval 和.eigenvec 結尾的兩個文件,其中. ...

2020-04-26 14:00 0 3506 推薦指數:

查看詳情

GWAS群體分層 (Population stratification):利用plink對基因型進行PCA

一、為什么要做祖先成分的PCA? GWAS研究時經常碰到群體分層的現象,即該群體的祖先來源多樣性,我們知道的,不同群體SNP頻率不一樣,導致后面做關聯分析的時候可能出現假陽性位點(不一定是顯著信號位點與該表型有關,可能是與群體SNP頻率差異有關),因此我們需要在關聯分析前對該群體做PCA分析 ...

Thu Mar 07 01:07:00 CST 2019 0 2575
運用sklearn進行主成分分析(PCA)代碼實現

運用sklearn進行主成分分析(PCA)代碼實現   一、前言及回顧   二、sklearn的PCA類介紹   三、分類結果區域可視化函數   四、10行代碼完成葡萄酒數據集分類   五、完整代碼   六、總結 一、前言及回顧 從上一篇《PCA數據降維原理 ...

Thu Aug 13 00:50:00 CST 2020 0 1293
plink 閾性狀(質量性狀)GWAS分析

plink進行閾性狀(質量性狀)關聯分析有兩種方法 --assoc 和 --logistic, 這兩種方法又分別有分是否校正: --assoc --adjust 和 --logistic --adjust --logistic方法有可以選擇是否添加協變量: --logistic ...

Sat Dec 18 07:47:00 CST 2021 0 1692
R語言PCA分析

學生身體4 項指標的主成份分析 excel數據 學生序號 x1身高 x2體重 x3胸圍 x4坐高 1 148 41 72 78 ...

Tue Jun 19 01:08:00 CST 2012 0 11086
PCA分析和因子分析

#由此說明使用prcomp函數時,必須使用標准化過的原始數據。如果使用沒有標准化的raw數據(不是相關系數矩陣或者協方差矩陣),必須將參數scale. = T <result>$sdev ...

Fri Apr 29 05:11:00 CST 2016 0 2541
在Python中使用K-Means聚類和PCA主成分分析進行圖像壓縮

各位讀者好,在這片文章中我們嘗試使用sklearn庫比較k-means聚類算法和主成分分析PCA)在圖像壓縮上的實現和結果。 壓縮圖像的效果通過占用的減少比例以及和原始圖像的差異大小來評估。 圖像壓縮的目的是在保持與原始圖像的相似性的同時,使圖像占用的空間盡可能地減小,這由圖像的差異百分比 ...

Thu Apr 09 21:43:00 CST 2020 0 889
運用PCA進行降維的好處

運用PCA對高維數據進行降維,有一下幾個特點: (1)數據從高維空間降到低維,因為求方差的緣故,相似的特征會被合並掉,因此數據會縮減,特征的個數會減小,這有利於防止過擬合現象的出現。但PCA並不是一種好的防止過擬合的方法,在防止過擬合的時候,最好是對數據進行正則化; (2)使用降維的方法,使 ...

Wed Mar 30 17:12:00 CST 2016 0 1808
 
粵ICP備18138465號   © 2018-2026 CODEPRJ.COM