使用vcftools或者gcta計算群體間固定指數（Fixation index，FST）

本文轉載自查看原文 2018-03-15 11:22 3939 GWAS/ 分析工具/ 自然選擇/ 數據庫使用

下列所用到的數據均為千人基因組數據庫

1、通過vcftools計算FST

命令行如下：

./vcftools --vcf input_data.vcf --weir-fst-pop population_1.txt --weir-fst-pop population_2.txt --out pop1_vs_pop2

其中，input_data.vcf就是輸入的vcf格式

population_1.txt的格式如下：

population_2.txt的格式同population_1.txt，只有一列sample名字的信息。

計算之后，會得到兩個文件格式，分別為.log和.fst,如圖下所示：

2、通過gcta計算FST

命令行如下：

gcta64 --bfile test --fst --sub-popu subpopu.txt --out test

其中，bfile文件W為plink二進制格式文件，后綴分別為.bed、.bim、.fam

subpopu.txt的輸入格式如圖下所示：

解釋下subpopu.txt這三列的意思。第一列為樣本數，第二列為樣本的ID，第三列為每個樣本對應的population（如CHB、GWD）

其中，CHB為其中一個population，GWD為另一個population。

得到的結果文件為.fst格式，如圖下所示：

參考鏈接：

http://cnsgenomics.com/software/gcta/#Fst

http://vcftools.sourceforge.net/documentation.html

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Fst指數說明 Fst計算會話固定攻擊（session fixation attack） vcftools安裝與使用 VCFtools Linux 如何綁定指定線程在某個固定CPU上使用excel計算指數平滑和移動平均 Spring Security如何防止會話固定攻擊(session fixation attack) 原生table表格固定指定列或行 H指數計算