1 Theta (\( \theta \))
群體遺傳學中,在中性 Wright-Fisher 模型 (neutral Wright-Fisher model) 下,尺度參數為
\[\theta = 4N\mu\]
為每世代平均突變數的兩倍。其中,\(N\) 為有效群體大小 (effective population size),\(\mu\) 為每世代個體突變率 (Klein et al. 1999)。
2 Watterson's estimator
Watterson GA (1975) Theoretical Population Biology 7:256-276
Carlson CS, et al. (2005) Genome Res 15:1553-1565
\[\theta = \frac{S}{ \sum_{i=1}^{n-1} \frac{1}{n} }\]
其中,\(S\) 為分離位點 (segregating site) 數目,\(n\) 為個體數。
2.1 計算
vcftools --vcf geno.vcf --SNPdensity 100000
\[\theta_w = \frac{SNP\_COUNT}{\sum \frac{1}{1} + \frac{1}{2} + ... + \frac{1}{n-1}}\]
3 Nucleotide diversity
Nei M, Li WH (1979) PNAS 76:5269-5273
Carlson CS, et al. (2005) Genome Res 15:1553-1565
\[\pi = \sum_{ij} x_i x_j \pi_{ij}\]
其中,\(x_i\) 為第 \(i\) 個序列的頻率,\(π_{ij}\) 為第 \(i\) 個序列和第 \(j\) 個序列間核苷酸差異數目 (the number of nucleotide differences)。
3.1 計算
vcftools --vcf geno.vcf --site-pi vcftools --vcf geno.vcf --window-pi 100000 --window-pi-step 25000