1 Theta (\( \theta \))
群体遗传学中,在中性 Wright-Fisher 模型 (neutral Wright-Fisher model) 下,尺度参数为
\[\theta = 4N\mu\]
为每世代平均突变数的两倍。其中,\(N\) 为有效群体大小 (effective population size),\(\mu\) 为每世代个体突变率 (Klein et al. 1999)。
2 Watterson's estimator
Watterson GA (1975) Theoretical Population Biology 7:256-276
Carlson CS, et al. (2005) Genome Res 15:1553-1565
\[\theta = \frac{S}{ \sum_{i=1}^{n-1} \frac{1}{n} }\]
其中,\(S\) 为分离位点 (segregating site) 数目,\(n\) 为个体数。
2.1 计算
vcftools --vcf geno.vcf --SNPdensity 100000
\[\theta_w = \frac{SNP\_COUNT}{\sum \frac{1}{1} + \frac{1}{2} + ... + \frac{1}{n-1}}\]
3 Nucleotide diversity
Nei M, Li WH (1979) PNAS 76:5269-5273
Carlson CS, et al. (2005) Genome Res 15:1553-1565
\[\pi = \sum_{ij} x_i x_j \pi_{ij}\]
其中,\(x_i\) 为第 \(i\) 个序列的频率,\(π_{ij}\) 为第 \(i\) 个序列和第 \(j\) 个序列间核苷酸差异数目 (the number of nucleotide differences)。
3.1 计算
vcftools --vcf geno.vcf --site-pi vcftools --vcf geno.vcf --window-pi 100000 --window-pi-step 25000