plink --bfile file --extract all.snp --r2 --ld-window-kb 1000 --ld-window-r2 0.8 --ld-snp-list all.snp --out all.snp.08.inter all.snp文件如下所示: ...
PLINK提供了 ld 的參數計算兩個SNP位點的連鎖不平衡值。 命令如下: plink file file ld rs rs out rs rs 生成如下數據: ld rs rs : R sq . D Haplotype Frequency Expectation under LE TG . CG . . TA . . CA . . In phase alleles are TA CG ...
2019-04-29 16:11 0 1779 推薦指數:
plink --bfile file --extract all.snp --r2 --ld-window-kb 1000 --ld-window-r2 0.8 --ld-snp-list all.snp --out all.snp.08.inter all.snp文件如下所示: ...
本文首發於“生信補給站”,https://mp.weixin.qq.com/s/Gl6BChxSYbSHMo9oMpufPg 連鎖不平衡圖,用來可視化不同SNP之間的連鎖程度,前同事間俗稱“倒三角”圖。 本文使用自己的數據,因為安裝R包后使用內置數據集運行出結果較容易 ...
哈代-溫伯格平衡定律(Hardy-Weinberg equilibrium),即HW平衡,是指對於一個大且隨機交配的種群,基因頻率和基因型頻率在沒有遷移、突變和選擇的條件下會保持不變。它是建立在一個理想的群體模式上的,有四個假設前提:1.群體無限大;2.隨機婚配;3.沒有突變;4.沒有大規模遷移 ...
最近需要畫LD block,之前一直用haploview軟件畫,haploview軟件毛病比較多,比如不能有多態位點,輸入的變異位點不能太多等。動不動就報錯。 最近試了一下另外一個畫LD block的軟件LDBlockShow,比haploview好用許多。不需要自己剔除多態位點,直接輸入vcf ...
GWAS入門必看教程:Statistical analysis of genome-wide association (GWAS) data 名詞解釋和基本問題: 關聯分析:就是AS的中文,全稱是GWAS。應用基因組中數以百萬計的單核苷酸多態;SNP為分子遺傳標記,進行全基因組水平 ...
1、測試數據 2、計算觀測雜合度和期待雜合度 ...
數據不平衡 1.什么是數據不平衡 一般都是假設數據分布是均勻的,每種樣本的個數差不多,但是現實情況下我們取到的數據並不是這樣的,如果直接將分布不均的數據直接應用於算法,大多情況下都無法取得理想的結果。 這里着重考慮二分類,因為解決了二分類種的數據不平衡問題后,推而廣之酒能得到多分類情況下 ...
最近有需求,對WGS測序獲得SNP信息進行篩減,可問題是測序個體少,call rate,maf,hwe,等條件過濾后,snp數量還是千萬級別,所以后面利用plink工具根據LD信息來濾除大量SNP標記。 工具版本:PLINK v1.90b4.6 64-bit (15 Aug 2017) 一、格式 ...