NIPT檢測流程


轉自:https://pzweuj.github.io/2019/03/20/NIPT.html

NIPT即非侵入性產前檢測,適用於檢測21、18、13號染色體的三體綜合征。實際上,NIPT的分析流程與CNV的分析流程相似。主要的分析流程是先得到唯一比對的reads,再提取每條染色體的reads來做一個Z檢驗得到Z值,因為Z值在[-3, 3]這個范圍的統計學意義上是占了99%,因此認為超出這個范圍時就是陽性。各種背景知識專家指南說的很清楚了。

測試數據可以使用NCBI的PRJNA400134。總共有3405個樣本,是優訊醫學上傳的,可以隨便下幾十個來測試一下,雖然我也不知道哪個是陽性樣本。

比對
使用bwa aln模式進行比對單端數據。

bwa aln -n 0 -e 0 -k 0 -t 16 hg19.fa s1.fq.gz > s1.sai
bwa samse -n -1 hg19.fa s1.sai s1.fq.gz > s1.sam
排序
samtools view s1.sam -bSh > s1.bam
samtools sort -@ 16 s1.bam -o s1.sorted.bam
samtools index s1.sorted.bam
過濾
samtools rmdup -s s1.sorted.bam s1.rmdups.bam
samtools view -F 4 s1.rmdups.bam -bSh > s1.final.bam
samtools index s1.final.bam
利用GC含量校正reads數
基本上現在的分析流程都會使用loess算法來進行校正,使用的是這篇論文的算法。 目前,也可以使用deeptools里現成的工具進行計算。deeptools需要2bit格式的參考基因。

wget http://hgdownload.cse.ucsc.edu/admin/exe/linux.x86_64/faToTwoBit
chmod +x faToTwoBit
faToTwoBit hg19.fa hg19.2bit
computeGCBias -b s1.final.bam --effectiveGenomeSize 2864785220 -g hg19.2bit -l 75 -o s1.freq -p 16
correctGCBias -b s1.final.bam --effectiveGenomeSize 2864785220 -g hg19.2bit --GCbiasFrequenciesFile s1.freq -o s1.corect.bam -p 16
提取reads數
在校正后,可以使用samtools提取reads數

samtools idxstats s1.corect.bam | sed -n '2,25'p | cut -f 1,3 > s1.counts
重復操作
對於每個樣本,都進行上述操作,這樣就可以得到很多counts數。然后這個時候就可以自己愉快的用python或者R來計算每個樣本的每個染色體的Z值啦。當然,在實際的操作上,我們需要的是30個以上的正常樣本作為對照組,這時候再加入一個受測樣本來算Z值。關於Z值怎么計算,請看上面的專家指南。真的不難呀。

用現成的
其實NIPT的現成工具還算多,親身體驗過覺得還不錯的有R包NIPTeR,有WisecondorX。都是安裝操作都簡單的。

其他
國內還有兩家公司說自己開發了新算法,可以看一看。

  • Informative priors on fetal Statistical Approach to Decreasing the Error Rate of Noninvasive Prenatal Aneuploid Detection caused by Maternal Copy Number Variation.
  • fraction increase power of the noninvasive prenatal screen.


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM