使用wtdbg利用三代數據進行基因組de novo組裝


相較於其他三代四代數據組裝軟件(Canu(也可用於糾錯),smartdenovo,miniasm,Flye,TULIP,FALCON,FALCON-unzip等)

wtdbg有如下優點

 

安裝運行簡單 (可用run_wtdbg_assembly.sh腳本生成運行腳本),運行速度快,

運行內容:一步組裝,兩輪糾錯

“--edge-min”值對基因大小影響特別大,在基因組復雜度低和測序深度大的情況下可提高該值,可降低運行內存和運行時間。(僅進行第一輪組裝) [2]

 

wtdbg2軟件使用[2,3]:

提供參數給run_wtdbg_assembly.sh,會動生成運行腳本。 

$ ./run_wtdbg_assembly.sh -h $ cat run.sh

### assembling wtdbg-1.2.8 -t 0 -i reads.fa.gz --tidy-reads 5000 -fo dbg -k 0 -p 21 -S 4 --rescue-low-cov-edges
進行基因組裝
$ wtdbg2 -t 16 -i reads.fa.gz -fo prefix -L 5000
 ### first round of correction wtdbg-cns -t 0 -i dbg.ctg.lay -fo dbg.ctg.lay.fa -c 0
得到一致性序列
$ wtpoa-cns -t 16 -i prefix.ctg.lay -fo prefix.ctg.lay.fa
 ### mapping kbm-1.2.8 -t 0 -d dbg.ctg.lay.fa -i reads.fa.gz -k 0 -p 21 -S 4 -O 0 | best_kbm_hit.pl | awk '{print $6"\t"$9"\t"$10"\t"$1"\t"$2" 

### generating new layout map2dbgcns dbg.ctg.lay.fa reads.fa.gz dbg.map >dbg.map.lay

### second round of correction wtdbg-cns -t 0 -i dbg.map.lay -fo dbg.map.fa -k 13 -c 3

### Finished
 

其他三代組裝軟件總結:

https://www.cnblogs.com/djx571/p/10223742.html

 

參考資料:

[1]https://github.com/ruanjue/wtdbg2

[2] https://www.jianshu.com/p/193f2cdd4407

[3] http://www.chenlianfu.com/?p=2647

[4]https://yiweiniu.github.io/blog/2018/06/Genome-Assembly-Pipeline-wtdbg/ 安裝,參數調整等


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM