相較於其他三代四代數據組裝軟件(Canu(也可用於糾錯),smartdenovo,miniasm,Flye,TULIP,FALCON,FALCON-unzip等)
wtdbg有如下優點:
安裝運行簡單 (可用run_wtdbg_assembly.sh腳本生成運行腳本),運行速度快,
運行內容:一步組裝,兩輪糾錯
“--edge-min”值對基因大小影響特別大,在基因組復雜度低和測序深度大的情況下可提高該值,可降低運行內存和運行時間。(僅進行第一輪組裝) [2]
wtdbg2軟件使用[2,3]:
提供參數給run_wtdbg_assembly.sh,會動生成運行腳本。
$ ./run_wtdbg_assembly.sh -h $ cat run.sh
### assembling wtdbg-1.2.8 -t 0 -i reads.fa.gz --tidy-reads 5000 -fo dbg -k 0 -p 21 -S 4 --rescue-low-cov-edges
進行基因組裝 $ wtdbg2 -t 16 -i reads.fa.gz -fo prefix -L 5000
### first round of correction wtdbg-cns -t 0 -i dbg.ctg.lay -fo dbg.ctg.lay.fa -c 0
得到一致性序列 $ wtpoa-cns -t 16 -i prefix.ctg.lay -fo prefix.ctg.lay.fa
### mapping kbm-1.2.8 -t 0 -d dbg.ctg.lay.fa -i reads.fa.gz -k 0 -p 21 -S 4 -O 0 | best_kbm_hit.pl | awk '{print $6"\t"$9"\t"$10"\t"$1"\t"$2"
### generating new layout map2dbgcns dbg.ctg.lay.fa reads.fa.gz dbg.map >dbg.map.lay
### second round of correction wtdbg-cns -t 0 -i dbg.map.lay -fo dbg.map.fa -k 13 -c 3
### Finished
其他三代組裝軟件總結:
https://www.cnblogs.com/djx571/p/10223742.html
參考資料:
[1]https://github.com/ruanjue/wtdbg2
[2] https://www.jianshu.com/p/193f2cdd4407
[3] http://www.chenlianfu.com/?p=2647
[4]https://yiweiniu.github.io/blog/2018/06/Genome-Assembly-Pipeline-wtdbg/ 安裝,參數調整等