NextDenovo 組裝基因組


NextDenovo 是有武漢未來組團隊開發出來用於組裝ONT,Pacbio, HIFI (默認參數可對60-100X數據更有效),可通過correct--assemble對其進行組裝。組裝后,每個鹼基正確率為98-99.8%, 可進一步通過NextPolish進行polish。

具體詳情可閱讀githup即可,https://github.com/Nextomics/NextDenovo

1 安裝

需要如下:

wget https://github.com/Nextomics/NextDenovo/releases/download/v2.4.0/NextDenovo.tgz
tar -vxzf NextDenovo.tgz && cd NextDenovo

## 測試
nextDenovo test_data/run.cfg

2 簡單使用

  • Step1 准備輸入文件

ls ultra-long-ont.fastq.gz > input.fofn
  • Step2 配置文件

[General]
job_type = local # sge, pbs
job_prefix = nextDenovo
task = all # all, correct, assemble ;可以進行針對性選擇
rewrite = yes # yes/no; 再次運行是否覆蓋之前結果
deltmp = yes
parallel_jobs = 22 # tasks 
input_type = raw #  raw, corrected; 輸入數據是否是correct
read_type = ont # clr, ont, hifi; 輸入數據類型
input_fofn = input.fofn # reads 文件
workdir = HG002_NA24385_son_assemble # 輸出文件

[correct_option]
read_cutoff = 1k
genome_size = 3g # estimated genome size 基因組大小評估
sort_options = -m 50g -t 30
minimap2_options_raw = -t 8
pa_correction = 5
correction_options = -p 30

[assemble_option]
minimap2_options_cns = -t 8
nextgraph_options = -a 1
  • Step3 運行

nohup nextDenovo run.cfg &

最終結果

  • corrected reads

HG002_NA24385_son_assemble/02.cns_align/01.seed_cns.sh.work/seed_cns*/cns.fasta
  • Final assembly result:

HG002_NA24385_son_assemble/03.ctg_graph/nd.asm.fasta

后續可進行三代以及二代對糾錯即可

歡迎掃碼交流

參考


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM