NextDenovo 是有武漢未來組團隊開發出來用於組裝ONT,Pacbio, HIFI (默認參數可對60-100X數據更有效),可通過correct--assemble對其進行組裝。組裝后,每個鹼基正確率為98-99.8%, 可進一步通過NextPolish進行polish。
具體詳情可閱讀githup即可,https://github.com/Nextomics/NextDenovo
1 安裝
需要如下:
wget https://github.com/Nextomics/NextDenovo/releases/download/v2.4.0/NextDenovo.tgz
tar -vxzf NextDenovo.tgz && cd NextDenovo
## 測試
nextDenovo test_data/run.cfg
2 簡單使用
-
Step1 准備輸入文件
ls ultra-long-ont.fastq.gz > input.fofn
-
Step2 配置文件
[General]
job_type = local # sge, pbs
job_prefix = nextDenovo
task = all # all, correct, assemble ;可以進行針對性選擇
rewrite = yes # yes/no; 再次運行是否覆蓋之前結果
deltmp = yes
parallel_jobs = 22 # tasks
input_type = raw # raw, corrected; 輸入數據是否是correct
read_type = ont # clr, ont, hifi; 輸入數據類型
input_fofn = input.fofn # reads 文件
workdir = HG002_NA24385_son_assemble # 輸出文件
[correct_option]
read_cutoff = 1k
genome_size = 3g # estimated genome size 基因組大小評估
sort_options = -m 50g -t 30
minimap2_options_raw = -t 8
pa_correction = 5
correction_options = -p 30
[assemble_option]
minimap2_options_cns = -t 8
nextgraph_options = -a 1
-
Step3 運行
nohup nextDenovo run.cfg &
最終結果
-
corrected reads
HG002_NA24385_son_assemble/02.cns_align/01.seed_cns.sh.work/seed_cns*/cns.fasta
-
Final assembly result:
HG002_NA24385_son_assemble/03.ctg_graph/nd.asm.fasta
后續可進行三代以及二代對糾錯即可