Assemblytics鑒定基因組間SV


Assemblytics, 發表在Bioinformaticshttp://www.ncbi.nlm.nih.gov/pubmed/27318204,鑒定基因組間SV。

Githup,https://github.com/marianattestad/assemblytics

同時也可以在線使用,http://assemblytics.com

Assemblytics 首先基於nucmer比對 ($\color{red}{contigs 比對到ref genome}$),然后進行過濾,獲取單一比對結果,進而進行SV的檢測,可檢測如下SV。

其中

  • 插入和缺失, <50 bp overlap or gap
  • Tandem, overmap >50 bp

依賴的工具
R相關

  • ggplot2
  • plyr
  • RColorBrewer
    -scales

Python

  • argparse
  • numpy

從githup下載后,給權限即可運行

chmod a+x scripts/Assemblytics*

第一步 序列比對

nucmer -maxmatch -l 100 -c 500 REFERENCE.fa ASSEMBLY.fa -prefix OUT

第二步 過濾並鑒定SV

scripts/Assemblytics <delta_file> <output_prefix> <unique_anchor_length> <min_variant_size> <max_variant_size>

或者直接使用在線工具也是可以的,將比對好的結果拽入紅色框中即可

主要結果

  • 變異類型即數量分布圖

  • 變異結果bed文件

reference	ref_start	ref_stop	ID	size	strand	type	ref_gap_size	query_gap_size	query_coordinates	method
NC_000913.3	1972855	1978502	Assemblytics_b_1	5647	+	Deletion	5647	0	NZ_CP009685.1:1721649-1721649:+	between_alignments
NC_000913.3	1873031	1873039	Assemblytics_b_2	777	+	Insertion	-8	769	NZ_CP009685.1:1821473-1822242:+	between_alignments
NC_000913.3	1096961	1097583	Assemblytics_b_3	181	+	Tandem_expansion	-622	-441	NZ_CP009685.1:2597877-2598318:-	between_alignments
NC_000913.3	4295948	4296271	Assemblytics_b_5	113	+	Tandem_contraction	-323	-436	NZ_CP009685.1:4040722-4041158:-	between_alignments

歡迎掃碼交流


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM