Bedtools genomecov 計算覆蓋度


簡單說明:

  • 從2.28.0版開始,bedtools使用htslib庫支持CRAM格式
  • 除了BAM文件,bedtools默認所有的輸入文件都以TAB鍵分割
  • 除非使用-sorted選項,bedtools默認不支持大於512M的染色體
  • 如果沒有使用-sorted參數對染色體按編碼順序進行排序(e.g., sort -k1,1 -k2,2n ),則必須使用-g參數輸入相同排序染色體
  • bedtools要求染色體命名方案在比較文件中是相同的(例如‘chr1’和‘1’不能同時存在)

1 genomecov

計算基因組水平上的reads覆蓋度,可以以單個點位顯示(-d),或者以bed格式顯示(-bg)。

在運行之前,保證
(1) 輸入的bed/vcf/gff 文件時,要對齊進行排序(sort -k1,1 -k2,2n), 且提供 -g genome 文件
(2) 輸入ban文件時,使用ibam 參數,先對bam文件進行sort,可不加-g 參數

如下

bedtools genomecov -bga -pc -ibam F_T02.sorted.bam >F_T02.frag.cov
head F_T02.frag.cov
YYchr1	0	183326	0
YYchr1	183326	183590	1
YYchr1	183590	187919	0
YYchr1	187919	188138	1
YYchr1	188138	190127	0
YYchr1	190127	190272	1
YYchr1	190272	190354	0

# -bg: 以bed文件輸入
# -bga: 如上一樣,但同時輸入覆蓋度為0的區域

以上結果中,第一列染色體,2,3列,位置區域,第4列 coverage,該區域的定義如下所示

參考

歡迎交流


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM