簡單說明:
- 從2.28.0版開始,bedtools使用htslib庫支持CRAM格式
- 除了BAM文件,bedtools默認所有的輸入文件都以TAB鍵分割
- 除非使用-sorted選項,bedtools默認不支持大於512M的染色體
- 如果沒有使用-sorted參數對染色體按編碼順序進行排序(e.g., sort -k1,1 -k2,2n ),則必須使用-g參數輸入相同排序染色體
- bedtools要求染色體命名方案在比較文件中是相同的(例如‘chr1’和‘1’不能同時存在)
1 genomecov
計算基因組水平上的reads覆蓋度,可以以單個點位顯示(-d),或者以bed格式顯示(-bg)。
在運行之前,保證
(1) 輸入的bed/vcf/gff 文件時,要對齊進行排序(sort -k1,1 -k2,2n), 且提供 -g genome 文件
(2) 輸入ban文件時,使用ibam 參數,先對bam文件進行sort,可不加-g 參數
如下
bedtools genomecov -bga -pc -ibam F_T02.sorted.bam >F_T02.frag.cov
head F_T02.frag.cov
YYchr1 0 183326 0
YYchr1 183326 183590 1
YYchr1 183590 187919 0
YYchr1 187919 188138 1
YYchr1 188138 190127 0
YYchr1 190127 190272 1
YYchr1 190272 190354 0
# -bg: 以bed文件輸入
# -bga: 如上一樣,但同時輸入覆蓋度為0的區域
以上結果中,第一列染色體,2,3列,位置區域,第4列 coverage,該區域的定義如下所示

參考
歡迎交流

