原文:使用Python處理BAM的方法

在上一篇的文章里我詳細介紹了BAM SAM CRAM 的格式和一些需要注意的細節,還說了該如何使用samtools在命令行中對其進行操作。但是很多時候這些操作是不能滿足我們的實際需要的,比如統計比對率 計算在某個比對質量值之上的read有多少,或者計算PE比對的插入片段長度分布,甚至需要你根據實際情況編寫一個新的變異檢測算法等。這個時候往往難以直接通過samtools來實現 注 ,而是需要編寫專門 ...

2021-06-17 16:48 0 218 推薦指數:

查看詳情

SAMTOOLS使用 SAM BAM文件處理

【怪毛匠子 整理】 samtools學習及使用范例,以及官方文檔詳解 #第一步:把sam文件轉換成bam文件,我們得到map.bam文件 system"samtools view -bS map.sam > map.bam"; #第二步:sort 一下 BAM ...

Thu Dec 27 17:35:00 CST 2018 0 6697
SAM/BAM文件處理

當測序得到的fastq文件map到基因組之后,我們通常會得到一個sam或者bam為擴展名的文件。SAM的全稱是sequence alignment/map format。而BAM就是SAM的二進制文件(B取自binary)。 那么SAM文件的格式是什么樣子的呢?如果你想真實地了解SAM文件 ...

Mon Dec 12 03:46:00 CST 2016 0 5502
Pysam 處理bam文件

Pysam可用來處理bam文件 安裝: 用 pip 或者 conda即可 使用: Pysam的函數有很多,主要的讀取函數有: AlignmentFile:讀取BAM/CRAM/SAM文件 VariantFile:讀取變異數據(VCF或者BCF ...

Fri Dec 06 01:03:00 CST 2019 0 469
pysam - 多種格式基因組數據(sam/bam/vcf/bcf/cram/…)讀寫與處理模塊(python

在開發基因組相關流程或工具時,經常需要讀取、處理和創建bam、vcf、bcf文件。目前已經有一些主流的處理此類格式文件的工具,如samtools、picard、vcftools、bcftools,但此類工具集成的大多是標准功能,在編程時如果直接調用的話往往顯得不夠靈活。 本文介紹的是一個處理 ...

Mon Sep 26 20:58:00 CST 2016 0 8381
處理bam文件提取信息

一般來說,一個bam文件通常只包含一個樣本的信息,最多需要進行染色體位置的處理, samtools也提供了簡單的處理方式,比如要提取 chr1的reads, 只需要: samtools view input.bam ch1 這幾天遇到了10x genomics的bam結果,發現 ...

Tue Aug 20 04:05:00 CST 2019 0 706
C++使用htslib庫讀入和寫出bam文件

  有時候我們需要使用C++處理bam文件,比如取出read1或者read2等符合特定條件的序列,根據cigar值對序列指定位置的鹼基進行統計或者對序列進行處理並輸出等,這時我們可以使用htslib庫。htslib可以用來處理SAM, BAM,CRAM 和VCF文件,是samtools ...

Thu Nov 16 04:56:00 CST 2017 0 1189
Python處理日期時間庫的使用方法

常用的庫有time、datetime。其中datetime庫是對time庫的封裝,所以使用起來更加便捷。date是指日期時間(年月日)處理,time往往更加細小的單位(小時分秒等)的時間處理。 一、datetime庫 datetime.date類 表示日期的類 ...

Tue Jun 23 04:01:00 CST 2020 0 1127
Python圖像處理庫Pillow常用使用方法

PIL(Python Imaging Library)是Python一個強大方便的圖像處理庫,只支持到Python2.7。Pillow是PIL的一個派生分支,在Python3中用Pillow代替PIL。Pillow官網:https://pillow.readthedocs.io/en/latest ...

Mon Sep 02 06:51:00 CST 2019 0 2376
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM