原文:Pysam 处理bam文件

Pysam可用来处理bam文件 安装: 用 pip 或者 conda即可 使用: Pysam的函数有很多,主要的读取函数有: AlignmentFile:读取BAM CRAM SAM文件 VariantFile:读取变异数据 VCF或者BCF TabixFile:读取由tabix索引的文件 FastaFile:读取fasta序列文件 FastqFile:读取fastq测序序列文件 一般常用的是第一 ...

2019-12-05 17:03 0 469 推荐指数:

查看详情

SAM/BAM文件处理

当测序得到的fastq文件map到基因组之后,我们通常会得到一个sam或者bam为扩展名的文件。SAM的全称是sequence alignment/map format。而BAM就是SAM的二进制文件(B取自binary)。 那么SAM文件的格式是什么样子的呢?如果你想真实地了解SAM文件 ...

Mon Dec 12 03:46:00 CST 2016 0 5502
pysam - 多种格式基因组数据(sam/bam/vcf/bcf/cram/…)读写与处理模块(python)

在开发基因组相关流程或工具时,经常需要读取、处理和创建bam、vcf、bcf文件。目前已经有一些主流的处理此类格式文件的工具,如samtools、picard、vcftools、bcftools,但此类工具集成的大多是标准功能,在编程时如果直接调用的话往往显得不够灵活。 本文介绍的是一个处理 ...

Mon Sep 26 20:58:00 CST 2016 0 8381
SAMTOOLS使用 SAM BAM文件处理

【怪毛匠子 整理】 samtools学习及使用范例,以及官方文档详解 #第一步:把sam文件转换成bam文件,我们得到map.bam文件 system"samtools view -bS map.sam > map.bam"; #第二步:sort 一下 BAM ...

Thu Dec 27 17:35:00 CST 2018 0 6697
处理bam文件提取信息

一般来说,一个bam文件通常只包含一个样本的信息,最多需要进行染色体位置的处理, samtools也提供了简单的处理方式,比如要提取 chr1的reads, 只需要: samtools view input.bam ch1 这几天遇到了10x genomics的bam结果,发现 ...

Tue Aug 20 04:05:00 CST 2019 0 706
pysam操作sam文件

pysam模块 因为要分析sam文件中序列的情况,因此要对reads进行细分,所以之前想用数据库将sam文件信息存储,然后用sql语句进行分类。后来发现很麻烦,pysam就是一个高效读取存储在SAM / BAM / CRAM格式文件中的映射短读序列数据信息的python模块,可以轻松 ...

Thu Jul 19 04:47:00 CST 2018 0 1566
bam文件格式说明

bam文件说明 bam文件和sam文件内容其实是一样的,只是bam是二进制的压缩文件,需要通过特定的软件来进行查看,bam文件通常可以理解为12个字段组成 BAM格式分为header section(头部分,注释信息,以@开头,可有可无)和alignment section(比对 ...

Fri May 24 21:55:00 CST 2019 0 2387
使用Python处理BAM的方法

在上一篇的文章里我详细介绍了BAM(SAM/CRAM)的格式和一些需要注意的细节,还说了该如何使用samtools在命令行中对其进行操作。但是很多时候这些操作是不能满足我们的实际需要的,比如统计比对率、计算在某个比对质量值之上的read有多少,或者计算PE比对的插入片段长度分布,甚至需要 ...

Fri Jun 18 00:48:00 CST 2021 0 218
bam/sam 文件格式详解

sam/bam 是一种序列比对格式标准,由sanger制定,是以TAB为分割符的文本格式。主要应用于测序序列mapping到基因组上的结果表示,当然也可以表示任意的多重比对结果。通常是把FASTQ文件格式的测序数据比对到对应的参考基因组版本得到的。 header 部分 sam 分为两部分,注释 ...

Tue Jun 01 01:27:00 CST 2021 0 1389
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM