【文章推薦】根據bed文件從fasta文件中獲取基因序列

原文：根據bed文件從fasta文件中獲取基因序列

第一次寫博客，分享一個做的提取基因序列的程序，根據bed文件里的位置信息從基因組里提取序列源碼地址：https: github.com Liuyuan fastaTools blob master pyGetFasta.py bed文件通常用來保存注釋基因信息，BED文件必須的列: chrom 染色體號 chromStart feature在染色體上起始位置其實編號為 chromEnd fe ...

2018-11-20 18:53 0 1142 推薦指數：

查看詳情

fasta文件中序列的排序

同樣的名為read_1.fa 的fasta文件，里面有若干序列，如： > ...

samtools faidx輸出的fai文件格式解析 | fasta轉bed | fasta to bed

fai示例： Sc0000003 2774837 10024730 60 61 Sc0000004 2768176 12845826 ...

統計 fasta 文件序列長度及 GC 含量

注：該腳本適用於序列不斷開的情況可用一下命令將折行的序列合並為一行運行腳本升級版，輸入文件是 fasta 格式即可。用 Bio 中的 Seq.IO 解析 fasta 文件，用 python 的內置函數 count() 的計算速度更快。 ...

參考基因組fasta文件添加index

參考基因組fasta文件添加index 命令一命令二 (投遞任務時，500M內存夠用) 命令三這三個命令下來，建立的參考基因組的index夠大部分生信流程用 ...

BED文件格式

BED 文件格式 BED 文件格式是一個可變方式的數據線，用來描述注釋的數據。BED線有3個要求的字段和9個額外的字段。每條線的字段數目必須是任意單條數據的在注釋上一致。可選字段的序試結合低數字的字段必須流行如果高位字段被使用。首先是三個要求的BED字段 chrom ...

BED文件格式

bed文件（browse extensive data）以及gff文件（general fearture format） bed文件第一列是染色體或者contig信息。第二列是起始位置，從0開始。第三列是終止位置。第四列是bed列的名字。第五列是score。第六列是鏈方向 ...

bed文件格式解讀

1）BED文件 BED 文件(Browser Extensible Data)格式是ucsc 的genome browser的一個格式 ,提供了一種靈活的方式來定義的數據行，以用來描述注釋信息。BED行有3個必須的列和9個額外可選的列。每行的數據格式要求一致(見下圖)。每條線的字段 ...

python處理fasta文件，ID和序列放在一行

...

原文：根據bed文件從fasta文件中獲取基因序列

相關推薦

相關標簽