原文:根據bed文件從fasta文件中獲取基因序列

第一次寫博客,分享一個做的提取基因序列的程序,根據bed文件里的位置信息從基因組里提取序列 源碼地址:https: github.com Liuyuan fastaTools blob master pyGetFasta.py bed文件通常用來保存注釋基因信息,BED文件必須的 列: chrom 染色體號 chromStart feature在染色體上起始位置 其實編號為 chromEnd fe ...

2018-11-20 18:53 0 1142 推薦指數:

查看詳情

fasta文件序列的排序

同樣的名為read_1.fa 的fasta文件,里面有若干序列,如: > ...

Thu May 18 06:03:00 CST 2017 0 1322
統計 fasta 文件序列長度及 GC 含量

注:該腳本適用於序列不斷開的情況 可用一下命令將折行的序列合並為一行 運行腳本 升級版,輸入文件fasta 格式即可。用 Bio 的 Seq.IO 解析 fasta 文件, 用 python 的內置函數 count() 的計算速度更快。 ...

Sat Jan 14 11:25:00 CST 2017 0 3357
參考基因fasta文件添加index

參考基因fasta文件添加index 命令一 命令二 (投遞任務時,500M內存夠用) 命令三 這三個命令下來,建立的參考基因組的index夠大部分生信流程用 ...

Wed Mar 10 23:50:00 CST 2021 0 268
BED文件格式

BED 文件格式 BED 文件格式是一個可變方式的數據線,用來描述注釋的數據。BED線有3個要求的字段和9個額外的字段。每條線的字段數目必須是任意單條數據的在注釋上一致。可選字段的序試結合低數字的字段必須流行如果高位字段被使用。 首先是三個要求的BED字段 chrom ...

Thu Aug 30 17:56:00 CST 2012 0 3336
BED文件格式

bed文件(browse extensive data)以及gff文件(general fearture format) bed文件 第一列是染色體或者contig信息。 第二列是起始位置,從0開始。 第三列是終止位置。 第四列是bed列的名字。 第五列是score。 第六列是鏈方向 ...

Tue Mar 10 00:08:00 CST 2020 0 1004
bed文件格式解讀

1)BED文件 BED 文件(Browser Extensible Data)格式是ucsc 的genome browser的一個格式 ,提供了一種靈活的方式來定義的數據行,以用來描述注釋信息。BED行有3個必須的列和9個額外可選的列。每行的數據格式要求一致(見下圖)。 每條線的字段 ...

Sun Aug 19 19:43:00 CST 2018 0 811
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM