原文:samtools faidx輸出的fai文件格式解析 | fasta轉bed | fasta to bed

fai示例: Sc Sc Sc Sc Sc Sc NAME Name of this reference sequence LENGTH Total length of this reference sequence, in bases OFFSET Offset within the FASTA file of this sequence s first base LINEBASES The n ...

2018-03-25 16:12 0 1346 推薦指數:

查看詳情

根據bed文件fasta文件中獲取基因序列

第一次寫博客,分享一個做的提取基因序列的程序,根據bed文件里的位置信息從基因組里提取序列 源碼地址:https://github.com/Liuyuan2018/fastaTools/blob/master/pyGetFasta.py bed文件通常用來保存注釋基因信息,BED文件必須的3列 ...

Wed Nov 21 02:53:00 CST 2018 0 1142
samtools faidx 命令處理fasta序列

samtools faidx 能夠對fasta 序列建立一個后綴為.fai文件,根據這個.fai 文件和原始的fastsa文件, 能夠快速的提取任意區域的序列 用法: samtools faidx input.fa 該命令對輸入的fasta序列有一定要求:對於每條序列,除了最后一行 ...

Fri Feb 19 20:56:00 CST 2016 0 7078
BED文件格式

BED 文件格式 BED 文件格式是一個可變方式的數據線,用來描述注釋的數據。BED線有3個要求的字段和9個額外的字段。每條線的字段數目必須是任意單條數據的在注釋上一致。可選字段的序試結合低數字的字段必須流行如果高位字段被使用。 首先是三個要求的BED字段 chrom ...

Thu Aug 30 17:56:00 CST 2012 0 3336
BED文件格式

bed文件(browse extensive data)以及gff文件(general fearture format) bed文件 第一列是染色體或者contig信息。 第二列是起始位置,從0開始。 第三列是終止位置。 第四列是bed列的名字。 第五列是score。 第六列是鏈方向 ...

Tue Mar 10 00:08:00 CST 2020 0 1004
bed文件格式解讀

1)BED文件 BED 文件(Browser Extensible Data)格式是ucsc 的genome browser的一個格式 ,提供了一種靈活的方式來定義的數據行,以用來描述注釋信息。BED行有3個必須的列和9個額外可選的列。每行的數據格式要求一致(見下圖)。 每條線的字段 ...

Sun Aug 19 19:43:00 CST 2018 0 811
bedtools神器 | gtfbed | bed文件運算

我們生信技能書有一篇介紹bedtools的文章,可以在微信里搜着看下,非常有用。 bedtools 用法大全 http://bedtools.readthedocs.io/en/latest/ gtfbed用Linux命令完全可以實現,因為gtf每一行比較規律,不像fasta和fastq ...

Sun Mar 25 12:16:00 CST 2018 0 3738
生信文件格式-BED文件

BED文件格式 注釋文件就是基因組的說明書。告訴我們哪些序列是編碼蛋白的基因,哪些是非編碼基因,外顯子、內含子、UTR等的位置等等。注釋文件在以下三個提供參考基因組的網站中都有提供,比如Ensemble、NCBI 、UCSC。但是現在最權威的人類和小鼠基因組的注釋還屬Gencode ...

Mon Jun 22 23:56:00 CST 2020 0 580
FASTQ 文件格式轉換為 FASTA 格式

1.利用Linux命令:awk 2.用法如下: awk '{if(NR%4 == 1){print ">" substr($0, 2)}}{if(NR%4 == 2){print}}' fastq > fasta 3.上述用法注意事項: fastq文件必須是解壓格式 ...

Sat Sep 23 01:10:00 CST 2017 0 4317
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM