【文章推薦】samtools faidx輸出的fai文件格式解析 | fasta轉bed

原文：samtools faidx輸出的fai文件格式解析 | fasta轉bed | fasta to bed

fai示例： Sc Sc Sc Sc Sc Sc NAME Name of this reference sequence LENGTH Total length of this reference sequence, in bases OFFSET Offset within the FASTA file of this sequence s first base LINEBASES The n ...

2018-03-25 16:12 0 1346 推薦指數：

查看詳情

根據bed文件從fasta文件中獲取基因序列

第一次寫博客，分享一個做的提取基因序列的程序，根據bed文件里的位置信息從基因組里提取序列源碼地址：https://github.com/Liuyuan2018/fastaTools/blob/master/pyGetFasta.py bed文件通常用來保存注釋基因信息，BED文件必須的3列 ...

samtools faidx 命令處理fasta序列

samtools faidx 能夠對fasta 序列建立一個后綴為.fai 的文件，根據這個.fai 文件和原始的fastsa文件，能夠快速的提取任意區域的序列用法： samtools faidx input.fa 該命令對輸入的fasta序列有一定要求：對於每條序列，除了最后一行 ...

BED文件格式

BED 文件格式 BED 文件格式是一個可變方式的數據線，用來描述注釋的數據。BED線有3個要求的字段和9個額外的字段。每條線的字段數目必須是任意單條數據的在注釋上一致。可選字段的序試結合低數字的字段必須流行如果高位字段被使用。首先是三個要求的BED字段 chrom ...

BED文件格式

bed文件（browse extensive data）以及gff文件（general fearture format） bed文件第一列是染色體或者contig信息。第二列是起始位置，從0開始。第三列是終止位置。第四列是bed列的名字。第五列是score。第六列是鏈方向 ...

bed文件格式解讀

1）BED文件 BED 文件(Browser Extensible Data)格式是ucsc 的genome browser的一個格式 ,提供了一種靈活的方式來定義的數據行，以用來描述注釋信息。BED行有3個必須的列和9個額外可選的列。每行的數據格式要求一致(見下圖)。每條線的字段 ...

bedtools神器 | gtf轉bed | bed文件運算

我們生信技能書有一篇介紹bedtools的文章，可以在微信里搜着看下，非常有用。 bedtools 用法大全 http://bedtools.readthedocs.io/en/latest/ gtf轉bed用Linux命令完全可以實現，因為gtf每一行比較規律，不像fasta和fastq ...

生信文件格式-BED文件

BED文件格式注釋文件就是基因組的說明書。告訴我們哪些序列是編碼蛋白的基因，哪些是非編碼基因，外顯子、內含子、UTR等的位置等等。注釋文件在以下三個提供參考基因組的網站中都有提供，比如Ensemble、NCBI 、UCSC。但是現在最權威的人類和小鼠基因組的注釋還屬Gencode ...

FASTQ 文件格式轉換為 FASTA 格式

1.利用Linux命令：awk 2.用法如下： awk '{if(NR%4 == 1){print ">" substr($0, 2)}}{if(NR%4 == 2){print}}' fastq > fasta 3.上述用法注意事項： fastq文件必須是解壓格式 ...

原文：samtools faidx輸出的fai文件格式解析 | fasta轉bed | fasta to bed

相關推薦

相關標簽