BED文件格式


bed文件(browse extensive data)以及gff文件(general fearture format) bed文件

第一列是染色體或者contig信息。

第二列是起始位置,從0開始。

第三列是終止位置。

第四列是bed列的名字。

第五列是score。

第六列是鏈方向。

第七列是基因起始。

第八列是基因終止。

第九列是RGB值。

第十列是外顯子數量。

第十一列是外顯子大小。

第十二列是外顯子起始位置。

詳解:

首先是三個要求的BED字段
1,chrom, 染色體或scafflold 的名字(eg chr3, chrY, chr2_random, scaffold0671 )
2,chromStart 染色體和scaffold的起始位置,第一個染色體的位置是0
3,chromEn 染色體和scaffold的結束位置,染色體的末端位置沒有包含到顯示信息里面。例如,首先得100個鹼基的染色體定義為chromStart =0 . chromEnd=100, 鹼基的數目是0-99
 
其次9個額外的可選BED字段是:
4,name 定義BED 的名字
5,score 0到1000的分值,如果track線在注釋時屬性設置為1,那么這個分值會決定現示灰度水平,數字越大,灰度越高。下面的這個表格顯示Genome Browser
6,strand 定義鏈的''+” 或者”-”
7,thickStart 開始的位置,這個特征是畫thickly(例如,在開始的編碼顯示基因的顯示
8,thickEnd 結束的位置,這個特征是畫thickly例如,在結束的編碼顯示基因的顯示 
9,itemRGB An AGB 值的形式, R, G, B (eg. 255, 0, 0), 如果track line itemRgb屬性是設置為'On”, 這個RBG 值將決定數據的顯示的顏色在BED 線。 注意, 它推薦簡單的顏色方案(eight color or less )是用作這個屬性避免顏色資源在基因組瀏覽器上過多
10,blockCount BED線在exon 的block數目
11,blockSize 用逗號分割block size, 這個item的列表對應於BlockCount
12,blockStarts- 用逗號分割的列表, 所有的blockStart位置應該被計算相關於chromStart, 這個數字的項應該對應於blockCount..


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM