BED 文件格式
BED 文件格式是一個可變方式的數據線,用來描述注釋的數據。BED線有3個要求的字段和9個額外的字段。每條線的字段數目必須是任意單條數據的在注釋上一致。可選字段的序試結合低數字的字段必須流行如果高位字段被使用。
首先是三個要求的BED字段
-
chrom, 染色體或scafflold 的名字(eg chr3, chrY, chr2_random, scaffold0671 )
-
chromStart 染色體和scaffold的起始位置,第一個染色體的位置是0
-
chromEn 染色體和scaffold的結束位置,染色體的末端位置沒有包含到顯示信息里面。例如,首先得100個鹼基的染色體定義為chromStart =0 . chromEnd=100, 鹼基的數目是0-99
9 個額外的可選BED 字段是:
4. name 定義BED 的名字
5. score 0到1000的分值,如果track線在注釋時屬性設置為1,那么這個分值會決定現示灰度水平,數字
越大,灰度越高。下面的這個表格顯示Genome Browser
6. strand 定義鏈的''+” 或者”-”
7. thickStart 開始的位置,這個特征是畫thickly(例如,在開始的編碼顯示基因的顯示
8. thickEnd 結束的位置,這個特征是畫thickly例如,在結束的編碼顯示基因的顯示
9 itemRGB An AGB 值的形式, R, G, B (eg. 255, 0, 0), 如果track line itemRgb屬性是設置為'On”, 這個RBG 值將
決定數據的顯示的顏色在BED 線。 注意, 它推薦簡單的顏色方案(eight color or less )是用作這個屬性
避免顏色資源在基因組瀏覽器上過多
-
blockCount BED線在exon 的block數目
-
blockSize 用逗號分割block size, 這個item的列表對應於BlockCount
-
blockStarts- 用逗號分割的列表, 所有的blockStart位置應該被計算相關於chromStart, 這個數字的項應該對應於blockCount..
摘自:http://5527lok.blog.163.com/blog/static/64751582011530113134590/
