BED文件格式


BED 文件格式

       BED 文件格式是一個可變方式的數據線,用來描述注釋的數據。BED線有3個要求的字段和9個額外的字段。每條線的字段數目必須是任意單條數據的在注釋上一致。可選字段的序試結合低數字的字段必須流行如果高位字段被使用。

首先是三個要求的BED字段

  1. chrom, 染色體或scafflold 的名字(eg chr3, chrY, chr2_random, scaffold0671 )

  2. chromStart 染色體和scaffold的起始位置,第一個染色體的位置是0

  3. chromEn 染色體和scaffold的結束位置,染色體的末端位置沒有包含到顯示信息里面。例如,首先得100個鹼基的染色體定義為chromStart =0 . chromEnd=100, 鹼基的數目是0-99

 

     9 個額外的可選BED 字段是:

  4. name 定義BED 的名字

   5. score 01000的分值,如果track線在注釋時屬性設置為1,那么這個分值會決定現示灰度水平,數字

     越大,灰度越高。下面的這個表格顯示Genome Browser

   6. strand 定義鏈的''+” 或者”-”

   7. thickStart 開始的位置,這個特征是畫thickly(例如,在開始的編碼顯示基因的顯示

  8. thickEnd 結束的位置,這個特征是畫thickly例如,在結束的編碼顯示基因的顯示 

  9 itemRGB An AGB 值的形式, R, G, B (eg. 255, 0, 0), 如果track line itemRgb屬性是設置為'On”, 這個RBG 值將

    決定數據的顯示的顏色在BED 線。 注意, 它推薦簡單的顏色方案(eight color or less )是用作這個屬性

    避免顏色資源在基因組瀏覽器上過多

  1. blockCount BED線在exon 的block數目

  2. blockSize 用逗號分割block size, 這個item的列表對應於BlockCount

  3. blockStarts- 用逗號分割的列表, 所有的blockStart位置應該被計算相關於chromStart, 這個數字的項應該對應於blockCount..

    摘自:http://5527lok.blog.163.com/blog/static/64751582011530113134590/

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM