RNA-seq 測序可以用於融合基因的發現,在過去的十幾年里,RNA-seq 測序數據不斷增加,發現的融合基因的數據也不斷增加;
FusionCancer 是一個人類癌症相關的融合基因的數據庫,利用NCBI SRA數據庫中的RNA-seq 數據,采用tophat-fusion, soap-fusion, fusionmap, chimerascan 4款預測融合基因的軟件進行預測;
網址如下:
http://donglab.ecnu.edu.cn/databases/FusionCancer/
點擊 Borwse DB 按鈕,首先瀏覽下數據庫中的記錄
DataBase ID : 對於每條融合基因的記錄,都會給出一個唯一的ID,以FUSC開頭,后面加數字;
Head Gene : 生成融合基因的第一個的基因
Head Breakpoint : 融合基因的連接點在第一個基因上的位置
Tail Gene : 生成融合基因的第二個基因
Tail Breakpoint : 融合基因的連接點在第二個基因上的位置
CanCer Type: 對應的癌症類型
SRA : 原始數據在SRA 數據庫中的編號
Detail : 融合基因的詳細信息;
以第一條為例,點擊Fusion detail,詳細信息如下
在詳細信息界面中,還會給出breakpoint 在基因的內含子區還是外顯子區,預測到該融合基因的 軟件;支持的Reads 數,
點擊最下方的鏈接,還可以得到融合基因的序列。對於上述的融合基因,其轉錄本序列如下:
對於融合基因而言,最直接的結果只是檢測到了兩個基因的連接處,breakpoint , 其實是不能夠直接確定融合轉錄本的全長序列的,這個是二代測序相比三代測序的一個劣勢;
這里給出的序列其實是兩個基因所有轉錄本的組合,可以看到斷點都是一樣的
總結:
對於融合基因的檢測而言,二代測序存在以下缺點:
1)只能給出有無該融合基因,而且檢測到的融合基因還存在假陽性;
2)沒有具體的融合轉錄本的序列,沒有融合基因的直接證據;
三代測序由於其讀長的優勢,在融合基因的檢測上有着先天的優勢;
FusionCancer 數據庫可以看做二代測序在融合基因檢測方面的集大成之作,首先用了4款軟件進行預測,通過數據庫,可以篩選出4種軟件都預測得到的融合基因,可以降低假陽性率;其次給出了可能的融合轉錄本序列,方面后續的RT-PCR驗證;