在預測circRNA時,都是檢測breakpoint 處的reads 數,最后給出的環狀RNA的ID 都是諸如 chr14:106994222-107183708 這樣的形式,給出了起始和終止位置;
對於某一個基因來說,其可能產生的circRNA的類型是多樣的,以下圖為例進行說明
1) 由單個外顯子組成的環狀RNA, 比如
2)有多個外顯子組成的環狀RNA, 比如
以上的兩種circRNA在序列提取時都非常容易,只需要將circRNA的起始和終止位置能夠和某些外顯子正好對應上,那么就可以確定其序列就是起始外顯子和終止外顯子之間的所有外顯子構成的序列
3)只由內含子組成的環狀RNA
這種環狀RNA也可以方便的提取序列,直接確定起始和終止位置在基因組上的位置,將對應的序列提取出來即可
4)起始外顯子和終止外顯子之間有多個外顯子,比如
5)起始外顯子和終止外顯子之間有內含子,比如
預測環狀RNA時,只能夠確定起始外顯子和終止外顯子,卻不能確定在該circRNA中間到底有哪幾個外顯子,而且到底包不包含內含子序列,由於可變剪切的存在,可能存在多個外顯子,也可能包含內含子,是不能夠准確的提取circRNA對應的序列;能夠做的只是將包括起始外顯子和終止外顯子以及之間的所有外顯子連起來作為circRNA的序列
以上面的exon1-exon4 之間形成的環狀RNA為例,我們只能將exon1-exon2-exon3-exon4的序列作為該環狀RNA的序列,但是和實際的環狀RNA的序列肯定是存在誤差的;
目前分析手段沒辦法很好的解決這個問題,也許隨着對環狀RNA認識的加深和分析方法的改進,可以准確的識別circRNA的序列;
為了准確的確定circRNA的序列,只能是針對breakpoint 兩邊的序列設計特異性引物,將circRNA 擴增出來,再測序,准確的識別序列;