find_circ 通過識別junction reads 來預測circRNA
和參考基因組比對完之后,首先剔除和基因組完全比對的reads,保留沒比對上的reads, 這部分reads 直接比是比對不上基因組的,因為其來自不同的外顯子區域,直接比對的話不允許這么大片段的缺失,那么如何區分剪切的spliced read 和 來自環狀RNA的junction read呢,從上面的示意圖我們可以直接看出,spliced read 的兩部分比對在基因組上的前后位置和轉錄本中的位置保持一致,而來自circRNA的junction read 其比對的位置是相反的;具體操作的時候,首先從junction read的5'端和3'端取一部分序列,分別叫做5' anchor 和 3" anchor, 如果兩個序列比對的位置是相反的,這條reads 就是一個可能的junction read, 然后將anchor read 一直延伸,直到連接處為止,如果到連接處為止序列都能夠完全匹配,再看連接點處的剪切模式是否符合AG-GT的剪切模式,如果以上條件都滿足,就認定這是一個circRNA
通過對不同組織中的circRNA 進行預測,發現不同組織中存在的circRNA的數量和種類是有差別的,就是說circRNA 具有組織特異性
對人的不同的細胞系進行環狀RNA的預測,發現不同細胞系中存在的circRNA的數量和種類都是有差異的,說明circRNA 具有組織特異性;
預測得到的circRNA如何驗證:
以上面的circRNA 為例,通常為擴增這一區域的線性RNA, 我們采用的引物都是Convertgent 所示的方向,但是為了擴增circRNA, 引物的方向應該是Divergent 方向
通過電泳的結果可以看到,對於cDNA , 使用Divergent 方向的引物可以擴增出circRNA 片段,而對於基因組DNA(gDNA), 則擴增不出對應的片段來