研究人員針對 PTEN 這個關鍵的抑癌基因,來探究調控該基因表達的ceRNA 網絡;
分析策略:
1)預測能調控該基因的miRNAs
通過miRanda 軟件預測和實驗驗證相結合的方式,挑選出 miR-17-5p, miR-19a,miR-19b, miR-20a, miR-20b, miR-26a, miR-26b, miR-93, miR-106a, miR-106b 等miRNA
2) 預測同時受這些miRNA 調控的其他基因
通過miRanda 軟件預測和實驗驗證相結合的方式,挑選出NCOA7, BCL11B, SERINC1, ZNF460, NUDT13,DTWD2, and VAPA 等候選基因進行后續分析;
3) 驗證共表達關系
體內實驗驗證候選基因和目標基因之間的共表達關系
從生物信息數據分析的角度看,只需要做兩步分析;
以上圖為例:對於目標RNA X, 預測能調控該RNA X的RNA Y,當然RNA Y不會只有一個;1)第一步以miRNA 為橋梁,找到和其共享miRNA 調控的RNA Y;2) 第二步,分析RNA X 和 RNA Y 之間的共表達關系,如果是二者存在調控關系,則表達量會存在一個相關性,而且肯定是正相關關系
分析的過程有以下幾個難點:
1) 不同類型的RNA 和 miRNA 調控關系的准確性, miradna 軟件的結果肯定會存在一定的假陽性率;
2) 共表達分析時。閾值的篩選,文章中通過皮爾森相關性檢驗,計算相關系數和p值,在結果過濾時,僅僅使用了pvlaue < 0.001 ,挑選了顯著相關的結果,但是可以看到,挑選的結果候選基因和目標基因的表達量的相關系數都不是很高,這個閾值在分析時如何取舍,是不是說只要p值越低越好,相關系數的大小無所謂?只要在統計學上相關性顯著即可?
以上的問題都會導致預測的 ceRNA 網絡存在許多的假陽性,這個是目前的分析手段不可避免的,最好的做法是結合實驗手段去驗證。
參考文獻:Coding-independent regulation of the tumor suppressor PTEN by competing endogenous mRNAs.Cell. 2011 Oct 14;147(2):344-57.