在做microRNA 和 mRNA 相互作用預測的時候,大家都知道microRNA 作用的靶點是位於mRNA 的3'UTR取,所以只需要提取mRNA 對應的3'UTR 區的序列去做分析即可;
那么如何提取一個mRNA的3'UTR區呢?
在UCSC數據庫中,提供了3'UTR區序列的下載,以人類hg19為例, 利用table browser 瀏覽器選擇對應的序列
鏈接:http://genome.ucsc.edu/cgi-bin/hgTables
按下圖所示進行選擇
點擊get output 按鈕,在彈出的頁面選擇 genomic
點擊 submit 按鈕,在彈出的頁面勾選需要的區域,這里我們只選擇 3'UTR區域
然后點擊下方的get sequence 按鈕,在瀏覽器中保存文件即可。
UCSC為我們提供了自動化的下載轉錄本特定區域的功能,如果我們自己來完成這件事,又該如何去做?
其實只需要兩步:
1)第一步,確定每個mRNA的3' UTR區在基因組上的位置;
2) 第二步,根據基因組上的位置,從基因組上提取對應的序列就可以了;
如何定義一個轉錄本的3’UTR區呢,我們看UCSC是如何定義的,
以轉錄本NM_033487 為例,從UCSC下載的該轉錄本的序列為
利用NCBI的 nucleotide 數據庫檢索該轉錄本序列,鏈接如下 https://www.ncbi.nlm.nih.gov/nuccore/NM_033487
在對應的頁面可以看到 該轉錄本的ploy A 尾開始的位置為2824;
在對應的序列中,可以看出poly A 尾之前的5bp的序列為aggaa, 和 UCSC對應的3’UTR區是一致的
從UCSC下載的3’UTR序列的長度為523bp,對應的的基因組位置為 chr1:1570603-1571125;