如何注釋基因組中的tRNA + 安裝tRNAscan-SE


簡介

  • tRNA:tRNA是mRNA翻譯到蛋白的步驟中根據密碼子搬運氨基酸的RNA。這個結構的最核心部位就是與密碼子配對的三位鹼基。tRNA長得像一個三葉草,大概76-90 bp,所以除了三位鹼基,識別其二維結構,是為了知道如何折疊成三葉草。
  • tRNAscan-SE用 Perl 整合了tRNAscan、EufindRNA 和Cove3個tRNA檢測軟件。首先調用 tRNAscan和EufindRNA鑒定基因組序列中 tRNA區域,然后調用Cove進行驗證。
  • 目前2.0版本正在beta階段,最新的下載穩定版本為1.3.1
  • 網頁版是2.0版,會根據數據庫找最相似的tRNA。
  • 如只需安裝看步驟即可,說明中總結我遇到的問題。

## 本地化安裝步驟
  1. 進入 Linux
  2. 下載 tRNAScan-SE 1.3.1.tar.gz
  3. 解壓縮
  4. 進入 tRNAScan-SE 1.3.1 目錄
  5. 修改 Makefile 中的相關路徑,能sudo安裝到opt里就不用這步。
  6. make 編譯
  7. 安裝
  8. 運行 testrun 檢驗是否運行成功
  9. 刪除 make 的文件

## 命令 ```bash wget http://lowelab.ucsc.edu/software/tRNAscan-SE.tar.gz tar zxf tRNAscan-SE.tar.gz cd tRNAscan-SE-1.3.1 sudo make && make install make testrun make clean
<br>
## 安裝過程說明
1. 從服務器下載 tRNAScan-SE 1.3.1.tar.qz(2017-07-26最新),在其web server 頁面沒有找到關於本地版的說明。
2. 如果你有root權限,又和我一樣還不太懂$PASH怎么改,就不要自己修改安裝路徑了。默認安裝在根目錄opt文件夾里的biosoft文件夾中。
3. 安裝過程中有一些提示信息,不懂可以不管。也是關於改路徑的。

> Makefile 里面的安裝路徑是:
>BINDIR  = /opt/biosoft/tRNAscan-SE-1.3.1/bin
LIBDIR  = /opt/biosoft/tRNAscan-SE-1.3.1/lib/tRNAscan-SE
MANDIR  = /opt/biosoft/tRNAscan-SE-1.3.1/man

<br>
## 使用說明
*   建議去[網頁版 Web Server](http://lowelab.ucsc.edu/tRNAscan-SE/)提交[示例](http://lowelab.ucsc.edu/tRNAscan-SE/ExampleSequences.fa "Example tRNA sequences")。然后看一下返回的結果,和實際運行的代碼。

> 網頁版運行后給出的運行的命令行: <br> `tRNAscan-SE -qQ -Y -o# -m# -f# -l# -c tRNAscan-SE.conf -s# (fasta file)`

* 其中.conf文件是一個設置文件,可以點開看。
* 輸出的結果里面有兩個score,
    - cove score,最后的一個分值,最低20,是每一個isotype的分值
    - 還有一個infernal score,是用來過濾,提高計算速度的
*   幫助文件運行 tRNAsecn-SE -h,參考3的說明挺詳細。
*   運行的主要參數包括
    -   選擇tRNA類型(默認細菌)-B
    -   不檢測是不是假基因 -D
    -   輸出文件的類型:
        +   -o &lt;file&gt; 總結果
        +   -f  &lt;file&gt; 二級結構結果
        +   \# 如果把 \# 放在&lt;file&gt;處,沒有空格隔開表示使用默認名字
*   文檔中提供了一個postscript的幫助,Mannual.ps,我用的遠程登錄ssh,也不知道怎么打開圖形界面,所以下到本地又下了[GView 和 Ghostscript](http://pages.cs.wisc.edu/~ghost/index.htm)打開的。30多頁,可是也沒有覺得有什么特別有用的。寫着有個html版本的,可是現在也打不開了。

<br>
## 結果確認
* 網頁目前使用的是2.0版本
*   使用的序列是NCBI上面下載的細菌基因組,其注釋信息顯示有39個tRNA,4.62MB。
*   測試
    * 設置1: default:返回41個結果,速度最快,大約10s。
`tRNAscan-SE -qQ -Y -o# -m# -f# -l# -c tRNAscan-SE.conf -B -s# (fasta file)`
    * 設置2:Legacy(tRNAscan+Eufindtran -> cove) -:返回39個結果
`tRNAscan-SE -qQ -Y -o# -m# -f# -l# -c tRNAscan-SE.conf -L -B -s# (fasta file)`
    * 設置3:不適用過濾算法,等了30min還在計算,果然很慢,放棄。

* 區別: -L參數默認值為116bp,大於這個數值的tRNA被刪除,刪除的這兩個的確沒有對應到NCBI里面的結果。
兩個.conf本身沒有區別。
觀察了下,被濾掉的2條大於116bp的序列cove score在30以下,且二維結構里面看出來成環的區域很長,就是下面的`...`很長,箭頭和箭頭連起來后會很不穩定的樣子。

Seq: TGTAGGATGTTGAAATTGGCaGACAAGCCCTCCTGTCTCGGGGGTGGGGAAcccagcataaagcgtaattcaaaccggactattgccTAACgACCCCGTGGAGGTTCGAATCCTTCTCCTACAG
Str: >>>>>>>..>>>...........<<<.>>>>>.......<<<<<.>>>>............................................<<<<..>>>>>.......<<<<<<<<<<<<.

*  如果選的是真核模式,預測出來的是38條,所以模式還是很重要。

<br>
## 參考
[[1]](https://prmadi.com/installing_trnascan_se/) 說明了安裝過程的提示信息是用於修改c shell的
[[2]](http://qinqianshan.com/prediction-of-trna-trnascan-se/) 關於postscript的說明和如何看結果
[[3]](http://www.cnblogs.com/xudongliang/p/7093458.html) 詳細的網頁版輸出結果說明
[[4]](https://academic.oup.com/nar/article-lookup/doi/10.1093/nar/gkw413) 關於2.0的2016年的論文


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM