如何注釋基因組中的tRNA + 安裝tRNAscan-SE

本文轉載自查看原文 2017-07-26 21:05 1710 annotation/ Binary World/ Linux/ bioinformatics

簡介

tRNA：tRNA是mRNA翻譯到蛋白的步驟中根據密碼子搬運氨基酸的RNA。這個結構的最核心部位就是與密碼子配對的三位鹼基。tRNA長得像一個三葉草，大概76-90 bp，所以除了三位鹼基，識別其二維結構，是為了知道如何折疊成三葉草。
tRNAscan-SE用 Perl 整合了tRNAscan、EufindRNA 和Cove3個tRNA檢測軟件。首先調用 tRNAscan和EufindRNA鑒定基因組序列中 tRNA區域，然后調用Cove進行驗證。
目前2.0版本正在beta階段，最新的下載穩定版本為1.3.1
網頁版是2.0版，會根據數據庫找最相似的tRNA。
如只需安裝看步驟即可，說明中總結我遇到的問題。

## 本地化安裝步驟

進入 Linux。
下載 tRNAScan-SE 1.3.1.tar.gz
解壓縮
進入 tRNAScan-SE 1.3.1 目錄
修改 Makefile 中的相關路徑，能sudo安裝到opt里就不用這步。
make 編譯
安裝
運行 testrun 檢驗是否運行成功
刪除 make 的文件

## 命令 ```bash wget http://lowelab.ucsc.edu/software/tRNAscan-SE.tar.gz tar zxf tRNAscan-SE.tar.gz cd tRNAscan-SE-1.3.1 sudo make && make install make testrun make clean

<br>
## 安裝過程說明
1. 從服務器下載 tRNAScan-SE 1.3.1.tar.qz（2017-07-26最新），在其web server 頁面沒有找到關於本地版的說明。
2. 如果你有root權限，又和我一樣還不太懂$PASH怎么改，就不要自己修改安裝路徑了。默認安裝在根目錄opt文件夾里的biosoft文件夾中。
3. 安裝過程中有一些提示信息，不懂可以不管。也是關於改路徑的。

> Makefile 里面的安裝路徑是：
>BINDIR  = /opt/biosoft/tRNAscan-SE-1.3.1/bin
LIBDIR  = /opt/biosoft/tRNAscan-SE-1.3.1/lib/tRNAscan-SE
MANDIR  = /opt/biosoft/tRNAscan-SE-1.3.1/man

<br>
## 使用說明
*   建議去[網頁版 Web Server](http://lowelab.ucsc.edu/tRNAscan-SE/)提交[示例](http://lowelab.ucsc.edu/tRNAscan-SE/ExampleSequences.fa "Example tRNA sequences")。然后看一下返回的結果，和實際運行的代碼。

> 網頁版運行后給出的運行的命令行： <br> `tRNAscan-SE -qQ -Y -o# -m# -f# -l# -c tRNAscan-SE.conf -s# (fasta file)`

* 其中.conf文件是一個設置文件，可以點開看。
* 輸出的結果里面有兩個score，
    - cove score，最后的一個分值，最低20，是每一個isotype的分值
    - 還有一個infernal score，是用來過濾，提高計算速度的
*   幫助文件運行 tRNAsecn-SE -h，參考3的說明挺詳細。
*   運行的主要參數包括
    -   選擇tRNA類型（默認細菌）-B
    -   不檢測是不是假基因 -D
    -   輸出文件的類型：
        +   -o &lt;file&gt; 總結果
        +   -f  &lt;file&gt; 二級結構結果
        +   \# 如果把 \# 放在&lt;file&gt;處，沒有空格隔開表示使用默認名字
*   文檔中提供了一個postscript的幫助，Mannual.ps，我用的遠程登錄ssh，也不知道怎么打開圖形界面，所以下到本地又下了[GView 和 Ghostscript](http://pages.cs.wisc.edu/~ghost/index.htm)打開的。30多頁，可是也沒有覺得有什么特別有用的。寫着有個html版本的，可是現在也打不開了。

<br>
## 結果確認
* 網頁目前使用的是2.0版本
*   使用的序列是NCBI上面下載的細菌基因組，其注釋信息顯示有39個tRNA，4.62MB。
*   測試
    * 設置1： default:返回41個結果，速度最快，大約10s。
`tRNAscan-SE -qQ -Y -o# -m# -f# -l# -c tRNAscan-SE.conf -B -s# (fasta file)`
    * 設置2：Legacy(tRNAscan+Eufindtran -> cove) -：返回39個結果
`tRNAscan-SE -qQ -Y -o# -m# -f# -l# -c tRNAscan-SE.conf -L -B -s# (fasta file)`
    * 設置3：不適用過濾算法，等了30min還在計算，果然很慢，放棄。

* 區別： -L參數默認值為116bp，大於這個數值的tRNA被刪除，刪除的這兩個的確沒有對應到NCBI里面的結果。
兩個.conf本身沒有區別。
觀察了下，被濾掉的2條大於116bp的序列cove score在30以下，且二維結構里面看出來成環的區域很長，就是下面的`...`很長，箭頭和箭頭連起來后會很不穩定的樣子。

Seq: TGTAGGATGTTGAAATTGGCaGACAAGCCCTCCTGTCTCGGGGGTGGGGAAcccagcataaagcgtaattcaaaccggactattgccTAACgACCCCGTGGAGGTTCGAATCCTTCTCCTACAG
Str: >>>>>>>..>>>...........<<<.>>>>>.......<<<<<.>>>>............................................<<<<..>>>>>.......<<<<<<<<<<<<.

*  如果選的是真核模式，預測出來的是38條，所以模式還是很重要。

<br>
## 參考
[[1]](https://prmadi.com/installing_trnascan_se/) 說明了安裝過程的提示信息是用於修改c shell的
[[2]](http://qinqianshan.com/prediction-of-trna-trnascan-se/) 關於postscript的說明和如何看結果
[[3]](http://www.cnblogs.com/xudongliang/p/7093458.html) 詳細的網頁版輸出結果說明
[[4]](https://academic.oup.com/nar/article-lookup/doi/10.1093/nar/gkw413) 關於2.0的2016年的論文

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 tRNAscan-SE 預測tRNA基因 tRNAscan-SE 基因組注釋【基因組注釋】GMAP安裝使用問題【基因組注釋】ncRNA注釋【基因組學】maker的安裝和注釋 SNPEFF snp注釋 (添加自己基因組) 轉錄組（四）：了解參考基因組及基因注釋轉錄組入門(4)：了解參考基因組及基因注釋基因組序列注釋（基因結構預測）