簡介
tRNA
:tRNA是mRNA翻譯到蛋白的步驟中根據密碼子搬運氨基酸的RNA。這個結構的最核心部位就是與密碼子配對的三位鹼基。tRNA長得像一個三葉草,大概76-90 bp,所以除了三位鹼基,識別其二維結構,是為了知道如何折疊成三葉草。tRNAscan-SE
用 Perl 整合了tRNAscan、EufindRNA 和Cove3個tRNA檢測軟件。首先調用 tRNAscan和EufindRNA鑒定基因組序列中 tRNA區域,然后調用Cove進行驗證。- 目前2.0版本正在beta階段,最新的下載穩定版本為1.3.1
- 網頁版是2.0版,會根據數據庫找最相似的tRNA。
- 如只需安裝看步驟即可,說明中總結我遇到的問題。
## 本地化安裝步驟
- 進入
Linux
。 - 下載 tRNAScan-SE 1.3.1.tar.gz
- 解壓縮
- 進入 tRNAScan-SE 1.3.1 目錄
- 修改 Makefile 中的相關路徑,能sudo安裝到opt里就不用這步。
- make 編譯
- 安裝
- 運行 testrun 檢驗是否運行成功
- 刪除 make 的文件
## 命令 ```bash wget http://lowelab.ucsc.edu/software/tRNAscan-SE.tar.gz tar zxf tRNAscan-SE.tar.gz cd tRNAscan-SE-1.3.1 sudo make && make install make testrun make clean
<br>
## 安裝過程說明
1. 從服務器下載 tRNAScan-SE 1.3.1.tar.qz(2017-07-26最新),在其web server 頁面沒有找到關於本地版的說明。
2. 如果你有root權限,又和我一樣還不太懂$PASH怎么改,就不要自己修改安裝路徑了。默認安裝在根目錄opt文件夾里的biosoft文件夾中。
3. 安裝過程中有一些提示信息,不懂可以不管。也是關於改路徑的。
> Makefile 里面的安裝路徑是:
>BINDIR = /opt/biosoft/tRNAscan-SE-1.3.1/bin
LIBDIR = /opt/biosoft/tRNAscan-SE-1.3.1/lib/tRNAscan-SE
MANDIR = /opt/biosoft/tRNAscan-SE-1.3.1/man
<br>
## 使用說明
* 建議去[網頁版 Web Server](http://lowelab.ucsc.edu/tRNAscan-SE/)提交[示例](http://lowelab.ucsc.edu/tRNAscan-SE/ExampleSequences.fa "Example tRNA sequences")。然后看一下返回的結果,和實際運行的代碼。
> 網頁版運行后給出的運行的命令行: <br> `tRNAscan-SE -qQ -Y -o# -m# -f# -l# -c tRNAscan-SE.conf -s# (fasta file)`
* 其中.conf文件是一個設置文件,可以點開看。
* 輸出的結果里面有兩個score,
- cove score,最后的一個分值,最低20,是每一個isotype的分值
- 還有一個infernal score,是用來過濾,提高計算速度的
* 幫助文件運行 tRNAsecn-SE -h,參考3的說明挺詳細。
* 運行的主要參數包括
- 選擇tRNA類型(默認細菌)-B
- 不檢測是不是假基因 -D
- 輸出文件的類型:
+ -o <file> 總結果
+ -f <file> 二級結構結果
+ \# 如果把 \# 放在<file>處,沒有空格隔開表示使用默認名字
* 文檔中提供了一個postscript的幫助,Mannual.ps,我用的遠程登錄ssh,也不知道怎么打開圖形界面,所以下到本地又下了[GView 和 Ghostscript](http://pages.cs.wisc.edu/~ghost/index.htm)打開的。30多頁,可是也沒有覺得有什么特別有用的。寫着有個html版本的,可是現在也打不開了。
<br>
## 結果確認
* 網頁目前使用的是2.0版本
* 使用的序列是NCBI上面下載的細菌基因組,其注釋信息顯示有39個tRNA,4.62MB。
* 測試
* 設置1: default:返回41個結果,速度最快,大約10s。
`tRNAscan-SE -qQ -Y -o# -m# -f# -l# -c tRNAscan-SE.conf -B -s# (fasta file)`
* 設置2:Legacy(tRNAscan+Eufindtran -> cove) -:返回39個結果
`tRNAscan-SE -qQ -Y -o# -m# -f# -l# -c tRNAscan-SE.conf -L -B -s# (fasta file)`
* 設置3:不適用過濾算法,等了30min還在計算,果然很慢,放棄。
* 區別: -L參數默認值為116bp,大於這個數值的tRNA被刪除,刪除的這兩個的確沒有對應到NCBI里面的結果。
兩個.conf本身沒有區別。
觀察了下,被濾掉的2條大於116bp的序列cove score在30以下,且二維結構里面看出來成環的區域很長,就是下面的`...`很長,箭頭和箭頭連起來后會很不穩定的樣子。
Seq: TGTAGGATGTTGAAATTGGCaGACAAGCCCTCCTGTCTCGGGGGTGGGGAAcccagcataaagcgtaattcaaaccggactattgccTAACgACCCCGTGGAGGTTCGAATCCTTCTCCTACAG
Str: >>>>>>>..>>>...........<<<.>>>>>.......<<<<<.>>>>............................................<<<<..>>>>>.......<<<<<<<<<<<<.
* 如果選的是真核模式,預測出來的是38條,所以模式還是很重要。
<br>
## 參考
[[1]](https://prmadi.com/installing_trnascan_se/) 說明了安裝過程的提示信息是用於修改c shell的
[[2]](http://qinqianshan.com/prediction-of-trna-trnascan-se/) 關於postscript的說明和如何看結果
[[3]](http://www.cnblogs.com/xudongliang/p/7093458.html) 詳細的網頁版輸出結果說明
[[4]](https://academic.oup.com/nar/article-lookup/doi/10.1093/nar/gkw413) 關於2.0的2016年的論文