mVISTA可對2個或者多個DNA序列進行比較,可以對比對結果進行可視化。
詳情請大力戳這里
0 輸入文件說明
mVISTA 需要輸入的文件有如下幾類
必須文件
- 郵箱
- fasta格式序列文件(或者GENBANK identifier)
上傳文件不得> 10 Mb
可選文件
- 比對程序 (一般選第3個即可)
a. AVID
b. LAGAN
c. Shuffle-LAGAN - 序列名稱(序列名稱會顯示在結果圖片中)
- 注釋文件 (添加注釋文件,可顯示在結果圖片中)
注釋文件格式如下
< 106481 116661 gene1
106481 106497 utr
107983 108069 exon
109884 110033 exon
111865 112023 exon
> 39424 42368 gene2
39424 39820 exon
41401 42368 exon
> 77817 81088 gene3
77817 78820 utr
79538 80107 exon
給出基因的起始,終止坐標; '>', '<'表示正負鏈,外顯子用exon表示;UTRs使用utr顯示即可。
上述格式文件可以通過 Ensembl genome browser快速導出具體請看http://genome.lbl.gov/vista/mvista/instructions.shtml#pdf
- 重復序列屏蔽 (是否進行屏蔽,如果否,則選擇one-celled/do not mask)
- 反向互補序列 (如果么有得到同源行較好的結果,可以選擇該參數)
- Regulatory VISTA (rVISTA) access (可用於預測轉錄因子結合位點,最大文件20k)
1 簡單操作
選擇3個測試數據進行檢驗
Step 1 選擇比對序列條數
Step 2 上傳序列以及注釋文件並提及即可
其中注釋文件的格式利用腳本進行轉換(腳本進行稍微修改,省下自己寫,感謝好人),即注意正負鏈,以及換行。上傳ref的注釋文件即可。
2 結果
結果則會得到3中類型文件
- TxtBrowse: 詳細記錄比對信息, 保守序列等
- Vista Browser: 交互的可視化工具
- PDF: 比對結果可視化
在表格最下面,有一個鏈接可調節可視化,保守序列的參數
點擊pdf,可查看比對結果,如下所示
其中CNS:保守非編碼序列 (conserved non-coding sequences)