這是一個嘗試性的文章,能不能解決我要解決的問題,並不清楚。
===本文利用NCBI的blast界面,實現將短序列比對上reference基因組,並實現變異位點可視化。===補言===
比對常用的是NCBI網站,打開NCBI。(百度 谷歌直接搜索NCBI, 現在中國也在搭建和完善國家生物信息中心,一個是位於深圳的國家基因庫,由BGI代運營,一個是北京的國家生物信息中心,由BIG開發和運營)。
核苷酸序列比對選默認的blast就好,其他的比對模塊可以自行查看,有必要的情況下公眾號再講。
搜索自己想要比對的物種(reference)。
serch (點擊搜索)
好了,database已經為我們選定的物種基因組(可自行選擇版本),如果沒有基因組的話,可能需要自己上傳或者是其他的辦法(本處未做嘗試)。
輸入需要查找的序列,或者文件。
格式為fasta格式,如下(關於序列的格式文件說明,可以參見鄙人公眾號):
>ID1
ATCG
>ID2
ATCG
...
相似度一般用默認的,個人習慣在新的頁面打開,然后點blast。
我給的是雙子葉植物的一段序列,不負眾望,沒有搜到任何信息。
==============================================================================
下面我想找一段同物種的基因:
管它三七二十幾(這里省略了約三個步驟),終究找了一段序列,貼進去看看效果:
然后結果:
沒錯,就是這段,點開果然是100%的相似度。
現在我突變3個位點,再比對一次。
可以看到相似度變低了:右側pre.ident 為99.75%(前一分鍾是100%)。
三個位點發生了差異。
可以看到被人為突變的位置是無法對齊的,但是沒有顏色標記不是很好看。
繼續,打開右邊的可視化頁面:
可視化信息如下:
點擊紅色的query(沒錯,這就是剛剛輸入的sequence,現在被重命名為Query_8543),可以看到我們之前人為做的三個突變位點,如下(紅線所示):
放大mismatch的位點,可以看到詳細的鹼基信息:
以上,
abysw