基因組注釋主要包括四個研究方向:重復序列的識別;非編碼RNA的預測;基因結構預測和基因功能注釋。我們將分別對這四個領域進行闡述。 1 重復序列的識別。 1.1 重復序列的研究背景和意義:重復序列可分為串聯重復序列(Tendam repeat)和散在重復序列 ...
基因結構預測中同源注釋策略,將mRNA cDNA 蛋白 EST等序列比對到組裝的基因組中,在文章中通常使用以下比對軟件: tblastn gamp exonerate blat 根據我的實測,以上軟件整體都比較慢。gmap可設置多線程來提升速度。tblastn雖然也可以,但對提速沒什么影響。exonerate和gamp巨吃內存。 以下是跑的資源情況。我的組裝基因組約 Mb。tblastn的查詢序列 ...
2021-04-16 12:11 0 576 推薦指數:
基因組注釋主要包括四個研究方向:重復序列的識別;非編碼RNA的預測;基因結構預測和基因功能注釋。我們將分別對這四個領域進行闡述。 1 重復序列的識別。 1.1 重復序列的研究背景和意義:重復序列可分為串聯重復序列(Tendam repeat)和散在重復序列 ...
目錄 1. ncRNA 2. 軟件 tRNA注釋 rRNA注釋 其他ncRNA注釋 3. 注釋 tRNA rRNA snRNA、miRNA等 4. snRNA、miRNA等結果的統計 ...
之間介紹過annovar進行對snp注釋,今天介紹snpEFF SnpEff is a variant annotation and effect prediction tool. It annotates and predicts the effects of variants ...
參考基因組下載 基因組各版本的對應關系http://www.bio-info-trainee.com/1469.html GRCh36 (hg18): ENSEMBL release_52. GRCh37 (hg19): ENSEMBL release_59/61/64/68/69/75. ...
任務列表 1.在UCSC下載hg19參考基因組; 2.從gencode數據庫下載基因注釋文件,並且用IGV去查看感興趣的基因的結構,比如TP53,KRAS,EGFR等等。 3.截圖幾個基因的IGV可視化結構 4.下載ENSEMBL,NCBI的gtf,也導入IGV看看,截圖 ...
基因組組裝完后需要對基因組序列進行注釋。注釋前首先得構建基因模型,有三種策略: 同源預測(homology-based prediction):有一些基因蛋白在相近物種間的保守型高,所以可以使用已有的高質量近緣物種注釋信息通過序列聯配的方式確定外顯子邊界和剪切位點 基於轉錄組預測 ...
作業要求: 在UCSC下載hg19參考基因組,我博客有詳細說明,從gencode數據庫下載基因注釋文件,並且用IGV去查看你感興趣的基因的結構,比如TP53,KRAS,EGFR等等。 作業,截圖幾個基因的IGV可視化結構!還可以下載ENSEMBL,NCBI的gtf,也導入IGV看看,截圖基因結構 ...
SSR (Simple Sequence Repeat),即簡單重復序列,是一種以PCR技術為核心的DNA分子標記技術,也稱為微衛星序列或者串聯重復。 簡單重復顧名思義就是以很短的序列為一 ...