snpEff 對snp進行功能注釋


主頁使用說明http://snpeff.sourceforge.net/SnpEff_manual.html。

下載解壓即可使用(java)。

一、建庫

(1)已有2500個基因組的庫,直接下載。

  查看已有庫:$ java -jar snpEff.jar databases

 下載庫:$ java -jar snpEff.jar download -v GRCh37.75

(2)自己建庫

      1. Configure a new genome:編輯:$ vi snpEffect.config

                                                                             # Mouse genome, version mm37.61

                                                                             mm37.61.genome : Mouse

      2. 如果是其他編碼格式,如線粒體:dm3.M.codonTable : Vertebrate_Mitochondrial (基因組dm3,染色體M)

      3. 建庫:

             $ mkdir snpEff/data/mm37.61

             $ cd snpEff/data/mm37.61

             將基因組數據 Mus_musculus.NCBIM37.61.dna.toplevel.fa.gz 改名為 sequences.fa

             將基因組注釋數據 dmel-all-r5.31.gff.gz 改名為 genes.gff.gz  (注:如果GFF3文件已經含有fasta序列,則在前面加 '##FASTA')

             還可以將protein.fa.gz、cds.fa.gz、regulation.gff.gz放入。

            $ cd snpEff

            $ java -jar snpEff.jar build -gff3 -v mm37.61

(3)注釋

        $ java -Xmx4g -jar snpEff.jar mm37.61 test.chr22.vcf > test.chr22.ann.vcf

                                    $ java-Xmx15G  -jar../snpEff_3_1/snpEff.jar  eff -v galGal4-c ../snpEff_3_1/snpEff.config -i vcf stop_gained.vcf > stop_gained.anno

    


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM