snpEff 对snp进行功能注释


主页使用说明http://snpeff.sourceforge.net/SnpEff_manual.html。

下载解压即可使用(java)。

一、建库

(1)已有2500个基因组的库,直接下载。

  查看已有库:$ java -jar snpEff.jar databases

 下载库:$ java -jar snpEff.jar download -v GRCh37.75

(2)自己建库

      1. Configure a new genome:编辑:$ vi snpEffect.config

                                                                             # Mouse genome, version mm37.61

                                                                             mm37.61.genome : Mouse

      2. 如果是其他编码格式,如线粒体:dm3.M.codonTable : Vertebrate_Mitochondrial (基因组dm3,染色体M)

      3. 建库:

             $ mkdir snpEff/data/mm37.61

             $ cd snpEff/data/mm37.61

             将基因组数据 Mus_musculus.NCBIM37.61.dna.toplevel.fa.gz 改名为 sequences.fa

             将基因组注释数据 dmel-all-r5.31.gff.gz 改名为 genes.gff.gz  (注:如果GFF3文件已经含有fasta序列,则在前面加 '##FASTA')

             还可以将protein.fa.gz、cds.fa.gz、regulation.gff.gz放入。

            $ cd snpEff

            $ java -jar snpEff.jar build -gff3 -v mm37.61

(3)注释

        $ java -Xmx4g -jar snpEff.jar mm37.61 test.chr22.vcf > test.chr22.ann.vcf

                                    $ java-Xmx15G  -jar../snpEff_3_1/snpEff.jar  eff -v galGal4-c ../snpEff_3_1/snpEff.config -i vcf stop_gained.vcf > stop_gained.anno

    


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM