主頁使用說明http://snpeff.sourceforge.net/SnpEff_manual.html。
下載解壓即可使用(java)。
一、建庫
(1)已有2500個基因組的庫,直接下載。
查看已有庫:$ java -jar snpEff.jar databases
下載庫:$ java -jar snpEff.jar download -v GRCh37.75
(2)自己建庫
1. Configure a new genome:編輯:$ vi snpEffect.config
# Mouse genome, version mm37.61
mm37.61.genome : Mouse
2. 如果是其他編碼格式,如線粒體:dm3.M.codonTable : Vertebrate_Mitochondrial (基因組dm3,染色體M)
3. 建庫:
$ mkdir snpEff/data/mm37.61
$ cd snpEff/data/mm37.61
將基因組數據 Mus_musculus.NCBIM37.61.dna.toplevel.fa.gz 改名為 sequences.fa
將基因組注釋數據 dmel-all-r5.31.gff.gz 改名為 genes.gff.gz (注:如果GFF3文件已經含有fasta序列,則在前面加 '##FASTA')
還可以將protein.fa.gz、cds.fa.gz、regulation.gff.gz放入。
$ cd snpEff
$ java -jar snpEff.jar build -gff3 -v mm37.61
(3)注釋
$ java -Xmx4g -jar snpEff.jar mm37.61 test.chr22.vcf > test.chr22.ann.vcf
$ java-Xmx15G -jar../snpEff_3_1/snpEff.jar eff -v galGal4-c ../snpEff_3_1/snpEff.config -i vcf stop_gained.vcf > stop_gained.anno
