制作annovar注釋依賴的cosmic數據庫


1. 文件准備

COSMIC相關文件下載

COSMIC更新了下載規則。以前直接用ftp可以下載,現在麻煩一些,要根據它們提供的指導規則下載。
GRCh37/cosmic/v90/VCF/CosmicNonCodingVariants.vcf.gz的下載為例:

  • 獲得授權字符
echo "email@example.com:mycosmicpassword" | base64
ZW1haWxAZXhhbXBsZS5jb206bXljb3NtaWNwYXNzd29yZAo=
  • 獲得下載鏈接
curl -H "Authorization: Basic ZW1haWxAZXhhbXBsZS5jb206bXljb3NtaWNwYXNzd29yZAo=" https://cancer.sanger.ac.uk/cosmic/file_download/GRCh37/cosmic/v90/VCF/CosmicNonCodingVariants.vcf.gz
  • 下載數據
    從上一步返回的JSON中提取下載鏈接並直接下載
curl "https://cog.sanger.ac.uk/cosmic/GRCh37/cosmic/v90/VCF/CosmicNonCodingVariants.vcf.gz?AWSAccessKeyId=KFGH85D9KLWKC34GSl88&Expires=1521726406&Signature=Jf834Ck0%8GSkwd87S7xkvqkdfUV8%3D" > CosmicNonCodingVariants.vcf.gz

2. 數據處理

prepare_annovar_user.pl -dbtype cosmic CosmicMutantExport.tsv -vcf CosmicCodingMuts.vcf > hg19_cosmic90_coding.txt # 生成 Coding Variant 的注釋文件
prepare_annovar_user.pl -dbtype cosmic CosmicNCV.tsv -vcf CosmicNonCodingVariants.vcf > hg19_cosmic90_noncoding.txt # 生成 Non Coding Variant 的注釋文件

## 以下步驟也可以忽略
sort -k1 -V -s -t ' ' hg39_cosmic90_coding.txt > hg19_cosmic90_coding.sorted.txt #排序
mv hg19_cosmic90_coding.sorted.txt hg19_cosmic90_coding.txt
perl Annovar_index.pl hg19_cosmic90_coding.txt 1000 #生成index,但是如果注釋文件很小,也可以不生成


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM