liftover-基因坐標的轉換


liftover的介紹

人類基因組有不同的版本,目前用的最多的是hg38和hg19,為了將不同版本的染色體上的位置一一對應,UCSC出了這款工具liftOver,官方的定義是:

This tool converts genome coordinates and genome annotation files between assemblies.

 

1.liftover的安裝 

1 wget http://hgdownload.cse.ucsc.edu/admin/exe/linux.x86_64/liftOver

 

2.坐標注釋文件下載 

hg38Tohg19注釋文件:

1 wget http://hgdownload.cse.ucsc.edu/goldenPath/hg38/liftOver/hg38ToHg19.over.chain.gz

hg19Tohg38注釋文件:

1 wget http://hgdownload.cse.ucsc.edu/goldenPath/hg19/liftOver/hg19ToHg38.over.chain.gz

下載得到的*over.chain.gz不需要解壓

 

如果需要其他版本的注釋文件,請見Sequence and Annotation Downloads,下載對應的liftOver注釋文件即可。

 

3.Input文件 

只接受BED格式文件,BED格式文件只定義前三列:chr start end,無表頭

注:start不等於end(如果是單位點的話,建議所有end+1 

 

4.坐標轉換

簡單兩個命令即可

1.將liftOver變為可執行文件
2.執行,參數為inputfile,over.chain.gz,outputfile,unmapfile(會輸出沒有對應上的行)

Example:
hg38>hg19

1 /path/to/liftOver /path/to/SFTSV_24vscontrol_circ_hg38.bed /path/to/hg38ToHg19.over.chain.gz /path/to/SFTSV_24vscontrol_circ_hg19.bed /path/to/SFTSV_24vscontrol_circ_hg19_unmap.bed

 

 顯示坐標已經完全轉換

 

2019-12-10

22:03:03


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM