1、基因系列中的data索引
2、基因ID之間的轉換
對於生信,依托於別人的工具不如自己動手,由於研究發表的滯后性,往往很多工具提供的轉換並不是最新的,況且開發者水平也參差不齊,理解原理才能讓你來去自如。
今天主要記錄幾個ID轉換的方式:
以果蠅為例
詳細的了解閱讀下面:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/README
1、從NCBI下載基因ID信息:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/GENE_INFO/Invertebrates/Drosophila_melanogaster.gene_info.gz
從中可以看到很詳細的各種基因信息
2、從NCBI下載基因與其他ID轉換的信息:
一、轉refseq:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2refseq.gz
二、轉ENSG:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2ensembl.gz#TCGA小工具ENSG轉換由此而來
三、轉uniprot:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2accession.gz
四、轉unigene:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2unigene
五、基因與GO的對應關系:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2go.gz
3、使用ID_Mapping:http://www.uniprot.org/uploadlists/
4、提取lncRNA的看這里:https://www.shengxin.ren/question/23
以上是數據原始信息,可以根據以上信息提取整理,應付各種常見的基因ID轉換基本沒啥問題了