基因组注释主要包括四个研究方向:重复序列的识别;非编码RNA的预测;基因结构预测和基因功能注释。我们将分别对这四个领域进行阐述。 1 重复序列的识别。 1.1 重复序列的研究背景和意义:重复序列可分为串联重复序列(Tendam repeat)和散在重复序列 ...
基因结构预测中同源注释策略,将mRNA cDNA 蛋白 EST等序列比对到组装的基因组中,在文章中通常使用以下比对软件: tblastn gamp exonerate blat 根据我的实测,以上软件整体都比较慢。gmap可设置多线程来提升速度。tblastn虽然也可以,但对提速没什么影响。exonerate和gamp巨吃内存。 以下是跑的资源情况。我的组装基因组约 Mb。tblastn的查询序列 ...
2021-04-16 12:11 0 576 推荐指数:
基因组注释主要包括四个研究方向:重复序列的识别;非编码RNA的预测;基因结构预测和基因功能注释。我们将分别对这四个领域进行阐述。 1 重复序列的识别。 1.1 重复序列的研究背景和意义:重复序列可分为串联重复序列(Tendam repeat)和散在重复序列 ...
目录 1. ncRNA 2. 软件 tRNA注释 rRNA注释 其他ncRNA注释 3. 注释 tRNA rRNA snRNA、miRNA等 4. snRNA、miRNA等结果的统计 ...
之间介绍过annovar进行对snp注释,今天介绍snpEFF SnpEff is a variant annotation and effect prediction tool. It annotates and predicts the effects of variants ...
参考基因组下载 基因组各版本的对应关系http://www.bio-info-trainee.com/1469.html GRCh36 (hg18): ENSEMBL release_52. GRCh37 (hg19): ENSEMBL release_59/61/64/68/69/75. ...
任务列表 1.在UCSC下载hg19参考基因组; 2.从gencode数据库下载基因注释文件,并且用IGV去查看感兴趣的基因的结构,比如TP53,KRAS,EGFR等等。 3.截图几个基因的IGV可视化结构 4.下载ENSEMBL,NCBI的gtf,也导入IGV看看,截图 ...
基因组组装完后需要对基因组序列进行注释。注释前首先得构建基因模型,有三种策略: 同源预测(homology-based prediction):有一些基因蛋白在相近物种间的保守型高,所以可以使用已有的高质量近缘物种注释信息通过序列联配的方式确定外显子边界和剪切位点 基于转录组预测 ...
作业要求: 在UCSC下载hg19参考基因组,我博客有详细说明,从gencode数据库下载基因注释文件,并且用IGV去查看你感兴趣的基因的结构,比如TP53,KRAS,EGFR等等。 作业,截图几个基因的IGV可视化结构!还可以下载ENSEMBL,NCBI的gtf,也导入IGV看看,截图基因结构 ...
SSR (Simple Sequence Repeat),即简单重复序列,是一种以PCR技术为核心的DNA分子标记技术,也称为微卫星序列或者串联重复。 简单重复顾名思义就是以很短的序列为一 ...