基因组注释主要包括四个研究方向:重复序列的识别;非编码RNA的预测;基因结构预测和基因功能注释。我们将分别对这四个领域进行阐述。 1 重复序列的识别。 1.1 重复序列的研究背景和意义:重复序列可分为串联重复序列(Tendam repeat)和散在重复序列 ...
目录 .conda安装 .配置RepBase .RepeatMasker避坑 .RepeatProteinMask避坑 .RepeatModeler避坑 .自定义重复序列库 后记 .conda安装 conda安装虽然简单,但还是有很多坑,而且很多都是隐形的坑。 repeatmodeler依赖于repeatmasker,因此其实你只要安装repeatmodeler就好。其中repeatmasker ...
2021-04-06 22:59 0 1248 推荐指数:
基因组注释主要包括四个研究方向:重复序列的识别;非编码RNA的预测;基因结构预测和基因功能注释。我们将分别对这四个领域进行阐述。 1 重复序列的识别。 1.1 重复序列的研究背景和意义:重复序列可分为串联重复序列(Tendam repeat)和散在重复序列 ...
简介 tRNA:tRNA是mRNA翻译到蛋白的步骤中根据密码子搬运氨基酸的RNA。这个结构的最核心部位就是与密码子配对的三位碱基。tRNA长得像一个三叶草,大概76-90 bp,所以除了三位碱 ...
homology策略预测基因结构,下载了公共mRNA/CDS序列,考虑用gmap比对。本来是个很简单的脚本,但总是不那么顺利。 无论是用conda安装,还是源码安装较新版本,都存在问题。 第一步建立索引都没问题。但比对时,没报错,出现如下: 结果是cds_gene.gff3除了表头 ...
本文默认读者有一定的生信基础,没有基础的可以阅读以前的笔记内容。 ============================================================ con ...
目录 1. ncRNA 2. 软件 tRNA注释 rRNA注释 其他ncRNA注释 3. 注释 tRNA rRNA snRNA、miRNA等 4. snRNA、miRNA等结果的统计 ...
之间介绍过annovar进行对snp注释,今天介绍snpEFF SnpEff is a variant annotation and effect prediction tool. It annotates and predicts the effects of variants ...
参考基因组下载 基因组各版本的对应关系http://www.bio-info-trainee.com/1469.html GRCh36 (hg18): ENSEMBL release_52. GRCh37 (hg19): ENSEMBL release_59/61/64/68/69/75. ...
任务列表 1.在UCSC下载hg19参考基因组; 2.从gencode数据库下载基因注释文件,并且用IGV去查看感兴趣的基因的结构,比如TP53,KRAS,EGFR等等。 3.截图几个基因的IGV可视化结构 4.下载ENSEMBL,NCBI的gtf,也导入IGV看看,截图 ...