作业要求: 比对软件很多,首先大家去收集一下,因为我们是带大家入门,请统一用hisat2,并且搞懂它的用法。 直接去hisat2的主页下载index文件即可,然后把fastq格式的reads比对上去得到sam文件。 接着用samtools把它转为bam文件,并且排序(注意N和P两种排序区别)索引 ...
任务列表 比对软件 hisat 的用法 下载index文件 比对 排序 索引 质量控制 载入IGV,截图几个基因 hisat 的用法 本作业是比对到基因组,所以使用gapped or splices mapper,此流程已经更新。TopHat首次被发表已经是 年前,STAR的比对速度是TopHat的 倍,HISAT更是STAR的 . 倍。HISAT 是TopHat Bowti 的继任者,使用改进 ...
2017-08-16 22:18 0 1159 推荐指数:
作业要求: 比对软件很多,首先大家去收集一下,因为我们是带大家入门,请统一用hisat2,并且搞懂它的用法。 直接去hisat2的主页下载index文件即可,然后把fastq格式的reads比对上去得到sam文件。 接着用samtools把它转为bam文件,并且排序(注意N和P两种排序区别)索引 ...
作业要求: 实现这个功能的软件也很多,还是烦请大家先自己搜索几个教程,入门请统一用htseq-count,对每个样本都会输出一个表达量文件。 需要用脚本合并所有的样本为表达矩阵。参考:生信编程直播第四题:多个同样的行列式文件合并起来 对这个表达矩阵可以自己简单在excel或者R里面摸索,求平均值 ...
做完基因组组装后,通常要评估基因组的质量,目前可以采用二三代数据比对回基因组看比对率和coverage,BUSCO,LAI等。转录组数据比对率也是我们常用的方法,通常可以排除转录组数据是否存在问题,也方便在后续注释中排除转录组数据样本的问题。 可以用HiSAT2比对来查看比对率 ...
作业要求: 使用R语言,载入表达矩阵,然后设置好分组信息,统一用DEseq2进行差异分析,当然也可以走走edgeR或者limma的voom流程。 基本任务是得到差异分析结果,进阶任务是比较多个差异 ...
作业要求: 我们统一选择p<0.05而且abs(logFC)大于一个与众的基因为显著差异表达基因集,对这个基因集用R包做KEGG/GO超几何分布检验分析。 然后把表达矩阵和分组信息分别作出c ...
mVISTA可对2个或者多个DNA序列进行比较,可以对比对结果进行可视化。 详情请大力戳这里 0 输入文件说明 mVISTA 需要输入的文件有如下几类 必须文件 邮箱 fasta格式序列文件(或者GENBANK identifier) 上传文件不得> 10 Mb ...
作业要求: 在UCSC下载hg19参考基因组,我博客有详细说明,从gencode数据库下载基因注释文件,并且用IGV去查看你感兴趣的基因的结构,比如TP53,KRAS,EGFR等等。 作业,截图几个基因的IGV可视化结构!还可以下载ENSEMBL,NCBI的gtf,也导入IGV看看,截图基因结构 ...
任务列表 1.在UCSC下载hg19参考基因组; 2.从gencode数据库下载基因注释文件,并且用IGV去查看感兴趣的基因的结构,比如TP53,KRAS,EGFR等等。 3.截图几个基因的IGV可视化结构 4.下载ENSEMBL,NCBI的gtf,也导入IGV看看,截图 ...