原文:報錯:RSEM can not recognize reference sequence name chr1!(基因組的bam不能直接用rsem進行表達值計算)

今天使用單端測序的 bam 文件進行表達值calling,命令如下所示: 報錯內容為:The SAM BAM file declares less reference sequences than RSEM knows RSEM can not recognize reference sequence name chr tag XM failed Plase check if you provid ...

2021-09-27 13:06 0 141 推薦指數:

查看詳情

使用RSEM進行轉錄測序的差異表達分析

仍然是兩年前的筆記 1. prepare-reference 如果用RSEM對比對后的bam進行轉錄本定量,則在比對過程中要確保比對用到的索引是由rsem-prepare-reference產生的。 可以看到,單純用bowtie2建的索引和rsem調用bowtie2建的索引 ...

Mon Feb 22 00:49:00 CST 2021 0 983
rsem對轉錄本進行定量

最近在研究轉錄本,現在在下載數據,想起來自己有一個博客,就暫且來這里更新一下內容。 要想對轉錄本進行定量,首先需要下載它的轉錄數據,將別人上傳的SRR文件的名字整理在wheat.txt中,引用 下載后通過sratoolkits將sra數據轉化成fq格式 --split-3將sra ...

Mon Nov 15 04:48:00 CST 2021 0 808
genome repeat sequence | 基因組重復序列

基因組里的小寫字母的序列就是soft masking,也就是被標記的重復序列。 怎么把重復序列提取出來,保存為bed文件? 參考:Uppercase vs lowercase letters in reference genome ...

Mon Mar 26 08:00:00 CST 2018 0 935
pysam - 多種格式基因組數據(sam/bam/vcf/bcf/cram/…)讀寫與處理模塊(python)

在開發基因組相關流程或工具時,經常需要讀取、處理和創建bam、vcf、bcf文件。目前已經有一些主流的處理此類格式文件的工具,如samtools、picard、vcftools、bcftools,但此類工具集成的大多是標准功能,在編程時如果直接調用的話往往顯得不夠靈活。 本文介紹的是一個處理 ...

Mon Sep 26 20:58:00 CST 2016 0 8381
基因組注釋

基因組注釋主要包括四個研究方向:重復序列的識別;非編碼RNA的預測;基因結構預測和基因功能注釋。我們將分別對這四個領域進行闡述。 1 重復序列的識別。 1.1 重復序列的研究背景和意義:重復序列可分為串聯重復序列(Tendam repeat)和散在重復序列 ...

Mon Jan 11 19:48:00 CST 2016 0 4001
參考基因組

參考基因組版本命名參考基因組聯盟(Genome Reference Consortium),它是由 NCBI,EBI,桑格研究所等機構組成。GRC 利用最佳的技術裝配,糾正,增加基因組序列,以此作為在生信分析領域作為參考的基因組。人基因組官名叫 GRCh38 (Genome ...

Sat Jun 12 20:52:00 CST 2021 0 1267
「三代組裝」使用Pilon對基因組進行polish

對初步組裝進行polish 以FASTA和BAM文件作為輸入,根據比對結果對輸入的參考基因組進行提高,包括 單鹼基差異 小的插入缺失(indels) 較大的插入缺失或者block替換 填充參考序列中的N 找到局部的錯誤組裝 最后輸出polish后的FASTA ...

Mon Sep 23 19:43:00 CST 2019 0 556
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM