原文:使用 gffread 提取基因組序列信息

需求:提取 號染色體的 和 區間的 fa 序列 需要准備的test.gff 文件如下所示,第一列是染色體號,第二列和第三列的內容隨意,第四列和第五列是提取的開始位置和終止位置,第六列和第八列內容隨意,第七列是基因組的正負鏈,第九列序列的信息,第九列必須有Parent , ID , gene id 信息,不然序列提取不出來。分隔符為tab: 另外還需要基因組文件GRCh .primary assem ...

2022-01-10 16:03 0 1401 推薦指數:

查看詳情

mVISTA 多序列比對葉綠體基因組

mVISTA可對2個或者多個DNA序列進行比較,可以對比對結果進行可視化。 詳情請大力戳這里 0 輸入文件說明 mVISTA 需要輸入的文件有如下幾類 必須文件 郵箱 fasta格式序列文件(或者GENBANK identifier) 上傳文件不得> 10 Mb ...

Tue Jan 26 17:41:00 CST 2021 0 752
基因組序列注釋 (基因結構預測)

基因組組裝完后需要對基因組序列進行注釋。注釋前首先得構建基因模型,有三種策略: 同源預測(homology-based prediction):有一些基因蛋白在相近物種間的保守型高,所以可以使用已有的高質量近緣物種注釋信息通過序列聯配的方式確定外顯子邊界和剪切位點 基於轉錄預測 ...

Sun Dec 22 01:29:00 CST 2019 0 4736
hg19基因組 | 功能區域 | 位置提取

如何獲取hg19的CDS、UTR、intergenic、intron等的位置信息? 參考手冊: Hg19 regions for Intergenic, Promoters, Enhancer, Exon, Intron, 5-UTR, 3-UTR 怎么從gtf文件獲取genome ...

Tue Nov 19 23:39:00 CST 2019 0 512
基因組注釋

基因組注釋主要包括四個研究方向:重復序列的識別;非編碼RNA的預測;基因結構預測和基因功能注釋。我們將分別對這四個領域進行闡述。 1 重復序列的識別。 1.1 重復序列的研究背景和意義:重復序列可分為串聯重復序列(Tendam repeat)和散在重復序列 ...

Mon Jan 11 19:48:00 CST 2016 0 4001
參考基因組

參考基因組版本命名參考基因組聯盟(Genome Reference Consortium),它是由 NCBI,EBI,桑格研究所等機構組成。GRC 利用最佳的技術裝配,糾正,增加基因組序列,以此作為在生信分析領域作為參考的基因組。人基因組官名叫 GRCh38 (Genome ...

Sat Jun 12 20:52:00 CST 2021 0 1267
genome repeat sequence | 基因組重復序列

基因組里的小寫字母的序列就是soft masking,也就是被標記的重復序列。 怎么把重復序列提取出來,保存為bed文件? 參考:Uppercase vs lowercase letters in reference genome ...

Mon Mar 26 08:00:00 CST 2018 0 935
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM