根據bed文件從fasta文件中獲取基因序列


第一次寫博客,分享一個做的提取基因序列的程序,根據bed文件里的位置信息從基因組里提取序列

源碼地址:https://github.com/Liuyuan2018/fastaTools/blob/master/pyGetFasta.py

bed文件通常用來保存注釋基因信息BED文件必須的3列:

  1. chrom - 染色體號
  2. chromStart - feature在染色體上起始位置(其實編號為0)
  3. chromEnd - feature在染色體上末尾位置(不包括此編號)

  第四列是基因的名稱

  還有些列想了解參考:http://genome.ucsc.edu/FAQ/FAQformat.html#format1

程序依賴 pyfasta模塊(https://pypi.org/project/pyfasta/)

安裝pyfasta的命令:pip install pyfasta

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM