第一次寫博客,分享一個做的提取基因序列的程序,根據bed文件里的位置信息從基因組里提取序列 源碼地址:https://github.com/Liuyuan2018/fastaTools/blob/master/pyGetFasta.py bed文件通常用來保存注釋基因信息,BED文件必須的3列 ...
同樣的名為read .fa 的fasta文件,里面有若干序列,如: gt r TGAATGCGAACTCCGGGACGCTCAGTAATGTGACGATAGCTGAAAACTGTACGATAAACNGTACGCTGAGGGCAGAAAAAATCGTCGGGGACATTNTAAAGGCGGCGAGCGCGGCTTTTCCG gt r NTTNTGATGCGGGCTTGTGGAGTTCAGCCGATC ...
2017-05-17 22:03 0 1322 推薦指數:
第一次寫博客,分享一個做的提取基因序列的程序,根據bed文件里的位置信息從基因組里提取序列 源碼地址:https://github.com/Liuyuan2018/fastaTools/blob/master/pyGetFasta.py bed文件通常用來保存注釋基因信息,BED文件必須的3列 ...
一、關於程序: FUN:計算FASTA文件中每條序列中G和C的含量百分比,輸出最大值及其id INPUT:FASTA格式文件 >seq1 CGCCGAGCGCTTGACCTCCAGCAAGACGCCGTCTGGCACATGCAACGAGCTGTAGCAGAC >seq2 ...
注:該腳本適用於序列不斷開的情況 可用一下命令將折行的序列合並為一行 運行腳本 升級版,輸入文件是 fasta 格式即可。用 Bio 中的 Seq.IO 解析 fasta 文件, 用 python 的內置函數 count() 的計算速度更快。 ...
文件排序 seq: 產生一系列的數字; man seq查看其具體使用。我們這使用seq產生下游分析所用到的輸入文件。 # 產生從1到10的數,步長為1 $ seq 1 10 1 2 3 4 5 6 7 8 9 10 # 產生從1到10的數,步長為1,用空格分割 ...
1.統計大於號開始的行數或seqkit 工具 Total sequence length 5,759,798,599 Total ungapped length 5,759,798,599 Nu ...
提取fasta文件genome_test.fa中第14號染色體的序列,其內容如下: >chr1 ATATATATAT >chr2 ATATATATATCGCGCGCGCG >chr3 ATATATATATCGCGCGCGCGATATATATAT >chr4 ...
一、序列操作: 1.取反向序列 seqkit seq test.fa -r > test_re.fa 2.取互補序列 seq test.fa -p > test_com.fa 3.取反向互補序列 seqkit seq test.fa -r -p > ...