seqkit一個FASTA/Q序列處理神器


該軟件功能強大,兼容所有系統。

網站:http://bioinf.shenwei.me/seqkit/usage/

下載,解壓,安裝seqkit軟件,下載二進制文件較好。

一、序列操作:

1.反向序列

seqkit   seq  test.fa   -r  >  test_re.fa

2.取互補序列

seqkit   seq   test.fa  -p  >  test_com.fa

3.取反向互補序列

seqkit   seq   test.fa  -r  -p  > test_re_com.fa

4.DNA序列轉換為RNA序列

seqkit   seq   test.fa  --nda2rna   >   test_rna.fa

5.RNA序列轉換為DNA序列

seqkit   seq  test.fa   rna2dna     >    test_dna.fa

6.將序列以小寫字母的形式輸出

seqkit  seq  test.fa  -l  >  test_lower.fa

7.將序列以大寫字母的形式輸出

seqkit   seq   test.fa  -u >  test_upper.fa

8.指定每行序列的輸出長度(為0的話,代表為一整行,默認的輸出 長度是60個鹼基)

seqkit  seq  test.fa  -w  10  >  test_10.fa  (指定序列的長度為10)

9.將多行序列轉換為一行序列

seqkit   seq  test.fa   -w   0   >  test_w.fa

10.只輸出序列

seqkit   seq  test.fa  -s  -w 0 > test_seq.fa

11.將只輸出的序列的,指定每行輸出的鹼基數

seqkit   seq  test_seq.fa  -s  -w 40 > test_seq40.fa

###注意10,11的微妙之處

###11,12也可以一步完成:

seqkit  seq   test.fa   -s  -w  20  -o  test_20.fa

二、Fasta/q之間以及與tab格式互換

10.將fataq文件轉化為fasta格式.

seqkit   seq   fq2fa   test.fq   -o   test.fa

11.將fasta格式轉化為tab格式

seqkit  fx2tab  test.fa >  test_tab.fa (沒有seq參數)

三、序列信息統計

1.序列鹼基含量

seqkit  fx2tab  -l  -g  -n  -i  -H  test..fa (這些參數組合起來比較好看)

2.序列長度的整體分布統計

seqkit  stat  test.fa

四、其他用法

網址:http://www.oebiotech.com/Article/seqkitfast.html

http://www.360doc.com/content/17/0114/16/35684706_622440037.shtml

http://bioinf.shenwei.me/seqkit/usage/


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM