該軟件功能強大,兼容所有系統。
網站:http://bioinf.shenwei.me/seqkit/usage/
下載,解壓,安裝seqkit軟件,下載二進制文件較好。
一、序列操作:
1.取反向序列
seqkit seq test.fa -r > test_re.fa
2.取互補序列
seqkit seq test.fa -p > test_com.fa
3.取反向互補序列
seqkit seq test.fa -r -p > test_re_com.fa
4.DNA序列轉換為RNA序列
seqkit seq test.fa --nda2rna > test_rna.fa
5.RNA序列轉換為DNA序列
seqkit seq test.fa rna2dna > test_dna.fa
6.將序列以小寫字母的形式輸出
seqkit seq test.fa -l > test_lower.fa
7.將序列以大寫字母的形式輸出
seqkit seq test.fa -u > test_upper.fa
8.指定每行序列的輸出長度(為0的話,代表為一整行,默認的輸出 長度是60個鹼基)
seqkit seq test.fa -w 10 > test_10.fa (指定序列的長度為10)
9.將多行序列轉換為一行序列
seqkit seq test.fa -w 0 > test_w.fa
10.只輸出序列
seqkit seq test.fa -s -w 0 > test_seq.fa
11.將只輸出的序列的,指定每行輸出的鹼基數
seqkit seq test_seq.fa -s -w 40 > test_seq40.fa
###注意10,11的微妙之處
###11,12也可以一步完成:
seqkit seq test.fa -s -w 20 -o test_20.fa
二、Fasta/q之間以及與tab格式互換
10.將fataq文件轉化為fasta格式.
seqkit seq fq2fa test.fq -o test.fa
11.將fasta格式轉化為tab格式
seqkit fx2tab test.fa > test_tab.fa (沒有seq參數)
三、序列信息統計
1.序列鹼基含量
seqkit fx2tab -l -g -n -i -H test..fa (這些參數組合起來比較好看)
2.序列長度的整體分布統計
seqkit stat test.fa
四、其他用法
網址:http://www.oebiotech.com/Article/seqkitfast.html
http://www.360doc.com/content/17/0114/16/35684706_622440037.shtml
http://bioinf.shenwei.me/seqkit/usage/