seqtk 是一款針對fasta/fastq 文件進行處理的小程序,有很多的功能,速度很快,很方便;
源代碼:https://github.com/lh3/seqtk
安裝:
git clone https://github.com/lh3/seqtk
cd seqtk
make
測試:
seqtk seq : 用途:
1)將fastq 文件轉換成fasta 文件
seqtk seq -A input.fastq > output.fasta
input.fastq的內容:
@NB001 ATGCACAAAACCCC + //////////////
output.fasta 的內容:
>NB001
ATGCACAAAACCCC
2)得到反向互補序列
seqtk seq -Ar input.fastq > output.fasta
output.fasta的內容為:
>NB001
GGGGTTTTGTGCAT
seqtk comp: 得到fastq/fasta 文件的鹼基組成
seqtk comp input.fastq > out.txt
out.txt 的內容為:
NB001 14 6 6 1 1 0 0 0 0 0 0 0
第一列為序列的name; 第二列為長度,3-6列代表在該序列中A, C, G ,T 4中鹼基的數目
用這個程序可以快速得到每條序列的長度