當你想爭對一個文本文件的特定內容進行篩選的時候,第一想到的是用awk還是grep?眾所周知(大家都知道)的是grep則以查找著稱,而awk是linux上非常強大的文本處理工具,它基本上可以滿足大部分日常需求,這篇隨筆主要想展示一下分別用這兩個工具處理以下兩個實際問題。
* 將gff文件中注釋類型為gene的部分提取出來
* 利用geneID從gff文件中提取該基因所在行號
awk
`awk -F '\t' '{if($3=="gene")print $0}' The.gff > The.gene.gff'`
`awk '/"'${geneID}'"/{print NR}' The.gene.gff`
grep
`grep '^[gene]' The.gff > The.gene.gff`
`grep -n ${geneID} The.gene.gff |cut -f1 -d:`
總結
有時候合適的方法或許就是最簡單的方法,研0菜鳥,有不對的地方請嚴厲地批評我,我立馬改!!!