生信數據文件一般是按列分開的,如果我們只想簡單的提取一列而不是費盡周折寫個程序提取哪一列的話,awk作為一個非常好用的文檔處理工具,我們現在來簡單看一下他的一些功能:
awk '{print $1}' ./Input.txt > ./out.txt
這里' '中是要輸出的表達式,$1代表第一列,Input.txt是輸入文件。
awk '{print $1,$2}'
提取前兩列。
提取之后的文件就可以用sort等命令進行操作:
sort ./out.txt | uniq out
排序並刪除重復行。