【背景】
cut是一個將文本按列進行划分的文本處理工具。cut命令逐行讀入文本,然后按列划分字段並進行提取、輸出等操作。
【命令格式】
cut [option] filename
cat filename | cut [option]
可以看到,cut命令既可以用文件作為參數也可以接受標准輸入。
【常見用法】
本次實驗所用的文件text.txt的內容為:
11 Tom computer-science 4.0
12 Jack economic 3.8
13 Marry biology 3.9
14 Cherry mathematics 4.1
15 Jim chemistry 4.2
1.提取文件中的人名
cut -d ' ' -f 2 text.txt
Tom
Jack
Marry
Cherry
Jim
其中,-f選項指定需要提取的字段編號。
2.提取多個字段
(1)-f field_list:field_list為字段列表,指定需要提取的字段。
(2)-f N-:指從第N個字段到行尾。
(3)-f N-M:指從第N個字段到第M個字段。
(4)-f -N:指從行首到第N個字段。
3.設定定界符
cut的默認定界符是空格,但有些文件的定界符不是空格,此時可以用-d選項設定定界符。
echo 1:2:3:4 | cut -d ':' -f 3
3
這里設定了定界符為冒號,因此cut可以解析用冒號分隔的各個字段。
4.按字節/字符分割
cut命令最常見的-f選項按照字段分割文本,其實cut還支持按照字節或者字符分割文本。
(1)-c:按字符分割。
(2)-b:按字節分割。
例如需要輸出文件每一行的前兩個字符:
cut -c 1-2 text.txt
11
12
13
14
15
---------------------
作者:csyuanA
來源:CSDN
原文:https://blog.csdn.net/csyuanA/article/details/76039586