awk對某個字段分割處理

本文轉載自查看原文 2019-04-02 12:59 2180 Linux

工作中遇到要根據文件中某個字段分割成多行文本的處理，想到用awk處理，這里記錄下：

問題：

原文件：假設一共2個字段，用“|”分割，其中第二個字段用“#”分割，但該字段中也有不含“#”的值和空值

要求：根據第二個字段，若含#，將這條數據根據#分割成多條數據，無#和無值的行不變

202143108500|#0_1000_VOICE#0_1000_VOICE#0_1000_VOICE#0_TRAFFIC#0_TRAFFIC#0_TRAFFIC
202121366359|#0_1000_VOICE#0_TRAFFIC
202143108500|#0_1000_VOICE#0_1000_VOICE#0_1000_VOICE#0_TRAFFIC#0_TRAFFIC#0_TRAFFIC
202121366359|#0_1000_VOICE#0_TRAFFIC
202113492312|W_GH_YYM
202132164529|

用awk解決：

1、將含“#”的一行變多行

awk -F "|"  -vOFS="|"  '{l=split($2,arr,"#");for(i=1;i<l;i++){$2=arr[i+1];print}}' ./test.txt

結果：

202143108500|0_1000_VOICE
202143108500|0_1000_VOICE
202143108500|0_1000_VOICE
202143108500|0_TRAFFIC
202143108500|0_TRAFFIC
202143108500|0_TRAFFIC
202121366359|0_1000_VOICE
202121366359|0_TRAFFIC
202143108500|0_1000_VOICE
202143108500|0_1000_VOICE
202143108500|0_1000_VOICE
202143108500|0_TRAFFIC
202143108500|0_TRAFFIC
202143108500|0_TRAFFIC
202121366359|0_1000_VOICE
202121366359|0_TRAFFIC

2、將不含“#”篩選出來

awk -F "|"  '$2!~/#/{print}' ./test.txt

結果：

202113492312|W_GH_YYM
202132164529|

經過上面兩步就可以解決，將結果生成新的文件 a.txt

awk -F "|"  -vOFS="|"  '{l=split($2,arr,"#");for(i=1;i<l;i++){$2=arr[i+1];print}}' ./test.txt >a.txt
awk -F "|"  '$2!~/#/{print}' ./test.txt >>a.txt

a.txt:

202143108500|0_1000_VOICE
202143108500|0_1000_VOICE
202143108500|0_1000_VOICE
202143108500|0_TRAFFIC
202143108500|0_TRAFFIC
202143108500|0_TRAFFIC
202121366359|0_1000_VOICE
202121366359|0_TRAFFIC
202143108500|0_1000_VOICE
202143108500|0_1000_VOICE
202143108500|0_1000_VOICE
202143108500|0_TRAFFIC
202143108500|0_TRAFFIC
202143108500|0_TRAFFIC
202121366359|0_1000_VOICE
202121366359|0_TRAFFIC
202113492312|W_GH_YYM
202132164529|

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 awk實現按照某個字段排序 es根據某個字段排序及問題處理 awk 按照文件中的某個字段排序（本例是按照第三個字段排序） mysql根據指定指定字符拆分某個字段，分割成多條記錄 List按某個字段排序 list根據某個字段去重 AutoMapper 忽略某個字段 mysql根據某個字段去重 php刪除某個字段 ES對某個字段分組