弄到一堆學習資料,都是網盤地址,其中有很多失效了,不想一個個試
3.3第20季:HTML5特效實戰
https://pan.baidu.com/s/1kVBrpZp
3.4第21季:3小時玩轉微信小程序入門
https://pan.baidu.com/s/1eUnMTii
3.5第22季:CSS3特效實戰
https://pan.baidu.com/s/1dESOjFr
3.6第23季:輕松搞定畢業設計:論文寫作+項目實戰
https://pan.baidu.com/s/1eS2DVjW
3.7第24季:Java8新特性全剖析
https://pan.baidu.com/s/1boL0IMr
3.8第25季:BAT前端面試揭秘
於是用grep 取地址
# cat tar.txt | grep -P 'https(.+)[a-zA-Z0-9]' -o
-P 表示使用正則
-o 表示輸出提取內容,不帶則顯示整行
結果:
https://pan.baidu.com/s/1c2tUAHU
https://pan.baidu.com/s/1slv5Yrz
https://pan.baidu.com/s/1KXvnojsly5JdbrPJPTQmVw
https://pan.baidu.com/s/1bpnkZCV
https://pan.baidu.com/s/1o78TbUM
https://pan.baidu.com/s/1skZRoLZ
https://pan.baidu.com/s/1skLEly9
https://pan.baidu.com/s/1jH8vplG
https://pan.baidu.com/s/1mhZv3q4
https://pan.baidu.com/s/1nvBThmp
https://pan.baidu.com/s/1pKY9yAZ
再使用wget 可以下載到網頁內容,再使用grep命令查找關鍵詞,結果比較少,難道只有這幾個有效?
[root@node1 result]# find . | xargs grep -L '此鏈接分享內容可能因為涉及侵權、色情、反動、低俗等信息,無法訪問' grep: .: Is a directory . ./16_rvg3oAdDqpNIv1pGraJA ./1iszcZYb6FZAU7bqoUInUfw ./1c5McVW ./1geZZ1Ov ./1nv2jpDB ./1nvAWFMT ./1eS2x2Hc