linux curl是通過url語法在命令行下上傳或下載文件的工具軟件,它支持http,https,ftp,ftps,telnet等多種協議,常被用來抓取網頁和監控Web服務器狀態。 一、Linux curl用法舉例: 1. linux curl抓取網頁: 抓取百度: curl http://www.baidu.com 如發現亂碼,可以使用iconv轉碼 curl http://iframe.ip138.com/ic.asp|iconv -fgb2312 iconv的用法請參閱:在Linux/Unix系統下用iconv命令處理文本文件中文亂碼問題 2. Linux curl使用代理: linux curl使用http代理抓取頁面: curl -x 111.95.243.36:80 http://iframe.ip138.com/ic.asp|iconv -fgb2312 curl -x 111.95.243.36:80 -U aiezu:password http://www.baidu.com 使用socks代理抓取頁面: curl --socks4 202.113.65.229:443 http://iframe.ip138.com/ic.asp|iconv -fgb2312 curl --socks5 202.113.65.229:443 http://iframe.ip138.com/ic.asp|iconv -fgb2312 代理服務器地址可以從爬蟲代理上獲取。 3. linux curl處理cookies 接收cookies: curl -c /tmp/cookies http://www.baidu.com #cookies保存到/tmp/cookies文件 發送cookies: curl -b "key1=val1;key2=val2;" http://www.baidu.com #發送cookies文本 curl -b /tmp/cookies http://www.baidu.com #從文件中讀取cookies 4. linux curl發送數據: linux curl get方式提交數據: curl -G -d "name=value&name2=value2" http://www.baidu.com linux curl post方式提交數據: curl -d "name=value&name2=value2" http://www.baidu.com #post數據 curl -d a=b&c=d&txt@/tmp/txt http://www.baidu.com #post文件 以表單的方式上傳文件: curl -F file=@/tmp/me.txt http://www.aiezu.com 相當於設置form表單的method="POST"和enctype='multipart/form-data'兩個屬性。 5. linux curl http header處理: 設置http請求頭信息: curl -A "Mozilla/5.0 Firefox/21.0" http://www.baidu.com #設置http請求頭User-Agent curl -e "http://pachong.org/" http://www.baidu.com #設置http請求頭Referer curl -H "Connection:keep-alive \n User-Agent: Mozilla/5.0" http://www.aiezu.com 設置http響應頭處理: curl -I http://www.aiezu.com #僅僅返回header curl -D /tmp/header http://www.aiezu.com #將http header保存到/tmp/header文件 6. linux curl認證: curl -u aiezu:password http://www.aiezu.com #用戶名密碼認證 curl -E mycert.pem https://www.baidu.com #采用證書認證 6. 其他: curl -# http://www.baidu.com #以“#”號輸出進度條 curl -o /tmp/aiezu http://www.baidu.com #保存http響應到/tmp/aiezu linux 使用curl小經驗教訓: http請求地址的url要使用""括起來。當有存在多個參數使用&連接時可能會出錯。