一、引言
古語有雲:“活到老學到老”。表達出一種“生命不止,學習不止”的學習進取精神,是一種樂觀的激勵!作為程序員更應該如此,否則就會被淘汰。今天我所要講的不是如何去學習,而是怎么在網上找到我們所需求的資源。
二、百度網盤搜索方法
找資源的方法有很多,如:百度,谷歌搜索。而我講的是如何搜索“百度網盤”里面的資源。
具體方法:在搜索引擎中搜索:site:pan.baidu.com 關鍵詞,如下圖。親測必應,谷歌可以。
三、寫了一個程序
為了自己搜索方便,索性寫了一個程序去爬取必應的搜索結果,如下圖。演示地址:http://pan.tianyouduo.com
四、程序介紹
1、通過抓包工具,分析必應搜索的url,如下圖。我們最終可以獲取到:http://cn.bing.com/search?q=關鍵詞&first=第幾條開始
2、向此url(http://cn.bing.com/search?q=site:pan.baidu.com 關鍵詞&first=第幾條開始)發起Http請求(GET方式),得到html,通過正則表達式和xPath解析源代碼,提取信息。
3、代碼概覽。
*DotNet.Http.Core:Http請求專用庫。
*Resouces.Crawl.Common:一些.Net擴展方法。
*Resource.Crawl.Services:解析Html源代碼,並返回信息的庫。
*Resource.Crawl.Web:展示層。
五、源碼下載(Visual Studio 2013)