介紹
Ajax,全稱為Asynchronous JavaScript and XML,即異步的JavaScript和XML。這是一種利用JS在保證頁面不被刷新、頁面鏈接不變的情況下與服務器交換數據並更新部分網頁的技術。例如微博的下滑頁面,這就是通過Ajax獲取新數據並呈現的過程。
正文
Ajax的基本原理就不詳細講解了,大致步驟分為三步:發送請求、解析內容、渲染網頁。這里主要講一下分析方法
首先借助瀏覽器的開發者工具,chorme的快捷鍵是F12,切換到network選項卡,這就是觀察的界面了。
Ajax其實有特殊的請求類型,叫作xhr,拿微博舉例:

點擊這個請求,可以查看這個請求的詳細信息,如Request Headers、URL和Response Headers等信息。其中Request Headers中有一個信息為X-Requested-With,這就標記了此請求是Ajax請求,如圖所示:

隨后點擊一下Preview,即可看到響應的內容,為JSON格式。Response選項卡中可以觀察到真實的返回數據。
接下來,用chorme的篩選功能選出所有的Ajax請求。然后不斷滑動頁面就可以看到一個個Ajax請求,只需要用程序模擬這些請求,就可以輕松提取我們所需要的信息了。

總結
了解了Ajax的分析方法之后,就可以爬取了。具體操作明天再繼續,今天忙了一天,有點累。打算明天再做一個小項目,但暫時沒考慮好做什么。
