百度的搜索引擎有反爬蟲機制,我先直接用guzzle試試水。代碼如下:
百度直接攔截了,進了跳轉頁面,我試試加個瀏覽器頭文件,再試試。
修改后的header如下:
我測試了下,網站打開了。
我們繼續,輸入關鍵詞,並搜索,結果發現被安全攔截了,所以我感覺直接用GuzzleHttp搞不動,於是我繼續我的神器:jaeger/querylist和jaeger/querylist-puppeteer。
安裝步驟:
1.安裝依賴
在這之前,要先啟用php的proc_open函數,否則無法安裝完整
composer install jaeger/querylist
composer install jaeger/querylist-puppeteer
2.安裝nodejs
yum install nodejs
3.安裝npm
4.安裝@nesk/puphpeteer
npm install @nesk/puphpeteer
5.PHP啟用proc_open
代碼如下:
$rt是我的結果集合,打印下,如下
原文在我博客:




