因為現在大多數網站都采取https,導致很多網站無法采集。那哪行,肯定得有解決辦法,今日就說說關於火車頭采集器7.6版本無法采集部分https網站處理方法。
火車頭7.6版本由於發布時間久遠,雖然采集器大部分功能都還可以正常使用,但是現在很多網站都從之前的http協議切換到了https協議。
現在怎么解決呢?辦法就是通過php進行抓取數據,把文章標簽都獲取
只要網站目錄新建一個接口,例如geturl/index.php
代碼附下載,你們下載,放在網站根目錄建個文件夾,例如:geturl,調用如下:
在接口后面/geturl/index.php?https://www.wood888.net/xinwens/qiyexingxiang-2.html
例如獲取數據:/geturl/index.php?https://www.wood888.net/xinwens/qiyexingxiang-2.html
獲取內容頁面就是通過火車頭手動提取設置,把鏈接加入接口提取出來
這樣就能獲取文章了
好了,這樣就完美解決了
插件下載地址:http://www.68xi.com/591.html