之前我們在網上看到有wp-autopost插件,是自動采集的。但是需要付費。 下面我們這邊發布一個開源的版本。如果覺得好,大家可以贊助我們哦~ 本插件使用需要一定的html、css 基礎. 本插件開發純屬興趣~~~插件已發布到wordpress官方插件中心
- 老季常用國內/國外VPS推薦總結
- 便宜VPS 搬瓦工bandwagonhost 優惠碼
- Vultr 充5美元可以用5個月VPS 充值最高送100美元
- Linode全面升級 推出月付5刀的套餐 機房可選東京2
- 插件下載地址:https://wordpress.org/plugins/wp-jpost/
- WP-JPost :http://wp-jpost.com/
- 演示站:http://147hub.com/
- WordPress 采集插件 wp-jpost 問答總結,如一些小伙伴出現的404錯誤請看這里。
- WordPress 采集插件 wp-jpost 任務列表 已知規則
- WordPress 采集插件 wp-jpost 采集教程視頻在線播放
- WordPress采集插件wp-jpost 采集規則【推薦】示例(不需要curl)
- 什么是curl?為什么需要curl?如何設置安裝curl?WordPress 采集插件 WP-JPost 在Windows/Linux 系統環境下安裝curl 采集 帶ssl的https網站 圖文教程
- 什么是USER-AGENT?為什么需要USER-AGENT? PC/WAP 常見USER-AGENT值 列表
WordPress 開源采集插件 wp-jpost 使用問題,請加QQ群下載:665443669 不會寫采集規則?請博主幫寫一個~親,插件免費,規則有價,詳情請聯系QQ:366609877 (注明:wp-jpost 規則)
主要功能
- 定向采集目標網站內容,並直接發布。
- 可以設置對應入庫的分類。
- 可以自定義文章的標簽。
- 可以自定義替換標題、文章內容。
- 自動另存為圖片到本地。
- 自動刪除內容中的所有鏈接。
- 加入百度翻譯,可以將內容翻譯成英文。
- 腳本定時自動增量功能。
插件截圖如下
如何安裝WordPress采集插件WP-JPost?
方法一:在后台插件中直接搜索“wp-jpost”
方法二:在WordPress插件官網下載,然后上傳安裝
https://wordpress.org/plugins/wp-jpost/
如何添加采集任務?
任務名
命名請使用英文字母數字組合. 例:douban。
抓取目標網站域名(網址以/結束)
這里填寫目標網站首頁的地址,以/結束。 例:https://www.douban.com
抓取目標網站列表頁
列表頁一般都是二級頁面,是欄目的具體展示頁,一般是用頁內跳轉的鏈接。 例如:https://www.douban.com/group/meituikong/
入庫目標分類ID
WordPress 后台 -- 文章 -- 分類目錄 -- 編譯你想入庫到的分類 -- 查看瀏覽器地址欄的地址。 例:/wp-admin/term.php?taxonomy=category&tag_ID=38... 這里的tag_ID=38,這個38就是我們需要填寫的值。
標簽
WordPress 入庫時,寫入文章的標簽值。多個標簽請使用,分割(英文狀態的逗號分隔) 例:WordPress,LaoJi,wp-jpost。
目標網站a鏈接元素
列表頁中到二級目錄的鏈接地址,同jQuery選擇器方法。
分頁格式
列表頁中第二頁區別列表頁的地方。例: 列表頁地址:https://www.douban.com/group/meituikong/ 翻頁后變成:https://www.douban.com/group/meituikong/discussion?start=8850 那么這里就填寫:discussion?start={page} 這里的 {page} 就是翻頁變化的地方。
分頁最大值
這里填寫翻頁后最后的page值。例: http://147hub.com/page/2052 這里翻頁的最大值,即填寫:2052
獲取單頁標題、目標單頁獲取元素 :title
內容頁中標題、內容的標簽值。同jQuery選擇器方法。下面我們具體得講述一下怎么選擇元素。首先我們需要使用chrome、firefox之類的瀏覽器。這些瀏覽器都具有調試等功能。我們這里以Firefox為例。 首先分析代碼,以下元素標簽可以是div , h3 ,title ,span , p 等。 例:<元素標簽 class="classname">...</元素標簽>,那么我們應該則填入:元素標簽.classname。 例:<元素標簽 id="classname">...</元素標簽>,那么我們應該則填入:元素標簽#classname。 學習更多CSS選擇器可以參考: http://www.w3schools.com/cssref/css_selectors.asp步驟:
1、網頁空白處右擊 -- 查看元素 。 下面會彈出一個調試器出來。
內容搜索值 、內容替換值(可以批量多個替換)
比如標題正文中帶有一些原來的字符串,我想替換成我的,或者不要了。 注意:這里如想替換成一樣的值,可以直接寫一個。如每個替換成不同的則需要對應填。例: 搜索值:- 摔角資料, - 賽事新聞 - 摔角網, - 賽事戰報, - 摔角網 替換值: 搜索值:搜索1,搜索2,搜索3 替換值:替換1,替換2,替換3 注意這里要一一對應。例如搜索2去要替換成空則替換值也需要留空(替換1,,替換2),否則就不能對應替換了。
curl設置
我們在采集時,會遇到一些網站帶有https,或者做了防采集。這時我們就需要curl來幫忙。具體方法請移步:WordPress 采集插件 WP-JPost 在Windows/Linux 系統環境下安裝curl 采集 帶ssl的https網站 圖文教程
如有任何意見、建議,請在這里留言! WordPress 采集插件 wp-jpost 任務列表 已知規則 WordPress 采集插件 wp-jpost 問答總結 QQ群:665443669
搬瓦工,年付$49.99
的CN2
高速線路,1024MB
內存/1000GB
流量/1GB
帶寬,電信聯通優化KVM
,延遲低,速度快,建站穩定,搬瓦工BandwagonHost VPS優惠碼BWH26FXH3HIQ
,支持<支付寶> 【點擊購買】!
Vultr月付$3.5
的日本
節點,512M
內存/500G
流量/1G
帶寬,電信聯通優化,延遲低,速度快【點擊購買】!