WordPress 采集插件 WP-JPost


之前我們在網上看到有wp-autopost插件,是自動采集的。但是需要付費。 下面我們這邊發布一個開源的版本。如果覺得好,大家可以贊助我們哦~ 本插件使用需要一定的html、css 基礎. 本插件開發純屬興趣~~~插件已發布到wordpress官方插件中心

WordPress 開源采集插件 wp-jpost 使用問題,請加QQ群下載:665443669 不會寫采集規則?請博主幫寫一個~親,插件免費,規則有價,詳情請聯系QQ:366609877 (注明:wp-jpost 規則)

主要功能

  1. 定向采集目標網站內容,並直接發布。
  2. 可以設置對應入庫的分類。
  3. 可以自定義文章的標簽。
  4. 可以自定義替換標題、文章內容。
  5. 自動另存為圖片到本地。
  6. 自動刪除內容中的所有鏈接。
  7. 加入百度翻譯,可以將內容翻譯成英文。
  8. 腳本定時自動增量功能。

插件截圖如下


如何安裝WordPress采集插件WP-JPost?

方法一:在后台插件中直接搜索“wp-jpost”

方法二:在WordPress插件官網下載,然后上傳安裝

https://wordpress.org/plugins/wp-jpost/

如何添加采集任務?

任務名

命名請使用英文字母數字組合. 例:douban。

抓取目標網站域名(網址以/結束)

這里填寫目標網站首頁的地址,以/結束。 例:https://www.douban.com

抓取目標網站列表頁

列表頁一般都是二級頁面,是欄目的具體展示頁,一般是用頁內跳轉的鏈接。 例如:https://www.douban.com/group/meituikong/

入庫目標分類ID

WordPress 后台 -- 文章 -- 分類目錄 -- 編譯你想入庫到的分類 -- 查看瀏覽器地址欄的地址。 例:/wp-admin/term.php?taxonomy=category&tag_ID=38... 這里的tag_ID=38,這個38就是我們需要填寫的值。

標簽

WordPress 入庫時,寫入文章的標簽值。多個標簽請使用,分割(英文狀態的逗號分隔) 例:WordPress,LaoJi,wp-jpost。

目標網站a鏈接元素

列表頁中到二級目錄的鏈接地址,同jQuery選擇器方法。

分頁格式

列表頁中第二頁區別列表頁的地方。例: 列表頁地址:https://www.douban.com/group/meituikong/ 翻頁后變成:https://www.douban.com/group/meituikong/discussion?start=8850 那么這里就填寫:discussion?start={page} 這里的 {page} 就是翻頁變化的地方。

分頁最大值

這里填寫翻頁后最后的page值。例: http://147hub.com/page/2052 這里翻頁的最大值,即填寫:2052

獲取單頁標題、目標單頁獲取元素 :title

內容頁中標題、內容的標簽值。同jQuery選擇器方法。下面我們具體得講述一下怎么選擇元素。首先我們需要使用chrome、firefox之類的瀏覽器。這些瀏覽器都具有調試等功能。我們這里以Firefox為例。 首先分析代碼,以下元素標簽可以是div , h3 ,title ,span , p 等。 例:<元素標簽 class="classname">...</元素標簽>,那么我們應該則填入:元素標簽.classname。 例:<元素標簽 id="classname">...</元素標簽>,那么我們應該則填入:元素標簽#classname。 學習更多CSS選擇器可以參考: http://www.w3schools.com/cssref/css_selectors.asp

步驟:

1、網頁空白處右擊 -- 查看元素 。 下面會彈出一個調試器出來。

內容搜索值 、內容替換值(可以批量多個替換)

比如標題正文中帶有一些原來的字符串,我想替換成我的,或者不要了。 注意:這里如想替換成一樣的值,可以直接寫一個。如每個替換成不同的則需要對應填。例: 搜索值:- 摔角資料, - 賽事新聞 - 摔角網, - 賽事戰報, - 摔角網 替換值: 搜索值:搜索1,搜索2,搜索3 替換值:替換1,替換2,替換3 注意這里要一一對應。例如搜索2去要替換成空則替換值也需要留空(替換1,,替換2),否則就不能對應替換了。

curl設置

我們在采集時,會遇到一些網站帶有https,或者做了防采集。這時我們就需要curl來幫忙。具體方法請移步:WordPress 采集插件 WP-JPost 在Windows/Linux 系統環境下安裝curl 采集 帶ssl的https網站 圖文教程  


如有任何意見、建議,請在這里留言! WordPress 采集插件 wp-jpost 任務列表 已知規則 WordPress 采集插件 wp-jpost 問答總結 QQ群:665443669

 

搬瓦工,年付$49.99CN2高速線路,1024MB內存/1000GB流量/1GB帶寬,電信聯通優化KVM,延遲低,速度快,建站穩定,搬瓦工BandwagonHost VPS優惠碼BWH26FXH3HIQ,支持<支付寶> 【點擊購買】!

Vultr月付$3.5日本節點,512M內存/500G流量/1G帶寬,電信聯通優化,延遲低,速度快【點擊購買】!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM