阿里雲人工智能實戰第一槍:圖片鑒黃節省90%費用


隨着內容審核的要求越來越嚴,圖片鑒黃幾乎是所有做UGC內容應用的標配了。最近在阿里雲上搭建了圖片鑒黃的應用,發現如果結合阿里雲的鑒黃接口和自建人工智能鑒黃系統,可以節省至少85%的費用。

1. 直接使用阿里雲的圖片鑒黃接口

阿里雲的圖片鑒黃服務基於深度學習技術神經網絡算法,經筆者實測准確率比較高,對圖片數量不太高的場景,可以直接使用。如果你的服務和數據都是部署在阿里雲上的話,那么所有的數據通訊都是走內網,幾乎免費。如果用其他第三方服務,還要通過公網進行圖片傳輸,耗費帶寬。

點擊免費開通阿里雲的內容安全功能,開通后即可調用阿里雲的圖片鑒黃,圖片涉政恐暴識別,圖片不良場景識別等多種圖片鑒別服務。從初次調用某一功能開始的一個月內,該功能都有一定的免費檢測次數,一般是每天3000張圖片,足夠做測試開發用。


 
 

阿里雲的鑒黃服務包括內容檢測API,站點檢測,和OSS違規檢測三種模式。我推薦使用內容檢測API,可以有更好的控制。當然如果應用場景簡單,可以直接用站點檢測,和OSS違規檢測。

內容檢測API有同步檢測和異步檢測兩種方式。一般情況下用同步檢測方式即可,開發部署都比較簡單。阿里雲API接口的響應時間也比較快, 大約在1秒左右,個別情況下會到5秒,但配上足夠的用戶交互,通常可以滿足需求。具體開發文檔參見鑒黃同步檢測API


 

檢測接口一般返回三種可能結果,如果是pass,則不是黃圖;如果是block,根據阿里的准確率,可以直接判定為黃圖;如果是review, 阿里的建議是人工審核。我實際運行下來發現,阿里的系統主要是對動漫內容的准確率不確定。所以如果你的場景都是實景圖,同時又不想做人工審核的系統,也可以直接認為是黃圖。但如果你有大量二次元內容,則肯定要人工審核了。

【省錢秘笈來了!】開發完成后,則要選擇付費方式。購買內容安全流量包比較划算。阿里雲,永遠是流量包划算!流量包划算!流量包划算!

點擊打開流量包購買傳送門,點擊”立即購買“按鈕,進入內容安全流量包購買頁面。


 

然后點擊“按量加油包”,我一般選擇300萬次,性價比比較高。


 
 

2. 搭建自己的人工智能鑒黃系統

如果自己的圖片處理量比較大,或者短時間內需要處理一大批圖片,那么使用阿里雲的鑒黃服務會不太划算。比如說我們需要一次性處理300萬張圖片,按量加油包需要4590萬元。但自己搭建一套准確率稍低的鑒黃系統,先過濾掉90%以上肯定不是黃圖的內容,再把剩下的10%傳給阿里雲的鑒黃接口,就只需要10%的鑒黃費用+1台ECS的錢。一般2核4G的ECS足夠運行一個初級鑒黃系統,每個月也就不到200塊。所以整體費用就降到了700元,可以省85%的費用。

先購買一台2核4G的ECS,阿里雲的ECS雲服務3折起活動,只需要1404元/年,每個月不到120元。


 

然后搭建自己的人工智能鑒黃系統。初級的人工智能鑒黃系統用二分類網絡判斷就可以,訓練數據包括正例負例兩個集合。其中正例需要自己收集,最好1萬張圖片以上。負例則收集各種各樣的正常圖片,數量與正例一致即可。

為了方便試驗,我們可以拿github上的Open nsfw model項目作測試。這個項目的Yahoo開源的不適合工作場景(Not Suitable for Work)圖片識別項目。 項目鏈接里有已經訓練好的模型。也可以通過增加自己的訓練集進行調優。

我試驗的Open nsfw系統(預先訓練的模型)判斷為黃圖或不確定的比例在10%左右,比較粗糙。但拿這個結果作為調用阿里雲鑒黃接口的前置,可以節省85%的費用。

而實際應用中,我增加了數據集並調優后,判斷為黃圖或不確定的比例在5%左右,實際節省了超過90%的費用。

 

更多省錢秘笈,請看:

小程序應用的Python服務器部署高配,依然是騰訊雲秒殺阿里雲!

小程序創業最低配置部署,騰訊雲折扣秒殺阿里雲!

阿里雲如何跨賬號打通,多賬號同時享受優惠

零門檻申請阿里雲1萬元代金券

阿里雲超長6個月免費套餐匯總

阿里雲包年包月服務器如何退款


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM