普通公司敏感詞審核制度


 

       普通公司的敏感詞審核制度,從三個方面來划分:敏感詞的程度、審查策略、人工審查策略。大公司還會將用戶類別、所在地區進行划分。

 

一、依據敏感詞程度分成違禁詞、高危敏感詞、中低危敏感詞。

       違禁詞依據限制還可划細分為“禁止發布”和“禁止搜索”,或二者皆有。

       文章或留言踩中一些高危敏感詞,如涉政涉爆信息,直接進到刪除狀態(或私密狀態),然后人工審核;若是踩中低危敏感詞,會進入默認通過的狀態,然后審核員會用先審后放或是先放后審兩種策略對待。

       先審后放,“先審”即人工審查前,內容在通過人工審查前無法被查看。

先放后審,與先審后放模式相反,內容在經過人工審查前的默認狀態為可見。

 

二、審查策略有三種:1、機審;2、人工審核;3、用戶舉報 。

       機審+用戶舉報:在普通小公司小平台上很適用。在《敏感詞過濾方案那些事》中,我闡述了小平台對敏感詞過濾要求很低的原因,這里不再重復了。

 

三、人工審查策略

       對帖子內容進行審查,具體操作主要有刪帖、私密、禁言、封號等。

       刪帖: 是指刪除論壇、平台上的帖子。如不少論壇向少數熱心於論壇建設的志願者賦予了一部分網絡管理的權限(版主),其中包括可以根據一定的價值判斷標准(例如版規)。刪除違規內容的權限。

       私密: 指被“私私密”的內容僅作者自己可見,是社交網絡最常用的“刪帖”方式。相對於刪除處理,私密更難被用戶察覺,但對平台上的其他用戶,該內容等同於被刪除。

禁言: 或稱暫時封號,禁言后用戶會被限制使用發言功能,也可能同時不能修改用戶名、頭像、簡介等,待解封后恢復。

       封號: 當用戶賬號被封,將無法進行登錄,同時該賬號所產生的所有內容會被一並清除。

 

四、將用戶分成四類,分別是一般用戶、敏感用戶、綠色用戶、被禁用戶。

       敏感用戶又會分為普通敏感用戶和VIP敏感用戶。少數敏感用戶會被手動划入VIP敏感組。該用戶組為影響力較大的經常討論公共議題,或發布第一手消息的VIP用戶,本身能為平台帶來巨大流量。平台需要對其發布的所有內容進行全量審核,還將其划給高級編輯進行審查。

 

五、地區划分國內與國外、或更細:

  有一個術語叫“海外私密”,指內容海外用戶仍然可見,實際為僅對中國用戶私密。

 

 

廣告一下,畢竟創業不易。

《ToolGood 內容審核系統》一款中小企業的敏感詞過濾解決方案。

  專注文本匹配算法多年,達到性能與內存均衡。

  小文本每秒25W條,長文本(18W字)每秒5條。

  加載數據后內存使用量為86M。

官網:https://toolgood.com/

       官網有測試面板,歡迎來測試。

 

后記:

ToolGood.Words(開源項目):https://github.com/toolgood/ToolGood.Words

       Go版本的文本匹配會更新,C++版本的也要提上日程。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM