騰訊用戶畫像——如何為QQ畫像和代理IP畫像


騰訊用戶畫像

畫像,實質

上就是給賬號、設備等打標簽。

用戶畫像 = 打標簽

我們這里主要從安全

的角度動身
來打標簽,比如

IP畫像,我們會標注IP是不是代理IP,這些對我們做戰略
是有輔佐

的。

以QQ的畫像為例,比如

,一個QQ只登錄IM、不登錄其他騰訊的業務、不聊天、頻繁的加好友、被好友刪除、QQ空間要么沒開通、要么開通了QQ空間但是評論多但回復少,這種號碼我們普通
會標注QQ養號(色情、營銷),相似

的我們也會給QQ打上其他標簽。

標簽的類別和明細,需求
做風控的人自己

去設定,比如

:天文
位置,按省份標志
。性別,安男女標志
。其他細致規則以此規律自己

去設定。

我們看看騰訊的IP畫像,沉淀的邏輯如下圖:

騰訊防刷擔任人:基於用戶畫像大數據的電商防刷架構

普通
的業務都有針對IP的頻率、次數限制的戰略
,那么黑產為了對立
,必然會大量采用代理IP來繞過限制。

既然代理IP的辨認

如此重要,那我們就以代理IP為例來談下騰訊辨認

代理IP的過程。

辨認

一個IP是不是代理IP,技術不外乎就是如下四種:

  1. 反向探測技術:掃描IP是不是開通了80,8080等代理效勞
    器經常開通的端口,顯然一個普通的用戶IP不太可能開通如上的端口。
  2. HTTP頭部的X_Forwarded_For:開通了HTTP代理的IP能夠

    經過
    此法來辨認

    是不是代理IP;假定

    帶有XFF信息,該IP是代理IP無疑。

  3. Keep-alive報文:假定

    帶有Proxy-Connection的Keep-alive報文,該IP毫無疑問是代理IP。

  4. 查看IP上端口:假定

    一個IP有的端口大於10000,那么該IP大多也存在問題,普通的家庭IP開這么大的端口簡直

    是不可能的。

以上代理IP檢測的辦法

簡直

都是公開的,但是盲目

去掃描全網的IP,被攔截不說,效率也是一個很大的問題。

因而

,我們的除了應用
網絡爬蟲爬取代理IP外,還應用
如下辦法

來加快代理IP的搜集
:經過
業務建模,搜集
歹意

IP(黑產運用
代理IP的可能性比較

大)然后再經過
協議掃描的方式來判別
這些IP是不是代理IP。每天騰訊都能發現千萬級別的歹意

IP,其中大部分

還是代理IP。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM