騰訊用戶畫像
畫像,實質
上就是給賬號、設備等打標簽。
用戶畫像 = 打標簽
我們這里主要從安全
的角度動身
來打標簽,比如
IP畫像,我們會標注IP是不是代理IP,這些對我們做戰略
是有輔佐
的。
以QQ的畫像為例,比如
,一個QQ只登錄IM、不登錄其他騰訊的業務、不聊天、頻繁的加好友、被好友刪除、QQ空間要么沒開通、要么開通了QQ空間但是評論多但回復少,這種號碼我們普通
會標注QQ養號(色情、營銷),相似
的我們也會給QQ打上其他標簽。
標簽的類別和明細,需求
做風控的人自己
去設定,比如
:天文
位置,按省份標志
。性別,安男女標志
。其他細致規則以此規律自己
去設定。
我們看看騰訊的IP畫像,沉淀的邏輯如下圖:
普通
的業務都有針對IP的頻率、次數限制的戰略
,那么黑產為了對立
,必然會大量采用代理IP來繞過限制。
既然代理IP的辨認
如此重要,那我們就以代理IP為例來談下騰訊辨認
代理IP的過程。
辨認
一個IP是不是代理IP,技術不外乎就是如下四種:
- 反向探測技術:掃描IP是不是開通了80,8080等代理效勞
器經常開通的端口,顯然一個普通的用戶IP不太可能開通如上的端口。 - HTTP頭部的X_Forwarded_For:開通了HTTP代理的IP能夠
經過
此法來辨認是不是代理IP;假定
帶有XFF信息,該IP是代理IP無疑。
- Keep-alive報文:假定
帶有Proxy-Connection的Keep-alive報文,該IP毫無疑問是代理IP。
- 查看IP上端口:假定
一個IP有的端口大於10000,那么該IP大多也存在問題,普通的家庭IP開這么大的端口簡直
是不可能的。
以上代理IP檢測的辦法
簡直
都是公開的,但是盲目
去掃描全網的IP,被攔截不說,效率也是一個很大的問題。
因而
,我們的除了應用
網絡爬蟲爬取代理IP外,還應用
如下辦法
來加快代理IP的搜集
:經過
業務建模,搜集
歹意
IP(黑產運用
代理IP的可能性比較
大)然后再經過
協議掃描的方式來判別
這些IP是不是代理IP。每天騰訊都能發現千萬級別的歹意
IP,其中大部分
還是代理IP。