離群點檢測(Novelty Detection, Outlier Detenction)


適合問題: 對於無標簽的數據, 又想找出壞用戶,完成業務目標。

參考: https://scikit-learn.org/stable/modules/outlier_detection.html

算法:

  1. one class SVM, 原理: 特征空間中, 分割平面離原點的距離大
  2. IsolationForest , 原理: 異常點在隨機分割的森林中,點到根的平均路徑要比正常點小很多。
  3. 其他方差,PCA等。
  4. Local Outlier Factor, 適合給定數據集, 不能做預測。
  5. 復雜算法, https://arxiv.org/pdf/1803.01798.pdf

應用:

  1. https://gallery.azure.ai/Experiment/1219e87f8fb84e88a2e1b54256808bb3
  2. https://www.kaggle.com/dloden/credit-card-fraud-detection


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM