適合問題: 對於無標簽的數據, 又想找出壞用戶,完成業務目標。
參考: https://scikit-learn.org/stable/modules/outlier_detection.html
算法:
- one class SVM, 原理: 特征空間中, 分割平面離原點的距離大
- IsolationForest , 原理: 異常點在隨機分割的森林中,點到根的平均路徑要比正常點小很多。
- 其他方差,PCA等。
- Local Outlier Factor, 適合給定數據集, 不能做預測。
- 復雜算法, https://arxiv.org/pdf/1803.01798.pdf
應用:
